多线程爬取都挺好链接并保存到mongodb
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,一个比较简单,python3多线程使用requests库爬取都挺好,并使用正则提取下载链接,保存到mongodb#!/usr/bin/env python# -*- coding:utf-8 -*-"
千家信息网最后更新 2025年01月23日多线程爬取都挺好链接并保存到mongodb
- 一个比较简单,python3多线程使用requests库爬取都挺好,并使用正则提取下载链接,保存到mongodb
#!/usr/bin/env python# -*- coding:utf-8 -*-"""@author:Aiker Zhao@file:doutinghao.py@time:下午8:18"""import requestsimport reimport pymongofrom multiprocessing import PoolMONGO_URL = 'localhost:27017'MONGO_DB = 'doutinghao'MONGO_TABLE = 'doutinghao'client = pymongo.MongoClient(MONGO_URL, connect=False)db = client[MONGO_DB]def get_result(url): response = requests.get(url).text # print(reponse.text) pattern = re.compile('', re.S) result = re.findall(pattern, response) if result: for i in result: url, name = i yield { "name": name, 'url': url }def save_to_mongo(result): if db[MONGO_TABLE].insert(result): print('存储到MongoDB成功', result) return True return Falsedef main(result): # result = get_result(url) save_to_mongo(result)if __name__ == '__main__': pool = Pool() url = "https://www.xl720.com/thunder/34283.html" item = [item for item in get_result(url)] # print(item) pool.map(main, item) pool.close() pool.join()
线程
链接
成功
正则
utf-8
存储
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
如何利用网络技术提高自己
数据库设计默认值为null
金砖会议 信息网络安全
节点机器与服务器对时
佛山安卓软件开发常见问题
58分钟网络安全宣传片
sql数据库执行语句
大千网络技术有限公司
东土串口服务器读取bcd吗
珠江路租房网络安全
服务器和云主机
联想td340服务器
网安落实网络安全主体责任报告
ibm服务器灯的含义
南京复翼软件开发有限公司中标
辽宁智能套料软件开发商
鹤壁启帆互联网科技
大学生网络安全意识研究的收获
郑州应用软件开发靠谱吗
服务器通讯数据异常是什么意思
软件开发者技术沙龙
软件开发团队管理制度
36岁软件开发什么水平
黔江区媒体网络技术服务活动
疫时网络安全防范指南
软件开发师猝死
用什么工具修改服务器时间
mcgs触摸屏与数据库
阿里云服务器灾备方案
计算机网络技术地址