怎么用Python爬取惠农网苹果数据
发表于:2025-02-05 作者:千家信息网编辑
千家信息网最后更新 2025年02月05日,这篇文章将为大家详细讲解有关怎么用Python爬取惠农网苹果数据,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。本次目标爬取惠农网信息受害者地址http
千家信息网最后更新 2025年02月05日怎么用Python爬取惠农网苹果数据
这篇文章将为大家详细讲解有关怎么用Python爬取惠农网苹果数据,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
本次目标
爬取惠农网信息
受害者地址
https://www.cnhnb.com/
环境
Python3.6
pycharm
爬虫代码
导入工具
import requestsimport parselimport csvimport time
请求头
headers = { 'Cookie': 'deviceIdRenew=1; Hm_lvt_91cf34f62b9bedb16460ca36cf192f4c=1604579356,1604659451; deviceId=d1dd5b9-d191-406b-971d-391916a0e; sessionId=S_0KH64T2IHLHSO77N; lmvid=b24dcd0ad2a8f0b783f248c7ff2675a8; lmvid.sig=w1UBnTUKSDq-GfAlx6TyR_K7SjyujGIlF-1kRjTrOAI; hnUserTicket=b80e6b3a-38a3-432c-816d-aeb0376228bd; hnUserId=870048250; Hm_lpvt_91cf34f62b9bedb16460ca36cf192f4c=1604659904', 'Host': 'www.cnhnb.com', 'Referer': 'https://www.cnhnb.com/supply/pingguo/', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',}
解析网站、爬取数据
def get_page_url(page_url, page_id): response_2 = requests.get(url=page_url, headers=headers) selector_2 = parsel.Selector(response_2.text) num_id = selector_2.css('#__layout > div > div > div > div > ul > li:nth-child(1) > a::attr(href)').get().split('/')[2] title = selector_2.css('.proinfo-title::text').get().strip() # 标题 update_time = selector_2.css('.update-time::text').get().strip('更新时间:') # 更新时间 price = selector_2.css('.priceTxt .orange .fs30::text').get().strip() + '元' # 价格 ads = selector_2.css('div:nth-child(5) > span.fs14.gray6::text').get() # 发货地址 get_phone_url = 'https://gateway.cnhnb.com/banana/im/operate/wechatcall' data = { 'businessType': '1', 'sourceFrom': '2', 'ticket': '"b80e6b3a-38a3-432c-816d-aeb0376228bd"', 'userId': '{}'.format(num_id), } head = { 'authority': 'gateway.cnhnb.com', 'method': 'POST', 'path': '/banana/im/operate/wechatcall', 'scheme': 'https', 'accept': 'application/json, text/plain, */*', 'accept-encoding': 'gzip, deflate, br', 'accept-language': 'zh-CN,zh;q=0.9', 'cache-control': 'no-cache', 'content-length': '98', 'content-type': 'application/json', 'origin': 'https://www.cnhnb.com', 'pragma': 'no-cache', 'referer': 'https://www.cnhnb.com/gongying/{}/'.format(page_id), # 'Cookie': 'deviceIdRenew=1; Hm_lvt_91cf34f62b9bedb16460ca36cf192f4c=1604579356,1604659451; deviceId=d1dd5b9-d191-406b-971d-391916a0e; sessionId=S_0KH64T2IHLHSO77N; lmvid=b24dcd0ad2a8f0b783f248c7ff2675a8; lmvid.sig=w1UBnTUKSDq-GfAlx6TyR_K7SjyujGIlF-1kRjTrOAI; hnUserTicket=b80e6b3a-38a3-432c-816d-aeb0376228bd; hnUserId=870048250; Hm_lpvt_91cf34f62b9bedb16460ca36cf192f4c=1604659904', 'sec-fetch-dest': 'empty', 'sec-fetch-mode': 'cors', 'sec-fetch-site': 'same-site', 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36', 'x-b3-traceid': '0KH64WG5WL1GXPNG', 'x-client-appid': '5', 'x-client-id': 'c10e4e9a-5e19-4ba2-a934-c8c5c56680f5', 'x-client-nonce': '62f080cd-ad30-4590-b362-b1c9e660a8d5', 'x-client-page': '/gongying/{}/'.format(page_id), 'x-client-sid': 'S_0KH64W0GT18JX07L', 'x-client-ticket': 'b80e6b3a-38a3-432c-816d-aeb0376228bd', 'x-client-time': '1604659611092', 'x-hn-job': 'If you see these message, I hope you dont hack us, I hope you can join us! Please visit https://www.cnhnkj.com/job.html', } response_3 = requests.post(url=get_phone_url, json=data, headers=head) html_data = response_3.json() if html_data['errorCode'] == 0: dit = { '标题': title, '更新时间': update_time, '价格': price, '发货地址': ads, '联系方式': html_data['data']['messageTitle'] } csv_writer.writerow(dit) print(dit) else: dit = { '标题': title, '更新时间': update_time, '价格': price, '发货地址': ads, '联系方式': '商家设置防打扰' } csv_writer.writerow(dit) print(dit)
保存数据
f = open('惠农网信息.csv', mode='a', encoding='utf-8-sig', newline='')csv_writer = csv.DictWriter(f, fieldnames=['标题', '更新时间', '价格', '发货地址', '联系方式'])csv_writer.writeheader()
效果图
关于怎么用Python爬取惠农网苹果数据就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
地址
时间
更新
数据
惠农
价格
标题
方式
联系方式
联系
苹果
信息
内容
文章
更多
知识
篇文章
不错
代码
受害者
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
阿里云服务器安全问题
阿里巴巴网络安全专家现况
西安高新区网络安全大会
公共信息网络安全监察工作忙吗
如何输出数据库所有数据
杭州软件开发公司哪个区多
万达软件开发公司深圳分公司
app读书软件开发
数据库删除整个表格
关于数据库分离叙述错误的是
cnpdtm数据库
钦州导航软件开发
DNF答题软件开发
网络安全分多少级
数据库安全设备有什么好处
靖江教实网络技术有限公司
国内实时数据库有哪些
eclipse数据库映射
重庆彭水生鲜类的软件开发
服务器回复pad0
网络技术的发展特点
数据库2005安全性在哪
罗湖网络安全建设哪里有
网络安全宣传周教程
华为服务器质量
武汉微信软件开发公司
数据库环境配置复杂
如何进入linux服务器
数据库应用技术 电大
江西通用软件开发网上价格