python如何爬取Q房网数据
发表于:2025-02-05 作者:千家信息网编辑
千家信息网最后更新 2025年02月05日,这篇文章主要介绍了python如何爬取Q房网数据,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。前言本文的文字及图片来源于网络,仅供学习
千家信息网最后更新 2025年02月05日python如何爬取Q房网数据
这篇文章主要介绍了python如何爬取Q房网数据,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
本次目标
爬取Q房网数据
https://shenzhen.qfang.com/newhouse
爬取目标数据:
小区名字
售房状态
房屋面积
户型
开盘时间
交房时间
楼盘地址
售价
预计总价
emmmm,我看看就行了,买不起买不起
开发工具
python 3.6.5
pycharm
爬虫代码
导入工具
import requestsimport parselimport csv
解析网页,爬取数据
for page in range(1, 84): print('===============================正在爬取第{}页的数据================================================='.format(page)) url = 'https://shenzhen.qfang.com/newhouse/list/n{}'.format(page) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) selector = parsel.Selector(response.text) lis = selector.css('.list-result li') dit = {} for li in lis: title = li.css('.list-main-header a em::text').get() # 名字 dit['标题'] = title status = li.css('.list-main-header i::text').get() # 是否在售 dit['房产状态'] = status space = li.css('.list-main div:nth-child(1) .space span::text').get() # 售房面积 dit['售房面积'] = space type_list = li.css('.list-main.fl p:nth-child(3) span a::text').getall() # 户型 type_str = '|'.join(type_list).strip().replace('\r\n', '').replace(' ', '') # 户型 dit['户型'] = type_str kp_time = li.css('.new-house-info > div:nth-child(2) > p.space.fl.clearfix > span::text').get() # 开盘时间 dit['开盘时间'] = kp_time cs_time = li.css('.new-house-info > div:nth-child(2) > p:nth-child(3)> span::text').get() # 出售时间 dit['出售时间'] = cs_time address = li.css('.list-main a:nth-child(3)::text').get() # 地址 if not address == None: address = address.strip() else: address = None dit['地址'] = address Price = li.css('.list-price .bigger .amount::text').get() # 售价 dit['售价'] = Price hj_Price = li.css('.list-price .smaller::text').get() # 预计总价 dit['预计总价'] = hj_Price
保存数据
f = open('房产数据.csv', mode='a', encoding='utf-8-sig', newline='')csv_writer = csv.DictWriter(f, fieldnames=['标题', '房产状态', '售房面积', '户型', '开盘时间', '出售时间', '地址', '售价', '预计总价'])csv_writer.writeheader()print(dit)
运行代码,效果如下图
感谢你能够认真阅读完这篇文章,希望小编分享的"python如何爬取Q房网数据"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!
数据
时间
户型
售价
地址
总价
篇文章
面积
房网
房产
状态
代码
名字
工具
标题
目标
学习
价值
兴趣
前言
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
永大电梯主板服务器
四川服务器维保云主机
软件开发公司企业画册
王者服务器未响应账号被封
互联网数码科技有限公司
计算机联锁仿真软件开发
广州直播软件开发服务
网络安全知识的问题跟解答
java结合数据库树状
极品飞车19 与服务器
河北运营网络技术服务怎么样
DHCP服务器配置管理心得
大话西游2推荐服务器多久刷新
天府文化服务数据库
提高5g网络技术
软件开发为何学费高
王者荣耀以前账号服务器
联想服务器保修几年
常熟高品质服务器客户至上
软件开发交流论坛
服务器管理各自权限
支付软件开发尾款的账务处理
农业数据库三级模式
涉密甲级软件开发全称
为什么服务器还能运行网速快
管家婆内置数据库
福建质量软件开发制造价格
雷光服务器地址
餐厅数据库实验目的
部队网络安全用什么软件