Python简单爬虫
发表于:2025-01-26 作者:千家信息网编辑
千家信息网最后更新 2025年01月26日,爬取链家二手房源信息import requestsimport refrom bs4 import BeautifulSoupimport csvurl = ['https://cq.lianjia.
千家信息网最后更新 2025年01月26日Python简单爬虫
爬取链家二手房源信息
import requestsimport refrom bs4 import BeautifulSoupimport csvurl = ['https://cq.lianjia.com/ershoufang/']for i in range(2,101): url.append('https://cq.lianjia.com/ershoufang/pg%s/'%(str(i))) # 模拟谷歌浏览器headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}for u in url: r = requests.get(u,headers=headers) soup = BeautifulSoup(r.text,'lxml').find_all('li', class_='clear LOGCLICKDATA') for i in soup: ns = i.select('div[class="positionInfo"]')[0].get_text() region = ns.split('-')[1].replace(' ','').encode('gbk') rem = ns.split('-')[0].replace(' ','').encode('gbk') ns = i.select('div[class="houseInfo"]')[0].get_text() xiaoqu_name = ns.split('|')[0].replace(' ','').encode('gbk') huxing = ns.split('|')[1].replace(' ','').encode('gbk') pingfang = ns.split('|')[2].replace(' ','').encode('gbk') chaoxiang = ns.split('|')[3].replace(' ','').encode('gbk') zhuangxiu = ns.split('|')[4].replace(' ','').encode('gbk') danjia = re.findall("\d+",i.select('div[class="unitPrice"]')[0].string)[0] zongjia = i.select('div[class="totalPrice"]')[0].get_text().encode('gbk') out=open("/data/data.csv",'a') csv_write=csv.writer(out) data = [region,xiaoqu_name,rem,huxing,pingfang,chaoxiang,zhuangxiu,danjia,zongjia] csv_write.writerow(data) out.close()
数据结果
二手房
数据
浏览器
源信息
结果
浏览
爬虫
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
服务器在美国的网站算外网吗
新罗区昊易网络技术工作室真假
合作共赢 网络安全
软件开发不能用汉字开发
建立wsus服务器的作用
软件开发人员就业前景如何
嵌入式软件开发大赛作品
云服务的服务器地址
贯彻落实网络安全四个坚持
怪猎的服务器
软件开发交付源码费用
对网络安全和相关政策法规的认识
戴尔t40服务器没有vga
软件开发net方向女生学
皖西学院网络安全专业
nasa总署气象数据库
东莞应用软件开发方案
互联网科技公司排行
网络技术同义词大全
软件开发公司市场前景
贵州智能养老软件开发
选择软件开发知乎
河南五点半网络技术有限公司
贵州6家庭与网络安全
怎么建立三级标准化数据库
p站关服务器
如何报考软件开发工程师
网络安全的注意事项
数据库用户密码修改
沧州市有软件开发吗