如何用Python采集腾讯招聘数据
发表于:2025-01-19 作者:千家信息网编辑
千家信息网最后更新 2025年01月19日,这篇文章将为大家详细讲解有关如何用Python采集腾讯招聘数据,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。今天我们爬取腾讯招聘网站Python岗位的
千家信息网最后更新 2025年01月19日如何用Python采集腾讯招聘数据
这篇文章将为大家详细讲解有关如何用Python采集腾讯招聘数据,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
今天我们爬取腾讯招聘网站Python岗位的招聘信息。如图所示:
然后还是先看一下最终的结果,我们保存到csv文件中。
爬取1000条数据,第一行是title:
老规矩,我们还是走流程。
01需求分析
抓取腾讯招聘网站Python相关岗位数据,打开目标网站,F12打开开发者工具,发现岗位信息不在网页源码中,很明显是在XHR中的json数据。
正好对应页面十条数据,接下来就好办了。
02发送请求
找到url的页面规律,
第一页url:https://careers.tencent.com/tencentcareer/api/post/Query?timestamp=1620561777984&countryId=&cityId=&bgIds=&productId=&categoryId=&parentCategoryId=&attrId=&keyword=python&pageIndex=1&pageSize=10&language=zh-cn&area=cn
index参数对应值即为页码,所以循环得到url链。
def getPage(self): url_list = [] for i in range(100): url = self.url.format(i + 1) url_list.append(url) return url_list
03解析页面
得到url链之后我们循环遍历发起请求,得到json数据,将json数据转换成字典,并解析数据。
for url in urlList: resp = requests.get(url, headers=self.headers) data = resp.content.decode('utf-8') dic_data = json.loads(data) dic_data_list = dic_data["Data"]["Posts"] for i in dic_data_list: work_list.append(i)
这样就得到了岗位信息数据。
04保存数据
得到了岗位数据之后我们需要把它保存到本地,这里我们把数据保存到本地csv文件中。
try: with open('Tx_work.csv', 'w', encoding='utf-8', newline='') as f: writer = csv.DictWriter(f, self.title) writer.writeheader() writer.writerows(dic) print('写入成功') except Exception as e: print(e)
05运行程序
if __name__ == '__main__': tx = Tx(base_url,hd,titles) tx.run()
关于如何用Python采集腾讯招聘数据就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
数据
招聘
岗位
腾讯
信息
网站
页面
内容
招聘网站
文件
文章
更多
知识
篇文章
还是
循环
不错
明显
成功
接下来
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库 转义字符
dhcp服务器清除缓存
企业保护数据库
dhcp服务器作用
数据库dmp导出15g图片
网络技术开发货源充足
相关软件开发资质证明
镇江企业网络安全准入控制公司
炫舞时代手机版怎么连接服务器
中学生网络安全教学稿
软件开发cpu选择酷睿和锐龙
昌平区大型软件开发推荐
海南州软件开发商家
文山好口碑java软件开发
web软件开发工程师证书
潍坊企业软件开发
java登录连接数据库
网络安全信息融合技术
英语网络安全话题
上海遨云互联网科技有限公司
sql脚本添加数据库
暨大网络技术服务中心
四川三星手机服务器托管
erp系统上云服务器配置
阿里云服务器注销
魔兽世界tcb服务器排行
ntc计算机网络技术考卷
oppo软件开发面经
肿瘤数据库大全
数据库日志和日期