python怎么抓取糗事百科的内容
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,这篇文章主要讲解了"python怎么抓取糗事百科的内容",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"python怎么抓取糗事百科的内容"吧!# 抓取糗
千家信息网最后更新 2025年01月23日python怎么抓取糗事百科的内容
这篇文章主要讲解了"python怎么抓取糗事百科的内容",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"python怎么抓取糗事百科的内容"吧!
# 抓取糗事百科的内容import requestsfrom lxml import etreeclass Qiushi() : def __init__(self) : self.url = 'http://www.qiushibaike.com/8hr/page/{}'; self.headers = { "User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1 Trident/5.0;" }; def parse_url(self , url) : response = requests.get(url , timeout = 10 , headers = self.headers) assert response.status_code == 200 print(url) return etree.HTML(response.text) def parse_content(self , html) : item = html.xpath('//div[@class="recommend-article"]/ul/li') print(item) for i in item : # 内容 print(i.xpath('./div/a[@class="recmd-content"]/text()')); # 好笑数 print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[1]/text()')) # 评论数 print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[4]/text()')) # 用户名 print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/span/text()')) # 头像地址 print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/img/@src')) def run(self) : url = self.url.format(1); html = self.parse_url(url); self.parse_content(html);if __name__ == '__main__': qiu = Qiushi(); qiu.run();
感谢各位的阅读,以上就是"python怎么抓取糗事百科的内容"的内容了,经过本文的学习后,相信大家对python怎么抓取糗事百科的内容这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
内容
百科
糗事
学习
好笑
地址
头像
就是
思路
情况
文章
更多
用户
用户名
知识
知识点
篇文章
跟着
问题
实践
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库技术及应用考研学校
乙方软件开发
软件开发环境netfram
建党百年网络安全演练
路诗广州软件开发商
四川博雅数据库理科
百度100 大数据库
中甲球员数据库app
数据库源码导入
龙族幻想服务器中断
java服务器验证
有力保障了网络安全
服务器管理岗位技能规范
网络安全个人金融信息简报
联想服务器的带外管理默认地址
什么是arm服务器
战地无服务器国旗
软件开发平台建设合同
广州鼎基互联网科技
阳江永信网络技术有限公司
网络安全警情提示
机房服务器安装
海康威视软件开发面经
网络安全最新规章制度
湖南省省公安厅网络安全
模拟数据库数据库和map
数据库设计包含几个内容
教材采购数据库代码
公司网络安全模型
阳江永信网络技术有限公司