python怎么抓取糗事百科的内容
发表于:2024-11-22 作者:千家信息网编辑
千家信息网最后更新 2024年11月22日,这篇文章主要讲解了"python怎么抓取糗事百科的内容",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"python怎么抓取糗事百科的内容"吧!# 抓取糗
千家信息网最后更新 2024年11月22日python怎么抓取糗事百科的内容
这篇文章主要讲解了"python怎么抓取糗事百科的内容",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"python怎么抓取糗事百科的内容"吧!
# 抓取糗事百科的内容import requestsfrom lxml import etreeclass Qiushi() : def __init__(self) : self.url = 'http://www.qiushibaike.com/8hr/page/{}'; self.headers = { "User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1 Trident/5.0;" }; def parse_url(self , url) : response = requests.get(url , timeout = 10 , headers = self.headers) assert response.status_code == 200 print(url) return etree.HTML(response.text) def parse_content(self , html) : item = html.xpath('//div[@class="recommend-article"]/ul/li') print(item) for i in item : # 内容 print(i.xpath('./div/a[@class="recmd-content"]/text()')); # 好笑数 print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[1]/text()')) # 评论数 print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[4]/text()')) # 用户名 print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/span/text()')) # 头像地址 print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/img/@src')) def run(self) : url = self.url.format(1); html = self.parse_url(url); self.parse_content(html);if __name__ == '__main__': qiu = Qiushi(); qiu.run();
感谢各位的阅读,以上就是"python怎么抓取糗事百科的内容"的内容了,经过本文的学习后,相信大家对python怎么抓取糗事百科的内容这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
内容
百科
糗事
学习
好笑
地址
头像
就是
思路
情况
文章
更多
用户
用户名
知识
知识点
篇文章
跟着
问题
实践
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
家庭硬件服务器
襄阳中嘉网络技术有限公司
网络安全钓鱼宣传周
番禺网络数据库维护怎么收费
创新网络安全培养
以萨服务器产品型号
温州高阳网络技术有限公司
网络安全产品普及
上海手机软件开发公司哪家好
网络安全为主题的申论
上海常用的外贸软件开发公司
我的世界开服服务器配置
交易笔记软件开发
泉州聊天软件开发多少钱
九江个人服务器一般多少钱
湖南正规软件开发服务以客为尊
数据库技术与应用读书报告
无法连接服务器是什么意思
嵌入式软件开发天津
网站数据库维护的工作
南京农华缘网络技术
卓健科技互联网医院
制作数据库的工具
广西数据库安全箱价目表
计算机应用是否包含软件开发
病毒对网络安全的影响
代理商数据库设计
如何检查服务器硬盘健康状态
运营商封锁网络技术
海康服务器上的u盘是干什么用