python中使用XPath爬取小说的方法
发表于:2025-01-17 作者:千家信息网编辑
千家信息网最后更新 2025年01月17日,这篇"python中使用XPath爬取小说的方法"文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来
千家信息网最后更新 2025年01月17日python中使用XPath爬取小说的方法
这篇"python中使用XPath爬取小说的方法"文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇"python中使用XPath爬取小说的方法"文章吧。
说明
xpath是一种在XML文档中搜索信息的语言。
过程
1、获得浏览器中的标题和作者测试。
2、在浏览器安装xpath插件:
3、在html中找到book-mid-info:
4、找到我们想得到小说的名字、作者
即//div[@class='book-mid-info']/h5/a/txt()
实例
# 作者:# 开发时间:2021/4/8/0008 8:24 import requestsfrom lxml import etreeurl="https://www.qidian.com/rank/yuepiao"headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400'}#发送请求resp=requests.get(url,headers)e=etree.HTML(resp.text) #类型转换,把str转变为class 'lxml.etree._ELementprint(type(e))names=e.xpath('//div[@class="book-mid-info"]/h5/a/text()')authors=e.xpath('//p[@class="author"]/a[1]/text()')print(names)print(authors)#名称和作者对应for name,authors in zip(names,authors): print(name,":",authors)
以上就是关于"python中使用XPath爬取小说的方法"这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注行业资讯频道。
内容
小说
作者
方法
文章
浏览器
知识
篇文章
浏览
价值
信息
名字
名称
大部分
实例
就是
想得到
插件
文档
时间
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
河北服务器维修调试云空间
互联网科技创新龙头
ava软件开发工程师
如何清理苹果5游戏数据库
excel服务器如何卸载
写一篇关于网络安全的周记
有关创建数据库的方法不正确
继续再教育网络安全题库
南岸网络技术安全
网络安全论文怎么拍照
数据库的多表连接案例
营销商城软件开发
服务器安全狗远程桌面端口
大规模网络安全事件
省市级联与数据库
大华摄像机服务器地址是多少
威海手机软件开发制作
winform访问数据库
区块链软件开发公司电话
计算机网络技术网页设计方向
太原软件开发多少钱
网络安全应急预案2017
添加网络安全类型
明日之后网易服务器在哪
金华比奇网络技术是什么
中韩软件开发水平比较
河北省对网络安全的重视
软件开发专业要经常加班吗
盘古网络技术公司工商信息
天津虚拟主机配置云主机服务器