python中怎么获取标题和链接
发表于:2025-02-07 作者:千家信息网编辑
千家信息网最后更新 2025年02月07日,本篇文章给大家分享的是有关python中怎么获取标题和链接,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。先上代码from request
千家信息网最后更新 2025年02月07日python中怎么获取标题和链接
本篇文章给大家分享的是有关python中怎么获取标题和链接,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
先上代码
from requests_html import HTMLSessionsession = HTMLSession()url = "https://my.oschina.net/u/4798232"r = session.get(url)for i in range(1, 12): i = str(i) urlxpath = '//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a' bt = r.html.xpath(urlxpath, first=True).text c = urlxpath+'/@href' link = r.html.xpath(c, first=True) a = "原" if bt.find(a) == -1:print(bt)print(link)else:print(bt.replace(a, ""))print(link)
首先呢,这个是通过xpath来进行操作的,具体如何复制xpath可以看我的https://zjzdmc.top/jsfx/47.html这篇文章,里面有动图。
然后导入什么库啥的,都是老生常谈的了,在a标签中,你复制的xpath为//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a这个,然后呢,我们获取标题的话,加上.text这个属性,就会变成文字了,而其中的文字我们可以看f12内的内容,发现其实只有标题,而我们如果需要连接的话,只需要加上这个/@href即可获取链接了。不过目前其实没有找到更好的获取所有文字序列的方法,所以我们直接看最前面的文章id和最后一篇文章的id,记录下来即可。之后我们只需要遍历一下1-12的值即可,然后给字符串添加变量的方法为字符串+变量+字符串即可'//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a'如文字所示,即可获取所有文章的标题了,然后给之前定义的变量urlxpath后面添加上/@href后,即可获取改xpath内的链接了,之后输出即可了。
以上就是python中怎么获取标题和链接,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。
标题
链接
文字
篇文章
变量
字符
字符串
文章
方法
更多
知识
实用
老生常谈
上代
内容
只有
就是
属性
工作会
序列
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
软件开发人员要做的培训
宁波蓝益互联网科技有限公司
我的世界服务器自动化小麦
数据库营销的商业价值
诊断仪软件开发
网页打不开数据库
网络安全的护航人
怎么在dos窗口内创建数据库
计算机网络技术理想职业
数据库表里含有html标签
制作服务器启动u盘用什么软件
同一个服务器两个网关要不要一样
数据库打包签名注意事项
中色科技互联网
智慧岛网络安全高峰论坛
金华地税网络技术
华为无线认证服务器
数据库数据闪回
数据库与后台
软件开发做前端还是后端好
广汽研究院软件开发科科长
嵩明创新软件开发咨询报价
昌平区品牌软件开发价格信息
最新网络安全大赛通知
网络安全研究的内容是什么
网络安全制度执行记录表
云服务器 连接到地址
网络安全大赛加固服务器工具
fq服务器
如何开启服务器管理器