千家信息网

python3爬虫中BeautifulSoup怎么用

发表于:2024-11-27 作者:千家信息网编辑
千家信息网最后更新 2024年11月27日,小编给大家分享一下python3爬虫中BeautifulSoup怎么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!有些朋
千家信息网最后更新 2024年11月27日python3爬虫中BeautifulSoup怎么用

小编给大家分享一下python3爬虫中BeautifulSoup怎么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

有些朋友觉得利用正则表达式提取信息太麻烦了。

有一个高效的网页解析库,它的名字叫做BeautifulSoup

它支持多种格式的解析,我们用的比较多的是lxml解析器

实例学习

html_doc = """学习python的正确姿势

小帅b的故事

有一天,小帅b想给大家讲两个笑话一个笑话长,一个笑话短 ,他问大家,想听长的还是短的?

...

导入库,将 html 的源代码传给 BeautifulSoupfrom bs4 import BeautifulSoupsoup=BeautifulSoup(html_doc,"lxml")打印title标签内容print(soup.title.string)打印p标签内容,只打印了第一个print(soup.p.string)打印title标签的父亲标签print(soup.title.parent.name)打印a标签,只打印了第一个print(soup.a)使用soup.find方法打印id为link2的标签print(soup.find(id="link2"))getText获取全部内容print(soup.getText)select法除了find方法之外如果你对css比较熟悉也可以使用 select 方法打印title标签print(soup.select("title"))#打印body标签print(soup.select("body a"))打印p标签中,id为link1的那一个print(soup.select("p #link1"))

以上是"python3爬虫中BeautifulSoup怎么用"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!

标签 内容 方法 篇文章 学习 爬虫 不怎么 两个 信息 名字 多种 大部分 姿势 实例 故事 更多 朋友 格式 正则 源代码 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 黑客和网络技术区别 国内软件开发销售的上市公司 小米的手机激活服务器出错 雅安似仁网络技术有限公司 服务器里面可以安装模拟器吗 电脑微信数据库修复 上海安卓软件开发定做 服务器管理员拦截 怎么设置云服务器语言退出后不变 数据库日志文件的功能为 软件开发模型快速原型模型 cs1.6服务器如何踢机器人 北仑手机游戏软件开发 数据库查询当前日期 e会计怎么改账套初始数据库 企业网络安全问题自查 数据库推荐与改进意见 遵义网络安全资讯白盒测试 软件开发日语三级有什么好处 院前急救系统软件开发商 杭州惠普服务器招聘 泰坦陨落2服务器被炸 网络安全三类 过去三年软件开发新进公司有多少 重庆市哪里回收服务器 联想服务器驱动哪里下 新华社图像采集数据库格式 剑网三选择服务器没有响应 战地1 连不上服务器 服务器时钟多了8小时
0