如何使用python爬取知乎全部回答
发表于:2025-01-24 作者:千家信息网编辑
千家信息网最后更新 2025年01月24日,小编给大家分享一下如何使用python爬取知乎全部回答,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1.代码逻辑这个核心代
千家信息网最后更新 2025年01月24日如何使用python爬取知乎全部回答
小编给大家分享一下如何使用python爬取知乎全部回答,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
1.代码逻辑
这个核心代码是直接对上篇推文中使用的代码进行修改,删去了对书籍名称的提取,添加了爬取内容的写入文件,小伙伴只要把getAnswers(问题号)里的传入参数改成想爬取回答的问题号,剩下的事情就只需要等待了
什么是知乎问题号?
查看知乎网页地址,question后的一串数字就是问题号
def getAnswers(qid):
offset = 0
num = 1
f = open("知乎回答%s.txt" % qid, "a")
while True:
qid = qid
print('Offset =', offset)
# 知乎api请求
data = getAnser(qid, offset)
print(data)
if len(data['data']) == 0:
break
for line in data['data']:
# 保存回答数据
content = line['content']
pattern = re.compile(r'<[^>]+>', re.S)
result = pattern.sub('', content)
print(result)
f.write("\n【第%d个回答】" % num)
num += 1
f.write(result)
offset += 20
time.sleep(1)
f.close()
getAnswers(62096167)
2.应用程序版本
对于不了解爬虫的小伙伴,只需要打开一行数据爬取知乎回答.exe,修改问题号和选择保存路径,就可以将该知乎问题下的所有回答保存到当前路径下,如下图所示
以上是"如何使用python爬取知乎全部回答"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
题号
代码
内容
篇文章
小伙
小伙伴
数据
路径
一行
上篇
不怎么
书籍
事情
参数
名称
地址
大部分
就是
应用程序
数字
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
济南高数软件开发工丝
山西移动网络安全
海珠软件开发专业技校院校
数据库中的记录文档字段
电信网络安全技术与应用
软件开发介绍大全
linux服务器挖矿特征
通用数据库采集
软件开发定制费用
杭州hpe塔式服务器报价
网吧里的绝地求生是什么服务器
河南服务器防火墙厂家
怎么查看服务器的网口ip
软件开发加班厉害吗
jav 数据库
冬奥会网络安全宣传
机器视觉软件开发招聘
电影数据库图形表示
halo连外部数据库
未转变者哪个地图服务器多
扬州悠米网络技术
数据库怎么查看分给用户的权限
mysql查询一条数据库
软件开发适合什么语言
软件测试转软件开发好转嘛
南京网络安全培训服务机构
河北开源软件开发报价
网络技术 重点题目
山东网络安全基地综合楼
分布式数据库最大内存