如何使用python爬取知乎全部回答
发表于:2024-11-11 作者:千家信息网编辑
千家信息网最后更新 2024年11月11日,小编给大家分享一下如何使用python爬取知乎全部回答,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1.代码逻辑这个核心代
千家信息网最后更新 2024年11月11日如何使用python爬取知乎全部回答
小编给大家分享一下如何使用python爬取知乎全部回答,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
1.代码逻辑
这个核心代码是直接对上篇推文中使用的代码进行修改,删去了对书籍名称的提取,添加了爬取内容的写入文件,小伙伴只要把getAnswers(问题号)里的传入参数改成想爬取回答的问题号,剩下的事情就只需要等待了
什么是知乎问题号?
查看知乎网页地址,question后的一串数字就是问题号
def getAnswers(qid):
offset = 0
num = 1
f = open("知乎回答%s.txt" % qid, "a")
while True:
qid = qid
print('Offset =', offset)
# 知乎api请求
data = getAnser(qid, offset)
print(data)
if len(data['data']) == 0:
break
for line in data['data']:
# 保存回答数据
content = line['content']
pattern = re.compile(r'<[^>]+>', re.S)
result = pattern.sub('', content)
print(result)
f.write("\n【第%d个回答】" % num)
num += 1
f.write(result)
offset += 20
time.sleep(1)
f.close()
getAnswers(62096167)
2.应用程序版本
对于不了解爬虫的小伙伴,只需要打开一行数据爬取知乎回答.exe,修改问题号和选择保存路径,就可以将该知乎问题下的所有回答保存到当前路径下,如下图所示
以上是"如何使用python爬取知乎全部回答"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
题号
代码
内容
篇文章
小伙
小伙伴
数据
路径
一行
上篇
不怎么
书籍
事情
参数
名称
地址
大部分
就是
应用程序
数字
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
品质网络技术服务优点
ssh怎么反向生成数据库
手机 软件开发平台有哪些
浙江crm售后管理软件开发
网络安全警示语英文
疫情保供企业数据库
软件开发人员个人年终总结
云数据库 开源
湖南多功能软件开发价格表格
服务器开机慢
软件开发一直没签合同
留守儿童网络安全意识
网络安全日答题2020
cad应用软件开发
查看ftp服务器
排查存储介质和网络安全隐患
服务器代理跨域
vs登录窗口连接数据库
广东荔枝网络技术的企业性质
乡镇网络安全自检自查报告
大学c 软件开发
cs1.6查找服务器
EI数据库自动取词根是
网信办网络安全态势感知平台
网络安全警示语英文
数据库及其建立过程面试
互联网网络安全应急预案
支付软件开发费用
phpci框架怎么匹配数据库
软件怎么关联到后台数据库