requests.gPython用requests.get获取网页内容为空的问题怎么解决
发表于:2024-11-18 作者:千家信息网编辑
千家信息网最后更新 2024年11月18日,requests.gPython用requests.get获取网页内容为空的问题怎么解决,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法
千家信息网最后更新 2024年11月18日requests.gPython用requests.get获取网页内容为空的问题怎么解决
requests.gPython用requests.get获取网页内容为空的问题怎么解决,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
下面先来看一个例子:
import requestsresult=requests.get("http://data.10jqka.com.cn/financial/yjyg/")result
输出结果:
表示成功处理了请求,一般情况下都是返回此状态码; 报200代表没问题
继续运行,发现返回空值,在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。headers
是解决requests
请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。对反爬虫网页,可以设置一些headers
信息,模拟成浏览器取访问网站 。
一、如何设置headers
拿两个常用的浏览器举例:
1、QQ浏览器
界面 F12
点击network 键入 CTRL+R
单击第一个 最下边就是我门需要的 把他设置成headers
解决问题
2、Miscrosft edge
二、微软自带浏览器
同样 F12 打开开发者工具
点击网络,CTRL+R
前文代码修改:
import requestsur="http://data.10jqka.com.cn/financial/yjyg/"headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3880.400 QQBrowser/10.8.4554.400 '}result = requests.get(ur, headers=headers)result.text
成功解决不能爬取问题。
关于requests.gPython用requests.get获取网页内容为空的问题怎么解决问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。
问题
网页
浏览器
浏览
内容
成功
信息
就是
方法
更多
帮助
解答
输出
易行
抱歉
简单易行
两个
代码
代表
例子
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
中草药靶点数据库
智能机器网络安全
网络安全攻击事件
mamp数据库
软件开发强制上线
lol的服务器图标
大兴区网络技术服务职责
删除用友数据库
服务器主体无法在当前安全上
软件用户测试和软件开发测试
网络安全类展板华为p40
火电厂网络安全分区
江苏省网络技术应用
网络安全宣传周征集
去哪里咨询网络安全问题
深圳大学csmar数据库入口
销售实时数据库软件批发
校园网网络安全架构具体方案
崇明区提供数据库系统要求
泰兰德服务器
软件开发签约合同
软件开发棋牌会被判刑吗
服务器的海关编码
软件开发项目管理流程培训
鸿洋数据库库
邢台网络安全工程师招聘
fastdb 内存数据库
数据库无权限怎么查看
台州天橙网络技术公司怎么样
校园网网络安全架构具体方案