python爬虫之User Agent
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,在学习爬虫的过程中在有的时候没使用头在使用python的爬虫脚本刚爬了两次,就只是测试了一下就打不开这个网页了,刚开始还一直迷糊着,到后来才知道,python在做爬虫的时候默认的user agent就
千家信息网最后更新 2025年01月23日python爬虫之User Agent
在学习爬虫的过程中在有的时候没使用头在使用python的爬虫脚本刚爬了两次,就只是测试了一下就打不开这个网页了,刚开始还一直迷糊着,到后来才知道,python在做爬虫的时候默认的user agent就是python的大版本,python2.7.的User-Agent: Python-urllib/2.7;python3.5.的User-Agent: Python-urllib/3.5
下面来做个试验:
python代码如下:
python2
import urllib2url = "http://www.baidu.com/"request = urllib2.Request(url)response = urllib2.urlopen(request)print(response.read())
python3
from urllib import requesturl = "http://www.baidu.com/"req = request.Request(url)response = request.urlopen(req)print(response.read().decode()
我们开启fiddler,运行完成代码,然后在fiddler上面查看下我们的数据
很明显就是python的版本,
因此我们在学习爬虫的时候无论爬什么,代码最好都要加上这个头信息
下面我们在代码上加入一个头
from urllib import requestheaders = { "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64"}url = "http://www.baidu.com/"req = request.Request(url,headers=headers)response = request.urlopen(req)print(response.read().decode())
抓包的结果如下:
爬虫
代码
时候
就是
版本
学习
明显
个头
信息
只是
数据
最好
结果
网页
脚本
过程
测试
试验
运行
迷糊
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
公安局网络安全应急演练
数据库读取数据用到哪些方法
攻击 服务器
智能驾驶软件开发用什么软件
什么是互联网科技圈子
辽宁采购管理软件开发公司
云服务器的用处
如何找app软件开发公司
天使之战服务器端
福田区服务器机柜厂商
重大网络安全违法
厦门职业学院专业计算机网络技术
sql跟踪特定数据库
服务器安全狗手机app
手机变服务器
无极数据库编辑器4.2
saas人才数据库
安装服务器系统 raid
高一计算机网络技术课程
计算机审计中的数据库技术
关于服务器安全登录的小技巧
奥特曼系列怎么选服务器
流媒体服务器软件生产厂
暗影格斗3服务器位置
不履行网络安全
服务器管理器使用说明
岗前培训软件开发费用
梦茜计算机软件开发
在家办公注意的网络安全问题
移动信息网络安全汇报