Python中怎么实现一个爬虫功能
发表于:2025-02-23 作者:千家信息网编辑
千家信息网最后更新 2025年02月23日,今天就跟大家聊聊有关Python中怎么实现一个爬虫功能,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。运行结果Python 2.6.6 (r26
千家信息网最后更新 2025年02月23日Python中怎么实现一个爬虫功能
今天就跟大家聊聊有关Python中怎么实现一个爬虫功能,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
运行结果
Python 2.6.6 (r266:84292, Jun 20 2019, 14:14:55) [GCC 4.4.7 20120313 (Red Hat 4.4.7-23)] on linux2Type "help", "copyright", "credits" or "license" for more information.>>> import requestsTraceback (most recent call last): File "", line 1, in File "/usr/lib/python2.6/site-packages/requests/__init__.py", line 43, in import urllib3 File "/usr/lib/python2.6/site-packages/urllib3/__init__.py", line 7, in from .connectionpool import HTTPConnectionPool, HTTPSConnectionPool, connection_from_url File "/usr/lib/python2.6/site-packages/urllib3/connectionpool.py", line 100 _blocking_errnos = {errno.EAGAIN, errno.EWOULDBLOCK} ^SyntaxError: invalid syntax
由于Linux服务器上的Python版本为2.6.6,import requests就已经报错了,这个库是没法用了。这个错误我试了几种办法,都宣告失败。之前文章是在windows环境Python2.7下完成的。
你可能会说升级Python版本吧?我有过升级glibc把服务器搞死的惨痛教训,不敢再乱升级了,而且我试验的机器是24小时运行着其它系统的生产服务器,一旦升级出问题,会酿成生产事故的。所以我只能在2.6的Python下开发爬虫。使用urllib2库代替requests库,实现过程基本是一样的简单明了。代码如下
#coding=utf-8import urllib2exact_url='https://news.qq.com/zt2020/page/feiyan.htm'try: r=urllib2.urlopen(exact_url) #抓取设定url的数据,可以改成你想获取的任意地址except urllib2.URLError,e: print e.code exit() r.encoding='utf8'html=r.read() print html #打印抓取的结果
所以如果你的服务器Python版本是2.6或者更低,尝试使用urllib2库吧!
低版本的Python还会出现无法安装mongodb的驱动包pymongo的情况,如下
这种情况可以选择MySQL的Python驱动包代替,pip安装MySQL的Python驱动包也不一定成功,我最后用yum安装成功的。
更奇葩的是2.6下,django也无法安装成功,
看完上述内容,你们对Python中怎么实现一个爬虫功能有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
服务器
版本
升级
服务
爬虫
成功
内容
驱动
功能
情况
结果
生产
运行
惨痛
事故
代码
办法
地址
奇葩
小时
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
vmware怎么搭建虚拟服务器
网络安全防范措施滞后
dns服务器地址重庆云空间
小学手机微信网络安全制度
名人数据库陈国华
徐汇区互联网络技术服务介绍
服务器怎么防止人家爆破
如何让ups电源安全关闭服务器
漳州市网络安全知识竞答答案
数据库转意
拜耳您已被输入招聘候选人数据库
报考公安局网络安全管理年龄
办公室网络安全防盗
服务器和数据库管理
新宁百世网络技术有限公司
数据库是不是jsp
曙光服务器bios查看网卡
十三五网络安全和信息化综述
倩女幽魂手游服务器哪个最多人
广州新媒体网络技术
葫芦岛中天软件开发
涉密网络安全管理制度
珠海软件开发的培训学校
re数据库
网络安全团队官方网站
网络安全意识培训的目标
打印服务器支持手机直连吗
epic代理服务器怎么填
组态王变量数据库模板
债券数据库python