HTML下载模块是怎样的
发表于:2025-02-02 作者:千家信息网编辑
千家信息网最后更新 2025年02月02日,这篇文章给大家介绍HTML下载模块是怎样的,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。HTML下载模块该模块主要是根据提供的url进行下载对应url的网页内容。使用模块requ
千家信息网最后更新 2025年02月02日HTML下载模块是怎样的
这篇文章给大家介绍HTML下载模块是怎样的,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
HTML下载模块
该模块主要是根据提供的url进行下载对应url的网页内容。使用模块requets-HTML,加入重试逻辑以及设定最大重试次数,同时限制访问时间,防止长时间未响应造成程序假死现象。
根据返回的状态码进行判断如果访问成功则返回源码,否则开始重试,如果出现异常也是进行重试操作。
from requests_html import HTMLSession
from fake_useragent import UserAgent
import requests
import time
import random
class Gethtml():
def __init__(self,url="http://wwww.baidu.com"):
self.ua = UserAgent()
self.url=url
self.session=HTMLSession(mock_browser=True)
#关于headers有个默认的方法 self.headers = default_headers()
#mock_browser 表示使用useragent
def get_source(self,url,retry=1):
if retry>3:
print("重试三次以上,跳出循环")
return None
while retry<3:
try:
req=self.session.get(url,timeout=10)
if req.status_code==requests.codes.ok:
return req.text
else:
time.sleep(random.randint(0,6))
except:
print('An Error Happened, Please wait 0-6 seconds')
time.sleep(random.randint(0, 6))
retry += 1
self.get_source(url,retry)
关于HTML下载模块是怎样的就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
模块
内容
更多
帮助
不错
最大
成功
兴趣
同时
小伙
小伙伴
文章
方法
时间
次数
源码
状态
现象
知识
程序
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
通过网络安全考试取得实效
提供防护的服务器
沉迷网络安全教育主题班会ppt
tnt跑酷服务器
秀兜网络技术有限公司
简易网络技术架构
访问服务器内虚拟机的数据库
如何依据网络安全法进行执法
网络安全三同步工作方案
互联网科技公司目标客户
兵团网络安全培训内容
iis服务器有用吗
思迅医药之星 数据库
怎么创建用户登录的数据库
中小年家庭教育与网络安全
数据库的索引是不是越多越好
如何用vs自己的数据库
sql数据库添加账户
基建网络安全管理
网络技术的应用的报告
通讯管理机 串口服务器
关系图中数据库设计的不合理值
山财数据库
数据库查询按日
数据库需要安装在docker吗
深信服数据库一体机
不同编程语言连接数据库方法
伊犁等椭网络技术有限公司
ibm 服务器 电源
网络技术简历职业技能怎么填