Python如何使用Requests抓取包图网小视频
发表于:2025-02-02 作者:千家信息网编辑
千家信息网最后更新 2025年02月02日,本篇内容介绍了"Python如何使用Requests抓取包图网小视频"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,
千家信息网最后更新 2025年02月02日Python如何使用Requests抓取包图网小视频
本篇内容介绍了"Python如何使用Requests抓取包图网小视频"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
目标抓取全站视频数据保存在本地,并以网站视频名命名视频文件。
分析网页数据结构
经分析我们可以发现总站数据我们可以从这四这选项下手
分析网页数据格式
image.png
网页数据为静态
抓取下一页链接
抓取下一页链接
OK, 上代码!
import requests
from lxml import etree
import threading
class Spider(object):
def __init__(self):
self.headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36"}
self.offset = 1
def start_work(self, url):
print("正在爬取第 %d 页......" % self.offset)
self.offset += 1
response = requests.get(url=url,headers=self.headers)
html = response.content.decode()
html = etree.HTML(html)
video_src = html.xpath('//div[@class="video-play"]/video/@src')
video_title = html.xpath('//span[@class="video-title"]/text()')
next_page = "http:" + html.xpath('//a[@class="next"]/@href')[0]
# 爬取完毕...
if next_page == "http:":
return
self.write_file(video_src, video_title)
self.start_work(next_page)
def write_file(self, video_src, video_title):
for src, title in zip(video_src, video_title):
response = requests.get("http:"+ src, headers=self.headers)
file_name = title + ".mp4"
file_name = "".join(file_name.split("/"))
print("正在抓取%s" % file_name)
with open(file_name, "wb") as f:
f.write(response.content)
if __name__ == "__main__":
spider = Spider()
for i in range(0,3):
# spider.start_work(url="https://ibaotu.com/shipin/7-0-0-0-"+ str(i) +"-1.html")
t = threading.Thread(target=spider.start_work, args=("https://ibaotu.com/shipin/7-0-0-0-"+ str(i) +"-1.html",))
t.start()
运行结果
是不是很简单呢!
"Python如何使用Requests抓取包图网小视频"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!
数据
网页
视频
分析
内容
更多
正在
知识
网站
链接
实用
学有所成
接下来
上代
全站
困境
实际
总站
情况
数据结构
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
开网吧需要买服务器吗
昆山直销服务器质量保证
网络安全小故事用英语
数据库技术专业就业
苹果的网络安全设置
软件开发项目抽成如何定
网络安全资讯中心电话
cf手游服务器已满正在排队中
网络安全是网路服务吗
邯郸博信软件开发公司怎么样
计算机网络技术与物联网技术
四川互联网络科技
用代理服务器访问微信
汕头市韦易互联网科技有限公司
线上养殖软件开发
浙江省网上认证服务器云主机
软件开发公司系统集成宣传册
网络安全产品的内涵
云数据库开发者
公司委托个人软件开发
我要去查数据库
互联网金融科技工作
怎么维护服务器
软件开发方案价钱
建材商城开发装修软件开发
医疗器械软件网络安全风险
杭州微客宝网络技术有限公司
佛山广东网络安全培训
网络安全解读
用什么服务器主板做软路由