Python如何实现短视频爬虫
发表于:2025-02-19 作者:千家信息网编辑
千家信息网最后更新 2025年02月19日,这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。网站地址在代码里面,大家用心一下就能看到
千家信息网最后更新 2025年02月19日Python如何实现短视频爬虫
这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
网站地址在代码里面,大家用心一下就能看到了。
使用的软件
python 3.8pycharm 2021.2
模块
requestsparselreconcurrent.futurestimewarnings
不会安装模块看这篇:python模块的安装以及安装失败的解决方法
知道你们不想看那些步骤,我直接上代码吧
import requestsimport parselimport reimport concurrent.futuresimport timeimport warnings# 取消警告warnings.filterwarnings("ignore")def get_html(url): """发送请求获取网页源代码""" html_data = requests.get(url=url, verify=False).text return html_datadef parse_data_1(html_data): """第一次解析, 拿到所有的详情页链接""" selector = parsel.Selector(html_data) url_list = selector.xpath('//a[@class="meta-title"]/@href').getall() return url_listdef parse_data_2(html_data): """第二次解析, 获取视频链接""" video_url = re.findall('url: "(.*?)",', html_data)[0] return video_urldef save(video_url): """保存视频""" title = video_url.split('/')[-1] # 取链接当中的字段作为标题 video_data = requests.get(video_url, verify=False).content # 发送网络请求 with open(f'video/{title}', mode='wb') as f: f.write(video_data) print(title, "爬取成功!!!")start_time = time.time()url = 'https://www.520mmtv.com/hd/rewu.html'# 1. 向目标网站发送请求html_data = get_html(url=url)# 2. 第一次解析数据 提取详情页链接url_list = parse_data_1(html_data=html_data)for info_url in url_list[:10]: # 3. 向详情页发送请求 html_data_2 = get_html(url=info_url) # 4. 第二次解析数据 提取视频播放地址 video_url = parse_data_2(html_data=html_data_2) # 5. 保存视频 save(video_url=video_url)print('花费时间:', time.time() - start_time)
感谢你能够认真阅读完这篇文章,希望小编分享的"Python如何实现短视频爬虫"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!
视频
篇文章
链接
模块
详情
爬虫
代码
地址
数据
第一次
网站
成功
价值
兴趣
同时
字段
方法
时间
更多
朋友
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
上海游驰网络技术 官网
青少年网络安全的内容
新万佳网络技术公司
韶华网络技术广州有限公司怎样
站群服务器防止假墙
佳都科技为工业互联网发展建言
常州网络安全警察办公地址
国外无线网络安全吗
晨讯科技软件开发
我的世界添加服务器地址格式
删除其中一个数据库
服务器开始自毁
网络安全法违法事件案例
征文网络安全伴我行
服务器月巡检报告
四川服务器阵列卡启动云空间
网络安全员是什么单位
2019电力行业网络安全
小学生信息网络安全教育
dmx512控台软件开发软件
化工管道技术员数据库整理怎么做
服务器文件存储过程
软件开发适合找什么工作
种子搜索器服务器连接不上
网络安全中截取是指
缅甸电信网络技术
广州运维服务软件开发
小型主机与小型服务器的区别
人工智能软件开发项目经理
抖音直播怎么显示服务器