Python如何实现短视频爬虫
发表于:2025-02-21 作者:千家信息网编辑
千家信息网最后更新 2025年02月21日,这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。网站地址在代码里面,大家用心一下就能看到
千家信息网最后更新 2025年02月21日Python如何实现短视频爬虫
这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
网站地址在代码里面,大家用心一下就能看到了。
使用的软件
python 3.8pycharm 2021.2
模块
requestsparselreconcurrent.futurestimewarnings
不会安装模块看这篇:python模块的安装以及安装失败的解决方法
知道你们不想看那些步骤,我直接上代码吧
import requestsimport parselimport reimport concurrent.futuresimport timeimport warnings# 取消警告warnings.filterwarnings("ignore")def get_html(url): """发送请求获取网页源代码""" html_data = requests.get(url=url, verify=False).text return html_datadef parse_data_1(html_data): """第一次解析, 拿到所有的详情页链接""" selector = parsel.Selector(html_data) url_list = selector.xpath('//a[@class="meta-title"]/@href').getall() return url_listdef parse_data_2(html_data): """第二次解析, 获取视频链接""" video_url = re.findall('url: "(.*?)",', html_data)[0] return video_urldef save(video_url): """保存视频""" title = video_url.split('/')[-1] # 取链接当中的字段作为标题 video_data = requests.get(video_url, verify=False).content # 发送网络请求 with open(f'video/{title}', mode='wb') as f: f.write(video_data) print(title, "爬取成功!!!")start_time = time.time()url = 'https://www.520mmtv.com/hd/rewu.html'# 1. 向目标网站发送请求html_data = get_html(url=url)# 2. 第一次解析数据 提取详情页链接url_list = parse_data_1(html_data=html_data)for info_url in url_list[:10]: # 3. 向详情页发送请求 html_data_2 = get_html(url=info_url) # 4. 第二次解析数据 提取视频播放地址 video_url = parse_data_2(html_data=html_data_2) # 5. 保存视频 save(video_url=video_url)print('花费时间:', time.time() - start_time)
感谢你能够认真阅读完这篇文章,希望小编分享的"Python如何实现短视频爬虫"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!
视频
篇文章
链接
模块
详情
爬虫
代码
地址
数据
第一次
网站
成功
价值
兴趣
同时
字段
方法
时间
更多
朋友
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
做渲染的服务器
国外工控网络安全架构
电脑吧我的世界玩服务器不卡
公安局主管网络安全
套餐报价软件开发公司
网络技术挑战赛准备
软件开发费用估算方法
永州快速软件开发费用
上海+发票软件开发
开源opc服务器
数据库统计1和10查出
中国计算机软件开发
图库类网站买服务器
邯郸前端软件开发哪里好
数据库的报表有三种视图
组装一台服务器可以同时作业吗
网络技术教育座谈会欢迎词范文
春节网络安全保障动态
NXP微控制器软件开发
注重网络安全注意事项
阿里数据网络安全工程师
网络安全审计工资3000
群晖家用服务器推荐
中国网络技术最牛的公司
投票 充钱 软件开发 判刑
软件开发用户权限管理
数据库导入和到处是什么意思
spring 禁用数据库
redis命令行选择数据库
广州攻壳网络技术