Python如何实现短视频爬虫
发表于:2025-01-17 作者:千家信息网编辑
千家信息网最后更新 2025年01月17日,这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。网站地址在代码里面,大家用心一下就能看到
千家信息网最后更新 2025年01月17日Python如何实现短视频爬虫
这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
网站地址在代码里面,大家用心一下就能看到了。
使用的软件
python 3.8pycharm 2021.2
模块
requestsparselreconcurrent.futurestimewarnings
不会安装模块看这篇:python模块的安装以及安装失败的解决方法
知道你们不想看那些步骤,我直接上代码吧
import requestsimport parselimport reimport concurrent.futuresimport timeimport warnings# 取消警告warnings.filterwarnings("ignore")def get_html(url): """发送请求获取网页源代码""" html_data = requests.get(url=url, verify=False).text return html_datadef parse_data_1(html_data): """第一次解析, 拿到所有的详情页链接""" selector = parsel.Selector(html_data) url_list = selector.xpath('//a[@class="meta-title"]/@href').getall() return url_listdef parse_data_2(html_data): """第二次解析, 获取视频链接""" video_url = re.findall('url: "(.*?)",', html_data)[0] return video_urldef save(video_url): """保存视频""" title = video_url.split('/')[-1] # 取链接当中的字段作为标题 video_data = requests.get(video_url, verify=False).content # 发送网络请求 with open(f'video/{title}', mode='wb') as f: f.write(video_data) print(title, "爬取成功!!!")start_time = time.time()url = 'https://www.520mmtv.com/hd/rewu.html'# 1. 向目标网站发送请求html_data = get_html(url=url)# 2. 第一次解析数据 提取详情页链接url_list = parse_data_1(html_data=html_data)for info_url in url_list[:10]: # 3. 向详情页发送请求 html_data_2 = get_html(url=info_url) # 4. 第二次解析数据 提取视频播放地址 video_url = parse_data_2(html_data=html_data_2) # 5. 保存视频 save(video_url=video_url)print('花费时间:', time.time() - start_time)
感谢你能够认真阅读完这篇文章,希望小编分享的"Python如何实现短视频爬虫"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!
视频
篇文章
链接
模块
详情
爬虫
代码
地址
数据
第一次
网站
成功
价值
兴趣
同时
字段
方法
时间
更多
朋友
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
微信小游戏 数据库
爆破网络技术交底
内网服务器安全设置
测试数据库性能关注点
redis无法加载数据库
如何将软件开发说的高大上
数据库权限的命令
灌云选择网络技术专业服务
银行软件开发考题
北京尚硅谷软件开发培训学校
数据库中怎么往表中插入列
网络安全等级测评工作如何做
数据库中的索引合并
镇江丹徒博莱软件开发有限公司
后端开发服务器server
商务局网络安全宣传内容
oracle数据库操作界面
沈阳数控软件开发
手机管理支持服务器
幻塔服务器是谁的
网络安全审查认证中心王连印
求最小的数据库
做大数据的数据库
数据库登录错误有哪些
互联网科技公司的特性
根服务器解释
小龙猫互联网科技
2017中国数据库技术
服务器证书无效怎么办
简单计算机网络技术