Python如何实现短视频爬虫
发表于:2024-11-14 作者:千家信息网编辑
千家信息网最后更新 2024年11月14日,这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。网站地址在代码里面,大家用心一下就能看到
千家信息网最后更新 2024年11月14日Python如何实现短视频爬虫
这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
网站地址在代码里面,大家用心一下就能看到了。
使用的软件
python 3.8pycharm 2021.2
模块
requestsparselreconcurrent.futurestimewarnings
不会安装模块看这篇:python模块的安装以及安装失败的解决方法
知道你们不想看那些步骤,我直接上代码吧
import requestsimport parselimport reimport concurrent.futuresimport timeimport warnings# 取消警告warnings.filterwarnings("ignore")def get_html(url): """发送请求获取网页源代码""" html_data = requests.get(url=url, verify=False).text return html_datadef parse_data_1(html_data): """第一次解析, 拿到所有的详情页链接""" selector = parsel.Selector(html_data) url_list = selector.xpath('//a[@class="meta-title"]/@href').getall() return url_listdef parse_data_2(html_data): """第二次解析, 获取视频链接""" video_url = re.findall('url: "(.*?)",', html_data)[0] return video_urldef save(video_url): """保存视频""" title = video_url.split('/')[-1] # 取链接当中的字段作为标题 video_data = requests.get(video_url, verify=False).content # 发送网络请求 with open(f'video/{title}', mode='wb') as f: f.write(video_data) print(title, "爬取成功!!!")start_time = time.time()url = 'https://www.520mmtv.com/hd/rewu.html'# 1. 向目标网站发送请求html_data = get_html(url=url)# 2. 第一次解析数据 提取详情页链接url_list = parse_data_1(html_data=html_data)for info_url in url_list[:10]: # 3. 向详情页发送请求 html_data_2 = get_html(url=info_url) # 4. 第二次解析数据 提取视频播放地址 video_url = parse_data_2(html_data=html_data_2) # 5. 保存视频 save(video_url=video_url)print('花费时间:', time.time() - start_time)
感谢你能够认真阅读完这篇文章,希望小编分享的"Python如何实现短视频爬虫"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!
视频
篇文章
链接
模块
详情
爬虫
代码
地址
数据
第一次
网站
成功
价值
兴趣
同时
字段
方法
时间
更多
朋友
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
青年网络安全主题小段
阿里云服务器降价
数据库范式太多
服务器换图就死机
网络安全同期声
网络安全应急信息化解决方案
天津app软件开发公司
hue创建数据库
ar红包软件开发
世界国家城市数据库
方舟8081服务器
tbc登陆提示没有服务器
数据库桥表
电子工程做软件开发
大学生毕业想从事软件开发
技算机网络技术用英语怎么说
北航 杭州 网络安全
CMS软件开发公司介绍
甘肃语音网络技术服务工程
2020年广西网络安全事件
asta3服务器源码
软件开发远程培训
软件开发学习的内容
中国联通网络技术研究院工资
保存到数据库英文
2019年自考数据库技术
曹妃甸区企业网络技术售后保障
云免服务器一键搭建
济南市计算机软件开发招聘
数据库事务串行化隔离