怎么让Python爬取B站视频
发表于:2024-10-22 作者:千家信息网编辑
千家信息网最后更新 2024年10月22日,这期内容当中小编将会给大家带来有关怎么让Python爬取B站视频,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。前言B站是国内知名的视频弹幕网站,有最及时的动漫新番,
千家信息网最后更新 2024年10月22日怎么让Python爬取B站视频
这期内容当中小编将会给大家带来有关怎么让Python爬取B站视频,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
前言
B站是国内知名的视频弹幕网站,有最及时的动漫新番,ACG氛围,最有创意的Up主。站点中的视频数据分成了视频画面和音频数据。
今天带大家下载以及合并B站的视频。
环境介绍:
python 3.6
pycharm
requests
re
json
subprocess
解析网页
目标网页分析
爬虫代码
导入工具
import requestsimport re # 正则表达式import pprintimport jsonimport subprocess
请求头
headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'}
请求数据
def send_request(url): response = requests.get(url=url, headers=headers) return response
解析视频数据
def get_video_data(html_data): """解析视频数据""" # 提取视频的标题 title = re.findall('(.*?)', html_data)[0] # print(title) # 提取视频对应的json数据 json_data = re.findall('', html_data)[0] # print(json_data) # json_data 字符串 json_data = json.loads(json_data) pprint.pprint(json_data) # 提取音频的url地址 audio_url = json_data['data']['dash']['audio'][0]['backupUrl'][0] print('解析到的音频地址:', audio_url) # 提取视频画面的url地址 video_url = json_data['data']['dash']['video'][0]['backupUrl'][0] print('解析到的视频地址:', video_url) video_data = [title, audio_url, video_url] return video_data
保存数据
def save_data(file_name, audio_url, video_url): # 请求数据 print('正在请求音频数据') audio_data = send_request(audio_url).content print('正在请求视频数据') video_data = send_request(video_url).content with open(file_name + '.mp3', mode='wb') as f: f.write(audio_data) print('正在保存音频数据') with open(file_name + '.mp4', mode='wb') as f: f.write(video_data) print('正在保存视频数据')
数据的合并
def merge_data(video_name): print('视频合成开始:', video_name) # ffmpeg -i video.mp4 -i audio.wav -c:v copy -c:a aac -strict experimental output.mp4 COMMAND = f'ffmpeg -i {video_name}.mp4 -i {video_name}.mp3 -c:v copy -c:a aac -strict experimental output.mp4' subprocess.Popen(COMMAND, shell=True) print('视频合成结束:', video_name)
效果图
合并视频与音频
这里使用到一个工具<ffmpeg>,FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。
下载之后解压即可,但是需要你设置环境变量。
1、我的电脑,鼠标右键点击属性
2、选择系统高级设置
4、添加环境变量,复制文件路径,选择新建添加即可。
上述就是小编为大家分享的怎么让Python爬取B站视频了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。
视频
数据
音频
地址
正在
环境
分析
内容
变量
工具
画面
网页
选择
知名
高级
专业
中小
代码
内容丰富
前言
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
互联网时代 科技企业
软件开发的主流工具
护苗2019 网络安全课
联想服务器管理口界面进不去
小米路由器3c连不上服务器
凉山公共场所网络安全
服务器的硬盘灯亮了
智能建筑网络安全问题
正确使用网络安全文明上网
以太网用什么网络技术
神经网络技术发展现状
lol欧洲服务器点券
app软件开发模板
苹果7联通无服务器
银川药厂软件开发
河北亿维网络技术有限公司
云服务器黑匣子
数据库系统的组成dba是什么
网络安全特性包含
无锡市公安局有网络安全吗
做数据库需要什么工具
斑马网络技术有限公司股东
中国全文数据库英文缩写
上海软件开发培训班
软件开发服务商需要什么条件
苹果数据库怎么进入电脑
当前网络安全面临的挑战
杭州飞腾服务器销售价格
mysql数据库的文件名字
计算机网络技术哪个快入门