千家信息网

怎么用python爬取喜马拉雅全站音频

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,喜马拉雅FM是一个知名的音频分享平台,在移动音频行业的市场占有率已达73%,用户规模突破4.8亿,今晚我们就带大家突破层层障碍,探秘喜马拉雅的天籁之音,实现实时抓捕并保存到本地。开发环境:Window
千家信息网最后更新 2025年01月23日怎么用python爬取喜马拉雅全站音频

喜马拉雅FM是一个知名的音频分享平台,在移动音频行业的市场占有率已达73%,用户规模突破4.8亿,今晚我们就带大家突破层层障碍,探秘喜马拉雅的天籁之音,实现实时抓捕并保存到本地。

开发环境:Windows 、pycharm 、 requests 、 json

知识点:

1、网络反爬技术

2、文件操作

3、数据转换

4、字典、字符串、列表数据类型的使用

同样,我们要求使用火狐浏览器或者Google浏览器;我们接下来要确定几件事:

1、确定网址(喜马拉雅网址)

2、网络请求获取数据(点开我们想要的音频)

3、数据筛选(筛选我们想要的音频)

4、保存数据(保存我们需要的音频)

部分程序如下:

url = "https://www.ximalaya.com/revision/play/album?albumId=291718&psgeNum=1&sort=1&page"

response = requests.get(url,headers=header).text

audio_data = json.loads(response)["data"]["tracksAudioPlay"]

for audio_in in audio_data:

music_url = audio_info["src"]

"https://fdfs.xmcdn.com/group61/M05/70/C1/wKgMcFoJCZuw9cSkAB9RrgvYaVU283.m4a"

music_name = music_url.split("/")[-1]

.....

完整视频关注公众号(自学的仙叔)或者扫描下面二维码,在公众号中回复"喜马拉雅"拿取资源。


本文分享自微信公众号 - 自学的仙叔(gh_3de5e20d92e5)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与"OSC源创计划",欢迎正在阅读的你也加入,一起分享。

0