Python怎么爬取网站音乐素材
发表于:2025-01-22 作者:千家信息网编辑
千家信息网最后更新 2025年01月22日,本篇内容主要讲解"Python怎么爬取网站音乐素材",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Python怎么爬取网站音乐素材"吧!前言基本开发环境Py
千家信息网最后更新 2025年01月22日Python怎么爬取网站音乐素材
本篇内容主要讲解"Python怎么爬取网站音乐素材",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Python怎么爬取网站音乐素材"吧!
前言
基本开发环境
Python 3.6
Pycharm
相关模块的使用
import osimport concurrent.futuresimport requestsimport parsel
安装Python并添加到环境变量,pip安装需要的相关模块即可。
一、确定需求
如果想要验证这个链接是否是音频的真实下载地址,可以复制链接粘贴到新的窗口中。
https://downsc.chinaz.net/Files/DownLoad/sound1/202102/s830.mp3
老思路了,复制链接中的某些参数在开发者工具中进行搜索,很明显 s830 就是音频的ID了。
搜索 s830 找到来源,发现网页页面中自带有下载地址。获取音频下载地址之后需要自己拼接url。
网页数据不复杂,相对而言还是比较简单的。
1、请求当前网页数据,获取音频地址以及音频标题
2、保存下载就可以了
三、代码实现
获取音频ID以及音频标题
def main(html_url): html_data = get_response(html_url).text selector = parsel.Selector(html_data) lis = selector.css('#AudioList .container .audio-item') for li in lis: name = li.css('.name::text').get().strip() src = li.css('audio::attr(src)').get() audio_url = 'https:' + src save(name, audio_url) print(name, audio_url)
保存数据
def save(name, audio_url): header = { 'Upgrade-Insecure-Requests': '1', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } audio_content = requests.get(url=audio_url, headers=header).content path = 'audio\\' if not os.path.exists(path): os.mkdir(path) with open(path + name + '.mp3', mode='wb') as f: f.write(audio_content)
这里想要重新给一个headers参数,不然会下载不了。代码会一直运行,但是没有反应
多线程爬取
if __name__ == '__main__': executor = concurrent.futures.ThreadPoolExecutor(max_workers=5) for page in range(1, 31): url = f'https://sc.chinaz.com/yinxiao/index_{page}.html' # main(url) executor.submit(main, url)
到此,相信大家对"Python怎么爬取网站音乐素材"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
音频
网站
地址
素材
音乐
数据
网页
链接
代码
内容
参数
标题
模块
环境
学习
开发
搜索
复杂
实用
明显
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
国家网络安全主题教育发言材料
如何判断服务器有没有被rdp
美团买菜服务器正忙
网络安全人物简笔画
经典数据库笔试题
盐田区新一代网络技术开发动态
设备软件开发大龄出路
DNS服务器设置为什么
嘉定区信息网络技术
四川浪潮服务器虚拟化安装
网络安全的几个
xp的服务器管理器
dns服务器的分类
武强软件开发项目管理
svn远程服务器管理
网络技术行业都有哪些
vf中删除指定数据库
日照微信公众号软件开发解决方案
海康安防管理平台服务器
网络安全知识手抄报内容 学生
php html数据库查询
方舟生物怎么传服务器
数据库怎么创建表和数据
玉林市亿客网络技术有限公司
如何找到传奇服务器
英国金融交易数据库
镇江软件开发培训班
软件开发产品服务架构
mysql数据库引擎支持事务
ftp服务器版 软件下载