怎么用Python爬取酷狗音乐TOP500
发表于:2025-01-31 作者:千家信息网编辑
千家信息网最后更新 2025年01月31日,这篇文章主要介绍"怎么用Python爬取酷狗音乐TOP500",在日常操作中,相信很多人在怎么用Python爬取酷狗音乐TOP500问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对
千家信息网最后更新 2025年01月31日怎么用Python爬取酷狗音乐TOP500
这篇文章主要介绍"怎么用Python爬取酷狗音乐TOP500",在日常操作中,相信很多人在怎么用Python爬取酷狗音乐TOP500问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"怎么用Python爬取酷狗音乐TOP500"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
上面是网址,
改变数字就可以实现翻页,所以这个不能翻页的问题解决了。然后就是老套路按F12查看找network.
往下翻,发现这些都有注释,那就更好办了。
解析这个数据,拿出来hash值和filename,歌词lyric。
也没什么要说的了,直接贴代码
import requests
from lxml import etree
import json
import re
import os
class kugou():
def startkugou(self):
for i in range(23, 24):
print(i)
res = requests.get('https://www.kugou.com/yy/rank/home/%s-8888.html?from=rank' % str(i))
self.get_song(res)
def get_song(self, res):
html = etree.HTML(res.content.decode('utf8'))
content = html.xpath('//script[10]')
content2 = content[0].text
# 解析出json列表,类型是str
content1 = content2.split('global.features =')[1].split('(function()')[0].strip()[0:-1]
try:
# 转换成json数据
content = json.loads(content1)
for i in range(len(content)):
hash = content[i]["Hash"]
file_name = content[i]["FileName"]
hash_url = "http://www.kugou.com/yy/index.php?r=play/getdata&hash=" + hash
hash_content = requests.get(hash_url)
play_url = ''.join(re.findall('"play_url":"(.*?)"', hash_content.text))
lyrics = ''.join(re.findall('"lyrics":"(.*?)"', hash_content.text))
real_download_url = play_url.replace("\\", "")
try:
# if os.path.exists('kugou/' + file_name + '.txt'):
# print(file_name + " 歌词已经存在")
# # continue
# else:
with open('kugou/' + file_name + '.txt', 'w', encoding='utf8')as f:
f.write(lyrics.encode('utf8').decode('unicode_escape'))
print(file_name + "歌词已下载完成!")
# if os.path.exists('kugou/' + file_name + '.mp3'):
# print(file_name+" 歌曲已经存在")
# # continue
# else:
with open('kugou/' + file_name + ".mp3", "wb")as fp:
fp.write(requests.get(real_download_url).content)
print(file_name + "歌曲已下载完成!")
except OSError as e:
print("出现异常" + file_name)
file_name = self.validateTitle(file_name)
# if os.path.exists('kugou/' + file_name + '.txt'):
# print(file_name + " 歌词已经存在")
# # continue
# else:
with open('kugou/' + file_name + '.txt', 'w', encoding='utf8')as f:
f.write(lyrics.encode('utf8').decode('unicode_escape'))
print(file_name + "歌词已下载完成!")
# if os.path.exists('kugou/' + file_name + '.mp3'):
# print(file_name + " 歌曲已经存在")
# # continue
# else:
with open('kugou/' + file_name + ".mp3", "wb")as fp:
fp.write(requests.get(real_download_url).content)
print(file_name + "歌曲已下载完成!")
except json.decoder.JSONDecodeError as e:
print(e)
print(content2)
content1 = content2.split('global.features =')[1].strip().split('(function() {')[0].strip()
content1 = content1[0:-1]
print(content1)
def validateTitle(self, file_name):
""" 将 title 名字 规则化
:param title: title name 字符串
:return: 文件命名支持的字符串 """
rstr = r"[\=\(\)\,\/\\\:\*\?\"\<\>\|\' ']" # '= ( ) , / \ : * ? " < > | ' 还有空格
new_title = re.sub(rstr, "_", file_name) # 替换为下划线
return new_title
if __name__ == '__main__':
kugou().startkugou()
到此,关于"怎么用Python爬取酷狗音乐TOP500"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
歌词
音乐
歌曲
学习
字符
字符串
数据
更多
问题
帮助
实用
接下来
没什么
下划线
代码
名字
就是
数字
文件
文章
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
成都网络安全公司
河北定制网络技术咨询信息推荐
软件开发准备工作内容
e5v3配什么服务器主板
黄山斯矣网络技术有限公司
毕马威网络安全保险预测
上海威力网络技术
信息技术网络安全应急预案
网络安全六问六答
电脑网络技术干什么的
庄河红光宾馆网络安全
软件开发c 面试题目
新形势下网络安全面临的挑战
syql数据库
开启服务器数据库
铁人三项赛网络安全
oscar 数据库
项目数据库与java
人工智能软件开发实训报告
EI数据库收录是什么意思
锐取录播服务器型号
网络安全风险和管控目标
一拳超人服务器爆满如何进去
廊坊双线服务器托管
软件开发在线学习
适时修订有关网络安全管理以及
数据库检测语句
共用数据库
无锡华硕服务器维修服务站
易语言可以建多少个数据库