怎么用Python爬取酷狗音乐TOP500
发表于:2024-09-22 作者:千家信息网编辑
千家信息网最后更新 2024年09月22日,这篇文章主要介绍"怎么用Python爬取酷狗音乐TOP500",在日常操作中,相信很多人在怎么用Python爬取酷狗音乐TOP500问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对
千家信息网最后更新 2024年09月22日怎么用Python爬取酷狗音乐TOP500
这篇文章主要介绍"怎么用Python爬取酷狗音乐TOP500",在日常操作中,相信很多人在怎么用Python爬取酷狗音乐TOP500问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"怎么用Python爬取酷狗音乐TOP500"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
上面是网址,
改变数字就可以实现翻页,所以这个不能翻页的问题解决了。然后就是老套路按F12查看找network.
往下翻,发现这些都有注释,那就更好办了。
解析这个数据,拿出来hash值和filename,歌词lyric。
也没什么要说的了,直接贴代码
import requests
from lxml import etree
import json
import re
import os
class kugou():
def startkugou(self):
for i in range(23, 24):
print(i)
res = requests.get('https://www.kugou.com/yy/rank/home/%s-8888.html?from=rank' % str(i))
self.get_song(res)
def get_song(self, res):
html = etree.HTML(res.content.decode('utf8'))
content = html.xpath('//script[10]')
content2 = content[0].text
# 解析出json列表,类型是str
content1 = content2.split('global.features =')[1].split('(function()')[0].strip()[0:-1]
try:
# 转换成json数据
content = json.loads(content1)
for i in range(len(content)):
hash = content[i]["Hash"]
file_name = content[i]["FileName"]
hash_url = "http://www.kugou.com/yy/index.php?r=play/getdata&hash=" + hash
hash_content = requests.get(hash_url)
play_url = ''.join(re.findall('"play_url":"(.*?)"', hash_content.text))
lyrics = ''.join(re.findall('"lyrics":"(.*?)"', hash_content.text))
real_download_url = play_url.replace("\\", "")
try:
# if os.path.exists('kugou/' + file_name + '.txt'):
# print(file_name + " 歌词已经存在")
# # continue
# else:
with open('kugou/' + file_name + '.txt', 'w', encoding='utf8')as f:
f.write(lyrics.encode('utf8').decode('unicode_escape'))
print(file_name + "歌词已下载完成!")
# if os.path.exists('kugou/' + file_name + '.mp3'):
# print(file_name+" 歌曲已经存在")
# # continue
# else:
with open('kugou/' + file_name + ".mp3", "wb")as fp:
fp.write(requests.get(real_download_url).content)
print(file_name + "歌曲已下载完成!")
except OSError as e:
print("出现异常" + file_name)
file_name = self.validateTitle(file_name)
# if os.path.exists('kugou/' + file_name + '.txt'):
# print(file_name + " 歌词已经存在")
# # continue
# else:
with open('kugou/' + file_name + '.txt', 'w', encoding='utf8')as f:
f.write(lyrics.encode('utf8').decode('unicode_escape'))
print(file_name + "歌词已下载完成!")
# if os.path.exists('kugou/' + file_name + '.mp3'):
# print(file_name + " 歌曲已经存在")
# # continue
# else:
with open('kugou/' + file_name + ".mp3", "wb")as fp:
fp.write(requests.get(real_download_url).content)
print(file_name + "歌曲已下载完成!")
except json.decoder.JSONDecodeError as e:
print(e)
print(content2)
content1 = content2.split('global.features =')[1].strip().split('(function() {')[0].strip()
content1 = content1[0:-1]
print(content1)
def validateTitle(self, file_name):
""" 将 title 名字 规则化
:param title: title name 字符串
:return: 文件命名支持的字符串 """
rstr = r"[\=\(\)\,\/\\\:\*\?\"\<\>\|\' ']" # '= ( ) , / \ : * ? " < > | ' 还有空格
new_title = re.sub(rstr, "_", file_name) # 替换为下划线
return new_title
if __name__ == '__main__':
kugou().startkugou()
到此,关于"怎么用Python爬取酷狗音乐TOP500"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
歌词
音乐
歌曲
学习
字符
字符串
数据
更多
问题
帮助
实用
接下来
没什么
下划线
代码
名字
就是
数字
文件
文章
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
实时数据库表结构
云开发数据库安全规则
各服务器开服英雄是什么
平果手机显示没有服务器怎么办
北京手机软件开发品牌企业
数据库管理百万量级数据
汉之星软件开发
手机通话显示未连接服务器
相册数据库
顺义区品牌软件开发价格信息
网络安全实例分析与研究
网络安全攻击与防护的实现
倩女幽魂手游魅族服务器
密云数据库安全审计系统
安全通信服务器
网站服务器怎么打开
网络安全厂家哪个好
服务器最早品牌
浏览器和服务器交互的协议是啥
崂山区游戏软件开发哪家好
蜜罐武汉互联网科技有限公司电话
安康市系统软件开发
cft网络安全比赛
diagbox服务器验证
以政治必修一谈网络安全
石排软件开发定制
彩虹六号异种链接服务器失败
数据库访问技术怎么学
电脑网络安全管理规定
手机日期同步服务器