怎么用Python采集雪中悍刀行的弹幕做成词云
发表于:2025-01-18 作者:千家信息网编辑
千家信息网最后更新 2025年01月18日,这篇文章主要为大家展示了"怎么用Python采集雪中悍刀行的弹幕做成词云",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"怎么用Python采集雪中悍刀行的弹
千家信息网最后更新 2025年01月18日怎么用Python采集雪中悍刀行的弹幕做成词云
这篇文章主要为大家展示了"怎么用Python采集雪中悍刀行的弹幕做成词云",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"怎么用Python采集雪中悍刀行的弹幕做成词云"这篇文章吧。
前言
最近已经播完第一季的电视剧《雪中悍刀行》,从播放量就可以看出观众对于这部剧的期待,总播放量达到50亿,可让人遗憾的是,豆瓣评分只有5.7,甚至都没有破6。
很多人会把这个剧和《庆余年》做对比,因为主创班底相同
400余万字的同名小说曾被捧为网文界里的"名著",不少粉丝早就对跨界改编有所期待,剧版的主创班底、出品方与2019年的爆款剧《庆余年》相同则放大了这份期待。然而《雪中悍刀行》播出后,书粉的怒火蔓延到了各类讨论场合。
今天就来采集这部剧的一部分视频弹幕,看看观众都说了啥,为什么播放量高,口碑却低
知识点介绍
requests模块的使用
pandas保存表格数据
pyecharts做词云图可视化
环境介绍
python 3.8
pycharm
requests >>> pip install requests
pyecharts >>> pip install pyecharts
代码实现
1. 导入模块
import reimport requests # 发送网络请求import pandas as pd # 保存数据
2. 发送网络请求
headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'}# 构建一个列表储存数据data_list = []for page in range(15, 1500, 30): url = f'https://mfm.video.qq.com/danmu?otype=json&target_id=7626435152%26vid%3Dp0041oidttf&session_key=0%2C174%2C1642248894×tamp={page}' esponse = requests.get(url=url, headers=headers)
3. 获取数据 弹幕内容
json_data = response.json()
4. 解析数据(筛选数据) 提取想要的一些内容 不想要的忽略掉
comments = json_data['comments']print(comments)for comment in comments: data_dict = {} data_dict['commentid'] = comment['commentid'] content = comment['content'] content = re.sub(r'[\x0e\xa0]', '', content) data_dict['content'] = content data_dict['opername'] = comment['opername'] print(data_dict) data_list.append(data_dict)
5. 保存数据
df = pd.DataFrame(data_list)# 乱码, 指定编码 为 utf-8 或者是 gbk 或者 utf-8-sigdf.to_csv('data.csv', encoding='utf-8-sig')
6. 词云图可视化
import jiebafrom pyecharts.charts import WordCloudimport pandas as pdfrom pyecharts import options as optswordlist = []data = pd.read_csv('data.csv')['content']dataa = [list(z) for z in zip(word, count)]c = ( WordCloud() .add('', a, word_size_range=[10, 50], shape='circle') .set_global_opts(title_opts=opts.TitleOpts(title="词云图")))c.render_notebook()
以上是"怎么用Python采集雪中悍刀行的弹幕做成词云"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
数据
内容
云图
篇文章
相同
余年
模块
班底
知识
网络
观众
主创
可视化
学习
帮助
成功
遗憾
乱码
代码
前言
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
桓台设备配件工具软件开发报价
江苏腾奕网络技术有限公司电话
怎样维护网络安全作文
nb服务器
lol新疆服务器
怎么用代理服务器上网
天龙八部荣耀版服务器开服时间
服务器系统和硬件的区别
漯河做app的软件开发
蓝牙透传 软件开发
网络技术应用的领域
数据库dump包空间不足
网络技术人员工作职责
服务器维护管理规定
我国网络安全的不足与措施
泛亚汽车技术中心数据库
湖州软件开发总结
网络安全检查坚持什么
韶山靠谱软件开发公司
成都工业软件开发费用是多少
有哪些知名的数据库
考三级数据库用哪个版本
服务器连不上dnf
服务器里数据库是什么东西
广西系统软件开发服务商
单元格格式切换成数据库
怎样创建数据库sql
软件开发入职逻辑思维测试
韶山靠谱软件开发公司
购买dns服务器