Python评论提取关键词制作精美词云的方法
发表于:2025-02-06 作者:千家信息网编辑
千家信息网最后更新 2025年02月06日,今天小编给大家分享一下Python评论提取关键词制作精美词云的方法的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获
千家信息网最后更新 2025年02月06日Python评论提取关键词制作精美词云的方法
今天小编给大家分享一下Python评论提取关键词制作精美词云的方法的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。
一、抓取全部评论
评论情况: {'android': 545 次, 'ios': 110 次, 'pc': 44 次, 'uniapp': 1 次}
一个小细节:给我评论的设备中,安卓苹果比是 5:1。
Building prefix dict from the default dictionary ... Loading model cost 0.361 seconds. Prefix dict has been built successfully.
1、找到评论接口
打开 chrome 浏览器,开发者模式
点击评论列表(图标 1)
点击接口链接(图标 2)
查看 response 返回值(评论结果的 json 格式)
2、Python 获取评论
def get_comments(articleId): # 确定评论的页数 main_res = get_commentId(articleId,1) pageCount = json.loads(main_res)['data']['pageCount'] comment_list,comment_list2 = [],[] source_analy = {} for p in range(1,pageCount+1): res = get_commentId(articleId, p) try: commentIds = json.loads(res)['data']['list'] for i in commentIds: commentId = i['info']['commentId'] userName = i['info']['userName'] nickName = i['info']['nickName'] ## 获取用户名 source_dvs = i['info']['commentFromTypeResult']['key'] # 操作设备 content = i['info']['content'] comment_list.append([commentId, userName, nickName, source_dvs, content]) comment_list2.append("%s 丨 %s"%(userName, nickName)) if source_dvs not in source_analy.keys(): source_analy[source_dvs] = 1 else: source_analy[source_dvs] = source_analy[source_dvs] + 1 # print(source_analy) except: print('本页失败!') print('评论数:' + str(len(comment_list))) return source_analy, comment_list, comment_list2
二、文本分词、词云制作
1、文本分析
西红柿采用的是 结巴 分词, 和 wordcloud。
# -*- coding:utf8 -*-import jiebaimport wordcloud
代码实现:
seg_list = jieba.cut(comments, cut_all=False) # 精确模式 word = ' '.join(seg_list)
2、生成词云
背景图 西红柿采用的是 心形图片
pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg')
完整代码::
def word_cloud(articleId): source_analy, comment_list, comment_list2 = get_comments(articleId) print("评论情况:", source_analy) comments = '' for one in comment_list: comment = one[4] if 'face' not in comment: comments = comments + comment seg_list = jieba.cut(comments, cut_all=False) # 精确模式 word = ' '.join(seg_list) pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg') wc = wordcloud.WordCloud(mask=pic, font_path='/Library/Fonts/Songti.ttc', width=1000, height=500, background_color='white').generate(word)
3、初步效果-模糊不清
西红柿发现文字模糊、图像曲线边缘不清晰的问题。
于是,指定分辨率,高清整起来。
# 保存plt.savefig('xin300.png', dpi=300) #指定分辨率保存
4、最终效果-高清无马
以上就是"Python评论提取关键词制作精美词云的方法"这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注行业资讯频道。
评论
知识
篇文章
制作
模式
西红柿
西红
精美
关键
关键词
制作精美
方法
精确
代码
内容
分辨率
图标
情况
接口
效果
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库查询已经有结果
提示网络安全什么意思
青少年网络安全目的
数据库按时间戳查询
按时计费服务器
网络服务器系统结构大纲
hp服务器安装系统
数据库插数据
软件开发甲级资质公司年限
华为通用软件开发北京工资
国内外网络技术现状
绿书签手抄报大全网络安全
北京什么是网络技术优势
北京安卓软件开发大概要多少钱
qq自由幻想服务器版本不一致
数据库的表怎么设计
网络安全模型有哪几种
迅游分配服务器失败
墨尔本大学校友数据库
数据库配置灰度策略
网络技术与应用考试题库
社区类app软件开发公司
上海星战竞网络技术有限公司
游戏服务器宽带要求
网络安全教育宣传作文
网络安全个人作文
数据库工程师都干啥
万方数据库查重报告是什么
大学期末网络安全考试题
silen软件开发