Python评论提取关键词制作精美词云的方法
发表于:2024-10-23 作者:千家信息网编辑
千家信息网最后更新 2024年10月23日,今天小编给大家分享一下Python评论提取关键词制作精美词云的方法的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获
千家信息网最后更新 2024年10月23日Python评论提取关键词制作精美词云的方法
今天小编给大家分享一下Python评论提取关键词制作精美词云的方法的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。
一、抓取全部评论
评论情况: {'android': 545 次, 'ios': 110 次, 'pc': 44 次, 'uniapp': 1 次}
一个小细节:给我评论的设备中,安卓苹果比是 5:1。
Building prefix dict from the default dictionary ... Loading model cost 0.361 seconds. Prefix dict has been built successfully.
1、找到评论接口
打开 chrome 浏览器,开发者模式
点击评论列表(图标 1)
点击接口链接(图标 2)
查看 response 返回值(评论结果的 json 格式)
2、Python 获取评论
def get_comments(articleId): # 确定评论的页数 main_res = get_commentId(articleId,1) pageCount = json.loads(main_res)['data']['pageCount'] comment_list,comment_list2 = [],[] source_analy = {} for p in range(1,pageCount+1): res = get_commentId(articleId, p) try: commentIds = json.loads(res)['data']['list'] for i in commentIds: commentId = i['info']['commentId'] userName = i['info']['userName'] nickName = i['info']['nickName'] ## 获取用户名 source_dvs = i['info']['commentFromTypeResult']['key'] # 操作设备 content = i['info']['content'] comment_list.append([commentId, userName, nickName, source_dvs, content]) comment_list2.append("%s 丨 %s"%(userName, nickName)) if source_dvs not in source_analy.keys(): source_analy[source_dvs] = 1 else: source_analy[source_dvs] = source_analy[source_dvs] + 1 # print(source_analy) except: print('本页失败!') print('评论数:' + str(len(comment_list))) return source_analy, comment_list, comment_list2
二、文本分词、词云制作
1、文本分析
西红柿采用的是 结巴 分词, 和 wordcloud。
# -*- coding:utf8 -*-import jiebaimport wordcloud
代码实现:
seg_list = jieba.cut(comments, cut_all=False) # 精确模式 word = ' '.join(seg_list)
2、生成词云
背景图 西红柿采用的是 心形图片
pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg')
完整代码::
def word_cloud(articleId): source_analy, comment_list, comment_list2 = get_comments(articleId) print("评论情况:", source_analy) comments = '' for one in comment_list: comment = one[4] if 'face' not in comment: comments = comments + comment seg_list = jieba.cut(comments, cut_all=False) # 精确模式 word = ' '.join(seg_list) pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg') wc = wordcloud.WordCloud(mask=pic, font_path='/Library/Fonts/Songti.ttc', width=1000, height=500, background_color='white').generate(word)
3、初步效果-模糊不清
西红柿发现文字模糊、图像曲线边缘不清晰的问题。
于是,指定分辨率,高清整起来。
# 保存plt.savefig('xin300.png', dpi=300) #指定分辨率保存
4、最终效果-高清无马
以上就是"Python评论提取关键词制作精美词云的方法"这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注行业资讯频道。
评论
知识
篇文章
制作
模式
西红柿
西红
精美
关键
关键词
制作精美
方法
精确
代码
内容
分辨率
图标
情况
接口
效果
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
湖北正规软件开发服务品质保障
方舟服务器管理器咋样踢人
造成网络安全隐患的原因
浙江专业软件开发价格服务标准
专门研究软件开发的学科
网络安全等级测评费收费指导价
获取数据库条数命令
法国泰勒斯公司网络安全
服务器管理的主要内容
群英服务器怎么样
杀毒软件开发商
计算机网络技术实习手册怎么填
个人买服务器
设备服务器
中国互联网科技项目
飞腾服务器直销厂家
深学网络安全绝招
网络安全思路的内容
华为服务器电源改台式机
数据库held
河北专业软件开发联系方式
金融网络安全重要性
2020怀旧服哪个服务器好
打印服务器支持手机直连吗
网络安全儿歌内容
阿里云服务器电脑壁纸
制造业配方管理软件开发
怎么看电脑数据库
帆软数据库锁
软件开发运用的计算机语言