导航：首页 > 开发技术 >

Python评论提取关键词制作精美词云的方法

发表于：2024-10-23 作者：千家信息网编辑

千家信息网最后更新 2024年10月23日，今天小编给大家分享一下Python评论提取关键词制作精美词云的方法的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获

千家信息网最后更新 2024年10月23日Python评论提取关键词制作精美词云的方法

今天小编给大家分享一下Python评论提取关键词制作精美词云的方法的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。

一、抓取全部评论

评论情况： {'android': 545 次, 'ios': 110 次, 'pc': 44 次, 'uniapp': 1 次}

一个小细节：给我评论的设备中，安卓苹果比是 5:1。

Building prefix dict from the default dictionary ... Loading model cost 0.361 seconds. Prefix dict has been built successfully.

1、找到评论接口

打开 chrome 浏览器，开发者模式
点击评论列表（图标 1）
点击接口链接（图标 2）
查看 response 返回值（评论结果的 json 格式）

2、Python 获取评论

def get_comments(articleId):    # 确定评论的页数    main_res = get_commentId(articleId,1)    pageCount = json.loads(main_res)['data']['pageCount']     comment_list,comment_list2 = [],[]    source_analy = {}    for p in range(1,pageCount+1):        res = get_commentId(articleId, p)        try:            commentIds = json.loads(res)['data']['list']            for i in commentIds:                commentId = i['info']['commentId']                userName = i['info']['userName']                nickName = i['info']['nickName']  ## 获取用户名                source_dvs = i['info']['commentFromTypeResult']['key']   # 操作设备                content = i['info']['content']                comment_list.append([commentId, userName, nickName, source_dvs, content])                comment_list2.append("%s 丨 %s"%(userName, nickName))                if source_dvs not in source_analy.keys():                    source_analy[source_dvs] = 1                else:                    source_analy[source_dvs] = source_analy[source_dvs] + 1                # print(source_analy)        except:            print('本页失败！')    print('评论数：' + str(len(comment_list)))    return source_analy, comment_list, comment_list2

二、文本分词、词云制作

1、文本分析

西红柿采用的是结巴分词, 和 wordcloud。

# -*- coding:utf8 -*-import jiebaimport wordcloud

代码实现：

seg_list = jieba.cut(comments, cut_all=False)  # 精确模式    word = ' '.join(seg_list)

2、生成词云

背景图西红柿采用的是心形图片

pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg')

完整代码：：

def word_cloud(articleId):    source_analy, comment_list, comment_list2 = get_comments(articleId)    print("评论情况：", source_analy)    comments = ''    for one in comment_list:        comment = one[4]        if 'face' not in comment:            comments = comments + comment    seg_list = jieba.cut(comments, cut_all=False)  # 精确模式    word = ' '.join(seg_list)     pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg')    wc = wordcloud.WordCloud(mask=pic, font_path='/Library/Fonts/Songti.ttc', width=1000, height=500,                             background_color='white').generate(word)

3、初步效果-模糊不清

西红柿发现文字模糊、图像曲线边缘不清晰的问题。

于是，指定分辨率，高清整起来。

# 保存plt.savefig('xin300.png', dpi=300) #指定分辨率保存

4、最终效果-高清无马

以上就是"Python评论提取关键词制作精美词云的方法"这篇文章的所有内容，感谢各位的阅读！相信大家阅读完这篇文章都有很大的收获，小编每天都会为大家更新不同的知识，如果还想学习更多的知识，请关注行业资讯频道。

很赞哦！

评论知识篇文章制作模式西红柿西红精美关键关键词制作精美方法精确代码内容分辨率图标情况接口效果数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全湖北正规软件开发服务品质保障方舟服务器管理器咋样踢人造成网络安全隐患的原因浙江专业软件开发价格服务标准专门研究软件开发的学科网络安全等级测评费收费指导价获取数据库条数命令法国泰勒斯公司网络安全服务器管理的主要内容群英服务器怎么样杀毒软件开发商计算机网络技术实习手册怎么填个人买服务器设备服务器中国互联网科技项目飞腾服务器直销厂家深学网络安全绝招网络安全思路的内容华为服务器电源改台式机数据库held 河北专业软件开发联系方式金融网络安全重要性 2020怀旧服哪个服务器好打印服务器支持手机直连吗网络安全儿歌内容阿里云服务器电脑壁纸制造业配方管理软件开发怎么看电脑数据库帆软数据库锁软件开发运用的计算机语言

千家信息网