如何使用R-wordcloud2包绘制词云
发表于:2024-10-19 作者:千家信息网编辑
千家信息网最后更新 2024年10月19日,小编给大家分享一下如何使用R-wordcloud2包绘制词云,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一 数据准备载入
千家信息网最后更新 2024年10月19日如何使用R-wordcloud2包绘制词云
小编给大家分享一下如何使用R-wordcloud2包绘制词云,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
一 数据准备
载入所需的R包,准备好流浪地球的txt格式的文本文件。
library(jiebaRD) library(jiebaR) library(wordcloud2)
二 分词,统计词频
使用jieba包对文本进行分词。
engine = worker() segment("流浪地球.txt",engine)data <- scan('流浪地球.segment.2019-04-09_22_36_54.txt',sep='\n',what='',encoding="UTF-8") data2 <- freq(data)data2 <- qseg[data]data.words <- data2head(data.words)
三 去掉停词
过滤掉类似"的","你","我们"等类似的无意义的停词,并可根据自己需要设置词频的个数。
#过滤掉1个字的词data.words <- subset(data.words, nchar(as.character(data.words))>1) #过滤停词stop=read.table(file=file.choose(),colClasses="character") stopwords=c(NULL) for(i in 1:dim(stop)[1]){ stopwords=c(stopwords,stop[i,1]) }for(j in 1:length(stopwords)){ data.words <- subset(data.words,data.words!=stopwords[j]) }
四 统计词频
4.1 统计词频
data.freq <- table(unlist(data.words)) data.freq <- rev(sort(data.freq)) data.freq <- data.frame(word=names(data.freq), freq=data.freq)
4.2 根据需要过滤频次
#按词频过滤词,过滤掉只出现过一次的词,这里可以根据需要调整过滤的词频数data.freq=subset(data.freq, data.freq$freq.Freq>=2) head(data.freq) word freq.Var1 freq.Freq1 地球 地球 1642 太阳 太阳 953 发动机 发动机 604 人类 人类 355 地面 地面 306 木星 木星 28
五 绘制词云
5.1 图形设定为"star"
wordcloud2(data.freq[,2:3],color = "random-light", backgroundColor = "grey",shape = 'star')
5.2 汉字图形展示
letterCloud(data.freq[,2:3],word="地球",size = 2)
5.3 指定图形
指定的背景图需要在R包的example文件夹中,本例为微信的开机图,然而不像,,,鬼知道咋回事啊。
world = system.file("examples/download1.jpg",package = "wordcloud2")wordcloud2(data.freq[,2:3], figPath = world, size = 1,color = "black")
OK,词云绘制完毕。
以上是"如何使用R-wordcloud2包绘制词云"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
地球
词频
图形
篇文章
流浪
统计
人类
内容
发动机
地面
太阳
文件
文本
木星
准备
不怎么
个数
回事
大部分
数据
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
宜兴多功能软件开发平均价格
开放式数据库互联技术简称
临沂java软件开发培训价格
岳阳教育网络安全专题
hp服务器客服
文明上网网络安全的黑板报
数据库语句用什么排序
软件开发费计算什么科目
修改数据库字段输入长度
怎么清空流量数据库
xampp远程数据库
博雅数据库南京中医药大学
新能源软件开发工作内容
软件开发原则的定义什么
当今世界软件开发的主流方法
软件开发协议 模板 英文
国外服务器可以做什么
明日之后岩浆湖服务器视频
柳州微信小程序软件开发
千动互联网信息科技有限公司
vs数据库开发
阜阳电商软件开发费用
游戏软件开发公司大专好找
哈尔滨网络安全科技馆
刚开服服务器就爆满了
我的世界天骑服务器
vs ef数据库优先
软件开发法律服务
excel关闭数据库读取
计算机网络技术学生课堂笔记