千家信息网

如何利用Python生成词云

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,这篇文章主要介绍"如何利用Python生成词云",在日常操作中,相信很多人在如何利用Python生成词云问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"如何利用Pytho
千家信息网最后更新 2025年01月23日如何利用Python生成词云

这篇文章主要介绍"如何利用Python生成词云",在日常操作中,相信很多人在如何利用Python生成词云问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"如何利用Python生成词云"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

前言:

话说,在这个大数据时代,获取信息显得极为容易,可正是如此,我们想要对信息进行直观地了解难度就大了。

Excel是一个很好的数据可视化方法,不过有时候我们的数据来源可能并不是一张或者多张Excel表格,这样子的话如果我们想利用Excel进行数据可视化就显得不是那么容易。

首先我们需要逐个将数据导入到Excel中,然后再用Excel的图表对数据进行可视化分析。在信息量大的情况下,这么做显然得不偿失,我们只是想对数据进行一个直观的了解,为什么要搞得这么复杂呢?

以上的问题是很多人会遇到的,因此一些数据可视化方式便应运而生,例如词云。大家看看这张图片


是不是非常直观并且炫酷呢?

现在,想做出这样子的图片的小伙伴们,跟着我,我手把手教你们做出这样子的词云,这里的实现方法是使用Python中的相关库

安装方法如下

pip install matplotlibpip install numpypip install jieba

以上的三个命令的作用是分别安装:matplotlib,numpy以及jieba这三个库。当然有些同学可能已经安装过了。想要检验是否有安装,可以在命令行下输入

pip list

这样子即可显示你已经安装的库,如果没有全部出现上面的3个库,请在命令行下执行对应的命令并且等待安装成功。

如果你没有安装Python或者输入pip显示不是内部命令,请移步这篇文章

Python小白环境搭建-开箱即用

现在直接上代码,代码上面有注释,相信你一定能看懂

# worcloud是生成词云的关键import wordcloud# numpy是一个强大的科学计算库,我们将用它来把PIL库打开的图片保存为数组import numpy as np# PIL是一个图像处理库,用来打开图片from PIL import Image# jieba是中文分词库,可以智能地拆分词语import jieba# matplotlib库是一个绘图库,可以用来显示图片以及绘制多种图形import matplotlib.pyplot as plt
# 生成背景图片的两种方法## 注意背景图片的路径要写对,可以是完整路径,例如C:/image/test.jpg# 若图片与Python代码在同一个文件夹,那可以直接写图片名称+后缀,例如test.jpg# 1.使用 matplotlib库读取图片bg_1=plt.imread("background_image_1.jpg")
# 2.使用numpy库和PIL库,PIL库用于打开图片,numpy库用于将图片转化为数组# 下面这行代码我注释掉了# bg_2=np.array(Image.open('background_image_2.jpg'))
# 对于以上的图片选择,要特别注意图片的背景应该为白色

#配置词云的背景,图片,字体大小等参数,# 也可以不配置,直接 wc=wordcloud.WordCloud()wc=wordcloud.WordCloud( # font_path为字体文件的路径,如果没有这个,那么生成的词云图片无法显示中文 font_path="C:/Windows/Fonts/simfang.ttf",
# scale为按比例放大或者缩小生成的图片。例如1.5表示图片放大为原来的1.5倍,可省略 scale=1.5,
# mask表示背景图片,如果不没有背景图片,那这个可以省略 mask=bg_1,
# background_color为背景颜色,默认为黑色,可以省略 background_color="black",
# width为词云生成的图片宽度,默认为400 width=600,
# height为词云生成的图片高度,默认为200 height=400,
# max_words图片上显示的最大词语的个数 max_words=1000,
# max_font_size为最大字体的大小 max_font_size=120,
# min_font_size为最小字体大小,默认为4 min_font_size=4)
# 打开要生成词云的文件,一般是txt格式的纯文本文档with open('词云来源.txt','r',encoding="utf-8") as f:
# text=f.read()是说读取 词云来源.txt 这个文件的所有内容并存储到变量text中 text=f.read()
# 利用jieba库把text拆分并且使用空格分隔拆分后的结果 spilt_text=" ".join(jieba.lcut(text))
print("正在生成词云,预计时间35s......")
# 调用generate方法,传入要生成词云的文本
wc.generate(spilt_text)
# 把词云保存成图片wc.to_file('wordcloud.jpg')
print("生成完毕!")

背景图片


词云效果


到此,关于"如何利用Python生成词云"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

0