Python制作词云图代码实例
作者:wx5d72071a58c07 时间:2023-10-24 11:20:21
词云图是将词汇按照频率的高低显示不同大小而形成的图,可以一目了然地看出关键词。下面是词云图的python代码~
#导入需要模块
import jieba
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
text_road=str(input('请输入文章的路径:'))
picture_road=str(input('请输入图片的路径:'))
#加载需要分析的文章
text = open(text_road,'r',encoding='utf-8').read()
#对文章进行分词
wordlist_after_jieba = jieba.cut(text, cut_all=False)
wl_space_split = " ".join(wordlist_after_jieba)
#读取照片通过numpy.array函数将照片等结构数据转化为np-array
mask=np.array(Image.open(picture_road))
#选择屏蔽词,不显示在词云里面
stopwords = set(STOPWORDS)
#可以加多个屏蔽词
stopwords.add("<br/>")
#创建词云对象
wc = WordCloud(
background_color="white",
font_path='/Library/Fonts/Arial Unicode.ttf',
max_words=1000, # 最多显示词数
mask=mask,
stopwords=stopwords,
max_font_size=100 # 字体最大值
)
#生成词云
wc.generate(text)
#从背景图建立颜色方案
image_colors =ImageColorGenerator(mask)
#将词云颜色设置为背景图方案
wc.recolor(color_func=image_colors)
#显示词云
plt.imshow(wc,interpolation='bilinear')
#关闭坐标轴
plt.axis("off")
#显示图像
plt.show()
#保存词云
wc.to_file('词云图.png')
下面这张图是我爬了阿里巴巴招聘网站上所有数据分析职位需求,生成的词云图,大家可以看看阿里对数据分析师的要求~
来源:https://blog.51cto.com/14534896/2436376
标签:python,词,云图
![](/images/zang.png)
![](/images/jiucuo.png)
猜你喜欢
python多进程 主进程和子进程间共享和不共享全局变量实例
2022-11-05 11:42:56
![](https://img.aspxhome.com/file/2023/1/85261_0s.jpg)
asp php 清空access mysql mssql数据库的代码
2023-11-20 21:49:13
python实现文本文件合并
2022-01-06 04:30:27
解决Python中由于logging模块误用导致的内存泄露
2021-08-24 08:04:46
CSS3:文字阴影知多少
2009-06-28 15:33:00
![](https://img.aspxhome.com/file/UploadPic/20096/28/01-91s.png)
JavaScript中对循环语句的优化技巧深入探讨
2024-04-19 10:45:48
![](https://img.aspxhome.com/file/2023/7/135777_0s.jpg)
针对Sqlserver大数据量插入速度慢或丢失数据的解决方法
2024-01-21 02:54:46
Python全栈之队列详解
2022-10-12 07:51:33
![](https://img.aspxhome.com/file/2023/5/85385_0s.png)
go mod 使用私有gitlab群组的解决方案
2024-05-22 10:29:28
MySQL在命名用过程中所遇到的常见问题
2008-12-05 16:03:00
基于layer.js实现收货地址弹框选择然后返回相应的地址信息
2024-05-08 09:32:22
![](https://img.aspxhome.com/file/2023/0/130280_0s.png)
python中__slots__节约内存的具体做法
2023-04-10 16:28:34
SQL查询超时的设置方法(关于timeout的处理)
2024-01-15 21:07:55
如何更优雅地写python代码
2022-03-03 04:53:24
形象化的reflow
2008-06-08 13:33:00
![](https://img.aspxhome.com/file/UploadPic/20086/8/ThumbnailServer2_51s.jpg)
以一段代码为实例快速入门Python2.7
2021-04-24 05:00:06
几款优秀的中文字体设计
2008-03-24 17:25:00
![](https://img.aspxhome.com/file/UploadPic/20083/24/2008324173030354s.jpg)
Go语言判断文件或文件夹是否存在的方法
2024-05-09 14:50:55
pytorch点乘与叉乘示例讲解
2021-01-24 15:43:15
vscode添加GIT和SVN的方法示例
2023-08-24 17:44:38
![](https://img.aspxhome.com/file/2023/7/109547_0s.png)