Python生成词云的实现代码
作者:Blue 发布时间:2023-09-12 22:42:48
标签:Python,词云
1 概述
利用Python生成简单的词云,需要的工具是cython,wordcloud与anaconda.
2 准备工作
包括安装cython,wordcloud与anaconda.
2.1 安装anaconda
下载官网
选择对应的版本下载即可.
2.2 安装cython
cython是为了安装wordcloud准备的.
pip -m pip install --upgrade cython
2.3 安装wordcloud
安装wordcloud前需要先安装Microsoft Visuall C++ 14.0.
这里下载
安装好了以后重启,输入
python -m easy_install wordcloud
3 使用
3.1 打开Jupyter
打开Jupyter Notebook.
然后会在浏览器打开这个页面,新建一个notebook.
先把需要的库导入:
from wordcloud import WordCloud
import matplotlib.pyplot as plt
3.2 创建文字库
简单的文字库可以直接选择一个txt文件,复杂的话可以选择创建一个excel,导出为csv文件,然后利用pandas库的read_csv()读入文件.这里创建一个txt,空格分隔单词即可.
然后上传到Jupyter中:
3.3 生成词云
首先读入文件:
text = open('1.txt').read()
然后使用WordCloud().generate(text),在里面设置各种属性.
wc=WordCloud(
width=800,
repeat=True,
height=800).generate(text)
这里设置了高度与宽度,允许重复.
plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.show()
显示词云,
interpolation='bilinear'
会使显示平滑更加平滑,axis("off")表示不显示坐标轴.
下面是效果:
3.4 注意事项
如果含有汉字,首先在读取时设置编码:
text = open('1.txt',encoding='utf-8')
然后再生成词云时设置字体:
wc = WordCloud(font_path=r'C:\Windows\Fonts\simfang.ttf')
测试:
text=open('1.txt',encoding='utf-8').read()
wc=WordCloud(
width=1300,
repeat=True,
font_path=r'C:\Windows\Fonts\simfang.ttf',
height=1300).generate(text)
plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.savefig('aaaa.jpg')
来源:https://segmentfault.com/a/1190000021574005


猜你喜欢
- 前言入门爬虫很容易,几行代码就可以,可以说是学习 Python 最简单的途径。刚开始动手写爬虫,你只需要关注最核心的部分,也就是先成功抓到数
- 昨天有人在群里问图1的边框效果是否能实现。 边框效果图有人给出答案,需要嵌套一个元素实现。我当时粗粗写了个测试页面,但是时间太晚了,也没有细
- 本文实例讲述了jquery判断单选按钮radio是否选中的方法。分享给大家供大家参考。具体如下:html代码如下:<input typ
- JSON格式数据简介JSON 全称“JavaScript Object Notation”,译为&a
- django是python语言快速实现web服务的大杀器,其开发效率可以非常的高!但因为秉承了语言的灵活性,django框架又太灵活,以至于
- 本文实例为大家分享了Python感知器算法实现的具体代码,供大家参考,具体内容如下先创建感知器类:用于二分类# -*- coding: ut
- 本文实例讲述了python简单实现基数排序算法。分享给大家供大家参考。具体实现方法如下:from random import randint
- MySQL 如何从表中取出随机数据 以前在群里讨论过这个问题,比较的有意思.mysql的语法真好玩. 他们原来都想用P
- 在做我的友情链接批量检查工具过程中,碰到一些情况,就是对方网页会用gzip压缩。用gzip压缩的好处是,能压缩网页大小,加快网页的浏览速度,
- 我大概思考了下有如下几种方法可以解决: 1.在图片服务器上开通FTP,人为添加图片地址即可,但不方便,特别是在可视编辑器中看图还的多一部操作
- '************************************* '读取文件 &
- 对于golang, 交换两个数很简单,如下这么写就可以了:i, j = j, i等号左边和右边含有多个表达式,这就是平行赋值。 赋值分为两个
- js 代码中经常会碰到 undefined 这种错误,下面本文分享一下为什么会发生这种错误以及如何处理这种错误,js 中如果通过 var 声
- python 实现单例的方法第一种方法:使用基类New 是真正创建实例对象的方法,所以重写基类的new 方法,以此保证创建对象的时候只生成一
- 最近看到好多人说到tns或者数据库不能登录等问题,就索性总结了下面的文档。首先来说Oracle的网络结构,往复杂处说能加上加密、LDAP等等
- 1.建立Recordset对象Dim objMyRstSet objMyRst=Server.CreateObject(&ldquo
- 目录1.根据默认的行列索引操作1.1行删除1.2列删除2.根据自定义的行列索引操作2.1行删除2.2列删除本文介绍Pandas中DataFr
- 在任何编辑器中,获取光标位置都是非常重要的,很多人可能认为较难,其实只要处理好浏览器的兼容,还是比较容易实现的。下面我们一起来看看如何获取到
- 版本Sublime Text v4.0(4143) 所需软件Sublime Text v4.0(4143)下载地址:https://www.
- 我的Python环境:3.7在Python类里声明一个装饰器,并在这个类里调用这个装饰器。代码如下:class Test():