详解Python数据可视化编程 - 词云生成并保存(jieba+WordCloud)
作者:Mu盒子 发布时间:2023-08-22 18:03:06
标签:python,词云,wordcloud,jieba
思维导图:
效果(语句版):
源码:
# -*- coding: utf-8 -*-
"""
Created on Tue Mar 5 17:59:29 2019
@author: dell
"""
# =============================================================================
# 步骤:
# 分割aaa = jieba.cut(str,cut_all=True/False)
# 连接bbb = " ".join(aaa)
# 制作xxx = WordCloud(background_color,font_path).generate(bbb) #bbb为字符串
# 显示plt.imshow(xxx) #不能用plt.show()
# 取消坐标轴的显示Matplotlib.pyplot.axis("off")
# 存为图片xxx.to_file(path)
# =============================================================================
from wordcloud import WordCloud
from matplotlib import pyplot as plt
import jieba
with open("pythonTest.txt",encoding="utf-8") as f:
text = f.read()
#textFromFile = open("pythonTest",encoding = "UTF-8").read()
word_list = jieba.cut("ABVDEFG",cut_all=True) #切成了一个个的字符串
xxx = " ".join(word_list) #"分隔符".join(需要被连接的数据) 将内容连接为字符串
myWordCloud = WordCloud(background_color="white",font_path='C:\windows\Fonts\STZHONGS.TTF').generate(text)
#myWordCloud = WordCloud(background_color="white",width=1000,height=860,font_path='C:\windows\Fonts\STZHONGS.TTF').generate(text)
plt.axis("off")
#plt.show(myWordCloud) #没有实际显示,只有背景!!!
plt.imshow(myWordCloud)
myWordCloud.to_file("词云图片.jpg") #保存为图片
注意事项:
<一> jieba分词
分词后的返回值类型
分词后的返回值
如何去除所要分离文本的中英文符号,还有空格符
import jieba
wordList = jieba.cut("机器学习,算法对新鲜样本!的适应能力:叫泛化能力",cut_all=False)
print(type(wordList)) #类型是一个生成器generator
print(wordList) #本身是一个生成器对象generator Object
for list in wordList:
if list in ",./;'[]~!@#$%^&*()_+,。、;‘ 【】~!@#¥%……&*()——+《 》?:“{}<>?:\n\r":
None
else:
print(list)
<二> 对词图进行重新上色的注意事项
recolor(color_func=color) 正确
recolor(color) 错误
<三> 读取图片时候的注意事项
a = np.array(Image.open(路径))
<四> python中文件路径注意事项
使用 \\
使用 /
<五> Spyder中的注释快捷键
单行注释:Ctrl+1
块注释:Ctrl+4
以上所述是小编给大家介绍的Python数据可视化编程 - 词云生成并保存(jieba+WordCloud)详解整合,希望对大家有所帮助
来源:https://blog.csdn.net/qq_42292831/article/details/88199877


猜你喜欢
- 本文实例为大家解析了vue中track-by的属性,供大家参考,具体内容如下api:http://cn.vuejs.org/guide/li
- yaml文件内容apiVersion: policy/v1beta1kind: PodSecurityPolicymetadata: &nb
- 该爬虫应用了创建文件夹的功能:#file settingfolder_path = "D:/spider_things/2016.
- KNN核心算法函数,具体内容如下#! /usr/bin/env python3# -*- coding: utf-8 -*-# fileNa
- python3.6.4安装opencv3.4.2使用pip安装OpenCV直接安装最新版:pip3 install opencv_pytho
- 这个代表显示宽度整数列的显示宽度与mysql需要用多少个字符来显示该列数值,与该整数需要的存储空间的大小都没有关系
- 目录什么是异常?异常处理try-except 格式一-try...except...格式二-try...except {error
- 前几天,我们用虚拟机安装了Ubuntu 20.04。今天,我们来安装一些常用的工具,比如Pycharm。 Pycharm是一种用来开发Pyt
- 代码如下:<?php$a;$b = false;$c = '';$d = 0;$e = null;$f = array
- 正常情况下,当我们定义了一个class,创建了一个class的实例后,我们可以给该实例绑定任何属性和方法,这就是动态语言的灵活性。先定义cl
- 前言本文是美团一位大佬写的,还不错拿出来和大家分享下,代码中嵌套在html中sql语句是java框架的写法,理解其sql要执行的语句即可。背
- 一、下载1.mysql官网下载地址:https://downloads.mysql.com/archives/community/2.下载完
- 我最近也在研究MySQL性能优化的路上,那么今天也算个学习笔记吧!在小伙伴们开发的项目中,对于MySQL排查问题找出性能瓶颈来说,最容易发现
- 背景: 由于工作需要,现在有这么一个需求,要合并大量的word文档,而且要在不同的目录
- 如下所示:import numpya = numpy.array(([3,2,1],[2,5,7],[4,7,8]))itemindex =
- 一、函数初识1、定义:将一组语句的集合通过一个名字(函数名)封装起来,要想执行这个函数,只需调用其函数名即可。2、好处:代码重用;保持一致性
- 题记:django如果要并和原有的数据库,那么就需要把现有数据库的表写入model.py中。一,在setting.py中配置好连接数据库的参
- 前言本文目的:根据本人的习惯与理解,用最简洁的表述,介绍爬虫的定义、组成部分、爬取流程,并讲解示例代码。基础爬虫的定义:定向抓取互联网内容(
- 前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。作者:黑白之道刮刮
- 背景:我们在使用数据库的过程中,很多时候要追求性能,特别在处理大批量数据的时候更希望快速处理。那么对SQL SERVER而言,数据库实现大批