关于jieba.cut与jieba.lcut的区别及说明
作者:stay_foolish12 时间:2022-12-10 17:02:20
jieba.cut与jieba.lcut的区别
jieba.cut生成的是一个生成器,generator,也就是可以通过for循环来取里面的每一个词。
word_list= [word for word in jieba.cut(text)]
jieba.lcut 直接生成的就是一个list
Prefix dict has been built succesfully.
Full Model 我/来/北京/上学
['我', '来', '北京', '上学']
jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut
cut
cut提供最基本的分词功能,返回的结果是个生成器generator,可通过迭代的方法访问各个分词
lcut
lcut和cut方法的区别是:lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()
prosseg
的方法
posseg.cut 和 posseg.lcut的区别雷同,只不过posseg还提供了词性,方便对句法做分析
s = '我们都是小青蛙 呱呱呱呱 喜欢快乐的生活 还会讲笑话'
import jieba
jieba.cut(s) # <generator object cut at 0x10a6e5500>
list(jieba.cut(s)) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
jieba.lcut(s) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
import jieba.posseg
jieba.posseg.cut(s) # <generator object cut at 0x10cc80eb0>
list(jieba.posseg.cut(s)) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
jieba.posseg.lcut(s) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
来源:https://blog.csdn.net/stay_foolish12/article/details/107466309
标签:jieba.cut,jieba.lcut
0
投稿
猜你喜欢
选择utf-8还是GB2312?
2009-06-19 13:05:00
NumPy 与 Python 内置列表计算标准差区别详析
2023-08-28 20:01:19
PL/SQL Number数字类型函数
2010-07-16 13:09:00
Python实现方便使用的级联进度信息实例
2021-04-22 12:31:18
浅谈Python函数式编程的返回函数与匿名函数
2021-02-22 13:40:36
Pycharm设置去除显示的波浪线方法
2022-06-29 16:04:59
微信小程序顶部导航栏可滑动并选中放大
2023-08-23 18:49:59
使用PHP批量生成随机用户名
2023-07-22 13:10:10
解决MYSQL出现Can't create/write to file '/tmp/#sql_5c0_0.MYD'的问题
2024-01-16 07:53:39
Python实现的KMeans聚类算法实例分析
2021-06-28 04:44:49
mysql left join快速转inner join的过程
2024-01-26 19:08:17
python使用SQLAlchemy操作MySQL
2024-01-16 19:11:11
python TK库简单应用(实时显示子进程输出)
2023-10-08 23:08:19
vue 打包后的文件部署到express服务器上的方法
2024-05-09 09:33:05
Python常见MongoDB数据库操作实例总结
2023-07-08 08:48:34
C#操作SQLite数据库之读写数据库的方法
2024-01-27 21:46:33
SQL中DATEADD和DATEDIFF的用法示例介绍
2024-01-27 16:57:58
Python爬虫代理池搭建的方法步骤
2022-08-12 15:31:03
Python使用cx_Oracle调用Oracle存储过程的方法示例
2021-01-26 19:37:28
Django --Xadmin 判断登录者身份实例
2021-08-28 07:59:34