关于jieba.cut与jieba.lcut的区别及说明

作者:stay_foolish12 时间:2022-12-10 17:02:20 

jieba.cut与jieba.lcut的区别

jieba.cut生成的是一个生成器,generator,也就是可以通过for循环来取里面的每一个词。

word_list= [word for word in jieba.cut(text)]

jieba.lcut 直接生成的就是一个list

Prefix dict has been built succesfully.
Full Model 我/来/北京/上学
['我', '来', '北京', '上学']

jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut

  • cut

cut提供最基本的分词功能,返回的结果是个生成器generator,可通过迭代的方法访问各个分词

  • lcut

lcut和cut方法的区别是:lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()

  • prosseg的方法

posseg.cut 和 posseg.lcut的区别雷同,只不过posseg还提供了词性,方便对句法做分析

s = '我们都是小青蛙 呱呱呱呱 喜欢快乐的生活 还会讲笑话'
import jieba
jieba.cut(s)  # <generator object cut at 0x10a6e5500>
list(jieba.cut(s))  # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
jieba.lcut(s)  # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
import jieba.posseg
jieba.posseg.cut(s)  # <generator object cut at 0x10cc80eb0>
list(jieba.posseg.cut(s))  # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
jieba.posseg.lcut(s)  # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]

来源:https://blog.csdn.net/stay_foolish12/article/details/107466309

标签:jieba.cut,jieba.lcut
0
投稿

猜你喜欢

  • 选择utf-8还是GB2312?

    2009-06-19 13:05:00
  • NumPy 与 Python 内置列表计算标准差区别详析

    2023-08-28 20:01:19
  • PL/SQL Number数字类型函数

    2010-07-16 13:09:00
  • Python实现方便使用的级联进度信息实例

    2021-04-22 12:31:18
  • 浅谈Python函数式编程的返回函数与匿名函数

    2021-02-22 13:40:36
  • Pycharm设置去除显示的波浪线方法

    2022-06-29 16:04:59
  • 微信小程序顶部导航栏可滑动并选中放大

    2023-08-23 18:49:59
  • 使用PHP批量生成随机用户名

    2023-07-22 13:10:10
  • 解决MYSQL出现Can't create/write to file '/tmp/#sql_5c0_0.MYD'的问题

    2024-01-16 07:53:39
  • Python实现的KMeans聚类算法实例分析

    2021-06-28 04:44:49
  • mysql left join快速转inner join的过程

    2024-01-26 19:08:17
  • python使用SQLAlchemy操作MySQL

    2024-01-16 19:11:11
  • python TK库简单应用(实时显示子进程输出)

    2023-10-08 23:08:19
  • vue 打包后的文件部署到express服务器上的方法

    2024-05-09 09:33:05
  • Python常见MongoDB数据库操作实例总结

    2023-07-08 08:48:34
  • C#操作SQLite数据库之读写数据库的方法

    2024-01-27 21:46:33
  • SQL中DATEADD和DATEDIFF的用法示例介绍

    2024-01-27 16:57:58
  • Python爬虫代理池搭建的方法步骤

    2022-08-12 15:31:03
  • Python使用cx_Oracle调用Oracle存储过程的方法示例

    2021-01-26 19:37:28
  • Django --Xadmin 判断登录者身份实例

    2021-08-28 07:59:34
  • asp之家 网络编程 m.aspxhome.com