关于jieba.cut与jieba.lcut的区别及说明

作者:stay_foolish12 时间:2022-12-10 17:02:20 

jieba.cut与jieba.lcut的区别

jieba.cut生成的是一个生成器,generator,也就是可以通过for循环来取里面的每一个词。

word_list= [word for word in jieba.cut(text)]

jieba.lcut 直接生成的就是一个list

Prefix dict has been built succesfully.
Full Model 我/来/北京/上学
['我', '来', '北京', '上学']

jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut

  • cut

cut提供最基本的分词功能,返回的结果是个生成器generator,可通过迭代的方法访问各个分词

  • lcut

lcut和cut方法的区别是:lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()

  • prosseg的方法

posseg.cut 和 posseg.lcut的区别雷同,只不过posseg还提供了词性,方便对句法做分析

s = '我们都是小青蛙 呱呱呱呱 喜欢快乐的生活 还会讲笑话'
import jieba
jieba.cut(s)  # <generator object cut at 0x10a6e5500>
list(jieba.cut(s))  # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
jieba.lcut(s)  # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
import jieba.posseg
jieba.posseg.cut(s)  # <generator object cut at 0x10cc80eb0>
list(jieba.posseg.cut(s))  # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
jieba.posseg.lcut(s)  # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]

来源:https://blog.csdn.net/stay_foolish12/article/details/107466309

标签:jieba.cut,jieba.lcut
0
投稿

猜你喜欢

  • 详解python爬虫系列之初识爬虫

    2023-11-21 04:09:41
  • python获取引用对象的个数方式

    2023-06-19 23:10:30
  • Django restframework 源码分析之认证详解

    2021-08-15 12:03:40
  • 在TensorFlow中屏蔽warning的方式

    2023-05-08 10:54:19
  • Python实现的爬取小说爬虫功能示例

    2022-07-14 20:36:16
  • Python遍历字典方式就实例详解

    2021-02-16 08:50:58
  • 对django xadmin自定义菜单的实例详解

    2023-06-19 22:48:21
  • 利用Python绘画双摆操作分享

    2022-12-08 21:30:36
  • 如何基于Python获取图片的物理尺寸

    2023-03-25 00:17:19
  • 简单谈谈Python中的反转字符串问题

    2022-02-24 11:55:07
  • Python破解excel进入密码的过程详解

    2021-06-14 03:06:25
  • 网页设计:巧用记事本编辑网页

    2008-02-05 09:00:00
  • pandas归一化与反归一化操作实现

    2023-07-01 13:24:57
  • python dataframe向下向上填充,fillna和ffill的方法

    2021-11-07 18:16:47
  • Django restframework 框架认证、权限、限流用法示例

    2023-01-17 15:51:20
  • Python可视化神器pyecharts绘制漏斗图

    2023-01-09 08:40:09
  • 如何在Python中创建二叉树

    2022-07-30 06:27:35
  • 数据库技巧——MySQL十大优化技巧

    2011-01-31 16:44:00
  • 使用TensorFlow直接获取处理MNIST数据方式

    2022-12-16 22:35:49
  • Pandas实现一列数据分隔为两列

    2021-01-06 04:31:36
  • asp之家 网络编程 m.aspxhome.com