Python中文分词实现方法(安装pymmseg)
作者:zeo 时间:2023-12-06 02:43:41
本文实例讲述了Python中文分词实现方法。分享给大家供大家参考,具体如下:
在Python这pymmseg-cpp 还是十分方便的!
环境 ubuntu10.04 , python2.65
步骤:
1 下载mmseg-cpp的源代码 http://code.google.com/p/pymmseg-cpp/
2 执行:
tar -zxf pymmseg-cpp*.tar.gz //解压后得到pymmseg 目录
cd pymmseg\mmseg-cpp
python build.py #生成 mmseg.so文件
3 将 pymmseg 目录复制到 /usr/local/lib/python2.6/dist-packages 中
4 测试有没有成功:
test.py文件:
from pymmseg import mmseg
mmseg.dict_load_defaults()
text = '今天的天气真好啊,我们一起出去玩一下吧'
algor = mmseg.Algorithm(text)
for tok in algor:
print '%s [%d..%d]' % (tok.text, tok.start, tok.end)
希望本文所述对大家Python程序设计有所帮助。
标签:Python,中文分词


猜你喜欢
oracle常用函数汇总(分享)
2024-01-12 17:03:56
Python+Socket实现基于TCP协议的客户与服务端中文自动回复聊天功能示例
2023-07-18 20:11:01

Go语言kube-scheduler深度剖析开发之scheduler初始化
2024-04-23 09:37:08

Python enumerate()计数器简化循环
2022-07-31 22:15:43
浅谈Python协程asyncio
2021-01-12 21:30:32
PHP判断密码强度的方法详解
2023-06-14 03:00:08
mysql5.7.20第一次登录失败的快速解决方法
2024-01-19 16:57:36

tensorflow 中对数组元素的操作方法
2022-01-22 11:35:37

Python Matplotlib库入门指南
2022-04-27 11:51:01
深入讲解Python函数中参数的使用及默认参数的陷阱
2022-04-21 20:09:14
python实现绘制树枝简单示例
2022-05-05 23:02:25

python查看微信好友是否删除自己
2021-01-31 23:16:32
vue不通过路由直接获取url中参数的方法示例
2024-04-30 08:41:06
PHP实现动态删除XML数据的方法示例
2024-06-05 09:51:28

python中序列的逆序方式
2023-12-12 19:49:07
python多线程socket编程之多客户端接入
2021-01-26 10:14:52

Python完美还原超级玛丽游戏附代码与视频
2022-03-20 16:57:41

解决django服务器重启端口被占用的问题
2023-11-10 14:14:12

Thinkphp5.0 框架使用模型Model添加、更新、删除数据操作详解
2024-06-07 15:35:37
深入解读Python解析XML的几种方式
2022-11-29 02:52:31
