python同义词替换的实现(jieba分词)
作者:Lty美丽人生 时间:2022-02-10 20:58:00
TihuanWords.txt文档格式
注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。
年休假 年假 年休
究竟 到底
回家场景 我回来了
代码
import jieba
def replaceSynonymWords(string1):
# 1读取同义词表,并生成一个字典。
combine_dict = {}
# synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
for line in open("TihuanWords.txt", "r", encoding='utf-8'):
seperate_word = line.strip().split(" ")
num = len(seperate_word)
for i in range(1, num):
combine_dict[seperate_word[i]] = seperate_word[0]
print(seperate_word)
print(combine_dict)
# 2提升某些词的词频,使其能够被jieba识别出来
jieba.suggest_freq("年休假", tune=True)
# 3将语句切分成单词
seg_list = jieba.cut(string1, cut_all=False)
f = "/".join(seg_list).encode("utf-8")
f = f.decode("utf-8")
print(f)
# 4返回同义词替换后的句子
final_sentence = " "
for word in f.split('/'):
if word in combine_dict:
word = combine_dict[word]
final_sentence += word
else:
final_sentence += word
# print final_sentence
return final_sentence
string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))
结果
来源:https://blog.csdn.net/weixin_44208569/article/details/104048793
标签:python,同义词,替换


猜你喜欢
Python timer定时器两种常用方法解析
2023-07-21 19:20:56
深入解析Go语言编程中slice切片结构
2024-04-25 15:01:23

Python开发的实用计算器完整实例
2023-07-25 17:11:53

理想高通滤波实现Python opencv示例
2022-09-29 03:58:07

使用Python编写简单网络爬虫抓取视频下载资源
2023-11-02 01:44:22

ThinkPHP中limit()使用方法详解
2023-11-14 22:05:04
Python3爬虫爬取英雄联盟高清桌面壁纸功能示例【基于Scrapy框架】
2023-03-07 19:19:59

JavaScript中document.forms[0]与getElementByName区别
2024-04-17 09:55:58
Python 实现递归法解决迷宫问题的示例代码
2021-01-31 08:14:23

Python切片用法实例教程
2023-09-28 15:26:17
根据表名和索引获取需要的列名的存储过程
2024-01-23 04:24:14
使用python实现微信小程序自动签到功能
2021-05-30 10:04:11

rs.open sql,conn,1,1与rs.open sql,conn,1.3还有rs.open sql,conn,3,2区别
2011-02-24 10:49:00
简单谈谈Python面向对象的相关知识
2022-08-25 19:11:23
微信小程序自定义底部导航带跳转功能
2024-05-02 17:25:49

基于pandas向csv添加新的行和列
2021-11-29 02:28:56

python入门for循环嵌套理解学习
2021-03-01 21:42:16

Python 新建文件夹与复制文件夹内所有内容的方法
2022-03-22 00:05:05
使用AJAX技术的十大理由
2008-04-30 13:21:00
960px下的黄金分割
2009-07-31 14:33:00
