python同义词替换的实现(jieba分词)

作者:Lty美丽人生 时间:2022-02-10 20:58:00 

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码


import jieba

def replaceSynonymWords(string1):
# 1读取同义词表,并生成一个字典。
combine_dict = {}
# synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
for line in open("TihuanWords.txt", "r", encoding='utf-8'):
  seperate_word = line.strip().split(" ")
  num = len(seperate_word)
  for i in range(1, num):
    combine_dict[seperate_word[i]] = seperate_word[0]
  print(seperate_word)
print(combine_dict)

# 2提升某些词的词频,使其能够被jieba识别出来
jieba.suggest_freq("年休假", tune=True)

# 3将语句切分成单词
seg_list = jieba.cut(string1, cut_all=False)

f = "/".join(seg_list).encode("utf-8")
f = f.decode("utf-8")
print(f)
# 4返回同义词替换后的句子
final_sentence = " "
for word in f.split('/'):
  if word in combine_dict:
    word = combine_dict[word]
    final_sentence += word
  else:
    final_sentence += word
# print final_sentence
return final_sentence

string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

来源:https://blog.csdn.net/weixin_44208569/article/details/104048793

标签:python,同义词,替换
0
投稿

猜你喜欢

  • Python timer定时器两种常用方法解析

    2023-07-21 19:20:56
  • 深入解析Go语言编程中slice切片结构

    2024-04-25 15:01:23
  • Python开发的实用计算器完整实例

    2023-07-25 17:11:53
  • 理想高通滤波实现Python opencv示例

    2022-09-29 03:58:07
  • 使用Python编写简单网络爬虫抓取视频下载资源

    2023-11-02 01:44:22
  • ThinkPHP中limit()使用方法详解

    2023-11-14 22:05:04
  • Python3爬虫爬取英雄联盟高清桌面壁纸功能示例【基于Scrapy框架】

    2023-03-07 19:19:59
  • JavaScript中document.forms[0]与getElementByName区别

    2024-04-17 09:55:58
  • Python 实现递归法解决迷宫问题的示例代码

    2021-01-31 08:14:23
  • Python切片用法实例教程

    2023-09-28 15:26:17
  • 根据表名和索引获取需要的列名的存储过程

    2024-01-23 04:24:14
  • 使用python实现微信小程序自动签到功能

    2021-05-30 10:04:11
  • rs.open sql,conn,1,1与rs.open sql,conn,1.3还有rs.open sql,conn,3,2区别

    2011-02-24 10:49:00
  • 简单谈谈Python面向对象的相关知识

    2022-08-25 19:11:23
  • 微信小程序自定义底部导航带跳转功能

    2024-05-02 17:25:49
  • 基于pandas向csv添加新的行和列

    2021-11-29 02:28:56
  • python入门for循环嵌套理解学习

    2021-03-01 21:42:16
  • Python 新建文件夹与复制文件夹内所有内容的方法

    2022-03-22 00:05:05
  • 使用AJAX技术的十大理由

    2008-04-30 13:21:00
  • 960px下的黄金分割

    2009-07-31 14:33:00
  • asp之家 网络编程 m.aspxhome.com