python用字典统计单词或汉字词个数示例

时间:2021-09-02 17:14:10 

有如下格式的文本文件


/“/请/!/”/“/请/!/”/两名/剑士/各自/倒转/剑尖/,/右手/握/剑柄/,
/左手/搭于/右手/手背/,/躬身行礼/。/两/人/身子/尚未/站/直/,
/突然/间/白光闪/动/,/跟着/铮的/一/声响/,
/双剑相/交/,/两/人/各/退一步/。
/旁/观众/人/都/是/“/咦/”/的/一声/轻呼/。/青衣/剑士/连/劈/三/剑/

将这段话进行词频统计,结果是  词—词数  的形式,比如  请  2  ,并把结果放到txt文件中。

这样的问题利用词或单词作为字典的key,循环判断有不有这个key,没有新增一个,有的话,将这个key对应的value加1


#coding:utf-8
word_lst = []
word_dict = {}

with open("中文.txt","r") as f1 ,open("词次数.txt",'w') as f2:
   for line in f1:
       word_lst.append(line.split('/'))

   for item in word_lst:
       for item2 in item:
           if item2.strip() not in ",!。“”" :
               if   item2 not in word_dict:
                   word_dict[item2] = 1
               else :
                   word_dict[item2] += 1

   for key in word_dict:
       print key,word_dict[key]
       f2.write(key+' '+str(word_dict[key]))

标签:python,字典,统计
0
投稿

猜你喜欢

  • Python中np.argmax()函数用法示例

    2021-06-17 23:47:09
  • 浅析javascript操作 cookie对象

    2024-04-18 10:49:23
  • idea连接sql sever2019图文教程(超详细)

    2024-01-15 03:03:13
  • Python中typing模块与类型注解的使用方法

    2022-10-30 14:09:42
  • asp 根据IP地址自动判断转向分站的代码

    2011-04-14 10:51:00
  • 加快Firefox 3.5启动速度的方法

    2009-07-16 15:22:00
  • 有效地使用 SQL事件探查器的提示和技巧

    2009-01-15 13:39:00
  • 解决python Markdown模块乱码的问题

    2021-09-15 07:31:36
  • 详解Python中命令行参数argparse的常用命令

    2022-06-06 15:59:30
  • Pytorch 使用 nii数据做输入数据的操作

    2023-12-28 23:21:33
  • python内存管理机制原理详解

    2021-05-24 16:19:48
  • 减少新开窗口提升可访问性

    2009-04-17 13:56:00
  • 历数Firefox2.0对XML处理的改进

    2007-11-27 12:41:00
  • Python计算字符宽度的方法

    2021-02-13 20:25:28
  • 怎么让别人看不到网页源代码

    2008-03-21 13:06:00
  • 如何将python代码生成API接口

    2022-10-27 14:37:39
  • mysql 8.0.28 安装配置方法图文教程

    2024-01-16 16:40:26
  • 前端面试之vue2和vue3的区别有哪些

    2024-04-28 10:54:38
  • 浅谈pc端rem字体设置的问题

    2024-05-22 10:27:44
  • python处理图片之PIL模块简单使用方法

    2023-06-25 21:42:05
  • asp之家 网络编程 m.aspxhome.com