Python实现统计单词出现的个数
作者:junjie 时间:2022-11-01 12:19:30
最近在看python脚本语言,脚本语言是一种解释性的语言,不需要编译,可以直接用,由解释器来负责解释。python语言很强大,而且写起来很简洁。下面的一个例子就是用python统计单词出现的个数。
import sys
import string
#import collections
if len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}:
print("usage: uniqueword filename_1 filename_2 ... filename_n")
sys.exit()
else:
words = {}
# words = collections.defaultdict(int)
strip = string.whitespace + string.punctuation + string.digits + "\"'"
for filename in sys.argv[1:]:
for line in open(filename):
for word in line.split():
word = word.strip(strip)
if len(word) >= 2:
words[word] = words.get(word, 0) + 1
# words[word] += 1
for word in sorted(words):
print("'{0}' occurs {1} times".format(word,words[word]))
假设文件名是 uniqueword.py,在命令行下输入: uniqueword.py filename_1 filename_2 ... filename_n中单词出现的次数可以被统计出来。
第四行和第五行判断是否有输入参数,如果输入参数为空或者为-h, -help,则输出帮助信息。
从第七行到第14行是核心部分,逐一打开参数中指定的文件,并读取每一行,再用字符串的split方法把读取的行抽取出一个一个的单词,但单词长度大于2的时候,把此单词加入到字典words中。 其中words.get(word, 0)的意思是取出key等于word的value,如果key为空,则把value置为默认值0. 最后打印出结果。
标签:Python,统计,单词,出现,个数
0
投稿
猜你喜欢
Django利用cookie保存用户登录信息的简单实现方法
2021-03-22 16:47:26
python中的eval函数使用实例
2021-06-20 00:34:07
Python django框架输入汉字,数字,字符生成二维码实现详解
2022-12-13 00:23:24
树莓派升级python的具体步骤
2023-08-04 00:28:49
HTML邮件的又一点思考
2009-05-06 13:33:00
python中opencv实现图片文本倾斜校正
2023-08-27 11:07:03
Python实现动态绘图的示例详解
2021-07-08 16:44:40
Python中is和==的区别详解
2022-08-22 10:53:09
将HTML自动转为JS代码
2010-03-17 20:49:00
python实现AI聊天机器人详解流程
2022-12-11 23:57:37
python使用smtplib模块发送邮件
2023-05-16 22:25:38
解析php中var_dump,var_export,print_r三个函数的区别
2023-11-24 12:27:02
微信小程序中target和currentTarget的区别小结
2024-04-10 16:17:30
javascript检测对象中是否存在某个属性判断方法小结
2024-04-30 10:10:54
MySQL数据库常用命令小结
2024-01-15 22:16:31
pytorch 把图片数据转化成tensor的操作
2022-01-14 19:02:46
MySQL实现字段或字符串拼接的三种方式总结
2024-01-22 04:23:47
奇怪的PHP引用效率问题分析
2023-10-29 14:36:04
将有安全问题的SQL过程删除,比较全面
2007-08-06 14:46:00
解决tensorflow/keras时出现数组维度不匹配问题
2023-01-01 04:16:24