Python 读取某个目录下所有的文件实例
作者:嘎里给给 时间:2022-08-27 20:04:13
在处理数据的时候,因为没有及时的去重,所以需要重新对生成txt进行去重。
可是一个文件夹下有很多txt,总不可能一个一个去操作,这样效率太低了。这里我们需要用到 os 这个包
关键的代码
<span style="font-size:14px;"># coding=utf-8
#出现了中文乱码的问题,于是我无脑utf-8 。希望后期的学习可以能理解
import os
import os.path
import re
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf-8')
#这里放着你要操作的文件夹名称
path = 'E:\\get_key\\'
#把e:\get_key\目录下的文件名全部获取保存在files中
files = os.listdir(path.decode('utf-8'))
#用set可以很好的去重,在数据处理的时候经常会被使用到。这里做初始化
datas = set()
for file in files :
#准确获取一个txt的位置,利用字符串的拼接
txt_path = 'E:\\get_key\\'+file.decode('utf-8')
#把结果保存了在contents中
contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8')
#datas的数据清空
datas.clear()
#把数据add到datas中,可以去重
for content in contents:
print(content.decode('utf-8'))
datas.add(content.decode('utf-8'))
#去重后新的文件保存的路径
new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8')
unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8')
#把datas里的数据输出到新生成的txt中
for data in datas:
unique_keywords.write(data+"\n")
#释放资源
unique_keywords.close()</span>
来源:https://blog.csdn.net/MakeContral/article/details/71544107
标签:python,读取,文件
0
投稿
猜你喜欢
SQL Server 高性能写入的一些经验总结
2024-01-21 10:46:37
Golang使用ini库读取配置详情
2023-07-02 07:46:56
css彩色虚线表格及JS鼠标指向单元格变色制作方法
2007-08-10 13:08:00
多栏自适应布局问题浅谈
2010-08-16 12:56:00
简述 Python 的类和对象
2023-05-17 12:44:23
selenium中常见的表单元素操作方法总结
2021-06-15 23:54:32
如何用CocosCreator制作微信小游戏
2023-08-23 16:00:02
mysql之跨库关联查询(dblink)问题
2024-01-20 21:54:54
SQL Server误区30日谈 第30天 有关备份的30个误区
2024-01-26 05:52:26
SQL Server 日期相关资料详细介绍
2012-07-11 16:14:07
js实现黑白div块画空心的图形
2023-08-29 07:24:21
django与小程序实现登录验证功能的示例代码
2023-08-04 01:06:58
一个拖动层和Onmouse自动下拉效果
2007-10-08 21:25:00
Python 程序员必须掌握的日志记录
2021-11-05 06:17:20
python实现简单的计时器功能函数
2023-02-13 08:33:55
Python requests.post()方法中data和json参数的使用方法
2022-10-10 04:25:45
用户体验量化方法研究(二)
2010-02-08 12:46:00
vue3如何实现挂载并使用axios
2023-07-02 16:46:06
python中安装django模块的方法
2023-08-27 13:30:21
Python Socket传输文件示例
2023-10-18 17:19:00