Python 如何对文件目录操作

作者:Alan.hsiang 时间:2022-10-08 05:40:04 

概述

I/O操作不仅包括屏幕输入输出,还包括文件的读取与写入,Python提供了很多必要的方法和功能,进行文件及文件夹的相关操作。本文主要通过两个简单的小例子,简述Python在文件夹及文件的应用,仅供学习分享使用,如有不足之处,还请指正。

涉及知识点

os模块:os 模块提供了非常丰富的方法用来处理文件和目录。
open方法:open方法用于打开一个文件,用于读取和写入。

实例1:获取指定目录下所有的文件大小,并找出最大文件及最小文件

分解步骤:

遍历文件夹下所有的子文件及子文件夹(需要递归),并计算每一个文件的大小
计算所有文件的大小总和
找出最大文件及最小文件

核心代码

定义一个方法get_file_size,获取单个文件的大小,单位有KB和MB两种。关键点如下所示:

  1. os.path.getsize 用于获取指定文件的大小,单位是Byte。

  2. round为四舍五入函数,保留指定位数的小数。


def get_file_size(file_path, KB=False, MB=False):
 """获取文件大小"""
 size = os.path.getsize(file_path)
 if KB:
   size = round(size / 1024, 2)
 elif MB:
   size = round(size / 1024 * 1024, 2)
 else:
   size = size
 return size

定义一个方法list_files,遍历指定文件目录,并存入字典当中。关键点如下所示:

  • os.path.isfile 用于判断给定的路径是文件还是文件夹。

  • os.listdir 用于获取指定目录下所有的文件及文件夹,返回一个列表,但是只是当前文件夹的名称,并不是全路径。

  • os.path.join 用于拼接两个路径


def list_files(root_dir):
 """遍历文件"""
 if os.path.isfile(root_dir): # 如果是文件
   size = get_file_size(root_dir, KB=True)
   file_dict[root_dir] = size
 else:
   # 如果是文件夹,则遍历
   for f in os.listdir(root_dir):
     # 拼接路径
     file_path = os.path.join(root_dir, f)
     if os.path.isfile(file_path):
       # 如果是一个文件
       size = get_file_size(file_path, KB=True)
       file_dict[file_path] = size
     else:
       list_files(file_path)

计算总大小和最大文件及最小文件,如下所示:

通过比较字典value的大小,返回对应的key的名称。关键点如下所示:

  1. max_file = max(file_dict, key=lambda x: file_dict[x])

  2. min_file = min(file_dict, key=lambda x: file_dict[x])


if __name__ == '__main__':
 list_files(root_dir)
 # print( len(file_dict))
 # 计算文件目录大小
 total_size = 0
 # 遍历字典的key
 for file in file_dict:
   total_size += file_dict[file]

print('total size is : %.2f' % total_size)
 # 找最大最小文件
 max_file = max(file_dict, key=lambda x: file_dict[x])
 min_file = min(file_dict, key=lambda x: file_dict[x])
 print('max file is : ', max_file, '\n file size is :', file_dict[max_file])
 print('min file is : ', min_file, '\n file size is :', file_dict[min_file])

实例2:将两个文本文件中的内容进行合并,并保存到文件中

两个文件内容,如下图所示:

Python 如何对文件目录操作

分解步骤:

  1. 读取两个文件中的内容并进行解析出key和value,存入字典当中(两个字典,分别存储两个文件的内容)。

  2. 遍历第1个字典,并查找第2个字典当中相同key的值,如不存在,则只显示第1个内容,如存在,则进行合并。

  3. 遍历第2个字典,并查找不在第1个字典当中的key的值,进行累加。

  4. 将拼接后的列表存入文件当中。
     

核心代码

定义一个函数read_book,用于读取两个文件的内容。关键点如下所示:

  1. open函数用于打开一个文件,文件编码为UTF-8。

  2. readlines用于读取所有的行,并返回一个列表。

  3. split用于分割字符串为数组。


def read_book():
 """读取内容"""
 # 读取一个文件
 file1 = open('book1.txt', 'r', encoding='UTF-8')
 lines1 = file1.readlines()
 file1.close()
 for line in lines1:
   line = line.strip() # 去空白
   content = line.split(',')
   book1[content[0]] = content[1]

# 另一种方式,读取另一个文件,不需要close,会自动关闭
 with open('book2.txt', 'r', encoding='UTF-8') as file2:
   lines2 = file2.readlines()
 for line in lines2:
   line = line.strip() # 去空白
   content = line.split(',')
   book2[content[0]] = content[1]

定义一个函数,用于合并内容,并保存。关键点如下所示:

  1. append 用于为数组添加新元素。

  2. dict.keys函数 用于返回所有的key。

  3. join函数用于将数组转换成字符串,并以对应字符分割。

  4. writelines 用于写入所有的行到文件。

  5. with语法,当执行结束时,自动close,并释放资源。


def merge_book():
 """合并内容"""
 lines = [] # 定义一个空列表
 header = '姓名\t 电话\t 文本\n'
 lines.append(header)
 # 遍历第一个字典
 for key in book1:
   line = ''
   if key in book2.keys():
     line = line + '\t'.join([key, book1[key], book2[key]])
     line += '\n'
   else:
     line = line + '\t'.join([key, book1[key], ' *****'])
     line += '\n'
   lines.append(line)
 # 遍历第2个,将不包含在第1个里面的写入
 for key in book2:
   line = ''
   if key not in book1.keys():
     line = line + '\t'.join([key, ' *****', book2[key]])
     line += '\n'
     lines.append(line)
 # 写入book3
 with open('book3.txt', 'w', encoding='UTF-8') as f:
   f.writelines(lines)

整体调用,如下所示:


if __name__ == '__main__':
 # 读取内容
 read_book()
 # 合并内容
 merge_book()

# print(book1)
 # print(book2)

最后拼接后生成的文件,如下所示:

Python 如何对文件目录操作

通过以上两个例子,可以大致了解文件及目录操作的一些方法及步骤。

来源:https://www.cnblogs.com/hsiang/p/13126403.html

标签:Python,文件目录,操作
0
投稿

猜你喜欢

  • CSS中写expression可能会在Chrome中有问题

    2010-01-29 13:10:00
  • 解释执行和编译执行的区别?

    2023-07-11 11:22:12
  • Python编译为二进制so可执行文件实例

    2023-03-05 06:30:36
  • 详解微信小程序缓存--缓存时效性

    2024-04-28 10:19:27
  • python 中[0]*2与0*2的区别说明

    2021-11-01 07:46:17
  • Opera浏览器简介

    2009-02-05 20:56:00
  • javascript移动设备Web开发中对touch事件的封装实例

    2024-04-26 17:13:17
  • SQL Server数据库开发的二十一条法则

    2024-01-18 05:30:40
  • go语言之给定英语文章统计单词数量(go语言小练习)

    2023-09-16 09:11:12
  • 擦除式图片轮番显示效果

    2013-08-10 11:01:48
  • MySQL千万级数据表的优化实战记录

    2024-01-23 08:53:12
  • 解决vue请求接口第一次成功,第二次失败问题

    2023-07-02 16:59:59
  • php查找指定目录下指定大小文件的方法

    2023-09-03 17:53:36
  • Python asyncore socket客户端实现方法详解

    2022-06-18 14:17:42
  • 浅析Python 多行匹配模式

    2022-07-23 13:32:18
  • python编程开发时间序列calendar模块示例详解

    2023-04-25 14:59:19
  • python io.BytesIO简介及示例代码

    2021-04-25 04:52:31
  • Python3.4学习笔记之列表、数组操作示例

    2021-04-10 10:56:11
  • Python实现MySQL操作的方法小结【安装,连接,增删改查等】

    2024-01-16 07:02:33
  • javascript 密码强度验证规则、打分、验证

    2010-05-18 19:58:00
  • asp之家 网络编程 m.aspxhome.com