python filecmp.dircmp实现递归比对两个目录的方法

作者:longfeiwlf 时间:2021-10-11 10:22:29 

使用python filecmp模块的dircmp类可以很方便的比对两个目录,dircmp的用法已经有很多文章介绍,不再赘述。

可以help(filecmp.dircmp)查看帮助信息,其中提到的x.report()、x.report_partial_closure(),都只能打印两目录一级子目录的比较信息。而x.report_full_closure()可以递归打印所有子目录的比对信息,但是输出太多,大多数情况下我们可能只关心两目录的不同之处。


help(filecmp.dircmp) 摘选:            

| High level usage:              
| x = dircmp(dir1, dir2)            
| x.report() -> prints a report on the differences between dir1 and dir2
|  or                
| x.report_partial_closure() -> prints report on differences between dir1
|   and dir2, and reports on common immediate subdirectories.  
| x.report_full_closure() -> like report_partial_closure,    
|   but fully recursive.

    本文编写的脚本,重点关注并实现两个目标:

1)递归比对两个目录及其所有子目录。

2)仅输出两目录不同之处,包括文件名相同(common_files)但是文件不一致(diff_files),以及左、右目录中独有的文件或子目录。

py脚本compare_dir.py内容如下:


# -*- coding: utf-8 -*-
"""
@desc 使用filecmp.dircmp递归比对两个目录,输出比对结果以及统计信息。
@author longfeiwlf
@date 2020-5-20
"""

from filecmp import dircmp
import sys

# 定义全局变量:
number_different_files = 0 # 文件名相同但不一致的文件数
number_left_only = 0 # 左边目录独有的文件或目录数
number_right_only = 0 # 右边目录独有的文件或目录数

def print_diff(dcmp):
"""递归比对两目录,如果有不同之处,打印出来,同时累加统计计数。"""
global number_different_files
global number_left_only
global number_right_only
for name in dcmp.diff_files:
 print("diff_file found: %s/%s" % (dcmp.left, name))
 number_different_files += 1
for name_left in dcmp.left_only:
 print("left_only found: %s/%s" % (dcmp.left, name_left))
 number_left_only += 1
for name_right in dcmp.right_only:
 print("right_only found: %s/%s" % (dcmp.right, name_right))
 number_right_only += 1
for sub_dcmp in dcmp.subdirs.values():
 print_diff(sub_dcmp) # 递归比较子目录

if __name__ == '__main__':
try:
 mydcmp = dircmp(sys.argv[1], sys.argv[2])
except IndexError as ie:
 print(ie)
 print("使用方法:python compare_dir_cn.py 目录1 目录2")
else:
 print("\n比对结果详情: ")
 print_diff(mydcmp)
 if (number_different_files == 0 and number_left_only == 0
   and number_right_only == 0):
  print("\n两个目录完全一致!")
 else:
  print("\n比对结果统计:")
  print("Total Number of different files is: "
    + str(number_different_files))
  print("Total Number of files or directories only in '"
    + sys.argv[1] + "' is: " + str(number_left_only))
  print("Total Number of files or directories only in '"
    + sys.argv[2] + "' is: " + str(number_right_only))

compare_dir.py脚本使用举例:

python filecmp.dircmp实现递归比对两个目录的方法

来源:https://blog.csdn.net/longfeizzu/article/details/106233479

标签:filecmp.dircmp,python,递归
0
投稿

猜你喜欢

  • Python运算符之Inplace运算符的使用教程

    2021-09-24 11:32:10
  • Python发送邮件封装实现过程详解

    2021-06-13 09:19:41
  • windows下安装php的memcache模块的方法

    2023-11-20 05:47:38
  • 浅谈Python 命令行参数argparse写入图片路径操作

    2023-03-18 21:08:11
  • MySQL索引用法实例分析

    2024-01-22 16:42:22
  • jupyter notebook 参数传递给shell命令行实例

    2023-08-28 06:52:55
  • 简单理解vue中track-by属性

    2024-04-30 10:21:05
  • ASP连接Oracle数据库的例子

    2007-10-02 12:44:00
  • Yahoo! BrowserPlus 发布

    2008-11-20 13:35:00
  • PHP中流的定义及作用详解

    2023-05-31 11:33:59
  • python中通过pip安装库文件时出现“EnvironmentError: [WinError 5] 拒绝访问”的问题及解决方案

    2023-08-29 20:25:40
  • Python timeit模块原理及使用方法

    2023-09-22 08:19:18
  • Python中的文本相似度的计算方法总结

    2021-02-08 08:40:37
  • FckEditor 配置手册中文教程详细说明

    2023-06-18 20:35:59
  • Python3.8安装Pygame教程步骤详解

    2022-05-11 15:26:15
  • Python Scrapy 框架简单介绍

    2021-09-18 14:51:48
  • PyQt5实现下载进度条效果

    2022-06-17 10:47:11
  • goland 实现自动格式化代码

    2024-02-22 07:44:16
  • Python如何安装第三方模块

    2023-08-01 12:50:07
  • python 装饰器的使用示例

    2021-05-15 00:52:09
  • asp之家 网络编程 m.aspxhome.com