基于Python实现文件分类器的示例代码

作者:Sir?老王 时间:2023-06-02 12:49:10 

本文实现文件分类器的目的主要是为了将办公过程中产生的各种格式的文件完成整理。

通过自定义需要整理的文件目录,将该目录下面的全部文件按照文件格式完成分类操作。

基于Python实现文件分类器的示例代码

实现逻辑使用的python技术栈就是os、glob、shutil三个标准库的综合运用,完成自动化的文件整理。

分别将这三个文件处理模块导入代码块中,进入后续的开发操作。

# It imports the os module.
import os

# Shutil is a module that provides a number of high-level operations on files and collections of files.
import shutil

# The glob module finds all the pathnames matching a specified pattern according to the rules used by the Unix shell,
# although results are returned in arbitrary order. No tilde expansion is done, but *, ?, and character ranges expressed
# with [] will be correctly matched.
import glob
import sys

将需要分类的文件目录uncatched_dir以及分类后文件存放目录target_dir设置为可以手动输入的方式。

# Asking the user to input the path of the directory that contains the files to be sorted.
uncatched_dir = input('请输入待分类的文件路径:\n')

# It checks if the uncatched_dir is empty.
if uncatched_dir.strip() == '':
    print('待分类的文件夹路径不能为空!')
    sys.exit()

# Asking the user to input the path of the directory that contains the files to be sorted.
target_dir = input('请输入分类后文件存放的目标路径:\n')

# It checks if the target_dir is empty.
if target_dir.strip() == '':
    print('分类后的文件存放路径不能为空!')
    sys.exit()

基于Python实现文件分类器的示例代码

检验输入的分类后文件存放目录路径是否存在,因为很可能是输入一个新的路径,不存在时则新建一个该路径。

# It checks if the target_dir exists. If it does not exist, it creates a new directory in the current working directory.
if not os.path.exists(target_dir):
    # It creates a new directory in the current working directory.
    os.mkdir(target_dir)

定义一个文件移动数量的变量file_move_num,以及一个新建的文件夹数量的变量dir_new_num用于记录文件整理的结果记录。

# A variable that is used to count the number of files that have been moved.
file_move_num = 0

# A variable that is used to count the number of new directories that have been created.
dir_new_num = 0

遍历需要整理的文件夹目录uncatched_dir,对该目录下面的所有类型的文件进行自动整理操作。

# A for loop that iterates through all the files in the uncatched_dir directory.
for file_ in glob.glob(f'{uncatched_dir}/**/*', recursive=True):

    # It checks if the file is a file.
    if os.path.isfile(file_):

        # It gets the file name of the file.
        file_name = os.path.basename(file_)

        # Checking if the file name contains a period.
        if '.' in file_name:

            # Getting the suffix of the file.
            suffix_name = file_name.split('.')[-1]

        else:

            # Used to classify files that do not have a suffix.
            suffix_name = 'others'

        # It checks if the directory exists. If it does not exist, it creates a new directory in the current working
        # directory.
        if not os.path.exists(f'{target_dir}/{suffix_name}'):

            # It creates a new directory in the current working directory.
            os.mkdir(f'{target_dir}/{suffix_name}')

            # Adding 1 to the variable dir_new_num.
            dir_new_num += 1

        # It copies the file to the target directory.
        shutil.copy(file_, f'{target_dir}/{suffix_name}')

        # Adding 1 to the variable file_move_num.
        file_move_num += 1

注意:为了避免移动文件夹而造成的异常,尤其是系统盘,因此这里用的是复制,也就是shutil.copy函数使用。

最后,将文件分类数量、文件夹新建数量使用print函数进行打印即可。

print(f'整理完成,有{file_move_num}个文件分类到了{dir_new_num}个文件夹中!\n')

input('输入任意键关闭窗口...')

为了避免程序执行完成后直接将命令窗口关闭,上面使用了input函数来保持窗口暂停的效果。

基于Python实现文件分类器的示例代码

基于Python实现文件分类器的示例代码

来源:https://mp.weixin.qq.com/s/9wTbJ2TWJ2owMSxX8I4boQ

标签:Python,文件,分类
0
投稿

猜你喜欢

  • pycharm永久激活方法

    2021-12-22 01:17:34
  • sql语句中单引号嵌套问题(一定要避免直接嵌套)

    2024-01-16 14:48:52
  • ASP GetRef 函数指针试探

    2011-03-16 11:09:00
  • php文章内容分页并生成相应的htm静态页面代码

    2023-07-23 23:48:20
  • Python答题卡识别并给出分数的实现代码

    2022-04-10 03:52:46
  • js操作浏览器的参数方法

    2024-04-18 10:00:04
  • 在ASP.NET 2.0中操作数据之四:使用ObjectDataSource展现数据

    2024-05-13 09:15:45
  • 详解Hadoop 运行环境搭建过程

    2022-08-25 13:50:58
  • 详解python基础中的for循环

    2021-04-23 07:42:11
  • js 原型对象和原型链理解

    2024-04-23 09:20:23
  • python3爬虫学习之数据存储txt的案例详解

    2022-01-17 05:02:09
  • HTML 5 预览

    2008-01-24 12:17:00
  • vue-music关于Player播放器组件详解

    2024-04-28 09:26:11
  • TensorFlow卷积神经网络AlexNet实现示例详解

    2022-06-14 21:17:30
  • 在Python中操作时间之tzset()方法的使用教程

    2022-10-28 22:22:01
  • anaconda jupyter不能导入安装的lightgbm解决方案

    2021-09-15 19:24:45
  • 使用有趣的自定义标记来布局页面

    2013-11-10 19:07:48
  • python 对key为时间的dict排序方法

    2021-03-22 17:09:59
  • http状态码一览表以及HTTP响应的返回头信息

    2010-03-31 14:45:00
  • python绘制散点图并标记序号的方法

    2023-12-22 09:59:49
  • asp之家 网络编程 m.aspxhome.com