Python中fnmatch模块的使用详情

作者:廖高祥 时间:2021-06-14 20:50:18 

fnamtch就是filenamematch, 在python中利用符合linuxshell风格的匹配模块来进行文件名的匹配筛选工作。

fnmatch()函数匹配能力介于简单的字符串方法和强大的正则表达式之间,如果在数据处理操作中只需要简单的通配符就能完成的时候,这通常是一个比较合理的方案。此模块的主要作用是文件名称的匹配,并且匹配的模式使用的Unix shell风格。源码很简单:


"""Filename matching with shell patterns.

fnmatch(FILENAME, PATTERN) matches according to the local convention.
fnmatchcase(FILENAME, PATTERN) always takes case in account.

The functions operate by translating the pattern into a regular
expression. They cache the compiled regular expressions for speed.

The function translate(PATTERN) returns a regular expression
corresponding to PATTERN. (It does not compile it.)
"""
import os
import posixpath
import re
import functools

__all__ = ["filter", "fnmatch", "fnmatchcase", "translate"]

def fnmatch(name, pat):
 """Test whether FILENAME matches PATTERN.

Patterns are Unix shell style:

*    matches everything
 ?    matches any single character
 [seq]  matches any character in seq
 [!seq] matches any char not in seq

An initial period in FILENAME is not special.
 Both FILENAME and PATTERN are first case-normalized
 if the operating system requires it.
 If you don't want this, use fnmatchcase(FILENAME, PATTERN).
 """
 name = os.path.normcase(name)
 pat = os.path.normcase(pat)
 return fnmatchcase(name, pat)

@functools.lru_cache(maxsize=256, typed=True)
def _compile_pattern(pat):
 if isinstance(pat, bytes):
   pat_str = str(pat, 'ISO-8859-1')
   res_str = translate(pat_str)
   res = bytes(res_str, 'ISO-8859-1')
 else:
   res = translate(pat)
 return re.compile(res).match

def filter(names, pat):
 """Return the subset of the list NAMES that match PAT."""
 result = []
 pat = os.path.normcase(pat)
 match = _compile_pattern(pat)
 if os.path is posixpath:
   # normcase on posix is NOP. Optimize it away from the loop.
   for name in names:
     if match(name):
       result.append(name)
 else:
   for name in names:
     if match(os.path.normcase(name)):
       result.append(name)
 return result

def fnmatchcase(name, pat):
 """Test whether FILENAME matches PATTERN, including case.

This is a version of fnmatch() which doesn't case-normalize
 its arguments.
 """
 match = _compile_pattern(pat)
 return match(name) is not None

def translate(pat):
 """Translate a shell PATTERN to a regular expression.

There is no way to quote meta-characters.
 """

i, n = 0, len(pat)
 res = ''
 while i < n:
   c = pat[i]
   i = i+1
   if c == '*':
     res = res + '.*'
   elif c == '?':
     res = res + '.'
   elif c == '[':
     j = i
     if j < n and pat[j] == '!':
       j = j+1
     if j < n and pat[j] == ']':
       j = j+1
     while j < n and pat[j] != ']':
       j = j+1
     if j >= n:
       res = res + '\\['
     else:
       stuff = pat[i:j].replace('\\','\\\\')
       i = j+1
       if stuff[0] == '!':
         stuff = '^' + stuff[1:]
       elif stuff[0] == '^':
         stuff = '\\' + stuff
       res = '%s[%s]' % (res, stuff)
   else:
     res = res + re.escape(c)
 return r'(?s:%s)\Z' % res

fnmatch的中的5个函数["filter", "fnmatch", "fnmatchcase", "translate"]

filter 返回列表形式的结果


def gen_find(filepat, top):
 """
 查找符合Shell正则匹配的目录树下的所有文件名
 :param filepat: shell正则
 :param top: 目录路径
 :return: 文件绝对路径生成器
 """
 for path, _, filenames in os.walk(top):
   for file in fnmatch.filter(filenames, filepat):
     yield os.path.join(path, file)

fnmatch


# 列出元组中所有的python文件
pyfiles = [py for py in ('restart.py', 'index.php', 'file.txt') if fnmatch(py, '*.py')]
# 字符串的 startswith() 和 endswith() 方法对于过滤一个目录的内容也是很有用的

fnmatchcase 区分大小写的文件匹配


# 这两个函数通常会被忽略的一个特性是在处理非文件名的字符串时候它们也是很有用的。 比如,假设你有一个街道地址的列表数据
address = [
 '5412 N CLARK ST',
 '1060 W ADDISON ST',
 '1039 W GRANVILLE AVE',
 '2122 N CLARK ST',
 '4802 N BROADWAY',
]
print([addr for addr in address if fnmatchcase(addr, '* ST')])

translate 这个似乎很少有人用到,前面说了fnmatch是Unix shell匹配风格,可以使用translate将其转换为正则表达式,举个栗子


shell_match = 'Celery_?*.py'
print(translate(shell_match))
# 输出结果:(?s:Celery_..*\.py)\Z

Celery_..*\.py就是正则表达式的写法。

来源:https://segmentfault.com/a/1190000017198824

标签:Python,fnmatch模块
0
投稿

猜你喜欢

  • Pandas数据结构中Series属性详解

    2021-12-13 22:32:17
  • Python简单实现自动删除目录下空文件夹的方法

    2021-07-28 20:28:39
  • 详解python中@classmethod和@staticmethod方法

    2022-10-24 11:47:16
  • linux下通过go语言获得系统进程cpu使用情况的方法

    2024-05-08 10:13:01
  • MySQL中的多字段相同数据去重复

    2024-01-17 11:21:21
  • javascript cookies 设置、读取、删除实例代码

    2024-04-19 10:01:51
  • TXT.WORD文档下载另存为,而不是在浏览器中打开

    2007-10-25 11:43:00
  • position、z-index、top、right、bottom和left属性

    2009-10-04 20:33:00
  • python+Word2Vec实现中文聊天机器人的示例代码

    2023-08-04 13:11:29
  • Go语言map元素的删除和清空

    2024-02-05 10:42:25
  • go redis实现滑动窗口限流的方式(redis版)

    2024-02-02 18:04:27
  • Python通过两个dataframe用for循环求笛卡尔积

    2023-11-02 04:32:24
  • 一文带你搞懂JS中导入模块import和require的区别

    2023-07-21 03:24:18
  • python pandas 如何替换某列的一个值

    2021-07-01 01:08:07
  • Python 中对 XML 文件的编码转换问题

    2022-08-19 12:46:53
  • SqlServer参数化查询之where in和like实现详解

    2012-05-22 18:10:50
  • 解决pytorch中的kl divergence计算问题

    2023-11-12 11:02:00
  • Golang 函数执行时间统计装饰器的一个实现详解

    2024-05-09 09:46:22
  • Symfony学习十分钟入门经典教程

    2023-11-14 23:38:38
  • 解决FCKEditor在IE10、IE11下的不兼容问题

    2023-05-26 14:01:22
  • asp之家 网络编程 m.aspxhome.com