Python实现递归遍历文件夹并删除文件
作者:hebedich 时间:2021-09-06 09:51:17
思路:
遍历文件夹下面的文件夹
如果文件夹名称等于".svn",则修改文件夹的属性(因为".svn"的文件都是只读的,你不能直接删除)
删除此文件夹
如果文件夹名称不等于".svn",则递归上面的方法
Python的实现
代码
import os
import shutil
import os.path
import stat
rootdir="F:\\work\\Test"
for parent,dirnames,filenames in os.walk(rootdir): #遍历文件夹下面的所有文件夹
for dirname in dirnames:
if dirname=='.svn':
strfilepath=parent+os.sep+dirname
if os.path.isdir(strfilepath):
os.system('attrib -r ' + parent + '\\*.* /s')#设置本文件夹可写
os.system('attrib -r ' + strfilepath + '\\*.* /s')#设置父文件夹可写
shutil.rmtree(parent+os.sep+dirname)#删除此文件夹
要点:
Walk在os模块下面,用来根据提供的文件夹生成一个generator。每次可以得到一个三元tupple,其中第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
os.system('attrib -r ' + parent + '\\*.* /s') 设置文件夹可写
shutil.rmtree(parent+os.sep+dirname) 删除文件夹(即使文件夹里面有文件)
例二:
Python实现递归遍历指定文件目录(startdir),从而找到所有与指定的文件或目录(target)名相同的文件或目录的绝对路径。
scandir.py :
#! /usr/bin/python
# filename : scandir.py
# author : Jesse
# update : 2011/08/15 10:16
import os
def scandir(startdir, target) :
os.chdir(startdir)
for obj in os.listdir(os.curdir) :
if obj == target :
print os.getcwd() + os.sep + obj
if os.path.isdir(obj) :
scandir(obj, target)
os.chdir(os.pardir) #!!!
startdir = raw_input('Please input startdir: ')
target = raw_input('Please input target: ')
scandir(startdir, target)
关于该程序的一点说明:
1. 函数scandir的形参target可以是目录名也可以是文件名。
2. 函数chdir的作用是切换到指定目录,该参数必须是有效的且有访问权限的相对路径或绝对路径。
3. 函数的第五行,使用getcwd函数也是为了取得当前绝对路径。
4. 加号作为字符串的连接符。os.sep根据你的操作系统给出目录分隔符,在GNU/Linux和UNIX上它的返回值是'/',在windows上它的返回值是'\\',在Mac OS上是‘:',使用os.sep而不直接使用字符,会提高程序的可移植性。
5. 递归调用后,一定不能忘了os.chdir(os.pardir),返回上层目录(即父目录)。
重要:
1. 理解for中的两个并列的if语句,并列是为了解决目标是文件夹时,该目标文件夹中包含符合要求的文件夹。
2. 如果指定目录中存在访问受限的文件或文件夹,该程序会失败,返回无权访问信息。
例三:
Python递归遍历文件夹,寻找包含某个字符串的文本文件
linux下,如果不使用eclipse的话,想查找某个字符串在哪些文件中出现过就很麻烦,自己写了这个脚本在编码时使用,挺方便的。如果某个文本文件中包含的话,则只记录出现第一次的行数输出
使用方法:
python xxx.py 路径 字符串
python search_content.py /home/www/ abcdefg
search_content.py
#!/use/bin/env python
#-*- coding:utf-8 -*-
import sys,os
filterType = ['gif','png','bmp','jpg','jpeg','rar','zip',
'ico','apk','ipa','doc','docx','xls','jar',
'xlsx','ppt','pptx','pdf','gz','pyc','class']
num = 0
def search(path=None,cont=None):
if not path or not cont:
print('path or searchString is empty')
return
global num
_loopFolder(path,cont)
print("%s file find" % num)
def _loopFolder(path,cont):
arr = path.split('/')
if not arr[-1].startswith('.'): #不检查隐藏文件夹
if os.path.isdir(path):
folderList = os.listdir(path)
for x in folderList:
_loopFolder(path+"/"+x,cont)
elif os.path.isfile(path):
_verifyContent(path,cont)
def _verifyContent(path,cont):
if path.split('.')[-1].lower() in filterType:
return
global num
fh = open(path,'r')
fhContent = fh.readlines()
fh.close()
for index,x in enumerate(fhContent):
if cont in x:
num += 1
print("%s %s" % (path,index+1))
break
return
if __name__ == "__main__":
if len(sys.argv) < 3:
print("invalid parameters")
else:
search(sys.argv[1],sys.argv[2])