使用python实现正则匹配检索远端FTP目录下的文件
作者:阿库纳玛塔塔 时间:2022-03-27 07:29:15
遇到一个问题,需要正则匹配远端FTP目录下的文件,如果使用ftp客户端可以通过命令行很容易的做到这一点,但是暂时没有一个工具支持这样的需求,于是通过python对FTP的支持和对正则表达式的支持,写了这么一个简单的工具,用于使用正则表达式来匹配远端目录的文件。
代码如下
# coding=utf-8
#########################################################################
# File Name: reg_url.py
# Author: WangWeilong
# Company: Baidu
#########################################################################
import re
import sys
import os
from ftplib import FTP
dhccmd = "http://xxx/api/submit"
class DHC_FTP():
def __init__(self, hostname, username="", passwd=""):
self.hostname = hostname
try:
self.ftp = FTP(self.hostname)
except:
print "hostname error!"
exit(-1)
self.username = username
self.passwd = passwd
self.filelist = []
self.reg_pattern = ""
def getftpfilelist(self, path):
self.ftp.login(self.username, self.passwd)
self.ftp.cwd(path)
self.filelist = self.ftp.nlst()
def matchnames(self, regpattern):
pattern = re.compile(regpattern)
matchedfiles = []
for file in self.filelist:
match = pattern.search(file)
if match:
matchedfiles.append(match.string)
return matchedfiles
if __name__ == "__main__":
if len(sys.argv) != 4:
print 'usage:python reg_url.py $ftpurldir $regular'
else:
#解析ftpurl字符串
head = sys.argv[1].split("@")[1].split("/")[0]
username = sys.argv[1].split("//")[1].split(":")[0]
passwd = sys.argv[1].split("//")[1].split(":")[1].split("@")[0]
pathdir = sys.argv[1].split(head)[1]
dhc_ftp = DHC_FTP(head, username, passwd)
dhc_ftp.getftpfilelist("./" + pathdir)
#获取正则表达式
regpattern = r'%s' % sys.argv[2]
matchedfiles = dhc_ftp.matchnames(regpattern)
for files in matchedfiles:
ftpname = sys.argv[1] + "/" + files
print ftpname
通过输入想要的检索的远端目录地址和想要用来匹配的正则表达式,就能获取到远端的文件了,至于用这些文件来干嘛,那就是需求问题了。
以上所述就是本文的全部内容了,希望大家能够喜欢。
请您花一点时间将文章分享给您的朋友或者留下评论。我们将会由衷感谢您的支持!
标签:python,正则,检索,FTP
0
投稿
猜你喜欢
Python中zip()函数的解释和可视化(实例详解)
2023-11-04 15:02:18
Python安装与卸载流程详细步骤(图解)
2023-10-05 19:36:21
从MySQL数据库表中取出随机数据的代码
2023-11-14 09:53:58
ASP 获取文件扩展名函数getFileExt()
2011-03-11 11:18:00
Vue组件全局注册实现警告框的实例详解
2024-05-02 16:53:05
Python JWT认证与pyjwt包详细介绍
2022-04-28 23:52:31
6个卓越Web设计细节[译]
2010-03-24 18:34:00
SQL Server高级内容之case语法函数概述及使用
2024-01-13 20:40:12
详解在Spring Boot中使用数据库事务
2024-01-15 23:20:28
如何在 Vue 表单中处理图片
2024-05-02 16:10:08
python负载均衡的简单实现方法
2021-10-31 23:15:22
浅谈python opencv对图像颜色通道进行加减操作溢出
2021-12-26 11:45:23
MySQL into_Mysql中replace与replace into用法案例详解
2024-01-26 20:10:00
pandas按条件筛选数据的实现
2021-10-04 03:07:54
mysql 数据同步 出现Slave_IO_Running:No问题的解决方法小结
2024-01-22 22:59:34
tensorflow转onnx的实现方法
2022-07-08 23:04:51
Python3多线程处理爬虫的实战
2023-08-16 02:16:21
python3 拼接字符串的7种方法
2021-12-24 09:09:32
Python可视化工具Plotly的应用教程
2022-03-28 01:47:02
使用SQL Server判断文件是否存在后再删除(详解)
2024-01-19 13:03:33