使用python实现正则匹配检索远端FTP目录下的文件

作者:阿库纳玛塔塔 时间:2022-03-27 07:29:15 

遇到一个问题,需要正则匹配远端FTP目录下的文件,如果使用ftp客户端可以通过命令行很容易的做到这一点,但是暂时没有一个工具支持这样的需求,于是通过python对FTP的支持和对正则表达式的支持,写了这么一个简单的工具,用于使用正则表达式来匹配远端目录的文件。

代码如下


# coding=utf-8
#########################################################################
# File Name: reg_url.py
# Author: WangWeilong
# Company: Baidu
#########################################################################

import re
import sys
import os
from ftplib import FTP

dhccmd = "http://xxx/api/submit"

class DHC_FTP():
def __init__(self, hostname, username="", passwd=""):
 self.hostname = hostname
 try:
  self.ftp = FTP(self.hostname)
 except:
  print "hostname error!"
  exit(-1)
 self.username = username
 self.passwd = passwd
 self.filelist = []
 self.reg_pattern = ""

def getftpfilelist(self, path):
 self.ftp.login(self.username, self.passwd)
 self.ftp.cwd(path)
 self.filelist = self.ftp.nlst()

def matchnames(self, regpattern):
 pattern = re.compile(regpattern)
 matchedfiles = []
 for file in self.filelist:
  match = pattern.search(file)
  if match:
   matchedfiles.append(match.string)
 return matchedfiles

if __name__ == "__main__":
if len(sys.argv) != 4:
 print 'usage:python reg_url.py $ftpurldir $regular'
else:
 #解析ftpurl字符串
 head = sys.argv[1].split("@")[1].split("/")[0]
 username = sys.argv[1].split("//")[1].split(":")[0]
 passwd = sys.argv[1].split("//")[1].split(":")[1].split("@")[0]
 pathdir = sys.argv[1].split(head)[1]

dhc_ftp = DHC_FTP(head, username, passwd)
 dhc_ftp.getftpfilelist("./" + pathdir)

#获取正则表达式
 regpattern = r'%s' % sys.argv[2]

matchedfiles = dhc_ftp.matchnames(regpattern)
 for files in matchedfiles:
  ftpname = sys.argv[1] + "/" + files
  print ftpname

通过输入想要的检索的远端目录地址和想要用来匹配的正则表达式,就能获取到远端的文件了,至于用这些文件来干嘛,那就是需求问题了。

以上所述就是本文的全部内容了,希望大家能够喜欢。

请您花一点时间将文章分享给您的朋友或者留下评论。我们将会由衷感谢您的支持!

标签:python,正则,检索,FTP
0
投稿

猜你喜欢

  • 使用Gitee自动化部署python脚本的详细过程

    2022-03-30 07:04:55
  • Pycharm报错:'NoneType' object has no attribute 'bytes'的解决方法

    2023-06-19 19:46:46
  • 利用python爬取散文网的文章实例教程

    2023-06-17 10:40:18
  • 在python中将list分段并保存为array类型的方法

    2023-11-15 10:18:00
  • Python中判断input()输入的数据的类型

    2023-03-14 17:02:15
  • python包的导入方式总结

    2021-01-18 08:55:23
  • SQL语句 一个简单的字符串分割函数

    2011-10-24 20:06:33
  • 用户分类浅谈

    2009-09-27 12:14:00
  • 使用TFRecord存取多个数据案例

    2023-07-14 22:26:34
  • 解决pycharm无法调用pip安装的包问题

    2023-01-25 23:43:16
  • 一文详解Python中多进程和进程池的使用方法

    2023-12-01 04:10:12
  • Windows8下安装Python的BeautifulSoup

    2022-05-30 15:03:06
  • Python中eval()函数的详细使用教程

    2023-11-22 15:51:39
  • 通过python连接Linux命令行代码实例

    2023-01-25 23:10:33
  • 仅Firefox中链接A无法实现模拟点击以触发其默认行为

    2023-06-27 23:29:02
  • Python基于Hypothesis测试库生成测试数据

    2021-10-21 20:27:22
  • Python制作词云图代码实例

    2023-10-24 11:20:21
  • 查询数据表中的记录(SELECT)

    2009-02-27 16:06:00
  • Sanic框架请求与响应实例分析

    2023-05-26 00:07:00
  • Oracle9i取得建表和索引的DDL语句

    2010-07-20 12:59:00
  • asp之家 网络编程 m.aspxhome.com