Python基于正则表达式实现检查文件内容的方法【文件检索】

作者:ykdsg 时间:2021-06-11 07:58:45 

本文实例讲述了Python基于正则表达式实现检查文件内容的方法分享给大家供大家参考,具体如下:

这个是之前就在学python,欣赏python的小巧但是功能强大,是连电池都自带的语言。平时工作中用Java ,觉得python在日常生活中比java用处要大,首先语法没那么复杂,特别是io的操作,java里要写一大坨没关的代码。还有就是不用编译,而且linux系统默认都会自带。

这次遇到的问题是工作当中想要迁移一个系统中的一个模块,这个时候需要评估模块里的代码有没有对其他代码强依赖,就是有没有import 其他模块的代码。如果通过人肉来坐,少量的文件还好,如果有大量的文件实在是很悲剧。这个时候就想起可以用pytho来检索文件,通过正则表达式分析文件内容,把有问题的文件名打印出来就可以了。


import os
import os.path
import re
packDir='/**/src/main/java/com/hz/yk/auction'
p1=re.compile(r"yk\.((?!auction)\w)+\b")
p2=re.compile(r"yk\.((?!domain)\w)+\b")
p3=re.compile(r"yk\.((?!utils)\w)+\b")
def processDirectory(args,dirname,filenames):
 # print 'Directory',dirname
 for filename in filenames:
   if os.path.splitext(filename)[1]=='.java':
     # print 'file',filename
     fileObj=open(dirname+ "/"+filename)
     hasOther=False
     for line in fileObj:
       if p1.search(line) and p2.search(line) and p3.search(line):
         hasOther=True
         print line
     if hasOther:
       print 'file:',filename
def search():
 os.path.walk(packDir,processDirectory,None)
if __name__ == '__main__':
 search()

因为希望看到应用其他模块的代码,所以排除掉自己的模块名auction和公共的应用domain,utils 。对剩下的符合条件的打印出import这句和文件名sikuli

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

希望本文所述对大家Python程序设计有所帮助。

来源:http://blog.csdn.net/ykdsg/article/details/11392371

标签:Python,正则表达式,文件内容
0
投稿

猜你喜欢

  • 如何结束一个session变量

    2009-08-12 19:20:00
  • PHP常用函数之获取汉字首字母功能示例

    2023-06-16 12:24:39
  • 浅析网页Transitional和Strict的文档声明的区别

    2009-02-17 12:45:00
  • Python+matplotlib+numpy实现在不同平面的二维条形图

    2023-11-11 21:01:58
  • ThinkPHP5集成JS-SDK实现微信自定义分享功能

    2023-06-10 13:59:47
  • python3编写ThinkPHP命令执行Getshell的方法

    2023-10-04 14:17:15
  • 使用Django实现商城验证码模块的方法

    2023-11-04 04:46:23
  • js验证表单(form)中的单选(radio)值

    2008-03-18 13:23:00
  • 比较SQL Server与Oracle、DB2三种数据库

    2008-09-12 17:24:00
  • asp fso创建与删除文件与文件夹

    2008-12-31 16:07:00
  • Python测试线程应用程序过程解析

    2023-09-11 03:04:25
  • 百度的图片轮换JS代码,支持FF

    2007-11-16 16:24:00
  • CSS样式表中SPAN和DIV的区别

    2007-10-21 08:47:00
  • PHP 截取字符串 分别适合GB2312和UTF8编码情况

    2023-09-30 18:02:30
  • windows8.1下Apache+Php+MySQL配置步骤

    2023-06-06 17:59:16
  • JSONObject.toString

    2008-03-09 19:12:00
  • 关于超级链接的一些问题

    2007-12-07 14:00:00
  • python判断变量是否为int、字符串、列表、元组、字典的方法详解

    2022-09-28 05:11:57
  • js实现屏蔽默认快捷键调用自定义事件示例

    2023-09-05 09:28:31
  • Python验证码识别的方法

    2023-05-30 10:22:39
  • asp之家 网络编程 m.aspxhome.com