python解析基于xml格式的日志文件

作者:程序猿全敏 时间:2022-11-08 21:26:31 

大家中午好,由于过年一直还没回到状态,好久没分享一波小知识了,今天,继续给大家分享一波Python解析日志的小脚本。

首先,同样的先看看日志是个啥样。

python解析基于xml格式的日志文件

都是xml格式的,是不是看着就头晕了??没事,我们先来分析一波。

1.每一段开头都是catalina-exec,那么我们就按catalina-exec来分,分了之后,他们就都是一段一段的了。

2.然后,我们再在已经分好的一段段里面分,找出你要分割的关键字,因为是xml的,所以,接下来的工作就简单了,都是一个头一个尾的。

3.但是还有一个问题,有可能有的里面没有你想要的关键字,所以你要判断下,如果没有这个字段,那么我就把这个字段设置为空。

思路清晰了,代码自然而然就简单了。

接下来我们就看看代码


#coding:utf-8
import re
#文本所在TXT文件
file = 'iag_interface.log'
#分割一段
xml1='catalina-exec'
xml2='catalina-exec'
#关键字reqtimestamp
time1 = '<timestamp>'
time2 = '</timestamp>'
#关键字functionid
functionid1 = '<functionid>'
functionid2 = '</functionid>'
#关键字transid
transid1='<transid>'
transid2='</transid>'
#关键字siappid
siappid1='<siappid>'
siappid2='</siappid>'
#关键字userid
userid1='<userid>'
userid2='</userid>'
#关键字mobnum
mobnum1='<mobnum>'
mobnum2='</mobnum>'
f = open(file,'r',encoding= 'utf-8')
#f = open(file,'r')
#for (num,value) in enumerate(f):
#print("line number",num,"is:",value)
buff = f.read()
#清除换行符,请取消下一行注释
#buff = buff.replace('\n','')
pat = re.compile(time1+'(.*?)'+time2,re.S)
pat1 = re.compile(functionid1+'(.*?)'+functionid2,re.S)
pat2 = re.compile(transid1+'(.*?)'+transid2,re.S)
pat3 = re.compile(siappid1+'(.*?)'+siappid2,re.S)
pat4 = re.compile(userid1+'(.*?)'+userid2,re.S)
pat5 = re.compile(mobnum1+'(.*?)'+mobnum2,re.S)
pat6=re.compile(xml1+'(.*?)'+xml2,re.S)
result6 = pat6.findall(buff)
print(len(result6))
x = open("logfx.txt", 'w')
x.write("===========================开始数据================================="+"\n")
x.write("time"+"\t"+"functionid"+"\t"+"transid"+"\t"+"siappid"+"\t"+"userid"+"\t"+"mobnum"+"\n")
for i in range(0,len(result6)):
result = pat.findall(result6[i])
result1 = pat1.findall(result6[i])
result2 = pat2.findall(result6[i])
result3 = pat3.findall(result6[i])
result4 = pat4.findall(result6[i])
result5 = pat5.findall(result6[i])
if len(result)==0:
 result.append("空")
if len(result1)==0:
 result1.append("空")
if len(result2)==0:
 result2.append("空")
if len(result3)==0:
 result3.append("空")
if len(result4)==0:
 result4.append("空")
if len(result5)==0:
 result5.append("空")
#print(result[0],"=",result1[0],"=",result2[0],"=",result3[0],"=",result4[0],"=",result5[0])
x.write("timestamp:"+result[0]+"\t"+result1[0]+"\t"+result2[0]+"\t"+result3[0]+"\t"+result4[0]+"\t"+"mobnum:"+result5[0]+"\n")
x.write("===========================结束数据================================="+"\n")  
print("执行完毕!生成文件logfx.txt")
x.close()

运行下代码

python解析基于xml格式的日志文件

python解析基于xml格式的日志文件把所有数据运行成功了。接下来查看文件

python解析基于xml格式的日志文件

好了。

来源:http://blog.csdn.net/u010798367/article/details/56489602

标签:python,xml,日志文件
0
投稿

猜你喜欢

  • 用javascript实现的汉字简繁转换功能

    2008-05-04 13:15:00
  • 微信小程序audio组件在ios端无法播放的解决办法

    2024-04-18 09:47:26
  • python 按照固定长度分割字符串的方法小结

    2021-05-28 06:05:05
  • Vue3-KeepAlive,多个页面使用keepalive方式

    2024-05-02 16:33:39
  • 网页设计软件FrontPage快捷键一览

    2008-02-24 16:55:00
  • python函数的重新定义及练习

    2023-10-12 22:47:55
  • python如何将图片转换素描画

    2022-05-26 23:17:49
  • 用Python创建声明性迷你语言的教程

    2023-08-10 04:49:42
  • SQL列名无效 sql查询列名 sql返回列名

    2009-09-03 13:19:00
  • Python操作Mongodb数据库的方法小结

    2024-01-20 15:00:51
  • python multiprocessing模块用法及原理介绍

    2021-01-27 06:22:44
  • escape、encodeURI、encodeURIComponent等方法的区别比较

    2024-05-13 09:36:40
  • Flask-Sqlalchemy的基本使用详解

    2023-06-16 19:40:02
  • Python 中的Sympy详细使用

    2021-10-03 03:22:45
  • Python xlrd excel文件操作代码实例

    2021-05-19 21:52:18
  • golang架构设计开闭原则手写实现

    2023-07-21 22:01:36
  • PHP isset()与empty()的使用区别详解

    2023-11-21 10:28:39
  • asp日期函数运用--生成简单的日历

    2008-08-15 13:47:00
  • 我跟iframe之间的误会

    2008-03-17 13:30:00
  • 详解Django 中是否使用时区的区别

    2023-08-28 04:29:48
  • asp之家 网络编程 m.aspxhome.com