正则表达式结合数组提取文章中的文件名

来源:dc9.cn 时间:2007-10-12 13:59:00 

  今天编ZBlog上传模块的时候,需要用到一个提取文章中文件名的子程,开始我把问题想复杂了,匹配了所有可能的文件名,不仅正则表达式写了一大串,而且下面还Split了半天,后来我突然发现Z-Blog的上传文件都存在upload下,白写了那么多复杂的匹配。。。哎,不能浪费掉啊,还是贴上来万一哪个兄弟以后需要也好拿去用~~

下面这段子程基本上可以算是比较不错的通用匹配了。(PS:我突然发现CODE_LITE把我的UBB转义了!!!晕,我只好自己转义了。。。)


Dim objRegExp,Matches,i,DC9_DOT_CN_MATCH
Dim aryMatch()
Redim Preserve aryMatch(0)
Set objRegExp=New RegExp
objRegExp.IgnoreCase =True
objRegExp.Global=True
objRegExp.Pattern="(?:\[[^\]]+\]([^\[]+)\[\/[^\]]+\])|(?:(?:href|src)=([^\s|^>]+)[""|>|\s\’])"
Set Matches = objRegExp.Execute("[img]2312.jpg[/img][img]2312.jpg[/img]hh[img]http://www.dc9.cn/cm/upload/2ed312.jpg[/img]<a href=""http://www.dc9.cn/ddd.jpg""></a> href=""http://www.dc9.cn/dccdd.jpg"">[IMG_RIGHT=400,300,title]upload/2assas.jpg[/IMG_RIGHT]<sctipt src=""http://www.dc9.cn/upload/sss.jpg""")
Dim TmpMatch
For i=0 to Matches.Count-1
Call InsertDataToArray(Matches(i).SubMatches(0),aryMatch)
Call InsertDataToArray(Matches(i).SubMatches(1),aryMatch)
Next 
For i=0 to Ubound(aryMatch)
If Not IsNull(aryMatch(i)) And Trim(aryMatch(i))<>"" Then Response.write aryMatch(i)&"<br>"
Next
Function InsertDataToArray(Data,ByRef aryMatch)
If Trim(Data)<>"" Then
Data=Replace(Data,"’","")
Data=Replace(Data,"""","")
Data=Replace(Data,"\","/")
Data=Split(Data,"/")(Ubound(Split(Data,"/")))
Redim Preserve aryMatch(Ubound(aryMatch)+1)
DC9_DOT_CN_MATCH=False
For j=0 to Ubound(aryMatch)
If aryMatch(j)=Data Then DC9_DOT_CN_MATCH=True
Next
If Not DC9_DOT_CN_MATCH Then aryMatch(Ubound(aryMatch))=Data
End If
End Function


实际上,Z-Blog的话就匹配Upload就可以了(但是我为了省事,也为了更精确些,就干脆在上面的那个匹配上面加上了upload,所以看上去好像下面这个更复杂些,其实理论上应该下面这个简单些,毕竟有upload管着呢。。),也不用SPLit那个/.这么写就可以了:

Dim objRegExp,Matches,i,ZC_UPLOAD_MATCH
Dim aryMatch()
Redim Preserve aryMatch(0)
Set objRegExp=New RegExp
objRegExp.IgnoreCase =True
objRegExp.Global=True
objRegExp.Pattern="(?:\[[^\]]+\][^\[]*upload\/([^\[|^\\|^\/]+)\[\/[^\]]+\])|(?:(?:href|src)=""{0,1}[^\s|^""|^>|^’]*upload\/([^\s|^>]+)[""|>|\s\’])" 
Set Matches = objRegExp.Execute("[img]2312.jpg[/img][img]2312.jpg[/img]hh[img]http://www.dc9.cn/cm/upload/2ed312.jpg[/img]<a href=""http://www.dc9.cn/ddd.jpg""></a> href=""http://www.dc9.cn/dccdd.jpg"">[IMG_RIGHT=400,300,title]upload/2assas.jpg[/IMG_RIGHT]<sctipt src=""http://www.dc9.cn/upload/sss.jpg"" src=http://www.dc9.cn/upload/sasds.jpg’>")
Dim TmpMatch
For i=0 to Matches.Count-1
Call InsertDataToArray(Matches(i).SubMatches(0),aryMatch)
Call InsertDataToArray(Matches(i).SubMatches(1),aryMatch)
Next 
For i=0 to Ubound(aryMatch)
If Not IsNull(aryMatch(i)) And Trim(aryMatch(i))<>"" Then Response.write aryMatch(i)&"<br>"
Next
Function InsertDataToArray(Data,ByRef aryMatch)
If Trim(Data)<>"" Then
Data=Replace(Data,"’","")
Data=Replace(Data,"""","")
Redim Preserve aryMatch(Ubound(aryMatch)+1)
ZC_UPLOAD_MATCH=False
For j=0 to Ubound(aryMatch)
If aryMatch(j)=Data Then ZC_UPLOAD_MATCH=True
Next
If Not ZC_UPLOAD_MATCH Then aryMatch(Ubound(aryMatch))=Data
End If
End Function      


出处:http://www.dc9.cn/post/279.html

标签:正则,RegExp,文件,数组
0
投稿

猜你喜欢

  • Python中logging日志的四个等级和使用

    2023-05-10 14:57:41
  • MySQL 移动数据目录后启动失败问题解决

    2024-01-23 02:45:42
  • Python实现Restful API的例子

    2023-03-23 18:28:10
  • Oracle学习笔记(五)

    2012-01-05 18:52:30
  • Python尾递归优化实现代码及原理详解

    2023-11-08 15:35:28
  • MYSQL之on和where的区别解读

    2024-01-21 20:17:46
  • java自定义动态链接数据库示例

    2024-01-27 13:05:29
  • Python中的jquery PyQuery库使用小结

    2023-05-27 11:08:15
  • 对Keras自带Loss Function的深入研究

    2021-08-27 03:18:24
  • Python探索之自定义实现线程池

    2021-10-09 08:28:11
  • SQL Server 排序函数 ROW_NUMBER和RANK 用法总结

    2024-01-20 17:16:36
  • JavaScript贪吃蛇的实现代码

    2023-08-31 04:41:44
  • Python GUI库PyQt5图形和特效样式QSS介绍

    2022-05-03 09:25:34
  • Python面向对象之多态原理与用法案例分析

    2023-08-16 00:09:59
  • 使用keras实现BiLSTM+CNN+CRF文字标记NER

    2022-05-01 04:46:22
  • sql集合运算符使用方法

    2024-01-26 08:18:13
  • Nodejs 数组的队列以及forEach的应用详解

    2024-05-02 16:18:39
  • MySQL关联查询优化实现方法详解

    2024-01-12 17:06:11
  • 通过SQL绘制杨辉三角的实现方法介绍

    2024-01-27 04:08:49
  • Python中关于使用模块的基础知识

    2022-11-10 04:11:21
  • asp之家 网络编程 m.aspxhome.com