asp用正则过滤html标签
来源:asp之家 时间:2008-01-19 16:34:00
有时候我们需要程序截图文章中的部分字符作为摘要显示出来,这时我们一般是只希望提取的字符串是纯文本的,没有如何html标签,如果我们章节用left函数截取的化,得到的内容就包含了html代码,为了解决这个问题,我们可以有两个方法。
一是,在数据库 * 别设置一个字段用于保存摘要。优点是你可以自己总结文章摘要,这样可读性更强,不至于让人看不懂。对seo也是有好处的,缺点就是麻烦了一点,要多花心思和时间。
二是,用程序提前文章中的特定内容作为摘要,一般是前面多少个字符。此时我们就可以使用正则表达式来轻松的实现这个提取前N个纯字符的功能。
我们知道html标签有一个特定都是用<>包含的,所以正则表达式只要匹配<>就可以了:
下面的两个函数都可以实现过滤html标签的作用:
Function RemoveHTML(str)
Dim re
Set re=New RegExp
re.Pattern="<.*?>"
re.IgnoreCase=True
re.Global=True
str=re.Replace(str,"")
Set re=Nothing
RemoveHTML=str
End Function
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = "<.+?>"
Set Matches = objRegExp.Execute(strHTML)
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
对于效率来讲应该第一个更好。
代码如下:
<%
Dim contenstr
contenstr="<a href='http://www.aspxhome.com' title="asp之家">asp之家<b>欢迎您</b>!欢迎出来看看,呵呵! "
'当然这里的contenstr在实际使用时换成你的文章内容
'调用过滤函数移除html标签
contenstr=RemoveHTML(contenstr)
contenstr=left(contenstr,100) '截取前100个字符
response.write("移除html标签后:" & contenstr)
%>
标签:过滤,正则表达式,摘要,标签
0
投稿
猜你喜欢
python 读写、创建 文件的方法(必看)
2023-08-07 11:37:40
node.js 中国天气预报 简单实现
2024-05-13 10:05:44
Python GUI布局尺寸适配方法
2022-03-07 05:52:26
使用Python从有道词典网页获取单词翻译
2022-12-10 21:18:03
python 使用get_argument获取url query参数
2023-02-12 03:52:18
Python 如何让特征值滞后一行
2021-06-06 06:30:46
淘宝2011新版首页开发实践
2011-01-20 20:07:00
Python脚本开发中的命令行参数及传参示例详解
2023-01-25 02:44:30
深入理解ASP中FSO的神奇功能
2007-09-18 12:22:00
mysql 5.5 安装配置方法图文教程
2024-01-20 04:28:35
端午节将至,用Python爬取粽子数据并可视化,看看网友喜欢哪种粽子吧!
2023-08-23 06:29:31
TensorFlow卷积神经网络AlexNet实现示例详解
2022-06-14 21:17:30
Python&Matlab实现蚂蚁群算法求解最短路径问题的示例
2021-09-18 15:40:11
Mysql中find_in_set()函数用法详解以及使用场景
2024-01-18 10:17:47
python画图的函数用法以及技巧
2021-11-01 17:58:19
SQL Server页类型汇总+疑问汇总
2024-01-24 13:03:57
模仿IE自动完成功能
2010-03-18 15:51:00
Oracle 11g数据库安装与卸载的方法图解
2024-01-22 19:54:15
使用golang编写一个并发工作队列
2023-09-02 20:54:08
教你制作1px边框表格的四种方法
2008-10-04 10:16:00