PHP实现网页内容html标签补全和过滤的方法小结【2种方法】

作者:websites 时间:2023-09-06 22:28:26 

本文实例讲述了PHP实现网页内容html标签补全和过滤的方法。分享给大家供大家参考,具体如下:

如果你的网页内容的html标签显示不全,有些表格标签不完整而导致页面混乱,或者把你的内容之外的局部html页面给包含进去了,我们可以写个函数方法来补全html标签以及过滤掉无用的html标签.

php使HTML标签自动补全,闭合,过滤函数方法一:

代码:


function closetags($html) {
preg_match_all('#<(?!meta|img|br|hr|input\b)\b([a-z]+)(?: .*)?(?<![/|/ ])>#iU', $html, $result);
$openedtags = $result[1];
preg_match_all('#</([a-z]+)>#iU', $html, $result);
$closedtags = $result[1];
$len_opened = count($openedtags);
if (count($closedtags) == $len_opened) {
   return $html;
}
$openedtags = array_reverse($openedtags);
for ($i=0; $i < $len_opened; $i++) {
   if (!in_array($openedtags[$i], $closedtags)) {
    $html .= '</'.$openedtags[$i].'>';
   }else {
    unset($closedtags[array_search($openedtags[$i], $closedtags)]);
   }
}
return $html;
}

closetags()解析:

array_reverse() : 此函数将原数组中的元素顺序翻转,创建新的数组并返回。如果第二个参数指定为 true,则元素的键名保持不变,否则键名将丢失。

array_search() : array_search(value,array,strict),此函数与in_array()一样在数组中查找一个键值。如果找到了该值,匹配元素的键名会被返回。如果没找到,则返回 false。 如果第三个参数strict被指定为 true,则只有在数据类型和值都一致时才返回相应元素的键名。

php使HTML标签自动补全,闭合,过滤函数方法二:


function checkhtml($html) {
 $html = stripslashes($html);
   preg_match_all("/\<([^\<]+)\>/is", $html, $ms);
   $searchs[] = '<';
   $replaces[] = '<';
   $searchs[] = '>';
   $replaces[] = '>';
   if($ms[1]) {
     $allowtags = 'img|font|div|table|tbody|tr|td|th|br|p|b|strong|i|u|em|span|ol|ul|li';//允许的标签
     $ms[1] = array_unique($ms[1]);
     foreach ($ms[1] as $value) {
       $searchs[] = "<".$value.">";
       $value = shtmlspecialchars($value);
       $value = str_replace(array('\\','/*'), array('.','/.'), $value);
       $value = preg_replace(array("/(javascript|script|eval|behaviour|expression)/i", "/(\s+|"|')on/i"), array('.', ' .'), $value);
       if(!preg_match("/^[\/|\s]?($allowtags)(\s+|$)/is", $value)) {
         $value = '';
       }
       $replaces[] = empty($value)?'':"<".str_replace('"', '"', $value).">";
     }
   }
   $html = str_replace($searchs, $replaces, $html);
 return $html;
}
//取消HTML代码
function shtmlspecialchars($string) {
 if(is_array($string)) {
   foreach($string as $key => $val) {
     $string[$key] = shtmlspecialchars($val);
   }
 } else {
   $string = preg_replace('/&((#(\d{3,5}|x[a-fA-F0-9]{4})|[a-zA-Z][a-z0-9]{2,5});)/', '&\\1',
     str_replace(array('&', '"', '<', '>'), array('&', '"', '<', '>'), $string));
 }
 return $string;
}

checkhtml($html)解析:

stripslashes():函数删除由addslashes()函数添加的反斜杠。该函数用于清理从数据库或HTML表单中取回的数据。

希望本文所述对大家PHP程序设计有所帮助。

标签:PHP,html,补全,过滤
0
投稿

猜你喜欢

  • 利用python实现冒泡排序算法实例代码

    2021-06-29 17:00:14
  • python 读取Linux服务器上的文件方法

    2023-03-31 23:54:19
  • PHP PDOStatement::bindValue讲解

    2023-06-14 11:16:02
  • python 算法 排序实现快速排序

    2022-09-04 03:20:17
  • mysql执行计划介绍

    2024-01-29 10:32:36
  • Javascript 动画初探(原理)

    2009-02-06 15:53:00
  • 详解Python函数print用法

    2023-06-10 03:47:34
  • TensorFlow索引与切片的实现方法

    2022-11-08 16:00:12
  • JavaScript解释型模版

    2009-10-19 23:12:00
  • python爬虫 爬取超清壁纸代码实例

    2021-03-19 02:51:54
  • MySQL表字段设置默认值(图文教程及注意细节)

    2024-01-18 14:34:52
  • 5款实用的python 工具推荐

    2021-08-09 20:13:28
  • Python从使用线程到使用async/await的深入讲解

    2021-07-26 10:56:11
  • JavaScript[对象.属性]集锦

    2020-07-08 18:05:45
  • oracle数据库下统计专营店的男女数量的语句

    2012-07-11 16:01:17
  • django注册用邮箱发送验证码的实现

    2022-11-08 06:59:59
  • SQL Server恢复模型之批量日志恢复模式

    2024-01-28 07:34:22
  • Python字符串、列表、元组、字典、集合的补充实例详解

    2022-06-24 14:50:56
  • CSS Sprites + 圆角[译]

    2009-05-08 16:10:00
  • python 判断txt每行内容中是否包含子串并重新写入保存的实例

    2023-11-28 06:34:56
  • asp之家 网络编程 m.aspxhome.com