防采集,几种觉得有用的防采集方法

时间:2009-09-03 13:30:00 

关于采集-防采集的我想大家都很清楚。这个就不多说,采集最终还是从页面源代码入手,所以只要没有规律想采集就难

由于一天自己在策划某个网站的时候,觉得自己的想法不错。可以于是就有了另个想法--防采集。所以就开始搜索了。找了些,讲的我个人觉得不是很理想,最后觉得这篇文章3点写得还可行(因为没试过什么是觉得)。内容如下:

1、文章头尾加随机广告..
2、文章列表加随机不同的链接标签,比如<a href="",<a class="dds" href=''
3、正文头尾或列表头尾添加<!--重复特征代码-->
4、空格,代码中的空格

第一种防采集方法:

下面我详细说一下这三种方法的实际应用:

如果全加上,绝对可以有效的防采集,单独加一种就可以让采集者头疼。
完全可以对付通用的CMS采集程序。

在采集时,通常都是指定头尾特征从哪到哪过滤.这里我们先讲第一种方法,文章头尾加随机广告..随机广告是不固定的。

比如你的文章内容是"欢迎访问阿里西西",那么随机广告的加入方法:
<div id="xxx">
随机广告1欢迎访问阿里西西随机广告2
</div>
注:随机广告1和随机广告2每篇文章只要随机显示一个就可以了.

第二种防采集方法:

---------------------------------------
<!--<div id="xxx_文章ID">-->
其它标题或内容...
<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
随机广告1欢迎访问阿里西西随机广告2
<--</div>-->
</div>
<--</div>-->
-------------------------------------

这是第二种防采集方法。在文章正文页面插入重复特征头尾代码的注释。
当然,这个可以用正则去掉,但足于对付通用的采集系统。

第三种防采集方法:

第三种加在文章的列表,随便链接样式:
<a href="xxx.html">标题一</a>
<a alt="xxx" href="xxx.html">标题二</a>
<a href='xxx.html'>标题三</a>
<a href=xxx.html>标题四</a>

-----------------------------------
所以:只要页面源代码没有规律想采集就难!无法批量进行采集.

标签:采集,防采集,CMS
0
投稿

猜你喜欢

  • conda查看、创建、删除、激活与退出环境命令详解

    2022-02-25 19:11:09
  • MySQL为数据表建立索引的原则详解

    2024-01-13 14:46:18
  • php获取文件扩展名的3种方法实例

    2023-05-25 02:15:51
  • 如何利用pycharm进行代码更新比较

    2022-06-21 17:13:09
  • Sqlserver 自定义函数 Function使用介绍

    2024-01-16 09:11:36
  • javascript实现划词标记+划词搜索功能

    2008-02-21 13:20:00
  • SQL server 表数据改变触发发送邮件的方法

    2024-01-23 02:15:48
  • 基于SQL Server OS的任务调度机制详解

    2024-01-14 22:17:59
  • Vue实现无限加载瀑布流

    2024-05-09 15:23:16
  • Python中Tkinter组件Button的具体使用

    2022-06-07 00:26:33
  • [项目布局配置]Nosql与PythonWeb-Flask框架组合

    2022-07-08 19:55:40
  • 如何利用python执行txt文件中的代码

    2021-03-01 04:47:46
  • MySQL的数据库数据备份和恢复详解

    2012-01-29 18:19:07
  • 将数组中指定数量的元素移动数组后面的实现代码

    2023-11-16 22:07:56
  • 分享6个好用到爆的Pycharm插件

    2021-07-07 21:17:59
  • MySQL 整表加密解决方案 keyring_file详解

    2024-01-18 07:50:31
  • python求质数列表的例子

    2021-01-10 01:42:56
  • python控制台打印log输出重复的解决方法

    2021-02-23 04:05:17
  • 怎样在不同版本SQL Server中存储数据

    2009-01-20 13:11:00
  • php使用pack处理二进制文件的方法

    2023-11-21 04:26:11
  • asp之家 网络编程 m.aspxhome.com