robots.txt使用技巧

作者:小可 来源:doumiao.net 时间:2008-04-28 13:06:00 

robots.txt文件的功能非常有限,它并不能诱使蜘蛛在你的网站上花费更多的时间或者访问更多的页面。但如果你知道robots.txt的一些使用技巧,你可以更大的发挥robots.txt文件的作用。

1. 每当用户试图访问某个不存在的URL时,服务器都会在日志中记录404错误(无法找到文件)。每当搜索蜘蛛来寻找并不存在的robots.txt文件时,服务器也将在日志中记录一条404错误,所以你应该在网站中添加一个robots.txt。

2. 网站管理员必须使蜘蛛程序远离某些服务器上的目录——保证服务器性能。比如:大多数网站服务器都有程序储存在“cgi-bin”目录下,因此在robots.txt文件中加入“Disallow: /cgi-bin”是个好主意,这样能够避免将所有程序文件被蜘蛛索引,可以节省服务器资源。一般网站中不需要蜘蛛抓取的文件有:后台管理文件、程序脚本、附件、数据库文件、编码文件、样式表文件、模板文件、导航图片和背景图片等等。

下面是VeryCMS里的robots.txt文件:
User-agent: *
Disallow: /admin/   后台管理文件
Disallow: /require/   程序文件
Disallow: /attachment/  附件
Disallow: /images/     图片
Disallow: /data/       数据库文件
Disallow: /template/   模板文件
Disallow: /css/       样式表文件
Disallow: /lang/      编码文件
Disallow: /script/    脚本文件

3. 如果你的网站是 * 页,并且你为这些 * 页创建了静态副本,以供搜索蜘蛛更容易抓取。那么你需要在robots.txt文件里设置避免 * 页被蜘蛛索引,以保证这些网页不会被视为含重复内容。

4. robots.txt文件里还可以直接包括在sitemap文件的链接。

目前对此表示支持的搜索引擎公司有Google, Yahoo, Ask and MSN。而中文搜索引擎公司,显然不在这个圈子内。这样做的好处就是,站长不用到每个搜索引擎的站长工具或者相似的站长部分,去提交自己的sitemap文件,搜索引擎的蜘蛛自己就会抓取robots.txt文件,读取其中的sitemap路径,接着抓取其中相链接的网页。

5. 合理使用robots.txt文件还能避免访问时出错。比如,不能让搜索者直接进入购物车页面。因为没有理由使购物车被收录,所以你可以在robots.txt文件里设置来阻止搜索者直接进入购物车页面。

标签:robots.txt,技巧,蜘蛛,服务器
0
投稿

猜你喜欢

  • 手机应用的HTML5 JavaScript框架

    2011-01-06 12:11:00
  • 第三季度Skype营收增27% 新增4000万用户

    2009-10-23 07:33:00
  • SEO 给你的html网页减减肥

    2008-10-27 17:17:00
  • 校内网是如何赚钱的

    2009-03-19 14:02:00
  • AdSense 广告换新装

    2008-01-29 12:41:00
  • 未成年男子利用系统漏洞网上盗购十万元

    2009-10-13 15:39:00
  • 国防部网站3月总点击12.5亿次 透明保密并重

    2009-11-18 07:26:00
  • 企业网站搜索引擎排名优化的seo战略

    2009-03-10 10:36:00
  • 3个月时间,流量1万 收录3万 一个中专生的建站经历

    2007-08-05 18:12:00
  • 个人POP3和SMTP服务器的配置

    2007-03-27 09:46:00
  • 淘宝封百度?必须的。

    2008-09-08 12:53:00
  • Discuz! 积分策略向导功能详解

    2009-03-26 21:01:00
  • 虚拟主机和服务器合租市场将何去何从

    2008-10-06 18:59:00
  • 招聘网站怎么做

    2009-05-27 13:28:00
  • 支付宝已获外管局批准 人民币可直购国外货物

    2009-10-27 13:59:00
  • 网站SEO详解链接策略与搜索引擎优化

    2009-03-11 11:11:00
  • 从技术到思路 网站内部链接进阶优化操作

    2008-12-01 11:37:00
  • 个人站长如何应付Google Adsense变化

    2007-11-19 13:24:00
  • 一个完美网站的101项指标.第六部分.性能

    2008-03-01 09:21:00
  • 用MDaemon搭建邮件服务器(中)

    2007-11-21 13:57:00
  • asp之家 网站运营 m.aspxhome.com