AWStats简介:Apache/IIS的日志分析工具(2)

作者:车东 来源:笔记 by 车东 时间:2008-05-02 20:44:00 


AWStats安装备忘

AWStats的运行模式是这样的:

  1. 分析日志:运行后将这样的日志统计结果归档到一个AWStats的数据库(纯文本)里;

  2. 然后是输出:分两种形式

    • 一种是通过cgi程序读取统计结果数据库输出;

    • 一种是运行后台脚本将输出导出成静态文件;

      以下是2个针对单个站点日志统计例子:
      一个是在GNU/Linux上通过CGI方式的输出,
      一个是在Windows 2000上的基于静态页面的导出

      下载/安装

      http://sourceforge.net/projects/awstats/ 下载安装包后:

      GNU/Linux:tar zxf awstats-version.tgz
      awstats的脚本和静态文件缺省都在wwwroot目录下: 将cgi-bin目录下的文件都部署awstats.pl程序到/home/apache/cgi-bin/awstats/ 下
      mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
      #把图标等文件目录复制到WEB的HTML文件发布目录下:/home/apache/htdocs/ 下发布
      更多的批量更新脚本等在tools 目录下,可以一并放到cgi-bin/awstats/ 目录下,

      Windows 2000:按照后台脚本模式运行,直接解包,然后移动到D:\AWStats目录下
      把图标icon目录复制到IIS的发布目录下:inetpub/icon

      数据源日志格式和按天的截断规则

      1. 对于Apache:日志格式好设置:设置成combined格式即可,日志截断麻烦一点:需要安装cronolog工具,将日志设置成按天截断:
        CustomLog "|/usr/local/sbin/cronolog /path/to/apache/logs/access_log.%Y%m%d" combined
        比如:logs/access_log.20030326
        日志是压缩格式,可以使用gzip -d < /home/apache/logs/access_log.%YYYY-24%MM-24%DD-24.gz | 动态解压缩统计。

      2. 对于IIS:缺省有比较好的日志按天截断规则,但是IIS的日志格式比较不适合AWStats统计,
        因此最好直接去掉所有日志字段,然后严格按照以下列表设置
        相比IIS缺省设置:
        减少的有:
        增加的有:

        • 发送字节数

        • 协议版本

        • 参照 

        • 服务器IP地址

        • 服务器端口

        • URI查询

        • 日期 date

        • 时间 time

        • 客户IP地址 c-ip

        • 用户名 cs-username

        • 方法 cs-method

        • URI资源 cs-uri-stem

        • 协议状态 sc-status

        • 发送字节数 sc-bytes

        • 协议版本 cs-version

        • 用户代理 cs(User-Agent)

        • 参照 cs(Referer)

      配置文件的命名规则:awstats.sitename.conf

      AWStats的主程序awstats.pl会自动根据站点名调用相应站点的配置文件:awstats.sitename.conf
      比如:运行./awstats.pl -config=chedong 调用的就是同目录下的 awstats.chedong.conf 配置文件;
      如果没有指定-config,还会找当前目录下的awstats.conf或者/etc/awstats.conf作为缺省配置文件。
      所以最好把缺省的awstats.model.conf 重命名成 awstats.yoursite.conf;比如:awstats.chedong.conf,

      对于多个站点的统计,AWStats的配置文件包含功能还是非常有用的,我们可以把通用的配置放在一个文档中,然后用(5.4版本以后开始支持) Include配置将通用配置包含在各个具体配置文件的头部,然后用其他配置覆盖通用配置中的相应属性,比如:
      Include="common.conf"
      LogFile="/path/to/bbs/access_log"
      SiteName="bbs.chedong.com"

      最少的配置文件修改:LogFile SiteDomain LogFormat

      对于在GNU/Linux上统计Apache日志只需修改:LogFile SiteDomain这2个选项

      1. GNU/Linux LogFile="/path/to/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
        Windows 2000 LogFile="d:\iis_logs\W3SV3\ex%YY-24%MM-24%DD-24.log"
        这个配置的意思是用24小时前的年份,月份,日期拼出的日志文件名;

      2. SiteDomain="www.chedong.com"
        站点的名称,缺省是空的,如果为空,AWStats将拒绝运行;

      3. 对于统计IIS日志需要多修改一个:
        LogFormat=2
        缺省值是1:Apache日志,2是IIS日志

      其他需要注意的事项:

      AWStats缺省不过滤swf文件,会把.swf算成PageView,所以如果站点上swf文件主要是广告的话最好还是要过滤掉:

      标签:awstats,iis,apache,日志
      0
      投稿

      猜你喜欢

    1. smtp协议手工使用

      2010-03-13 19:11:00
    2. 配置Apache James邮件服务器

      2009-02-26 17:32:00
    3. 网络“新三十六行”机会多 就业蓝海待进一步开发

      2009-11-13 15:41:00
    4. 抛砖引玉:原创文章不好搞?教新手如何快速伪原创!

      2009-01-16 18:25:00
    5. 外部链接优化 提交到DMOZ以及链接诱饵

      2009-03-09 11:16:00
    6. 实战:用Linux构建高效FTP服务器

      2009-08-24 08:54:00
    7. 站长们 为什么你的站没有流量

      2007-10-11 18:07:00
    8. 快速分辨欺诈paypal

      2009-03-30 17:30:00
    9. PHPWind7.3特色功能推荐

      2009-04-19 18:37:00
    10. 一个站长论坛运营经验——和大家分享

      2008-12-09 15:57:00
    11. DISCUZ架构:AJAX之ajax.js 函数之三

      2009-02-14 08:19:00
    12. DEDE:显示文章上级栏目的名称和链接

      2009-02-15 09:39:00
    13. 2009年SEO作弊和不合理优化方式认定标准

      2009-09-09 09:45:00
    14. 使用VMware 15 安装虚拟机和使用CentOS 8的步骤详解

      2023-08-07 05:40:03
    15. 链接诱饵实例:谈行业性归类和争议性话题

      2009-02-24 12:28:00
    16. 旁观者看福州四大网站的成功之道

      2010-03-07 20:35:00
    17. 没有百度 我还有Google

      2009-08-23 13:14:00
    18. ProFTPD和WU-FTP的BANDWIDTH控制

      2010-01-02 19:03:00
    19. godaddy使用经验谈 Godaddy

      2010-04-07 12:59:00
    20. 如何在 CentOS/RHEL 系统中使用带 VLAN 标记的以太网卡

      2023-10-07 06:02:51
    21. asp之家 网站运营 m.aspxhome.com