AWStats简介:Apache/IIS的日志分析工具(3)

作者:车东 来源:笔记 by 车东 时间:2008-05-02 20:44:00 

日志分析

./awstats.pl -update -config=sitename -lang=cn
比如:./awstats.pl -update -config=chedong
会自动调用awstats.chedong.conf这个配置文件

统计输出

GNU/Linux    http://localhost/cgi-bin/awstats/awstats.pl?config=chedong
Windows 2000 http://localhost/awstats/awstats.chedong.html

日志统计自动运行

GNU/Linux上:crontab -e: 每天8点10分运行
#update awstats
10 8 * * * (cd /path/to/apache/cgi-bin/awstats/; ./awstats.pl -update -config=chedong)

Windows 2000上:设置每天8点10分运行
D:\Perl\bin\perl.exe d:\AWStats\tools\awstats_buildstaticpages.pl -update -config=chedong -lang=cn -dir=c:\inetpub\awstats\ -awstatsprog=d:\awstats\wwwroot\cgi-bin\awstats.pl

多站点日志统计

AWStats自带了一个批处理工具:tools/awstats_updateall.pl,可以批量地遍历一个目录下所有地配置文件并运行统 计。因此剩下的工作就主要是日志的同步问题了。

针对多个站点,很多配置选项是重复的,如果每个配置文件都修改维护起来会很麻烦,AWStats从5.4版本开始提供了配置文件包含的功能,所以我们可 以配置一个通用配置,比如:common.conf

然后其他站点的配置设置为:可以通过后面的选项覆盖和缺省不一致的配置。
awstats.bbs.chedong.conf
Include "chedong.common.conf"
LogFile "/path/to/bbs_log"
SiteName "bbs.chedong.com"

awstats.www.chedong.conf
Include "chedong.common.conf"
LogFile "/path/to/www_log"
SiteName "www.chedong.com"
HostAliases="chedong.com" 

统计指标说明

  • 参观者:按来访者不重复的IP统计,一个IP代表一个参观者;

  • 参观次数:一个参观者可能1天之内参观多次(比如:上午一次,下午一次),所以按一定时间内(比如:1个小时),不重复的IP数统计,参观者 的访问次数;

  • 网页数:不包括图片,CSS, JavaScript文件等的纯页面访问总数,但如果一个页面使用了多个帧,每个帧都算一个页面请求;

  • 文件数:来自浏览器客户端的文件请求总数,包括图片,CSS,JavaScript等,用户请求一个页面是,如果页面中包含图片等,所以对服 务器会发出多次文件请求,文件数一般远远大于文件数;

  • 字节:传给客户端的数据总流量;

  • 来自REFERER中的数据:日志中的参考(REFERER)字段,记录了访问相应网页之前地址,因此如果用户是通过搜索引擎的搜索结果点击 进入网站的,日志中就会有用户在相应搜索引擎的查询地址,这个地址中就可以通过解析将用户查询使用的关键词提取出来:
    比如:
    2003-03-26 15:43:58 123.123.123.123 - GET /index.html 200 192 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+5.01;+Windows+NT+5.0) http://www.google.com/search?q=chedong
    AWStats在搜索引擎的关键短语和关键词统计方面的功能还是比较完整的:可以对全世界3百多种机器爬虫进行识别,并且可以识别大部分主流国际化搜索引 擎和很多地区的本地语言搜索引擎。

Hacking AWStats

基于地理信息的插件安装:

GeoIP 和 Geo::IPfree(awstats 5.5+)
GeoIP和Geo::IPfree都免费的是国家/IP的影射表,比通过DNS反相解析域名得到的统计准确,而且速度快。GeoIP的API都是免费 的,缺省库是免 费的,收费的是它的数据更新服务。Geo::IPfree不仅代码是公开的,而且库数据也是公开的。

GeoIP安装:
先下载C库:GeoIP C解包后
%./configure; make
#make install

然后下载Perl库:GeoIP Perl解包后
%perl MakeFile.PL; make
#make install

Geo::IPfree安装:
下载Geo::IPfree解 包后
%perl Makefile
%make
#make install

配置:通过在配置文件中启用GEOIP相关插件:

LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
 

MaxMind目前免费提供了GeoIP和GeoIPCityLite数据包:可以定期每个月从以下地址下载

http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz

标签:awstats,iis,apache,日志
0
投稿

猜你喜欢

  • 谷歌排名算法异动:大品牌的排名全面提升

    2009-03-02 11:09:00
  • 分词与索引库

    2009-09-22 15:17:00
  • Discuz! 7.2图文安装教程

    2009-11-24 09:13:00
  • 上班月入3000与网赚日入3000

    2009-01-22 20:18:00
  • 开心人公司首度披露广告收入达3448万元

    2009-10-30 13:42:00
  • 动易SiteFactory CMS 新特性之——“角色”

    2009-02-13 17:57:00
  • WordPress 3.3:将更注重上传功能和更新方式

    2011-07-13 19:53:59
  • MDaemon Server操作指南

    2007-03-27 13:27:00
  • SEO必备能力之数据分析能力

    2009-09-07 16:51:00
  • linux驱动开发中常用函数copy_from_user open read write详解

    2023-10-21 04:51:31
  • GoDaddy,指定Document Root需要注意的问题

    2010-04-12 12:58:00
  • Linux jdk安装及环境变量配置教程(jdk-8u144-linux-x64.tar.gz)

    2023-08-05 21:11:16
  • 小内存VPS跑wordpress专用lanmp一键安装包damnp.sh

    2011-04-29 12:27:00
  • 网易网站部业务大调整:分拆资讯与产品内容

    2010-03-08 08:29:00
  • Windows 2000 Outlook Express 5.0的新特性

    2010-05-13 18:31:00
  • UCenter Home新版优化用户邮箱验证等功能

    2009-06-13 19:21:00
  • 在Godaddy注册购买域名有什么好处?

    2010-04-07 09:01:00
  • ProFtpd快速指南(六)

    2007-09-27 13:42:00
  • Microsoft JET Database Engine (0x80004005) 未指定的错误的完美解决

    2010-08-22 19:00:00
  • linux系统命令笔记整理

    2022-08-21 08:55:50
  • asp之家 网站运营 m.aspxhome.com