日志分析工具AWStats的部署与林业网站分析研究
2019-09-09魏娟
魏 娟
(山东省林业信息中心,山东 济南250014)
AWStats是一个免费的并可以根据用户进行个性化设置的一个强大工具,它可以对网站等产生的大量日志档案进行分析,输出直观的统计图。AWStats是众多日志分析软件中发展势头较快的Web日志分析工具之一,它基于Perl,支持windows或GNU/Linux系统(安装了ActivePerl后),可跨平台运行。用户可以依照浏览器不同调用不同语言界面,有简体中文版本。支持Apache格式日志,效率很高,AWStats相较于开源日志分析工具Webalizer,它输出的统计项目足够丰富,固然执行速度弱于Webalizer,但足够应对某个日访问量百万级的网站。结果精确,可将很多搜索引擎的机器人访问过滤掉。配置简单易操作,扩展性强,有很多统计功能参数。
1 获取日志文件
AWStats日志分析是通过服务器分析指定格式的web运行日志进行实现。
首先是获取分析数据,这是日志分析的前提条件。如何获得日志数据,可以通过该两种方式进行:一是通过在网页中进行代码植入,二是对网页没有任何修改,直接从web服务器端日志文件中获取数据。通常来说,不推荐在网页中植入代码的方式,随意增减代码给网站服务器带来一定安全隐患的同时,也无形中为网页维护工作增加了工作量。因此一般选择第二种方式,即通过获取网站log文件的方式来获得数据进行分析。
以某林业政府网站域名www.xxlinye.gov.cn,使用Tomcat6.0为例。在web服务器上找到Apache服务。在服务运行过程中,logs文件是无法拷贝的,因为它要随时根据运行情况实时更新,必须停掉Apache服务。键入以下命令找到服务器管理器
servermanager.msc
找到Apache服务,停止以下几项服务:
Apache Tomcat6.0 Tomcat6cms
Apache Tomcat6.0 Tomcat6platform
Apache Tomcat6.0 Tomcat6search
然后在appApachelogs下找到日志文件。
2 日志分割
在服务器端找到了林业网站的相关日志文件dummy-host.example.com-access_log与dummy-host.example.com-error_log,发现日志文件已达到十几个G,如果直接进行日志分析,速度不能保证的同时,分析也很困难。
因此,为了今后更好的实现该网站的日志分析工作,通过对Apache进行相应的配置,对目前的日志文件进行之日分割,实现按天存储访问日志文件,方便以后使用,同时将之前的超大日志删除。
在Apache安装盘上conf文件夹下找到apache的配置文件httpd.conf。
打开文件,查找 CustomLog,将 CustomLog“logs/access.log”common改成
CustomLog"|e:/app/apache/bin/rotatelogs.exe
e:/app/apache/logs/access_%Y_%m_%d.log 86400 480"common
其中,rotatelogs通过它的offset参数表示中国标准时间与UTC的时区差异。我国是东八区,比零时区早8个小时,也就是480分钟,86400秒则是表示1天。若没有480这个参数,日志记录时间和服务器时间会相差8小时。
错误日志也是一样,进行如下操作。
查找ErrorLog,将ErrorLog"logs/error.log"改成
#ErrorLog"|e:/app/apache/logs/bin/rotatelogs.exe
e:/app/apache/logs/_error_%Y_%m_%d 86400 480"
设置完毕后重启Apache服务。以上操作可以实现产生1个日志文件/每日,1个错误日志/每日。
3 AWStats的部署与分析
3.1 下载工具
下载perl5、cronolog、awstats 3个工具,其版本都是支持在windows平台上运行的。
3.2 安装
首先对perl5进行安装,然后从cronolog的压缩包中把cronolog.exe提取出来,之后 对awstats压缩包进行解压缩,假设目录结构如下:
3.3 Apache 配置文件修改
将以下代码增加到apache的配置文件末尾,目的是让apache可以访问到awstats的目录
3.4 AWStats 文件配置
在awstats安装目录下找到以下目录E:/awstats/awstats-6.9/wwwroot/cgi-bin找到默认的awstats.model.conf文件,拷贝两次到当前目录,
第一份拷贝取名为:common.conf即可。
另一份拷贝根据分析网站的域名而有所区别,取名为:awstats.www.xxlinye.gov.cn.conf,分析的网站不同,取名相应改变。
然后打开awstats.www.xxlinye.gov.cn.conf,将原本内容情况,换成如下:
#包含通用的配置文件
3.5 测试
配置完成,测试一下配置成功与否。
在开始输入"cmd"打开命令提示符,用命令行方式操作,
进入到E:/awstats/awstats-6.9/wwwroot/cgi-bin目录,
然后输入:
E:/awstats/perl5/bin/perl.exe awstats.pl-config=www.domain.com,
回车执行。
部署成功则显示如下信息:
3.6 实现web显示
在E:/awstats/awstats-6.9/wwwroot/cgi-bin目录下有两个pl文件,分别为awredir.pl和awstats.pl。按照如下修改这两个文件:
将第一行的:#!/usr/bin/perl都修改成:#!E:/awstats/perl5/bin/perl.exe
打开web浏览器,输入:
www.xxlinye.gov.cn/awstats/awstats.pl?config=www.xxlinye.gov.cn
就可以看到AWStats的统计界面了。
4 分析与总结
随着社会对政府网站的逐步重视,政府网站绩效评估已成为政府工作重点之一。林业政府网站作为一个部门的门户网站,每日发布大量政务信息,包括涉及林业方面的重大方针政策、工作动态、文件办理结果、行政审批公示、咨询问题回应等等,是社会公众了解林业工作的重要窗口。
加强对林业网站的日志分析,比如分析公众对不同栏目的访问量,访问速度,在线咨询问题数、网站访问人数等指标,可以很容易的看出不同时间节点,公众的关注热热点是在哪里,政府可以根据访问热点及时作出公众回应,引导舆情发展,从一定程度上为推进网站信息内容建设,提升林业网站在线服务水平提供依据,为网站管理决策提供参考,使网站以更高的效率和更贴心的亲和力服务于公众。
AWStats作为可以运行在Windows服务器上的日志分析软件,对很多有着Linux服务器困难症的技术工程师带来了更加友好的操作,实现起来也更便捷。所以用AWStats日志分析工具的对政府网站的评估有着良好的促进作用。