APP下载

日志分析工具AWStats的部署与林业网站分析研究

2019-09-09

山东林业科技 2019年4期
关键词:配置文件拷贝日志

魏 娟

(山东省林业信息中心,山东 济南250014)

AWStats是一个免费的并可以根据用户进行个性化设置的一个强大工具,它可以对网站等产生的大量日志档案进行分析,输出直观的统计图。AWStats是众多日志分析软件中发展势头较快的Web日志分析工具之一,它基于Perl,支持windows或GNU/Linux系统(安装了ActivePerl后),可跨平台运行。用户可以依照浏览器不同调用不同语言界面,有简体中文版本。支持Apache格式日志,效率很高,AWStats相较于开源日志分析工具Webalizer,它输出的统计项目足够丰富,固然执行速度弱于Webalizer,但足够应对某个日访问量百万级的网站。结果精确,可将很多搜索引擎的机器人访问过滤掉。配置简单易操作,扩展性强,有很多统计功能参数。

1 获取日志文件

AWStats日志分析是通过服务器分析指定格式的web运行日志进行实现。

首先是获取分析数据,这是日志分析的前提条件。如何获得日志数据,可以通过该两种方式进行:一是通过在网页中进行代码植入,二是对网页没有任何修改,直接从web服务器端日志文件中获取数据。通常来说,不推荐在网页中植入代码的方式,随意增减代码给网站服务器带来一定安全隐患的同时,也无形中为网页维护工作增加了工作量。因此一般选择第二种方式,即通过获取网站log文件的方式来获得数据进行分析。

以某林业政府网站域名www.xxlinye.gov.cn,使用Tomcat6.0为例。在web服务器上找到Apache服务。在服务运行过程中,logs文件是无法拷贝的,因为它要随时根据运行情况实时更新,必须停掉Apache服务。键入以下命令找到服务器管理器

servermanager.msc

找到Apache服务,停止以下几项服务:

Apache Tomcat6.0 Tomcat6cms

Apache Tomcat6.0 Tomcat6platform

Apache Tomcat6.0 Tomcat6search

然后在appApachelogs下找到日志文件。

2 日志分割

在服务器端找到了林业网站的相关日志文件dummy-host.example.com-access_log与dummy-host.example.com-error_log,发现日志文件已达到十几个G,如果直接进行日志分析,速度不能保证的同时,分析也很困难。

因此,为了今后更好的实现该网站的日志分析工作,通过对Apache进行相应的配置,对目前的日志文件进行之日分割,实现按天存储访问日志文件,方便以后使用,同时将之前的超大日志删除。

在Apache安装盘上conf文件夹下找到apache的配置文件httpd.conf。

打开文件,查找 CustomLog,将 CustomLog“logs/access.log”common改成

CustomLog"|e:/app/apache/bin/rotatelogs.exe

e:/app/apache/logs/access_%Y_%m_%d.log 86400 480"common

其中,rotatelogs通过它的offset参数表示中国标准时间与UTC的时区差异。我国是东八区,比零时区早8个小时,也就是480分钟,86400秒则是表示1天。若没有480这个参数,日志记录时间和服务器时间会相差8小时。

错误日志也是一样,进行如下操作。

查找ErrorLog,将ErrorLog"logs/error.log"改成

#ErrorLog"|e:/app/apache/logs/bin/rotatelogs.exe

e:/app/apache/logs/_error_%Y_%m_%d 86400 480"

设置完毕后重启Apache服务。以上操作可以实现产生1个日志文件/每日,1个错误日志/每日。

3 AWStats的部署与分析

3.1 下载工具

下载perl5、cronolog、awstats 3个工具,其版本都是支持在windows平台上运行的。

3.2 安装

首先对perl5进行安装,然后从cronolog的压缩包中把cronolog.exe提取出来,之后 对awstats压缩包进行解压缩,假设目录结构如下:

3.3 Apache 配置文件修改

将以下代码增加到apache的配置文件末尾,目的是让apache可以访问到awstats的目录

3.4 AWStats 文件配置

在awstats安装目录下找到以下目录E:/awstats/awstats-6.9/wwwroot/cgi-bin找到默认的awstats.model.conf文件,拷贝两次到当前目录,

第一份拷贝取名为:common.conf即可。

另一份拷贝根据分析网站的域名而有所区别,取名为:awstats.www.xxlinye.gov.cn.conf,分析的网站不同,取名相应改变。

然后打开awstats.www.xxlinye.gov.cn.conf,将原本内容情况,换成如下:

#包含通用的配置文件

3.5 测试

配置完成,测试一下配置成功与否。

在开始输入"cmd"打开命令提示符,用命令行方式操作,

进入到E:/awstats/awstats-6.9/wwwroot/cgi-bin目录,

然后输入:

E:/awstats/perl5/bin/perl.exe awstats.pl-config=www.domain.com,

回车执行。

部署成功则显示如下信息:

3.6 实现web显示

在E:/awstats/awstats-6.9/wwwroot/cgi-bin目录下有两个pl文件,分别为awredir.pl和awstats.pl。按照如下修改这两个文件:

将第一行的:#!/usr/bin/perl都修改成:#!E:/awstats/perl5/bin/perl.exe

打开web浏览器,输入:

www.xxlinye.gov.cn/awstats/awstats.pl?config=www.xxlinye.gov.cn

就可以看到AWStats的统计界面了。

4 分析与总结

随着社会对政府网站的逐步重视,政府网站绩效评估已成为政府工作重点之一。林业政府网站作为一个部门的门户网站,每日发布大量政务信息,包括涉及林业方面的重大方针政策、工作动态、文件办理结果、行政审批公示、咨询问题回应等等,是社会公众了解林业工作的重要窗口。

加强对林业网站的日志分析,比如分析公众对不同栏目的访问量,访问速度,在线咨询问题数、网站访问人数等指标,可以很容易的看出不同时间节点,公众的关注热热点是在哪里,政府可以根据访问热点及时作出公众回应,引导舆情发展,从一定程度上为推进网站信息内容建设,提升林业网站在线服务水平提供依据,为网站管理决策提供参考,使网站以更高的效率和更贴心的亲和力服务于公众。

AWStats作为可以运行在Windows服务器上的日志分析软件,对很多有着Linux服务器困难症的技术工程师带来了更加友好的操作,实现起来也更便捷。所以用AWStats日志分析工具的对政府网站的评估有着良好的促进作用。

猜你喜欢

配置文件拷贝日志
提示用户配置文件错误 这样解决
一名老党员的工作日志
扶贫日志
搭建简单的Kubernetes集群
互不干涉混用Chromium Edge
忘记ESXi主机root密码怎么办
唐氏综合征是因为“拷贝”走样了
游学日志
一种基于粗集和SVM的Web日志挖掘模型
小小拷贝工.最快Windows拷贝工具