APP下载

基于内容组的网站访问者路径分析

2014-04-29张如云

计算机时代 2014年5期
关键词:访问者网站分析

张如云

摘 要: 分析了基于内容组的访问者路径分析的内涵,阐述了进行基于内容组的访问者路径分析前需做的准备工作,提出了进行基于内容组的访问者路径分析的具体步骤,最后得出了进行网站路径分析的相关结论。为广大用户分析网站路径提供参考。

关键词: 内容组; 网站; 访问者; 路径; 分析

中图分类号:TP311 文献标志码:A 文章编号:1006-8228(2014)05-23-02

Abstract: The connotation of visitor route analysis based on content forms is analyzed. The necessary preparation before analyzing is illustrated. The concrete steps of carrying out the visitor route analysis are introduced. The analytical relevant conclusion of carrying out website route is obtained. It offers reference for users to analyze website routing.

Key words: content forms; website; visitor; route; analysis

0 引言

对网站而言,用户更多关注网络流量来源渠道和转化这两部分内容,而对于网站内容分析则提及的较少。例如,如果网站的商业目标是销售商品获利,那么帮助潜在的购买者在网站中快速找到其所需商品信息就是路径分析的一个目的,那么如何通过最短的路径找到用户所需要的内容,这是本文所要讨论的。

1 概述

所谓基于内容组的访问者路径分析,就是在开始分析之前先对网站的内容进行分组,如图1所示。那么,应如何对网站的内容进行分组;有没有可依照的标准;是按网站频道分组,还是按内容类型或者页面层级分组;每个内容组划分到多细的粒度才合适。所有的这一些问题都没有标准答案,划分内容组没有统一的标准。每个网站,甚至每个人的划分方法都不一样。这里没有对与错和好与坏之分,只要划分的内容组能够满足分析需求,达到分析目的即可。因此,在划分内容组之前,需要先明确分析的目的是什么。

分析的目的是要通过分析来解决问题。例如,对于个人博客来说,要解决的问题是如何增加订阅量,而如何增加订阅量反推到网站的内容中可分解成如下具体的问题:①网站的首页布局合理吗? ②文章列表页中的信息是否有效?③站内搜索提供的结果有效吗?④文章页的推荐有效吗?

以上问题还可以再继续分解为更具体的问题,例如:①访问者从首页去了哪些页面?②列表页的排序规则合理吗?③选择翻页的访问者有多?④没有点击站内搜索结果的访问者去了哪里?这些具体的问题就是网站的分析目的。在了解了分析目的后,就可以开始创建内容组。

2 创建内容组前的准备工作

创建内容组的过程中,经常需要反复地调整,网站创建内容组不会一次就能够顺利完成的,其中遇到的主要问题有两个。①网站URL规则混乱,层级划分不清晰。这主要是因为最初的URL规划问题,或者是SEO为了优化URL结构造成的。②内容组对URL的覆盖不全面,总会发现规则之外的新URL出现。这主要是因为对URL的整理不全面。

根据网站管理的经验,在开始创建内容组之前,必须进行如下三项准备工作,从而可以最大限度地避免内容报告中的混乱。

2.1 整理并理解网站URL

准备工作的第一步是整理网站中所有的URL,获得网站所有URL的方法有三种:①从技术或网站管理员那里导出网站URL列表;②从现有的分析工具中导出最大时间段的URL列表;③按照URL规则生成URL,并逐一验证。

前两种方法可以快速获得网站的大部分URL,但在后期整理和分类时比较麻烦;第三种方法在开始阶段比较复杂,但分类时简单,并且可以避免URL遗漏,当然前提是网站的URL规则层级清晰。

2.2 对网站URL进行分组

在获得了网站大部分URL后,可以开始对URL进行分组,并为每个分组设置一个名称。分组的标准是具体的分析需求,也就是通过分析想要解决的问题。最基础的问题有多细致,分组就要有多细致。例如,针对前面例子中的分析目的,需要将网站首页单独作为一个分组,用来分析首页的分流情况;将列表页首页作为一个分组,分析列表首页的排序规则;将列表的后续页面作为一个分组,分析访问者在列表页的翻页情况,等等。这时候,可能会发现已经创建了很多分组,并且每个分组的规则都不太一样,有些分组中只有一个页面,有些分组则包含一个频道,有些分组中只记录了访问者的某些特定的行为,比如翻页、按钮点击、留言或订阅等,而有些分组记录了网站中的错误,例如404页面、搜索失败页面等。这些都没有问题,只要分组可以满足分析需求就可以。

2.3 化为正则表达式

完成网站所有URL的分组后,需将每一个分组转化为一条正则表达式。这个工作有些复杂,必须保证每条正则表达式不遗漏分组内所有的URL,又不能错误匹配到其他分组的URL。这里没什么经验可谈,从每个分组中挑选一个典型的URL,然后放在一起进行测试。一个非常好用的正则表达式工具Rubular就可提高创建正则表达式的效率。

3 使用滤过器创建内容组

内容组是通过搜索和替换过滤器将现有URL进行聚合生成的。新生成的内容组将会覆盖Google Analytics热门内容报告,接下来需要为内容组单独创建一个新的重复配置文件,这个配置文件中的页面数据将只以内容组的名称显示,可称为“内容组路径分析报告”。

3.1 创建新配置文件

创建重复配置文件的方法非常简单,但需注意以下几点:①与主报告应用相同的配置,包括时区、过滤器等设置;②有子域的网站必须设置增加主机名过滤器;③按照具体的分析需求,有选择地过滤URL中的参数;④不要开启站内搜索报告,也不要过滤掉站内搜索或类别参数。

3.2 逐一创建内容组

通过对网站URL的整理和分组,已将整个网站的内容按照分析目的分为了不同的组。现在要做的工作就是在Goog1e Analytlcs中创建这些内容组,并获得数据。创建内容组的工具是Goog1e Ana]ytcs的搜索与替换过滤器。整个过程很简单,将分组的正则表达式输入到搜索字符串中,将分组名称输入到替换字符串中。过滤器将对URL进行过滤,与正则表达式的规则匹配的URL将被替换为替换字符串中的分组名称。

4 检查并优化内容组

创建完内容组后,并不能马上进行分析。因为这时的数据并不准确,需要对内容组进行行检查。检查的方法很简单,就是通过查看配置文件中的热门内容报告,寻找是否有被遗漏的URL,整个检查过程大概要持续3-5天。

4.1 通过热门内容报告检查内容组

在创建好内容组的第二天,通过热门内容报告检查内容组数据,检查是否有遗漏的URL,如果内容组报告中显示了某个页面URL,则说明这个页面没有被匹配到对应的内容组中,需要分析原因,对这个内容组的正则表达式进行调整。如图3所示,可明显发现,网站地图的翻页没有匹配到内容组中,需要检查这个内容组的正则表达式设置。如果创建的内容组比较多,可选择一个快速检查的方法,按页面浏览量对报告进行排序可以很快发现那些没有匹配到内容组中的URL。对内容组报告的检查是一个持续的过程,因为新增加的外部流量经常带有各种奇怪的参数,这些参数随时可能破坏现有的URL规则。

4.2 优化过滤器的顺序

在检查内容组的设置时,除了遗漏URL的检查,还需要对存在冲突的内容组进行检查。这种情况并不常见,只在URL规则混乱时才会出现。例如在同一级目录中包含多个信息,当需要对每个信息分别创建内容组时,正则表达式可能会发生匹配错误,这时需要通过调整过滤器的前后顺序来保证正确匹配至此,网站内容组的创建和检查工作都已经完成,然后通过Google Analytics中的访问者流功能,并将创建的内容组与访问者流功能配合使用,就可以对访问者的浏览行为进行详细分析。

5 结束语

本文详细讨论了基于网站的内容组的路径分析,首先要对网站的内容有个规划和分类,然后再借助Goog1e Ana]ytcs这个强大的过滤器进行内容组的分析,这样就可以最大程度地提高网站用户的访问量,进而提高网站的社会效益和经济效益。

参考文献:

[1] 张玉梅.公共数据开放的国际经验——基于公共数据开放的门户网

站分析[J].信息系统工程,2013.7:88-90

[2] 汪传雷,张莉莉,胡潇潇.基于链接分析的安徽省A级物流企业网站

分析[J].物流工程与管理,2012.2:15-17,33

[3] 孔菊芳.基于语音识别技术的英语学习网站分析[J].哈尔滨职业技术

学院学报,2012.5:65-66

[4] 张皓,王玉龙.一种网站分析系统的设计方案[J].电信网技术,

2013.10:37-42

[5] 孙丹鹏.基于访问者信息行为的网站分析探究[J].科技信息,

2012.24:275

猜你喜欢

访问者网站分析
隐蔽失效适航要求符合性验证分析
电力系统不平衡分析
电力系统及其自动化发展趋势分析
河洛文化旅游资源外宣网站日译现状调查及对策研究
文管综合实践教学中心网站建设与维护
浅析企业建立网站VI系统的必要性探讨
人物专访的技巧性分析
“造访”与“到访”
恭喜刘伟成为本刊网站第3万位访问者
恭喜刘伟成为本刊网站第3万位访问者