国外图书馆Goog le Analytics应用研究述评*
2013-08-11黄晴珊朱伟丽
黄晴珊 朱伟丽
(中山大学图书馆 广东广州 510080)
Google Analytics是Google公司提供的网站分析服务,用于采集目标网站的访问数据,生成网站分析报告,为明智的网站改版决策提供信息。Google Analytics推出于2005年,继承了Google公司高品质服务的传统,后来经过多次升级改进,其功能设置与分析报告已经成为网站分析领域的标准,是公认的最好的网站分析工具。
对于图书馆界而言,尤其关注Google Analytics以下几个方面的特点:(1)免费服务。根据Google Analytics的服务条款,每月每个帐户不超过一千万的点击量为免费服务,而这对于图书馆网站而言足够多了,因此图书馆网站可以应用以往需高昂费用的商业服务;(2)部署简单。网站分析有两种方法,即页面标签与服务器日志文件,相对而言,页面标签方式更为简便,应用也日益广泛。Google Analytics就是基于页面标签技术的网站分析服务,只需在网站的每一个页面中放置一小段JavaScript代码即可采集数据。(3)功能完善。其网络使用基本情况报表,网站点击量分布图,地图覆盖图,站内搜索报告及高级细分功能等可以深入洞察网站健康状况,特别对Flash(事件),PDF文件下载的追踪对图书馆网站尤其有用。
图书馆网站及各类网络应用作为图书馆在数字化时代的门户与服务方式,对于图书馆的生存与发展起着重要的作用。为了更好地服务用户,发挥图书馆的功能,图书馆网站及各类网络应用也需要营销、推广与不断的改善,在这一过程中,应用Google Analytics成为必然的选择。为了解国外图书馆界对Google Analytics应用与研究的现状,本文以EBSCO的图书馆信息科学与技术数据库(Library,Information Science&Technology)为信息来源,统计该数据库中与Google Analytics相关的研究成果。具体方法为,在图书馆信息科学与技术数据库的摘要字段中以Google Analytics为检索词,在检索结果的基础上开展分析。利用这一方法,截止目前共得到81条检索结果,对检索结果做进一步的人工筛选,最终精选出相关研究文献70篇,以此为基础了解国外应用的概况。
1 文献定量分析
1.1 文献发表年代分布
从70篇相关文献发表的年代分布 (见表1)可见,Google Analytics刚一问世便被引入图书馆学领域,相关研究也呈逐年增长的态势。结合对文献内容的分析,发现前两年主要是将Google Analytics引入图书馆界,直到2007年美国法律和司法中心罗格斯纽瓦克法律图书馆的Wei Fang的 《使用Google Analytics提高图书馆网站的内容和设计:一个案例研究》,才有了第一篇研究性的文献。至2010年相关文献数量达到最多的15篇,之后每年发表的文献数量维持在近10篇左右。虽然2013年至今可检索到的文献已经达到16篇,实际上是因为其中有7篇文献是美国图书馆协会2013年4月发布的《图书馆技术报告》(Library Technology Reports)中的7个章节。总体来看,多年来,国外图书馆界对于Google Analytics的应用保持了持续的关注,相关研究也在稳步推进。
表1 文献发表时间的年代分布(篇)
1.2 发表文献类型分布
从检索到的相关文献的类型(Document Type)上看,绝大部分为Article,数量达到60篇。3篇Book Review所评论的三部图书分别是:《Google analytics》、《Performance Marketing With Google Analytics:Practical Techniques for Maximizing》与《Google Analytics:Understanding Visitor Behavior》。 此外,还包括 Case Study、Editorial、Proceeding 以及Product Review各2种,类型较为广泛,可以看出研究比较活跃,研究角度多样,并且注意对图书等相对成熟成果的引入。
同时,考虑Google Analytics是一种技术应用,文献内容涉及到Google Analytics可深可浅,所以对于检索到的70篇相关文献又根据其研究内容的深度分为介绍引入、应用案例、应用研究与应用指导4种类型(见表2),可以看出,因为Google analytics不断的改进与更新,对其进行持续的介绍推广是必要的。同时,随着研究成果的不断积累,近年来出现了对实践应用更具意义的指导型文献,这也是相关的应用与研究日益走向成熟的标志。
表2 各年代文献的类型分布(篇)
1.3 文献发表期刊分布
检索到的70篇相关文献发表在42种期刊上,平均每种期刊上发表不到2篇文献,总体来看较为分散,这表明Google analytics的应用与研究广泛,可能涉及到图书馆学的多个领域。在42种期刊中,发表文献为2篇或2篇以上的有13种期刊,共发表41篇文献(见表3)。
表3 发表了2篇或2篇以上的期刊题名与发文数量
依据 《期刊引用报告》数据库 (Journal Citation Reports,JCR)中被SSCI收录的信息科学与图书馆学学科期刊列表,调查中共有11篇文献发表于被SSCI收录的期刊 (见表4)。可见,虽然总体而言图书馆界关于Google Analytics应用的研究成果并不丰厚,但已经在图书馆学研究的重要专业期刊中占有一席之地,受重视程度日渐增加,其研究的价值得到了同行的承认。
2 研究主题分析
2.1 图书馆网站使用分析及改进
Google Analytics本身是网站分析工具,因此利用Google Analytics开展图书馆网站使用情况统计分析,并以此为依据改进图书馆网站的功能是应用的主要内容。Wei Fang介绍了将Google Analytics应用于美国法律和司法中心罗格斯纽瓦克法律图书馆的主页改版过程中。其基本方法就是利用Google Analytics的网站点击量分布图、内容标题、流量来源、访问者细分、连接速度等统计报告测试图书馆网站功能,从用户体验的角度,对图书馆新网站的设计提出建议。应用的结果表明改进后的网站有更多的流量与回访用户,并且决定在图书馆的OPAC中继续探索这一工具的应用。美国奥斯汀佩伊州立大学图书馆电子资源馆员Michael N.Hooper在文章中认为,对于图书馆应用而言,Google Analytics的统计报告大体可分为3类,即图书馆用户与图书馆网站连接的方式、图书馆网站用户的类型、用户获取图书馆网站上的内容类型。应用Google Analytics也为其网站改进提供了重要的信息,如发现应用移动设备接入所在图书馆网站的用户并不多,从而决定无需另外开发一个适应小屏幕的图书馆网站。
表4 发表于被SSCI收录的信息科学与图书馆学学科期刊的11篇文献相关信息
在网站分析领域,有一个重要术语 KPI(关键绩效指标),KPI是度量网站成功与否的关键要素。Google Analytics为网站提供了创建KPI的数据,甚至在某些场景下可以提供直接的KPI。设计与制定KPI也是图书馆网站分析的重要内容,南密西西比大学图书馆网络服务馆员Steven J.Turner在文章中指出,图书馆网站设计中缺少基于目标的KPI,创建稳健的微观KPI的过程应该包括三个基本步骤:审查图书馆发布的目标;根据图书馆的目标,为图书馆网站创建一个目标文档;创建一个列表,定义网站用户的行动,活动和行为,以支持或反映图书馆的目标。当然,对于KPI也有馆员表达了不同的看法,南伊利诺伊大学莫里斯图书馆的馆员Julie Arendt与Cassie Wagner在文章中认为图书馆的用户行为与网站目标是复杂的,没有必要试图去开发一些KPI,只需利用基本的统计数据来指导网站的改进。如果基本的统计信息与假设不符,就意味着改变的必要,如果统计指标信息不足,甚至矛盾时,需要馆员从实际需求出发做出专业的决策。
2.2 图书馆数字化资源使用情况统计
对于图书馆自建的数字化资源,可以应用Google Analytics统计使用概况,即使对于有统计模块的商业数据库,Google Analytics也可以从用户使用模式的角度来为其改进提供依据。美国范德比尔特大学创新技术和研究主任Marshall Breeding提倡从行为导向的角度寻求数据库使用的模式,比如将打印一张图片,打开一本电子书作为标准来确定一次成功的访问,对于范德比尔特电视新闻档案数据库而言,一次视频的在线请求被视为一次成功的会话,一天内成功会话的平均数可以作为服务的标尺。同时,他认为,对于增加网上资源的有效性,Google Analytics可以提供重要的信息,这些信息使数字化资源的使用建立在实证的基础上,真正确立以用户为中心的持续发展模式,这比那些非正式的主观判断或是经验基础上的观察方法要好的多。密苏里大学信息科学与学习技术学院Xin Wang等利用Google Analytics对于用户利用网络资源的行为进行深度的分析,试图揭示网站用户来源,离开站点的网页,用户的行为是否是网站建立者所期望的等信息,以分辨用户的忠诚度,了解流量来源与其它指标的相互关系。他们以一个K12资源导航网站为对象,检查不同流量来源用户行为的差异。通过研究发现,搜索引擎虽然带来了大量的流量,但偶然进入的访问者居多;而直接输入或是收藏网站地址的访问,目的性更强,用户停留的时间更长,浏览的网页更多;同时存在一批忠实用户,将查看该资源网站当成每日的信息来源。
2.3 图书馆OPAC使用情况统计分析
OPAC是图书馆网站上的重要功能之一,Google Analytics可以为图书馆OPAC的使用提供全面而独特的分析报告。Wei Fang与Marjorie E.Crawford利用Google Analytics调查了基于Innovative Interfaces的OPAC系统的信息检索模式以测量目录的有效性,为改进搜索工具提供依据。他们结合OPAC的使用日志与Google Analytics的统计结果,揭示出OPAC用户的重要行为趋势,如58%的用户定期使用OPAC、37%用户采用的检索方式是标题等,据此对于改善OPAC功能提出了建议。同时认为OPAC系统本身的统计模块在数据收集方面的功能有限,可设置参数不多,尽管开发商有增强的统计产品可供选择,但需要付出高昂的费用,而Google Analytics易于使用,易于理解,自定义功能强,可以在OPAC使用统计与改进中发挥作用。美国俄亥俄州立大学图书馆的馆员Rebekah Kilzer认为使用Google Analytics来统计OPAC的原因有四点:一是ILS软件统计功能有限;二是方便与灵活的报告;三是基于页面或站点水平的数据;四是可简单的看到趋势。同时指出,在统计过程中,Google Analytics提供的重要信息包括搜索词、浏览器信息、地理信息、网站点击量分布图等,这些Google Analytics提供的各种OPAC目录使用细节是政策与决策制定的重要数据。
2.4 Flash教育资源使用情况统计
利用Adobe Captivate、Camtasia Studio等快速课件制作工具制作flash格式的教育资源,已经成为国外图书馆开展在线用户信息素养教育的重要方式。图书馆制作了大量的教育资源,在使用过程中用户浏览这些教育资源的时长、页数、停止浏览的位置等,是改进时急需了解的信息,而对于这些信息,传统的点击量,浏览量等统计方法是无法提供的,Google Analytics通过事件跟踪功能与代码的灵活运用,为图书馆自制Flash格式教育资源使用情况统计提供了解决之法。里吉斯大学德顿纪念图书馆远程学习馆员Paul Betty是用Google Analytics统计图书馆自制flash格式教育资源的代表性人物,在其两篇论文中都阐述了利用Google Analytics来统计图书馆自制的flash格式教学资源的相关问题,并提供了具体的应用方法。根据其研究,利用Google Analytics统计工具统计图书馆自制flahs格式资源每一个页面播放次数的方法为,使用adobe captivate软件(Camtasia Studio方法类似)在生成的flash视频某一页面加入一段Google Analytics代码,则Google Analytics便会自动跟踪这一页面的播放次数。比如在一段flash视频的前后及中间任意两个位置各加入一段Google Analytics代码,相当于设定4个标记,Google Analytics可统计4个标记的播放次数,从而揭示出用户观看这段flash视频的具体情况,如是否打开后马上离开,在哪个标记前离开的情况最多等。如果需要,可以为每一个flash页面插入Google Analytics统计代码,使之都成为可跟踪的标记页。利用Google Analytics统计flash教育资源的使用情况,以更清楚的了解用户的需求与行为模式,为教育资源的完善改进提供客观的指引。
2.5 其它特色应用的使用统计
可以利用Google Analytics统计图书馆博客、维基、二维码等特色应用的使用情况。亚伯丁中央图书馆媒体中心馆员Claire Bell在伦敦互联网馆员国际会议上,介绍其利用Google Analytics跟踪二维码使用情况并改进服务。淡江大学资讯与图书馆学系林信成与洪铭禅以台湾棒球维基馆为对象,利用Google Analytics为主要分析工具,再辅以问卷调查结果掌握维基使用者的多样面貌,作为网站经营,管理,改进的依据。宾夕法尼亚州立大学存取档案保管员Michelle Belden认为博客在图书馆档案机构中应用非常广泛,并就图书馆如何使用,推广与评价博客开展了调查。同时将Google Analytics应用于北卡罗拉纳大学格林斯伯勒分校的档案博客,去发现用户的使用方式、地理位置、停留时间、流量来源等信息,并对Google Analytics应用于图书档案领域博客提出了建议。
3 研究特色总结
3.1 图书馆应用环境下统计指标的解释
Google Analytics作为一种工具,仅仅向网站管理者展示了用户做了什么,但无法解释用户行为之后的动机,更不可能对于网站的改善提出建议,调查中很多作者的文献都表达了类似的观点。也正是因为这个原因,Google Analytics在各个行业的应用,都不仅仅需要技术人员的代码安装与报表生成,而需要领域专家的深度参与,根据各领域的特点对Google Analytics的各项指标做出专门的解释。图书馆应用Google Analytics也是这样,调查中每篇研究型的文献都会针对具体应用,对Google Analytics的统计指标做出图书馆环境下的解释。其中有代表性的如美国明尼苏达大学健康科学图书馆Wayne Loftus的文章,认为图书馆网站因为主要针对校园社区用户,数量变化不大,因此网站浏览量是没有意义的;网站跳出率高通常被认为是用户体验差,但对于图书馆网站之类的导航性网站而言,较高的跳出率反而是成功的标志;此外一次会话的长短等,对于不同的页面也有不同的解释。Beatriz Plaza的研究则更为严谨,采用时间序列分析法,重新认识流量来源统计指标,对于直接访问,网站推荐与搜索引擎3种流量来源,推翻了通常上“流量多即重要”的认识。根据其研究,就该馆网站而言,虽然网站链接是最多的流量来源,但结合访问深度、会话长度、回访率、跳出率等访问者行为,直接链接与搜索引擎来源的流量更为重要,从而使馆员在网站改版时做出了截然不同的决定。
3.2 从用户行为视角研究图书馆网络服务
用户行为是近年来图书情报学科领域研究的热点问题,从用户行为视角来研究图书馆网络服务对于提高图书馆网络服务的水平,提高用户满意度具有重要意义。Google Analytics网站分析服务的内容与特点,使其很自然成为一种有效的用户行为分析工具,对用户行为的统计分析也是Google Analytics等网站分析服务,与数量众多的网站计数服务工具相区别的重要方面。图书馆领域相关研究论文也有很多是从用户行为入手来探讨Google Analytics在图书馆界的应用,比如伊利诺伊州厄巴纳—香槟大学数字人文专家Kirk Hess认为Google analytic所具有的高级功能可以跟踪用户的搜索请求,揭示出用户行为的规律,而关于用户行为的研究,传统的基于服务器日志的统计方式是无法获知的。研究特别应用了Google analytics跟踪Illinois Harvest Portal中的资源,通过分析其用户的站内搜索行为,指导Illinois Harvest Portal用户界面的重新设计。东密歇根大学图书馆馆员Sara Memmott与Susann deVries在图书馆网站与用户教育资源上应用Google Analytics,以揭示校外用户“难以捉摸”的行为,其应用Google Analytics跟踪PDF格式的教育资料与外部视频资源的使用情况尤其值得关注。以用户行为研究为基础,还有一部分学者利用Google Analytics开展图书馆网站的可用性测试,为图书馆网站改版提供客观的依据,比如用Google Analytics网站分析结果指导图书馆移动网站开发等。
3.3 具有实践应用意义系统性指南的编写
从调查结果来看,自从Google Analytics被引入图书馆界以来,经过一段时间的实践与研究,近年来出现了系统性的总结与指导性文献,美国图书馆协会编写的《图书馆技术报告》是这一方面研究的亮点。代表性的文献包括2011年的《图书馆的网站分析》,该期主要内容包括:网站分析工具概况,数据收集机制解读,安装与配置Google Analytics,有效的报告与分析,图书馆使用Google Analytics 的案例分析;2012 年《运行数字部门:图书馆网站操作指引》中的第3章《数字部门的使用与参与度》,也讨论了对来自于Google Analytics的统计数据如何应用的问题;2013 年又出版了更为详细的《Google Analytics的最大化:六种高影响力的实践》,内容包括如何将Google Analytics应用于内容管理系统、OPAC、发现服务与机构仓储、跨域跟踪;指导何时与怎样组合与分离数据;提取网站的目标并使用目标报告去测试结果;使用过滤器从数据中去排除本馆馆员的行为;使用事件跟踪得到数据,包括PDF、视频播放插件与其它非HTML目标的使用等。同时,还给出易于应用的HTML代码,使其极具实用价值;美国图书馆协会的《图书馆技术报告》连续3年涉及到Google Analytics的应用,也足以见得Google Analytics在网络时代对于提升图书馆服务的价值。
4 对图书馆应用Google Analytics的思考
4.1 加强网站分析工具的运用
从调查结果可以看出,Google Analytics已经广泛应用于国外图书馆界网络服务的多个领域,对于Google Analytics的研究也逐步系统化,应用性指南的编制使其对于实践的指导性更强。但总体来看,实践应用并不是十分广泛,研究成果也不算丰厚,这并不利于理论与经验的总结与思考。未来需要更多的图书馆从业者参与到Google Analytics的应用中来,探索各项统计指标在图书馆环境下的独特意义,从而增强图书馆网络服务的效果。与此同时,反观国内图书馆界,Google Analytics之类网站分析方法的运用与研究更需加强。根据《中国知网》的检索结果,国内图书馆界至今没有应用Google Analytics或者Baidu Analytics等网站分析服务的文献报道,甚至关于网站分析方面的研究文献也为数很少。即使个别图书馆在实践中有所涉及,但缺乏相应的理论总结,应用的深度与效果也令人置疑,当务之急是加强Google Analytics等网站分析工具的应用,及时总结实践经验,编制相关应用指南,以促进整体应用水平的提高。
4.2 多方式分析用户网络行为
因为网站分析工具本身存在的缺陷,在Google Analytics用于图书馆网站分析的实践过程中需要结合其它多种方式来全面揭示图书馆用户的网络行为。正如国外有学者所指出,网站记录只揭示了使用者浏览网站时做了哪些动作,但无法了解使用者的动机与原因;对于图书馆的公用电脑而言,使用者的确定本身都有困难;网站记录分析法也无法了解使用者对于检索系统的满意程度等。因此,如果想了解使用者对于图书馆网站的使用感受、动机、满意度或情感认知,必须辅以多种方式,如问卷调查法、访谈法、焦点小组法、观察法等,才能有效的反映出使用者信息行为的多元面貌。总之,对于图书馆网站建设及网络服务而言,网站分析是有效的方法,但并不是唯一的方法,因为 “有时,网页点击量少并不代表其不重要。”在图书馆网站服务过程中,多方了解用户需求,再结合馆员专业化的思考与判断,才是科学决策的基础。
[1]Fang W.Using Google Analytics for Improving Library Website Content and Design:A Case Study[J].Library Philosophy&Practice.2007,(7):1-17.
[2]Hooper M.Tracking Visits to a Library Website Using Google Analytics:How This Free Service Can Be Used to Improve Customer Service[J].Tennessee Libraries,2009,59(3):16.
[3]Turner S.Website Statistics 2.0:Using Google Analytics to Measure Library Website Effectiveness[J].Technical Services Quarterly,2010,27(3):261-278.
[4]Arendt J,Wagner C.Beyond Description:Converting Web Site Usage Statistics into Concrete Site Improvement Ideas[J].Journal Of Web Librarianship,2010,4(1):37-54.
[5]Breeding M.An Analytical Approach to Assessing the Effectiveness of Web-Based Resources[J].Computers in Libraries,2008,(1):20,22.
[6]Xin W,Shen D,Hsin-liang C,Wedman L.Applying web analytics in a K-12 resource inventory[J].Electronic Li brary,2011,29(1):20-35.
[7]Wei F,Crawford M.Measuring Law Library Catalog Web Site Usability:A Web Analytic Approach [J].Journal of Web Librarianship [serial online],2008,2(2/3):287-306.
[8]Kilzer,Rebekah D.Using Google Analytics in the Propriet ary OPAC[EB/OL].[2013-09-20].http://kb.osu.edu/dspa ce/bitstream/handle/1811/31951/GA0804_kilzer.pdf?sequ ence=1.
[9]Betty P.Assessing Homegrown Library Collections:Us ing Google Analytics to Track Use of Screencasts and Flash-Based Learning Objects[J].Journal Of Electronic Resources Librarianship,2009,21(1):75-92.
[10]Betty P.Creation,Management,and Assessment of Li brary Screencasts:The Regis Libraries Animated Tuto rials Project [J].Journal Of Library Administration,2008,48(3/4):295-315.
[11]Bell C.QR codes& Internet Librarian International 2011[J].Multimedia Information&Technology,2012,38(1):13-14.
[12]Sinn-Cheng L,Ming-Chen H.A Web Metrics Study on Taiwan Baseball Wiki Using Google Analytics[J].Jour nal Of Educational Media&Library Sciences,2010,47(3):343-369.
[13]Belden M.Archives and Archivists in the Blogosphere[J].Journal For The Society Of North Carolina Archivists,2009,7(1):43-71.
[14]Loftus W.Demonstrating Success:Web Analytics and Continuous Improvement[J].Journal Of Web Librarian ship,2012,6(1):45-55.
[15]Plaza B.Monitoring web traffic source effectiveness with Google Analytics[J].Aslib Proceedings,2009,61(5):474-482.
[16]Hess K.Discovering Digital Library User Behavior with Google Analytics[J].Code4lib Journal,2012,(17):1-10.
[17]Memmott S,deVries S.Tracking the Elusive Student:Opportunities for Connection and Assessment[J].Jour nal Of Library Administration,2010,50(7/8):798-807.
[18]Tidal J.Using Web Metric Software to Drive Mobile Website Development[J].Computers In Libraries,2011,31(3):19-23.
[19]Kate Marek.Web Analytics in the Library Number[J].Library Technology Reports,2011,(6).
[20]David Lee King.Running the Digital Branch:Guide lines for Operating the Library Website.Library Tech nology Reports,2012,(6).
[21]Tabatha Farney,Nina McHale.Maximizing Google Ana lytics:Six High-Impact Practices,2013,(4).
[22]Jamali H,Nicholas D,Huntington P.The use and users of scholarly e-journals:a review of log analysis studies[J].Aslib Proceedings,2005,57(6):554-571.