“用户友好”环境下COUNTER图书使用统计标准的失灵与警示
2016-04-11王鸑飞葛欣旭中国农业科学院农业信息研究所中国农业博物馆宁夏图书馆
董 越,颜 蕴,王鸑飞△,葛欣旭,吕 燕(.中国农业科学院农业信息研究所;.中国农业博物馆;.宁夏图书馆)
“用户友好”环境下COUNTER图书使用统计标准的失灵与警示
董越1,颜蕴1,王鸑飞1△,葛欣旭2,吕燕3
(1.中国农业科学院农业信息研究所;2.中国农业博物馆;3.宁夏图书馆)
摘要:资源供应商为了迎合用户,竭力提升服务水平,创造“用户友好”的信息使用环境。然而,新环境却导致以COUNTER标准为例的一些现行规范或标准失灵。笔者通过深入解析最新COUNTER图书使用统计特征,一方面揭示“用户友好”的运营环境如何影响该标准,另一方面说明图书馆在当前供需关系转变过程中所处的弱势地位,强调图书馆积极投身改革与创新的必要性。
关键词:COUNTER;使用统计;阅读习惯;用户友好;电子图书;采后评估
图书馆资源建设具有科学系统的评估流程,其中,了解和分析资源的利用情况,是馆员评价图书馆馆藏和服务质量的重要依据。随着多年的电子资源馆藏积淀与实践经验积累,如今电子资源建设工作重点,已由最初的资源引入上升为有效利用。借助使用统计数据,客观地分析资源建设效益、了解用户需求状态、发现图书馆服务短板,从而辅助图书馆制定或调整运营决策,更好地促进图书馆馆藏建设和巩固信息服务的核心地位。[1]同时,使用统计对资源拥有机构意义重要,资源供应方与代理商通过分析数据,直接摸底自己出版或代理的电子资源的终端用户使用情况,及时调整以便保持市场占有度。随着电子资源种类与资源运营商的增加,为了实现统计结果的纵向与横向比较,需要采用标准一致、方法可靠的标准来规范电子资源的使用统计。[2]
有关使用统计的研究早在2002年已经开始,[3]经过不断地探索与检验,COUNTER标准的实施规范最受青睐。COUNTER作为国际水平通行的电子资源使用统计标准,保障每个资源供应机构提供在线产品与服务的同时,能够诚信的、连续的、可比较的将资源使用情况记录并生成对应报告。2013年底颁布实施的最新版《COUNTER电子资源实施规范》(第四版)整体而言又做了诸多改进:它融合了期刊、数据库、图书、会议录以及多媒体等电子资源类型,综合了《COUNTER期刊与数据库的实施规范》(第三版)与《COUNTER图书与参考文献实施规范》(第一版)的内容特点;[4]引入了新的术语、记录对象及测量指标,新增了用户(Customer)、机构标识符(Institutional Identifier)、图书数字对象标识符(Book DOI)和所有权标识符(Proprietary Identifier)等多项资源与机构标识符。[5]然而,细究电子图书与参考文献部分的统计规范,可以发现其结构与内容调整甚微。
当前,信息供需正处于一个以用户信息需求为核心、“用户体验”服务模式为导向、资源供应商直接参与服务的新兴信息服务环境。以中国农业科学院专业图书馆的服务情况为例,用户的需求分散广泛、时效性强、专业度高,出版商的服务直达终端、模式创新多样、资源高度垄断,导致图书馆作为信息服务中介机构,传统主体业务或已落伍,或被侵蚀,严峻的环境迫使图书馆在服务中加大力度。由于服务的评估与分析主要借助分析工具,一旦失去,则严重制约分析工作的执行,使图书馆的生存状况雪上加霜。实际操作过程中发现,COUNTER标准作为图书馆资源建设评估的主要工具,虽然被不断更新完善,但其中的图书使用统计标准在当前环境中失灵,应予以警觉。
1 第四版《COUNTER电子资源实施规范》在线“图书使用报告”解析
《COUNTER电子资源实施规范》(第四版)(以下简称COUNTER R4),COUNTER R4整合了以往“期刊与数据库”和“图书与参考文献”的独立版本,将期刊、数据库、图书、参考文献、多媒体五大类资源的统计标准汇总于统一的实施规范,在名称上以“电子资源”概括。生成统计数据方面,划分为期刊使用报告(Journal Report)、数据库使用报告(Database Report)、平台使用报告(Platform Report)、图书使用报告(Book Report)、多媒体使用报告(Multimedia Report)和题名使用报告(Title Report)六大种类;每个大类之下再根据用户不同需求,提供以小标号区分具有内容侧重的子报告。
“图书使用报告”适用于在线图书及参考文献类型资源的使用情况统计,在COUNTER R4中,包含五个子报告。已有研究将新规范与之前版本进行比对,并且介绍了新版的特性(见表1)。[5]但是,由于“图书使用报告”主体构架和内容依然沿用了《COUNTER图书与参考工具实施规范》(第一版),所以总体而言新版统计数据所展示内容没有显著变化。
1.1图书使用报告1(BR1)
BR1格式与统计内容用于描述“每月、每个题名成功获取的题名数目”;另对记录目标补充说明“仅针对全书内容以唯一文档方式提供,其他情况必须统计于BR2”。
该报告输出表格分为两大部分,第一部分以摘要式介绍五项内容:报告类型、用户、机构识别码、报告覆盖期间(年月日-年月日时间制式)、以及相同时间制式的报告生成日期。第二部分为明细,首先分七列分别记录书名、出版商、所在平台、图书DOI、所有权标识符、ISBN编码与ISSN编码,随后几列记录每本图书在报告数据期间的总下载量与月度下载量。
表1 COUNTER R4图书及参考资料使用报告类型及内容描述
BR1最后还附有七项说明:第1-4项分别对用户、机构标识符、图书数字对象标识符、所有权标识符的使用情况予以说明;第5项约定了统计总量(Total for all titles)的显示位置;第6项说明“0使用”标题不包含在本报告内;第7项指向性说明“有关规则指导参考期刊使用报告JR1”。
1.2图书使用报告2(BR2)
BR2格式与内容用于描述“每月、每个题名成功获取的章节数目”;并对“章节”附有注释“章节类型(书目章节、百科内容主体等)使用于本报告的情况,必须在报告中予以标示。超过一种章节类型的情况,简单列举报告中主要的章节类型”。
该报告输出表格的第二部分与BR1的记录字段相同,仅在第一部分增加了一项介绍对象。因为是统计“章节”获取情况,所以在BR1的基础上,增加了对于章节种类的描述。
BR2同样附有七项说明,内容与BR1相同。
1.3图书使用报告3(BR3)
BR3格式与统计内容用于描述“每月、每个题名、每种类型被拒绝请求量”。
除报告类型外,该报告的第一部分记录项目和内容与BR1一致。第二部分差异较大,首先与BR1一样分七列记录图书信息,随后就每本图书获取内容失败的情况,提供期间累计量和月度统计数据。根据获取失败的原因,又分成“并发用户受限”和“非授权资源”两种情况。所以,同一题名的图书会出现两行,相对独立地记录两种情况的请求被拒数据。
BR3附有七项说明。第2~7项说明与之前报告内容相同。因为此报告统计拒访数据,所以在第1项明确说明“BR3仅针对题名级别,统计请求被拒绝的数据;平台级别的统计将记录于BR4中”。
1.4图书使用报告4(BR4)
BR4格式与统计内容用于描述“每月、每个平台、每种类型被拒绝请求量”。
BR4有5项说明,分别是用户、机构标识符、所有权标识符、统计总量显示位置的补充说明,以及“规则参考JR1”的指向性说明。
1.5图书使用报告5(BR5)
BR5格式与统计内容用于描述“每月、每个题名的全部检索量”
该报告仍然可以参考BR3,项目内容与统计方式几乎一致。区别仅在于第二部分的数据明细中,统计数据不是“并发用户受限”和“非授权资源”的拒绝量,而是反映“常规搜索”和“联邦式或自动化搜索”的检索量。
BR5有8项说明,第1项说明“本报告仅用于统计基于题名级别的检索数据,基于平台级别的检索由平台使用报告(Platform Report 1, PR1)统计”;第2~6项分别说明用户、机构标识符、图书数字对象标识符、所有权标识符以及统计总量显示位置;第7项将联邦检索和自动搜索引擎产生的数据,与常规检索产生数据加以区分;第8项是“规则参考JR1”的指向性说明。
1.6小结
通过解析图书使用报告,可以将COUNTER R4用于统计“图书类”资源的子项报告归纳为“使用”、“拒访”、“检索”三类。每个子项报告附有对报告中字段内容的补充说明,虽然直观上细化了用户和资源信息颗粒度,但是整体而言缺乏提升统计数据解读性的作用。
“使用类”报告是资源采后评估的重要参考依据。BR1、BR2分别以“题名”与“章节”的使用量作为区分,从实际操作层面分析,是以每个单一电子文档的使用情况作为数据统计基础。BR1附有说明“仅当全书内容包含于单一文档的使用情况记录在BR1中,其他情况记录于BR2”,由此可知,若一本图书以章节或其他方式将全书内容拆分为多个相对独立的电子文档,则该图书的使用数据将被统计于BR2中,且拆分后每个文档的使用均会被记录。所以BR2以“章节”为基础的统计方法,所得数据看似精细实则粗犷,其不确定性直接影响对整本书使用情况的评估。
“拒访类”与“检索类”报告多用于采前分析评估工作。其中拒访报告BR3、BR4分别在“题名”和“平台”层面统计,报告中又以“并发用户受限(Access denied:concurrent/simultaneous user licence limit exceeded)”和“非授权资源(Accessdenied:contentitem notlicenced)”作为区分。由于未与“使用类”的统计规则对应,其统计方法的合理性有待考证。检索报告BR5中包含常规检索和联邦检索两部分数据,实际使用价值也难以定论。因为资源采前评估不是本研究重点,所以有关拒访和检索的数据暂不深入分析。
这张不同寻常的地图是由萨普手绘的,数据由希森收集。(萨普作为一名女性,当时不允许她登上研究轮船。)地图显示,一条庞大的水下山脉呈南北向延伸,像一道巨大的接缝位于海洋的中部,这条山脉被称为大西洋中脊。萨普发现,这条山脉的中间有一道又深又阔的裂缝,裂缝的两边都是高高的山峰。她把这个作为证据来说明海洋地壳是运动的。她是正确的,这一点也支持了魏格纳被边缘化的大陆漂移理论。然而,萨普的同事希森赞成地球膨胀论,遗憾地将她的理论当作是“女孩讲的空话”。
2 实例剖析“用户友好”环境下COUNTER图书使用报告的失灵
通过前文解析可知,《COUNTER R4》“图书使用报告”基本沿用旧例,其统计内容、格式与术语定义和期刊统计规范高度同一。[6]虽然报告中记录的内容引入多种资源与机构用户标识符等粒度细化的数据项,或有助于提升资源匹配与机构分析的精确度和可比性。然而,实际操作过程中发现,该规范下的统计数据,在分析用户基于图书与参考文献类资源的阅读行为和服务绩效时,存在严重的统计失灵情况。该问题在当前提倡“用户友好”、注重“用户体验”,数据资源供应商采用一切手段提高服务质量和方便用户使用时尤其突出,导致原有使用统计构架所揭示内容无法继续适用于现在的数据环境。
以中国农业科学院订购Springer Protocols(实验室指南)数据库的实际使用统计结果为例。2011~2014年间,Springer Protocols数据库年均新增丛书150余卷,对应“章节”等级的电子文档3300余篇。年度资源数量增长整体平稳,即丛书卷册年度涨幅约25%,电子文档年度涨幅约13%(表2)。然而,该数据库的使用统计数据却出现了令人费解的激增(表3与图1),2013与2014两年的年度用量近似,但同比2011、2012年度用量约为5至6倍。分析历年的使用数据可以看出,中国农业科学院Springer Protocols数据库月度使用情况较为平均而且具有一定规律性,即资源使用峰值集中于每年2~4月与8~11月两时间段。尽管2013年的统计数据依然表现出相似规律性,然而当年使用量增长十分异常。首先,本院用户对该资源月度用量原本维持于“千篇”附近波动,但7月之后计量级别跃增至“万篇”;再者,2013年1~6月的半年用量总和,竟然不及下半年的月平均用量。统计数据总体呈现出“被放大”的特征。
表2 2011~2014年度Springer Protocols资源数量
表3 2011~2014年度中国农业科学院(集团)Springer Protocols使用统计(BR2标准)
图 2011~2014年度中国农业科学院(集团)Springer Protocols用量趋势(BR2标准)
经查证,统计数据巨大变动由供应商对资源发布平台服务功能的升级引起。2013年6月前,Springer Protocols资源在SpringerLink发布平台中仅提供单篇文档下载功能;随后因为考虑整卷丛书所含实验室指南具有专一性和关联性特点,为方便用户全面获取并能系统对照参考,于2013年7月新增“整书下载(Download the Book)”功能。用户可以在SpringerLink平台检索到某篇实验室指南时,选择性点击“整书下载”键钮,一键式获取该指南所在丛书全部章节的电子文档。然而,由于统计规范仍然采用BR2未作改变,用户的资源使用情况将以“章节”为标准生成统计报告。因此,新功能的推出造就了电子文档的下载量的倍增。
服务平台功能升级,对COUNTER统计保持真实性、客观性是一个挑战。举例说明:当A书全部内容包含在唯一的电子文档中,用户每次下载将在BR1中记录使用一次;若A书有10个章节,而且被拆分为10个独立的电子文档,用户下载每个文档则在BR2记录使用一次,下载全书10个章节生成使用记录十次。简而言之,现行BR1与BR2使用类统计报告分工明确,每个独立电子文档的下载情况是使用统计的数据基础。在2013年6月之前,因为下载数值能够与用户的操作行为一一对应,这样的统计数据具有一定参考意义。然而,面对“整书下载”功能,用户的一个操作行为对应着全书章节总数的下载量,必然与用户实际使用情况脱钩。而且,由于不同丛书所含章节数目不同,所以同样的“整书下载”操作,对应于BR2不同题名的统计数据差别很大。此外,因为整书下载功能与单篇下载功能并存,不同行为粒度产生的数据堆叠在同一标准的汇总报告中,使得报告本身失去了统一的量度。由此,BR2统计数据的使用情况反馈功能已经失灵,成为一个纯粹的泡沫化的文档下载量计数器。
截取2013年度中国农业科学院机构用户的Springer Protocols数据库BR2统计报告片段为例(见表4),Rice Protocols全年下载章节文档796篇,上半年与下半年使用数据差异明显,1月与7月是同一年中的两个使用高峰,符合本院用户的使用规律,但数值相差7倍有余。直观数据显示,Spermatogenesis 8个月均被使用且月度用量平稳,但是全年仅下载417篇;而Antibody Engineering全年下载3304篇,超出Spermatogenesis 7倍多,却基本来自于8月份的单月用量。就这三卷丛书的自身属性来说,每个图书题名下包含文档数目分别是24篇、47篇和52篇。直接分析这样的数据显得有些无从下手,其结果也基本失去了参考价值,图书馆员借助COUNTER使用统计工具,来了解用户对图书和参考文献需求的方法已然实效。
表4 2013年度中国农业科学院(用户)Springer Protocols使用统计片段(BR2标准)
3 COUNTER图书与参考文献实施规范的发展预测
信息技术与网络通信技术的广泛应用打破了原有的空间与时间维度束缚,连接了信息资源供应商与用户之间的通路,改写了传统信息管理与服务模式中“出版商供给、图书馆汇集、读者用户查阅”的三方供需关系。出版商根据资源特征和用户使用偏好而提供“用户友好”服务模式,是建立在成熟技术基础上的新运营方式,同样显露出颠覆效力。
第三方组织综合权衡信息资源供应和服务机构的需求,制定了COUNTER实施规范,并依照时代发展的需求变化而不断修正升级。但是,历经供需关系变革的冲击,部分统计报告已经不能发挥分析评估工具的应有作用。因此,图书馆有责任以信息服务中介的角色提出建议,修缮电子资源使用统计等工具的功能,从而有效利用并增强机构服务能力。“整书下载”功能导致的图书使用报告失灵问题,在COUNTER实施规范修改图书使用报告的内容与标准时将得到解决。通过区分整书下载与章节下载的用户行为,调整BR1与BR2的使用决策,一方面提升数据可读性,另一方面增强对用户行为的敏感性。
COUNTER R4中几个新增特性所释放出的信号应当引起图书馆界重视,或将引起下一次资源供需关系与信息服务模式的重大变革。首先,开放获取文章(Gold Open Access即金色OA)纳入JR1使用统计体系当中,可视为COUNTER对新兴运营模式的融入;以独立文章为统计单位,将当前能够用于分析的数据颗粒细化到极致,使用统计突破了用于资源建设成本与效益核算的初级认知,数据价值被拓展至学术传播效果和用户行为分析。其次,通过引入用户与资源的各类标识符,多维度地记录目标个体信息,可以预见未来统计数据所展现的内容,将更活跃在个体级别的用户行为研究或资源特性分析。统计信息逐渐深入至终端微观层面,预示大型集团采购与服务的时代将面临小型网络社区概念的挑战。由个性化需求交汇组成的网络用户社区,将从资源需求、服务模式、获得途径等方面,拆分大集团建设环境中图书馆建立的“普遍受益”式信息资源保障体系,转交供应链上游的资源所有者以寻得更为精确、灵活的服务。至此,图书馆有可能沦为纯粹的付费机构。随着信息供需个性化、内容碎片化、渠道多样化的进一步升级,图书馆最后的采购功能也将被类似于开放获取的新兴商业模式替代。使用统计数据原本用于资源供给与服务机构了解资源的利用情况,经过数代演替之后,最终可能演化为资源供应商研究用户从而扼杀图书馆的工具。
4 结论
图书馆作为传统信息供需关系链的中间环节,受到来自上游技术创新压力与下游需求变化推力的双方挤压,处于信息服务变革影响作用的暴风眼。COUNTER使用统计规范被图书馆视为重要评估工具之一,虽然紧随信息环境的变化而不断完善,但是依然在创新的运营模式中失灵,可以看作一个典型例证,暴露出图书馆传统运营模式在改革创新洪流中的孱弱。因此,图书馆积极投身改革创新已经刻不容缓。探索独立自主并且客观适用的资源建设与服务评价方法,加强对用户需求与使用偏好的认知与满足,巩固信息服务中心的供需关系,主动适应环境、迎合需求,这即是在危机中寻找机遇的关键途径,也是从COUNTER图书使用统计失灵问题中获得的警示。
[参考文献]
[1]梅海燕.电子资源使用统计研究[J].大学图书馆学报,2006(3):82-86,107.
[2]张建,张苏.在线电子资源使用统计的新标准——COUNTER[J].现代情报,2006(11):211-213,215.
[3]肖珑,张宇红.电子资源评价指标体系的建立初探[J].大学图书馆学报,2002(3):35-42,91.
[4]The COUNTER Code of Practice for e-Resources:Release 4[EB/OL].[2015-07-16].http://www.projectcounter.org/.
[5]李洪.新版COUNTER的特征及未来发展[J].中国图书馆学报,2012(6):29-37.
[6]刘廷蓉,严霞.COUNTER在线图书和参考资料使用统计标准[J].现代情报,2007(11):125-128.
Function Failure of COUNTER System and the Cautions under User Friendly Environment
Dong Yue,Yan Yun,Wang Yue-fei,Ge Xin-xu,Lv Yan
Abstract:Based on various information technologies, the transmission of information resources is no longer limited by time and space, which led to great transformation of information supply and demand.Information suppliers have improve their service by creating User Friendly environment which resulted in the failure of COUNTER system to some extent.This article makes a deep analysis of COUNTER by pointing out how does User Friendly environment affect the system and how important of the innovation andreformfor the libraries as well.
Keywords:COUNTER; Usage Statistics; Reading Habit;User Friendly;E-books;Acquisition Estimation
[收稿日期]2015-08-25[责任编辑]菊秋芳
[作者简介]董越(1985-),男,中国农业科学院农业信息研究所馆员;颜蕴(1964-),女,中国农业科学院农业信息研究所研究馆员,研究方向:文献资源建设;王鸑飞(1973-),男,中国农业科学院农业信息研究所副研究馆员;葛欣旭(1988-),女,中国农业博物馆助理馆员;吕燕(1977-),女,宁夏图书馆助理馆员。
通讯作者:△王鸑飞
中图分类号:G252.0;G253
文献标志码:B
文章编号:1005-8214(2016)02-0065-05