APP下载

电子资源使用评价系统的比较研究
——基于数据获取的角度

2016-11-09刘梦影

图书馆研究与工作 2016年4期
关键词:网关数据库图书馆

刘梦影

(浙江大学图书与信息中心浙江杭州310027)

·工作研究·

电子资源使用评价系统的比较研究
——基于数据获取的角度

刘梦影

(浙江大学图书与信息中心浙江杭州310027)

文章阐述了电子资源使用评价的意义,介绍了电子资源使用数据获取的三种模式:基于Web调查的模式、基于数据库商的模式和基于图书馆网关的模式。最后,从获取数据类型、数据可靠性、技术平台和扩展服务等方面对这三种模式下的电子资源使用评价系统进行比较评估。

电子资源;使用评价;数据获取;高校图书馆

1 电子资源使用评价的背景与意义

1.1电子资源的应用现状

早在20世纪90年代,英国国家图书馆Brindley馆长在谈到英国学术研究出版趋势时提到:“到2020年,英国的研究著作40%将以电子形式出版,50%将以印刷和电子两种形式同时出版,仅有10%的出版物将纯粹以印刷形式出版”[1]。根据2014年高校图书馆发展概况统计[2],2006年至2014年,我国高校图书馆电子资源购置费用逐年增加,在总文献资源购置费用中所占比例逐渐加大,纸质资源购置费用整体呈缓慢下降趋势(见图1)。面对日益增长的电子资源需求,如何更好地选购和宣传电子资源,优化电子资源的经费配置已经成为并将长期成为图书馆的工作重点。

图1 高校图书馆近9年文献资源平均购置费用

1.2电子资源使用评价的意义

(1)电子资源使用评价可以为电子资源的建设决策提供依据。将静态的内容评估与动态的使用评估相结合,可以提供更为客观的电子资源评价体系,为图书馆的资源建设与管理决策提供数据保障,同时让用户直接参与到电子资源建设与优化的过程中来,有助于建设交互式图书馆。

(2)电子资源使用评价有助于电子资源的使用推广。电子资源使用评价可以通过分析用户对电子资源的访问和使用行为,分析特定电子资源的具体投入方案,针对不同类型的电子资源制定相应的宣传推广方案。

(3)电子资源使用评价有助于电子资源的运维保障。电子资源使用评价通过对单种电子资源的纵向时间分析和多种电子资源间的横向对比分析,在运维成本固定的前提下,实现运维资源的优化调度,同时为下一年的运维计划提供数据支撑。如果电子资源使用评价系统可以实现电子资源使用的实时监控功能,还可以通过检测用户的下载流量,对有违规行为的用户进行针对性的制止和惩处,从而避免数据库对所有用户禁止权限,保障合法用户对电子资源的正常使用。

2 电子资源使用数据的获取模式

全面准确获取电子资源的使用数据是电子资源使用评价的基础。目前,电子资源使用数据的获取模式主要有3种:基于Web调查的模式、基于数据库商的模式、基于图书馆网关的模式[3]。

2.1基于Web调查的模式

基于Web调查的模式是通过在图书馆网页内嵌程序插件,实现对该网页点击量的数据统计,用户离开该网页后的其他行为不计入统计范围。由于无法对合法用户身份进行准确界定,统计数据通常不能全面地代表目标群体的倾向性,常常会造成一定的统计误差。基于Web调查的模式实现简单,但不具备用户追踪和定量数据分析的条件,常常作为电子资源使用评价的辅助数据获取方式,可以便捷直观地观察高校图书馆用户对不同电子资源的关注程度。浙江大学图书馆利用Web调查对数据库导航界面的各个数据库进行网页点击统计检测,统计该数据库图书馆入口网页的总点击量、单日点击量和移动点击量等。

2.2基于数据库商的模式

基于数据库商的模式是电子资源使用数据获取最基本的途径。建立统一的电子资源使用报告的标准和协议是该模式实现的前提。目前该领域较为重要的统计标准有:(1)美国研究图书馆协会(Association of Research Libraries,ARL)发起的电子资源计量;(2)图书馆共同体国际联盟(International Coalition of Library Consortia,ICOLC)提出的《网络信息资源使用统计测评指南》;(3)美国国家信息标准协会(National Information Standards Organization,NISO)颁布的NISO Z39.7-2004;(4)国际标准化组织(International Organization for Standardization,ISO)制定的有关图书馆网络信息服务与评价指标体系的标准(ISO2789);(5)美国“网络化电子资源在线使用统计”(Counting Online Usage of Net Worked Electroinic Resources,COUNTER)项目。目前应用比较广泛的是COUNTER标准。

利用数据库商提供的数据进行电子资源评价是目前高校图书馆最常见的电子资源使用评价模式。电子科技大学的秦鸿利用数据库商提供的COUNTER标准使用统计报告,设计了使用量-成本分析法的数据分析流程和基本评价指标,建立了决策与指标的匹配模型,为图书馆资源决策提供数据保障[4]。南京航空航天大学的刘佳音根据爱思唯尔公司提供Science Direct数据库的使用报告分析了数据库的期刊绩效与用户检索信息,对图书馆资源建设提供建议[5]。

2.3基于图书馆网关的模式

基于图书馆网关的模式,通过采集图书馆中心网关的底层数据,挖掘图书馆使用日志,得到电子资源使用数据。只要能够确保用户对电子资源服务的所有请求都通过同一个中心网关,并且实现该网关指向内嵌的调查系统,就可以实现电子资源使用数据的获取[6]。该模式获取电子资源使用数据,需要避开不同数据库商数据平台的应用异构和数据库异构问题,深层次获取图书馆知识发现和学科服务所需的数据集[7]。基于图书馆网关的模式需要较高的硬件成本和技术投入,但其数据获取较为准确、完整。复旦大学张春梅等利用复旦大学自主开发的电子资源使用统计分析和访问监控项目(Electric Resource Utilities,ERU)的数据采集平台,获取用户使用电子资源的动态数据,实现了学科交叉热点分析[8]。西安交通大学闫晓弟等提出并实现了电子资源使用统计的网关系统,实现了对日志统计数据的比较分析[9]。

3 基于不同数据获取模式的电子资源使用评价系统比较

对电子资源使用评价系统进行比较的过程中,基于数据库商的模式涉及具体标准以下内容的均以符合COUNTER标准的数据库使用报告为参照。基于图书馆网关的模式涉及具体实现内容的以复旦大学ERU系统为参照。

3.1获取数据类型

电子资源使用数据可以分为基础数据和扩展数据两类。基于Web调查模式获取的基础数据一般包含网页点击总量、单位时间网页点击量(如每天)等;扩展数据可包含校内IP及校外IP分别点击量、单次点击停留时间等。COUNTER标准下的数据库使用报告包含的基础数据主要有每月、每种期刊全文文献请求量,每月、每种期刊拒绝访问量,每月、每种数据库全部检索操作访问时段和全文文献请求量,每月、每种数据库拒绝请求量,数据库全部检索和访问时段量;该标准下扩展数据的内容可包含每月、每种期刊、每种页面类型中各项访问量(含全文、文摘、目次等),每月、每个内容集合(Collection)全部检索量等[10]。基于图书馆网关的模式基本采集数据一般包含源IP、目的IP、数据库名称、访问时间、操作信息、文献信息等;扩展可采集数据可包含相关检索词、相关专家、相关机构、相关文献、相关文献作者、参考文献、共引文献、二级文献、用户会话等[8]。基于Web和图书馆网关的数据获取可以自定义统计的单位时间,而数据库商提供的数据报告以月为最小标准周期,更小周期统计数据的获取有一定难度。

3.2数据可靠性

基于Web调查的模式对于调查对象难以界定,网络无应答比例高,问卷调查对象的随机性难以代表真实情况。这些因素决定了该数据模式下获取的电子资源使用数据不具备定量统计的可靠条件,但可以定性地、实时地、直接地反应用户对电子资源的关注程度。基于数据库商的模式,不同数据库商之间遵循不同的数据标准,使得数据库之间的横向测评存在困难。该模式下获取的数据统计报告不能提供详细信息,同时存在数据库商趋利避害,提供数据不全面的可能性,使得评测数据的全面性、即时性、可靠性受到一定程度的影响。基于图书馆网关的模式,可以规避数据库商之间遵循不同标准的问题,通过限定IP范围界定合法用户,同时可以自主定义输出数据的标准模式,获取数据较为精准,同时可以针对具体研究的不同需要导出特定的数据。基于Web、基于数据库商、基于图书馆网关模式获取数据的可靠性依次递增。

3.3技术平台

基于Web调查的模式,主要需要解决的问题是通过编程语言实现网页统计脚本设计和问卷嵌入设计。统计对象的范围界定、问卷设计周期等问题是该模式下需要具体考虑的问题。通过优化统计方式使得定性结果尽可能向定量结果靠拢,可以更好地获取统计结果。

基于数据库商的模式,所需技术主要是后期数据处理技术。一般涉及同一数据库纵向时间使用数据的比对分析(如一年内各月份使用情况比较、近几年使用趋势等);某一数据库成本与使用情况的比对分析(如计算单次检索成本、计算单次下载成本等)以及不同数据库之间使用情况的比对分析(如相似学科数据库使用情况和单次成本比对等)。该模式下数据处理和结果可视化均可应用Excel、MATLAB、R语言等数据处理软件实现。

基于图书馆网关的模式,首先需要从图书馆网关系统采集相关的使用数据,要求中心网关指向旁路统计系统并且需要从底层获取数据,规避各个数据库之间数据异构和应用异构的问题;继而对采集到的网页数据进行处理与分析;最后将处理结果以可视化的方式规范入库。该模式下的电子资源使用评价系统主要包含数据采集、网页处理、数据分析、规范入库等四方面内容。与基于数据库商的模式相比,数据分析与规范入库方面需要的技术支持基本相同,但增加了数据采集的软硬件需求,实现的成本与技术要求较高。

3.4扩展服务

基于Web调查的模式不仅可以通过设计问卷实现不同需求的数据统计,还可以根据统计的需要设置统计的时间周期。同时可以进一步优化插件程序提高统计对象的可靠性,增加无应答统计,提供实时的电子资源使用情况等。采集网页各部分点击量的数据还可以优化电子资源的访问页面。

基于数据库商的模式由于直接获取成形的数据报告,对于获取数据的格式和类型不具备更改条件。同时数据库商提供的报告以月为最小单位,不能反映实时的电子资源使用情况。该模式下的服务扩展主要可以考虑通过进一步挖掘已有的数据得到对资源决策有用的相关信息,如资源建设、学科相关等。

基于图书馆网关的模式,数据从底层旁路硬件采集,可以自行定义采集的内容类型、界定有效的访问对象范围、定于输出标准等。因此在个性服务定制方面有非常强的扩展性。比如通过实时监测电子资源访问的流量,检测并惩处恶意访问与下载的用户;通过对合法用户已有的电子资源使用数据分析向其推介相关电子资源或杂志的实时更新;通过对每个合法用户下载文献的主题及学科进行类比分析,研究交叉学科热点等。

3.5综合比较

基于Web调查模式的系统获取的数据类型比较单一、数据可靠性比较差、可实现的扩展服务也比较有限,但是该模式实现简单,又可以实时直观地反映用户对电子资源的关注程度,因此可以作为辅助的电子资源使用评价系统。基于数据库商模式的系统,获取数据类型比较丰富,数据可靠性比较强,获取数据周期固定,获取数据标准不统一,不能对电子资源进行实时监控,扩展服务有限,但是该模式实现数据获取几乎不需要技术与成本投入,因此是目前高校图书馆主流的电子资源使用评价系统。基于图书馆网关模式的系统,获取数据类型丰富且可以定制,数据可靠性高,可扩展服务丰富,但是该模式的实现需要较高的硬件成本和技术投入,目前已经有少量高校图书馆开始应用该模式进行电子资源使用评价,该模式下的电子资源使用评价系统是未来的趋势。

4 结语

电子资源使用数据的获取是其使用评价的基础。三种数据获取模式的不同特点决定了它们适用的场合与范围。经济实力和科研能力雄厚的高校图书馆可以直接研发基于图书馆网关的电子资源使用评价系统,该系统虽然需要较高的硬件成本和技术投入,但是从长远发展的角度,自主研发的电子资源使用评价系统有助于特色化电子资源建设和个性化服务。对于经济和技术有一定限制的高校图书馆,可以将基于Web的模式与基于数据库商的模式相结合,前者可以实时直接地反映用户对电子资源的关注程度和使用反馈,后者可以提供较长时间内电子资源使用的趋势,二者结合能够更加全面地评价电子资源的使用绩效,为电子资源管理决策提供更好的数据支持。

[1]ALtman E,Hernon P.Service Quality and Eustomer Satisfaction Do Matter[J].American Libraries,1998,29(7):53-55.

[2]王波,吴汉华,姚晓霞,等.2014年高校图书馆发展概况[EB/OL].[2016-04-25].http://www.tgw.cn/sites/default/files/attachment/tjpg/20151109.pdf.

[3]徐革.大学图书馆电子资源利用统计数据的获得模式评析[J].大学图书馆学报,2007,25(1):54-58.

[4]秦鸿.决策支持视角下的数字资源使用统计分析实例研究:以电子科技大学图书馆为例[J].大学图书馆学报,2013,31(6): 60-66.

[5]刘佳音.高校图书馆电子资源使用与用户检索行为统计分析:以ScienceDirect数据库为例[J].大学图书馆学报,2012,30 (2):81-86.

[6]Antelm K.Database-Driven Websites[M].New York:Haworth Information Press.2002:133.

[7]张计龙,殷沈琴,陈铁.基于ERU的图书馆用户信息行为数据采集方法研究:以复旦大学图书馆为例[J].图书馆杂志, 2014,33(12):10-16.

[8]张春梅,张计龙,殷沈琴,等.基于复旦大学ERU数据的学科交叉程度与研究热点分析[J].现代情报,2015,35(3):68-76.

[9]闫晓弟,邵晶,周奇,等.电子资源利用统计网关系统的设计与实现[J].现代图书情报技术,2008(8):97-100.

[10]COUNTER[EB/OL].[2016-02-12].http://www.projectcounter.org/.

A Comparative Study of Electronic Resources Usability Evaluation Systems: Based on the Perspective of Data Acquisition

The article discussed the significance of electronic resources usability evaluation,and introduced three ways of electronic resources data acquisition:the way based on web surveys,the way based on reports of database providers and the way based on library gateways.Furthermore,electronic resources usability evaluation systems based on the three models are compared and evaluated from four aspects:data type,data reliability,technological platform and extended service.

electronic resource;usability evaluation;data acquisition;university library

G250.73

A

刘梦影(1989—),女,浙江大学图书与信息中心助理馆员。

2016-05-09

猜你喜欢

网关数据库图书馆
信号系统网关设备的优化
图书馆
基于ETC在线支付网关的停车场收费系统设计
数据库
数据库
数据库
数据库
应对气候变化需要打通“网关”
去图书馆
一种实时高效的伺服控制网关设计