APP下载

全文数据库使用中产生的帕累托效应

2017-03-22

中华医学图书情报杂志 2017年2期
关键词:帕累托药科全文

近年来,由于数据库资源的数量激增、部分核心外文数据库价格涨幅过高以及人民币兑外币汇率波动趋高,导致部分高校缺乏足够的资金购买所需数据库资源,在数量和质量上已无法满足学校教学科研需求,这给高校图书馆数字资源建设提出了严峻挑战。为了提高数字资源采购的科学性, 评价这些数据库的使用显得尤为重要。

帕累托法则也称为二八定律或80/20法则,是指在众多现象中,80%的结果取决于20%的原因, 这一法则在很多社会领域被广泛应用[1]。Richard L. Trueswell早在1969年首次将帕累托效应引入图书馆[2]。 此后,国外有大量的相关研究[3],如Mangkholien Singson等人在研究印度图书馆采购联盟所提供的数据库下载量分布时,发现电子期刊的使用遵循“80/20” 法则或帕累托效应[4]。然而,国内学者在期刊全文数据库的使用率方面的研究[5-9]中,很少结合帕累托效应评估读者核心需求、指导文献资源建设,目前仅有暨南大学的朱前东发现该校ScienceDirect 数据库的下载量符合帕累托效应[10]。验证Wiley Online Library(WOL)数据库使用中的帕累托效应的意义在于通过揭示全文下载量与下载品种之间的不平衡关系,寻求创新思维意识,体现有所为、有所不为的工作方法[11]。帕累托效应的价值主要体现在制定图书馆文献藏书原则、制定图书馆文献资源购置比例、图书馆文献资源共建共享、图书馆文献剔旧等方面的应用[12]。

在数据库中引入帕累托效应,以动态发展的视角,实施文献资源整合、优化、取舍等策略,是图书馆为解决文献资源购置经费短缺性和文献资源品种多样性、学科复杂性、分布无序性与本单位用户文献需求特殊性之间矛盾而产生的一个具有实际意义的研究课题。

本文以中国药科大学(以下称称“我校”)WOL数据库使用为例, 采用量化的实证法,分析2011 -2015 年全文下载量的期刊分布,并从年下载量的学科分布情况,SCIE、SSCI 、A&HCI来源期刊收录情况,我校SCI论文载文情况等方面, 探析了帕累托效形成的原因及对文献资源建设、数据情报服务与学科服务等方面的启示。

1 WOL数据库使用符合帕累托效应

WOL数据库是John Wiley & Sons Inc 的学术出版物在线平台,提供包括化学化工﹑生命科学﹑医学﹑高分子及材料学等14个学科领域的学术出版物,是中国药科大学读者最熟悉和最常用的外文全文期刊数据库。图1反映了2011-2015年WOL数据库下载情况。这里的统计数据包括访问网页(HTML)和下载全文(PDF)两部分,年下载量按两部分之和计算。

图1 中国药科大学2011-2015年WOL数据库下载情况

从表1可以看出,我校2011-2015年Wiley全文下载量呈逐年递增状态,2011-2015年全文下载量增长了两倍,可见师生对WOL数据库的使用越来越频繁。为进一步解析数据库中期刊与下载量之间可能存在的关系,以至少有一次下载记录的期刊数量及网页访问为基准计算。

表1统计了2011-2015年WOL数据库全文下载量前80%的期刊分布情况,分别计算出每年下载量占当年下载量80%的期刊总数,及占当年已访期刊总数之比。结果表明,10%左右的期刊提供了80%的下载量,2011-2015提分别为9.66%,10.86%,10.47%,7.92%,7.60%。

表1 2011-2015 WOL全文下载占80%下载量分布

以2015年数据为例,至少有一次下载记录的期刊数量是658种。依据Wiley提供的数据,按期刊下载量高到低的顺序统计,有50种期刊下载量合计达65 494篇,即占2015全年下载量(81 686篇)的80%。因此,约有7.60%的期刊占全文下载量的80%。

9.3%的期刊产生80%的全文下载,而90.7%的期刊只提供了20%的全文下载。帕累托效应理论表现了一种不平衡关系,即少数主流的事物可以造成主要的、重大的影响。并非只有20/80的比例才能说明帕累托效应出现在了期刊数据库的使用中。帕累托效应只说明了一个规律,而不是绝对的比例分布[13]。由此可见,我校WOL数据库近几年使用情况基本与帕累托效应吻合。为了解释帕累托效应,本文下面提到的20%期刊与80%期刊,是指20/80中的20和80部分,并不是实际的数字。

2 数据库使用中产生帕累托效应的原因

2.1 用户更倾向于选择质量高的期刊进行阅读和下载

以WOL数据库收录的SCIE、SSCI 、A&HCI来源期刊考察下载量与帕累托效应可能存在的关系。本文以2014年的JCR报告为标准,以2012-2014年期刊情况为分析对象,统计了2012-2014年WOL数据库使用中的20%和80%期刊分别收录的SCIE、SSCI 、A&HCI来源期刊的数量。

这里20%期刊数量是指下载量达80%的部分,实际并未达到20%,80%期刊数以此类推。统计结果见表2。

表2 2012-2014年WOL数据库使用中的20%和80%期刊收录的来源期刊数量

由表2可以看出,2012-2014年WOL数据库中20%的期刊收录SCIE、SSCI、A&HCI来源期刊数量所占的比例明显高于其他80%期刊收录数量,分别高于80%期刊17.83%、14.56%、10.97%。虽然80%期刊和20%期刊收录SCIE、SSCI、A&HCI来源期刊的差距逐年缩小,但仍明显低于20%期刊的收录情况,说明用户更倾向选择质量高的全文期刊进行阅读和下载。这是导致WOL数据库使用中产生帕累托效应的部分原因。

2.2 刊载我校论文的SCI来源期刊更受读者的关注和使用

当SCI来源期刊上刊载了教师或博士研究生的论文时,该来源期刊往往会成为相关师生的关注对象。为考察WOL数据库收录我校SCI论文情况与20%、80%期刊可能存在的关系,沿用前面关于20%、80%期刊的表述,通过检索WOS,统计了2012-2014年20%期刊和80%期刊刊载我校SCI论文情况(表3)。

从表3中可以看出,20%期刊刊载中国药科大学论文的期刊数量和论文的篇数,均远远高于80%期刊的刊载数量和篇数。2012年20%期刊中刊载我校论文的期刊数量和刊载的论文篇数分别为80%期刊的7.5倍和5.4倍,2013年的20%期刊中刊载我校论文的期刊数量和刊载的论文篇数分别为80%期刊的3.5倍和2.6倍,2014年20%期刊中刊载我校论文的期刊数量和刊载的论文篇数分别为80%期刊的1.5倍和1.83倍。由此可见,虽然20%期刊和80%期刊在刊载论文的期刊数量和论文篇数方面的差距逐年减小,但20%期刊刊载我校论文的期刊数量和论文篇数上仍要大大高于80%期刊。

表3 2012-2014年WOL数据库20%期刊和80%期刊刊载中国药科大学SCI论文

由此可以说明,刊载我校论文的SCI来源期刊更受读者的关注和使用,是在WOL数据库使用中产生帕累托效应的部分原因。

2.3 WOL数据库中高频下载期刊研究方向和学科

表4统计了2011-2015年下载频次前20期刊的下载量,以探析WOL数据库期刊高频下载的成因。

表4 2011-2015年WOL数据库中前20种期刊的下载量/次

从表4可见,2011-2015年前20名期刊下载总量逐年增加,其中AngewandteChemieInternationalEdition从2011-2015年都占据全文下载量的第1位,且占全文年下载量的比例逐年递增;其余年度下载量较高的还有Chemistry-AEuropeanJournal,JournalofPharmaceuticalSciences等期刊。因此,有必要进一步对以上期刊进行数据挖掘,探究其高频下载原因。

我校校内师生是全文电子期刊的主要使用者,科研、学术讨论、发表学术论文、撰写毕业论文等都需要下载一定数量的相关文献,所下载的文献往往与师生所属的专业和研究方向有很大关系。为探寻期刊高频下载量的成因,本文进对上述24种期刊的研究方向、期刊影响因子等指标进行了统计(表5)。

从表5可以看出,出版国别包括英国(10种)、德国(7种)、美国(3种)、瑞士(3种)、日本(1种)。期刊平均影响因子为4.2,按期刊研究方向包括有机化学(6种)、生物化学(3种)、分析化学(8种)、药理及制药(8种)、临床医学(6种)、无机化学(3种)、纳米化学(1种)、计算化学(1种)。这与我校学科设置及学科重点发展方向是一致的。

中国药科大学是一所以药学为特色的学校,目前设有天然药物活性组分与药效、药物代谢动力学、药物分子设计与成药性优化、肿瘤发生与干预等重点实验室及新药筛选中心。

药学为国家重点一级学科,药物化学、生药学、药剂学、药物分析学、药理学、微生物与生化药学为国家重点二级学科。由此可,学术期刊的主要使用人群,如学校重点和优势学科的师生以及实验室的研究人员,是导致全文电子期刊数据库使用过程中产生帕累托效应的重要原因。

表5 2011-2015年WOL24种高频下载期刊研究方向

3 WOL数据库使用中产生的帕累托效应的启示

3.1 图书馆文献资源建设

通过上述分析,验证了期刊全文数据库使用中产生的帕累托效应。帕累托效应也是经验定律。理论上,20%的期刊对应80%的下载量;实践中,80%的下载量对应20%的期刊,10%-30%的期刊也可接受。暨南大学2007-2009年SD数据库全文下载量分布,80%下载量的期刊占期刊总数比例分别为27.67%、21.03%、23.72%[14];我们统计的2011-2013年WOL数据库80%下载量的期刊占期刊总数为9.66%、10.86%、10.47%,两者平均值相差13.81%,均在可接受的范围,两者分布符合帕累托法则。本文因受学科专业及研究方向等的限制,使分析结果与综合性院校暨南大学有所区别,但可在医药专科院校中起到一定的示范作用。

目前,全国医学门类专业的普通高等本科院校约有280余所,根据DRAA高校数字资源采购联盟的最新统计,我国引进的医学相关专业期刊全文数据库有128个。针对医学院校图书馆引进全文数据库资源,根据各校的实际情况,应充分考虑数据库的质量和使用对象。 从WOL数据库使用中产生的帕累托效应可以看出,文献质量和使用对象的需求在很大程度上决定了资源的使用情况。因此,医学院校在引进数字资源时要先评估数据库的质量,然后分析试用期间的使用数据,在综合考虑数据库质量和用户使用情况后,结合已购资源学科分布、重复情况等因素决定是否购买。中国药科大学读者群体在使用WOL期刊数据库时,帕累托效应表现得极为明显,体现在少于20%的期刊提供了80%的下载量。我校在实际集团采购WOL数据库中选择了包库选刊方案。以2015年为例,购买了WOL的82种刊,有近50种刊合计下载量达到了当年的80%。这50种刊只占了已访问刊658种的7.6%。以相对少的经费购置了高频使用的期刊数据,说明我校的外文全文数据库采购策略是成功的。考察数据库使用的分布情况,是图书馆数据库购置策略的一个重要方面。 对于医学专科学校而言,选择一个合适的数据库定价模式越来越重要。 如果20 %的期刊相对集中于某个或数个学科, 应当努力争取按学科子库进行购买。 这样不仅可以节省数字资源购置经费, 还可以发挥数字资源最大使用价值。

此外,期刊采购是图书馆运行中最繁琐的内容之一,需要投入大量的人力、物力、财力,而帕累托效应的分析及应用可以给予很大的帮助。对中国药科大学WOL数据库使用中产生的帕累托效应的观察和分析,通过高频下载量分析可以以较快的速度,确定高频下载期刊数量、期刊的研究方向,从而制定部分特色馆藏明细,避免了枯燥且复杂的筛选,或浪费大量时间进行数据整理和分析。

3.2 数据情报服务

WOL数据库中有大于80%的期刊只提供了20%的下载量,。在80%期刊中也有部分高质量的期刊,图书馆应该深度挖掘这部分数据的价值。在此基础上,图书馆可以通过各种途径即时为科研提供全方位、一站式情报服务,包括文献传递、课题调研、最新资讯推送、专题检索、收引查新等,提供快速和高效的文献保障和信息服务,提高低使用率期刊的使用, 充分发挥数字资源的最大使用价值。除此之外,图书馆还可以采取网络推介、读者培训、校内通告、期刊导航、期刊投稿指南等方式, 让读者熟悉并利用这些期刊, 使其在学校教学科研活动中,发挥更大的作用。

3.3 学科服务

针对WOL数据库高频下载期刊的研究方向及专项课题研究领域,以有机化学、生物化学、分析化学、药理及制药、临床医学、无机化学、纳米化学、计算化学等学科领域的研究论文、学术会议和基金项目作为分析框架和检索目标,以中国药科大学学科发展支撑平台,提供基于CSCD/SCI 核心期刊数据库、ESI 高被引文献数据库的学科发展趋势以及国家自然科学基金(NSFC) 重点资助的医药领域、机构、项目分布与研究热点等学科评估分析报告,为专项团队的科学研究和技术研发提供有力的保障。

猜你喜欢

帕累托药科全文
成都经济区极端降水广义帕累托分布模型研究
中国药科大学2020年1~7月获授权专利情况(3)
中国药科大学2020年1~7月获授权专利情况(1)
中国药科大学2020年1~7月获授权专利情况(2)
中国药科大学2018年1~6月获授权专利情况
青年再造
发现“西方中医”
反腐
来信
帕累托最优