APP下载

期刊全文数据库中的帕累托效应及其对图书馆资源建设的影响

2012-07-17丁玉东张春峰燕山大学图书馆河北秦皇岛066004

图书馆建设 2012年1期
关键词:帕累托全文效应

丁玉东 张春峰 (燕山大学图书馆 河北 秦皇岛 066004)

电子期刊的销售模式不同于纸本期刊的销售模式。数据库商往往把众多电子期刊作为整体打包销售或者按学科、专辑等拆分为子数据库分别销售。这些经过重新整合的期刊中不乏大量利用率较低的期刊,加之不同数据库商提供的电子期刊存在重复问题,所以在一定程度上增加了图书馆的经费支出。由于期刊出版行业的垄断、期刊价格的不断攀升,图书馆界不得不考虑电子期刊使用效率和使用成本问题,以期在不影响读者使用的情况下节省支出。除开展读者调查外,对电子资源使用过程中生成的数据(包括访问次数、检索次数、文献下载量、访问请求被拒绝次数等)进行分析是较为普遍的做法,其中文献下载量是较为重要的指标之一。

帕累托效应又称80/20法则,原为经济领域的一种现象,即在任何系统中都有约80%的结果是由约20%的变量产生的[1]。该理论提出后人们发现,在社会生活的各个方面均存在这种现象。那么,读者在使用电子期刊数据库的过程中是否也存在帕累托效应?如果存在,国内外语言差异是否会导致不同的数据比例?不同类型的学校或不同语种的数据库中生成的数据是否都存在帕累托效应?帕累托效应的出现是否会对图书馆的发展产生积极的影响?笔者通过文献调研分析了2007—2010年Elsevier出版集团的ScienceDirect数据库和中国知网的中国期刊全文数据库的文献下载量,以期对上述问题加以阐释。

1 期刊全文数据库中帕累托效应的研究现状

1969年,Richard L. Trueswell首次将帕累托效应引入图书馆[2],并用于分析文献借阅统计。此后,国外学者开展了大量的类似研究[3],如伊利诺大学芝加哥分校(University of Illinois at Chicago)的Blecic等人统计ACS(American Chemical Society,美国化学学会)数据库时发现,28%的期刊提供了80%的文献下载量[4];北卡罗来纳大学教堂山分校(University of North Carolina at Chapel Hill)的Hamaker统计ScienceDirect数据库的使用情况时发现,28%的期刊提供了大约75%的文献下载量[5];明尼苏达大学(University of Minnesota-Twin Cities)的Stemper统计了4个数据库,其中ScienceDirect数据库的使用情况为35%的期刊提供了80%的文献下载量[6];土耳其大学的Tonta Y则统计出ScienceDirect数据库中约5%的期刊提供了1/3的文献下载量,约13%的期刊提供了另外1/3的文献下载量,约82%的期刊提供了余下1/3的文献下载量[7]。国外大量研究数据表明,在电子期刊数据库利用案例中,约有30%的期刊提供了约80%的文献下载量[3]。然而,国内学者在期刊全文数据库的利用率方面的研究[8-12]很少结合帕累托效应来评估读者核心需求、指导文献资源建设。目前仅有暨南大学图书馆的朱前东发现该校ScienceDirect数据库的下载量符合帕累托效应,即在一个周期内ScienceDirect数据库中80%被下载的文献集中在约20%的期刊中[13]。同时,朱前东从期刊覆盖学校重点和强势学科的情况,被SCIE(Science Citation Index Expanded,科学引文索引)、SSCI(Social Sciences Citation Index,社会科学引文索引)和A&HCI(Arts & Humanities Citation Index,艺术与人文类引文索引)收录的文献数量以及该校SCIE论文载文期刊数量3个方面对导致帕累托效应的原因进行了分析[13]。

2 期刊全文数据库的使用量数据统计与分析

数据库的文献下载量一般由数据库商提供,如SciencDirect数据库的文献下载量是基于COUNTER(Counting Online Usage of Networked Electronic Resources)标准的统计数据,中国期刊全文数据库的文献下载量可在后台管理页面的“日志数据”栏目获取,但统计数据仅提供了期刊名称、浏览次数、下载次数和总操作次数。笔者对统计数据进行整理后,利用Excel进行排序统计。统计结果显示,2007—2010年在燕山大学(以下简称我校)授权范围内从SciencDirect数据库下载学术论文850 247篇次,文献下载量逐年递增,详细数据见表1。中国期刊全文数据库的文献下载量及期刊数量见表2。

表1 ScienceDirect数据库的文献下载量及期刊数量

表2 中国期刊全文数据库的文献下载量及期刊数量

2.1 ScienceDirect和中国期刊全文数据库中的帕累托效应

从表1可以看出,ScienceDirect数据库的下载数据呈现出比普通的80/20法则更为明显的帕累托效应。以2009年为例,80%的文献下载量来自于不足13%的期刊,文献下载来源非常集中;2007年提供80%文献下载量的期刊占期刊总数的比例最大,为17.6%,但是与20%仍有部分差距,显然比国内外其他相关研究中[3-7,13]所表现出来的数据更为收敛。而表2中中国期刊全文数据库的下载数据则相反,4年中提供80%文献下载量的期刊均超过了当年期刊总数的20%,其中2008年的比例最大,达到了28.2%,期刊的发散性更为明显。

2.2 学科设置对帕累托效应的影响

根据Elsevier公司提供的期刊学科主题分组,2007—2010年的下载数据中,文献下载量位居前5位的学科依次是“Engineering, Energy and Technology”(工程、能源与技术)、“Materials Science”(材料科学)、“Physics and Astronomy”(物理学和天文学)、“Computer Science”(计算机科学)、“Chemistry and Chemical Engineering”(化学与化学工程)。上述5个学科每年的文献下载量之和分别占当年所有文献下载量的70.0%、69.6%、66.9%和64.1%。同样,按照中国知网对期刊的分类,中国期刊全文数据库每年80%的文献下载量均分布在工程科技II、工程科技I、经济与管理科学、信息科技、社会科学II这5个专辑中。

以上数据统计出的重点学科与我校的优势学科非常吻合,反映出读者的核心需求。我校起源于东北重型机械学院,以机械、材料、电气、信息等学科见长,化学化工专业发展较好,但是没有独立的医学、药学、农学等相关专业,文科类专业发展相对滞后。ScienceDirect数据库中包含大量的农业、医药、护理、生命科学等学科期刊,由于我校学科设置问题,这些期刊的利用率较低,下载量少,导致下载数据呈现出更为明显的帕累托效应。

2.3 读者层次对帕累托效应的影响

笔者认为,不同层次读者的使用习惯是造成中国期刊全文数据库的下载数据比ScienceDirect数据库的下载数据更加发散的原因。我校外文数据库的读者群主要为硕士研究生及以上学历的读者。这部分读者科研需求明显,具备较为成熟的科研方法,因此下载文献有针对性,甚至有的读者只关注某几种专业期刊。而中国期刊全文数据库的读者群更为广泛,本科生是该读者群的主体。但是由于本科生的检索技能相对较低,更注重文献的易读性和易获得性,较少注重承载文献的期刊,因而导致两个数据库的帕累托效应存在差异。这在下载数据中同样可以得到验证:在中国期刊全文数据库中,载文量大、载文学科广的期刊的文献下载量也较大。以2010年的下载数据为例,文献下载量排前3名的期刊分别是《科技信息》、《商场现代化》和《中国电机工程学报》,其文献下载量分别为6 652篇、6 081篇和5 001篇[14]。同样,在中国知网的学术期刊导航中,《科技信息》和《商场现代化》的总载文量排名分别为第一和第五,其中《科技信息》每期的载文量超过600篇,《商场现代化》每期的载文量超过了100篇[14]。在中国知网提供的“复合影响因子”统计中,两者的影响因子分别为0.127和0.410[14]。而在ScienceDirect数据库中,2010年文献下载量排前3名的期刊是《Materials Science and Engineering:A》、《Journal of Materials Processing Technology》、《Acta Materialia》,其文献下载量分别为11 238篇、7 360篇和6 178篇,这3种期刊的全年载文量仅为1 196篇、275篇和686篇,在2011年JCR(Journal Citation Reports,期刊引证报告)中的影响因子分别为2.090、1.567和3.781[15]。因此可以认为,不同层次读者使用数据库的习惯和方法也是造成中文期刊数据库的帕累托效应更为发散的原因之一。

3 帕累托效应对图书馆资源建设和服务的积极影响

3.1 有助于图书馆确定核心期刊

在长期的工作实践及科研活动中,图书馆已经积累了较多确定核心期刊的方法。帕累托效应有别于完全参照第三方机构发布的核心期刊目录,它所呈现出的数据不仅能够帮助图书馆寻找适合本馆读者的核心期刊,而且可以定位出具体的核心期刊排名。以2010年下载数据为例,通过对2010年JCR期刊列表[15]、EI数据库2010年来源期刊[16]及2008版《中文核心期刊要目总览》[17]的比较可知,在2010年ScienceDirect数据库提供80%文献下载量的245种期刊中,被SCI-E收录的期刊数量为226种,被EI收录的期刊数量为219种,分别占245种期刊的92.2%和89.4%。在中国期刊全文数据库提供80%文献下载量的2 254种期刊中,核心期刊数量为895种,占39.7%。上述数据说明,我校读者较常使用的外文期刊绝大多数属于SCI、EI两个二次文献数据库的来源期刊,而常用的中文期刊中核心期刊所占比例较小,数量也不足《中文核心期刊要目总览》(2008)中核心期刊总数的1/2。这说明,我校读者在学科专业、阅读喜好等方面与《中文核心期刊要目总览》(2008)公布的核心期刊有一定差异,所以图书馆在订购期刊时应注意筛选。

3.2 为订购纸本期刊提供参考

随着图书馆经费向电子资源采购的倾斜,图书馆通过分析已有电子期刊的使用情况,可以更好地指导纸本期刊的订购,而且在不影响期刊正常使用的前提下节省订购成本。在具体操作时可分为两种情况:(1)若所订购的电子期刊拥有永久使用权或者存档权,则可以考虑停订与电子刊重复的纸本期刊。目前国内期刊数据库购买后均可永久使用当年的期刊数据,因此国内期刊数据库的订购可参照这种模式。(2)对于只有使用权的数据库订购模式(如国外小型学/协会的数据库),应结合试用期间或者上一订购周期的帕累托效应进行具体分析,选择订购文献下载量高的期刊。当然,文献下载量高的期刊并不完全等同于其学术价值大,因此还需要考虑文献下载量与载文量的比值,或通过读者问卷调查、参照其影响因子来决定。

3.3 为订购电子期刊提供参考

在首次订购期刊数据库或续订之前,图书馆员往往分析试用期间或上一合同期内数据库的检索次数、单篇成本等,为下一轮采购数据库提供决策支持。电子期刊订购分析引入帕累托效应,不仅可从整体上分析数据库的性价比,还可以通过排序、比较下载数据微调订购方案。如果下载量大的期刊多数集中于某几个学科或者专业且价格较为均衡,则可以在数据库商允许的情况下按照学科或者专辑订购。在谈判过程中,图书馆应争取更加灵活的订购方式,如选择单独的期刊进行订购。

3.4 优化区域联盟的数据库采购

区域图书馆联盟建立的目的之一是促进区域内资源的共建共享。通过分析区域联盟各个成员数据库文献下载量或者整个区域联盟的总体文献下载量的帕累托效应,寻找出提供大量下载的少量期刊或者期刊所属的学科分类,有助于明确联盟成员的具体需求。通过联盟成员馆之间的沟通,各成员馆可以只购买自己需求量较大的专辑或学科子数据库,需求中的“长尾”则可以通过联盟内的文献传递来获取。这样可在较大程度上节省数据库购置经费,充分利用成员馆所购置的资源,促进区域内资源的共建共享。

3.5 作为图书馆与院系合作购买数据库的依据

面对数据库价格迅猛上涨的态势,部分高校图书馆采取了与院系合作的方式购置数据库[10]。通过分析数据库文献下载量的帕累托效应,分析其中被大量下载的期刊目录或者期刊所属学科,可以将具体数据作为图书馆与院系划分经费分摊比例的参考。

3.6 发现参考咨询服务和读者培训的重点

在研究过程中笔者发现,ScienceDirect数据库中的文献浏览次数普遍与文献下载量均等,或高于文献下载量;而中国期刊全文数据库则相反,文献的浏览次数一般小于文献下载量。如果不考虑网速的影响,这种现象说明,研究层次较高的读者相对已经有了较好的科研习惯,善于在阅读文献摘要后作出取舍,有针对性地下载所需文献。而中文期刊数据库的读者研究层次较低,他们更多是在检索出文献列表后依据题名等基本题录信息作出下载决定,对文献质量及查准率的判断较少。因此,期刊全文数据库的使用数据可以作为读者培训的参考及对读者使用习惯的验证[8],而期刊使用中的“长尾”部分则可以作为读者培训及数据库宣传的重点。

4 结 语

国内外研究数据表明,帕累托效应在中外文期刊全文数据库的使用数据中普遍存在。语种是影响数据库文献下载量的因素之一,读者在使用非母语文献期刊全文数据库时,其表现出的帕累托效应更为明显。相比于学科综合性较强的高校,专业特色明显的高校在使用外文期刊全文库时帕累托效应更为明显,表现在少于20%的期刊提供了80%的下载量。而对于同一个单位的读者,中文期刊数据库中的帕累托效应略差,80%的下载量分布在大于20%的期刊上。

需要指出,期刊的文献下载量是诸多影响因素共同作用的结果。高校图书馆作为学校的文献保障机构,不能简单地将文献下载量作为数据库采访的唯一依据,还需要从学科建设需要、专业覆盖完备情况以及期刊的学术质量、载文量和引用情况等多方面进行综合考虑,根据学校的发展需要在“主体”和“长尾”之间作出权衡。另外,帕累托效应中的80/20比例只是提供了一种寻找核心期刊的方法。国外学者的研究数据表明,多数实例并不完全符合这一比率[3],所以并不能认定只有80/20的比例最为合适,70/30或60/40的比例就不合理。帕累托效应只是一个规律,不是图书馆必须要遵守的“红线”。

事实上,虽然帕累托效应所反映的数字不如布拉德福定律那么严谨,但作为电子期刊全文数据库使用中普遍存在的规律,对其进行统计、分析仍有利于图书馆合理配置经费,掌握读者使用规律,了解读者的使用习惯,改进服务工作。

本文在讨论时并未考虑其他小型专业期刊全文数据库的购置对综合性全文期刊数据库中帕累托效应的影响、未分析数据库中期刊变更所造成的影响,可以说是本文的不足之处,仍需后续进一步研究、探讨。

[1]科克. 帕累托80/20效率法则 [M]. 李汉昭, 译. 北京: 海潮出版社,2001:3-6.

[2]Trueswell R L. Some Behavioral Patterns of Library Users: The 80/20 Rule[J]. Wilson Libr Bull, 1969 (5):458-461.

[3]Nisonger T E. The“ 80/20 Rule” and Core Journals[J]. The Serials Librarian, 2008 (1-2):62-84.

[4]Deborah D B, Joan B F, Stephen E, et al. The Measurement of Use of Web-Based Information Resources: An Early Look at Vendor-Supplied Data[J]. College & Research Libraries, 2001 (5):434-453.

[5]Ball D. What's the“Big Deal”, and Why Is It a Bad Deal for Universities?[J]. Interlending & Document Supply, 2004 (2):117-125.

[6]James A, Stemper M L S, Janice M, et al. Usage Statistics for Electronic Journals: An Analysis of Local and Vendor Counts[J].Collection Management, 2003 (4):3-22.

[7]Tonta Y. Consortial Use of Electronic Journals in Turkish Universities[R]. Toronto: ELPUB 2008 International Conference on Electronic Publishing, 2008.

[8]杜莹琦, 郏 琳. ScienceDirect Online数据库使用统计报告的获取及利用[J]. 情报探索, 2009(1):64-66.

[9]李国洪, 任小伟, 王大元. 研究型大学图书馆数据库资源利用统计分析:以四川大学CNKI为例[J]. 现代情报, 2009 (6):136-139.[10]李丽萍, 张丽娟. ScienceDirect数据库的订购问题及使用统计分析:以河北师范大学为例[J]. 图书馆论坛, 2009 (4):60-62.

[11]刘亚茹, 韩鹏鸣, 闫 裴. 全文电子期刊数据库利用率统计分析研究:以天津大学Elsevier SDOL为例[J]. 图书馆工作与研究,2010(1):73-76.

[12]张永梅. 我校用户对ScienceDirect Online数据库的使用统计与分析[J]. 图书馆建设, 2008(9):38-39.

[13]朱前东. 全文电子期刊数据库使用中的帕累托效应分析:以暨南大学Elsevier SD为例[J]. 现代情报, 2010 (12):125-129.

[14]中国知网期刊导航[EB/OL]. [2011-08-06]. http://epub.cnki.net/grid2008/brief/result_src.aspx..

[15]Thomson Reuters. JCR-Web 4.5[EB/OL]. [2011-08-07]. http://www.webofknowledge.com/JCR.

[16]Elsevier. COMPENDEX Journals Sources List 2010[EB/OL]. [2011-08-07]. http://www.ei.org/userfiles/SourceLists/CPX%20JOURNAL%20LIST_%202010_0402.pdf.

[17]朱 强, 戴龙基, 蔡蓉华. 中文核心期刊要目总览[M]. 北京: 北京大学出版社, 2008.

猜你喜欢

帕累托全文效应
铀对大型溞的急性毒性效应
全文中文摘要
成都经济区极端降水广义帕累托分布模型研究
懒马效应
全文中文摘要
审判工作量何以最优:民事审判单元的“帕累托效率”——以C市基层法院为例
青年再造
应变效应及其应用
帕累托最优
构思精巧余味无穷 讽刺鞭挞淋漓尽致——再谈“虚荣”贯穿《项链》全文