APP下载

基于网络引文的开放存取期刊利用效率研究

2014-01-13王宏光上海理工大学图书馆上海200093

图书馆理论与实践 2014年2期
关键词:半衰期遗失参考文献

●高 丽,王宏光(上海理工大学图书馆,上海 200093)

基于网络引文的开放存取期刊利用效率研究

●高 丽,王宏光(上海理工大学图书馆,上海 200093)

开放存取期刊;网络引文;半衰期;利用效率

随着计算机网络技术的不断发展,网络学术资源越来越受到人们的重视,其中最重要的一个标志是学术论文引用网络学术资源作为参考文献的现象越来越普遍。本文选取4份具有国际影响力的开放存取期刊,以2001-2010年发表的电子期刊论文为数据样本,基于网络引文,按不同学科分别从参考文献、遗失引文文献、域名、网络搜索路径等几个角度深入分析网络引文的引用情况,通过期刊文献半衰期测度,试图对开放式存取的学术期刊利用率作比较研究。

随着信息技术的飞速发展和网络文献信息资源的日益丰富,人们获取信息的途径和学术交流模式发生了很大的变化,在科学研究、文献继承及文献引证过程中,网络引文作为一种新兴的引文类型,在学术期刊论文的参考文献中的数量日益增长。本文基于网络引文,按不同学科分别从参考文献、遗失引文文献、域名、网络搜索路径等几个角度展开研究,并对期刊进行半衰期测度,通过对不同学科的学术期刊半衰期的研究与分析,了解科研人员对网络开放式获取期刊的利用效率。

1 国内外研究现状

Sellitto等[1]2004年研究了网络引文对图书馆学领域学术交流的影响,发现影响较小,但有逐渐加强的趋势。此外,他还发现电子期刊比印刷型期刊更多地引用了网络文献。Yang等[2]2010年通过引文分析了在学术电子期刊中利用网络资源的状况,发现电子资源对现代学者的影响越来越大,同时电子资源促进了学者发现和利用以前不可用资源的能力,加强了资源共享。我国的学者也对网络引文进行了深入的研究。河南师范大学图书馆的王恺荣等[3]对我国图书馆学、情报学的7种核心期刊作为研究样本,对其近五年间(1998~2002年)所发表的学术论文的参考文献和网络引文进行统计、归纳、分析,发现网络引文/引文总量只有9.6%,含有网络引文的论文数/总论文数只有15.7%。2004年山西大学信息管理系的张翠英等[4]以情报学核心期刊2002-2003年的载文为样本,发现网络引文占当年引文总量的20.59%。中南大学胡德华等[5]基于网络引文理论,分别从年代、期刊、域名、文本格式四个角度对我国近五年的5种图书情报学期刊中网络学术资源的利用效率进行全面系统的研究分析,发现含网络引文的论文量占总论文量的百分比为13.15%。

但是网站资源具有不稳定性,国外学者Ducut[6]在2008年的研究中指出,通过网络获取电子期刊在稳定性和持久性方面表现出显著的差异。他经过一项为期四年的研究发现,网页的寿命是由其类别和用途相互复杂作用的结果,且提出不同学科、不同域名、不同领域的网络信息的半衰期各不相同。Bar-Ⅰlan& Peritz,Goh&Ng等[7]研究了印刷文献的URL和网站列表,发现不同的学科类型和主题领域半衰期不同。目前国内学者主要对网络信息老化的原因、特征以及测度方法有所探讨,但却未对不同学科的网络信息做分类研究。

以上研究表明,目前国内外学术界对网络信息资源的分类还缺乏一个完善的体系,且对于不同内容网络信息资源的半衰期也没有深入的比较分析。对网络信息老化的测度仅局限于物理层面,而没有从网络信息的利用价值的角度去研究。基于此,本文从网络引文的角度,以2001~2010年发表的电子学术期刊为数据样本,目的在于通过对开放存取期刊进行半衰期测度,对不同学科电子期刊利用率作出比较研究。

2 研究问题及研究方法

2.1 问题的提出及假设

基于网络获取电子学术资源的方式,本文做出如下假设:① 学术论文中的参考文献和引文文献数量呈正相关;② 网络引文的利用程度与学科性质相关;③ 遗失的网络引文数量与学科性质相关;④ 网络引文的半衰期与网络域名、路径呈正相关。

基于以上假设,本文试图解决以下几个具体问题:① 不同学科学术期刊论文的引文现状分析;② 不同学科学术期刊论文的引文遗失比例;③ 网络引文与网络域名、URL路径的关系以及半衰期的计算。

2.2 样本期刊及参考文献的选择

本文电子期刊文章数据样本是通过DOAJ(www. doaj.org)网站获得。共4份具有代表性的学术期刊,分别属于自然科学和社会科学两大学科:① 化学学报(Acta Ahimica Sinica,AAS);② 国际分子科学学报 (Ⅰnternational Journal of Molecular Science,ⅠJMS);③ 世界体系研究杂志 (Journal ofWorld System Research,JWSR);④ 文献学报(Journalof Documentation,JD)。

尽管之前有少数研究基于网络引文进行了半衰期测试,但数据样本的时间跨度都较短。不能有效的说明期刊的利用情况。因此,本研究选择了更长、更大的样本,具有影响力的国际期刊、时间范围(2001~2010年),从而减少数据的局限性。本文下载了2001~2010年发表的学术期刊。参考文献数据集仅仅指文后列出的期刊论文和书目,不包括书评、作者介绍、扩展的书目、脚注、尾注、电子邮件和注释等。本文共选取1086篇文章,其中参考文献共38820篇。

2.3 测试条件及途径

本文从38820篇参考文献中提取了1158篇网络引文,通过W3C链接检查器(http://validator.w3.org/)检查网络引文的引用情况。引文测试结果按“存活”和“遗失”分类,链接检查器测试不成功的情况,依据错误类型 (如:HTTP403,HTTP404,HTTP 500, HTTP502,HTTP 503)以及详细的URL分类。最后采用SPSS19版本进行统计分析。

3 研究过程及结果分析

3.1 不同学科的期刊论文和参考文献研究过程及结果分析

表1列出了所选期刊在2001~2010年发表的论文,参考文献和引文情况。4份期刊的网络引文数量是1158(占2.98%),本文第一个目标是测试学术期刊的网络引文是否是科研人员获取信息的最佳渠道。研究数据表明,从十年的引文数量来看,这个比例从2001年的3.53到2010年为0.89,说明通过网络获取期刊信息资源并未取得突出成绩。如果假设“参考文献和引文数量与期刊论文的数量呈正相关”,使用皮尔森相关分析进行测试(r=0.091),统计分析表明它们的相关性还不是很明显。我们普遍认为,开放存取期刊更多是依赖印刷型引文而不是网络引文。而由表2可以看出网络引文在自然科学和社会科学期刊所占比重还比较少,分别是:1.32%和7.33%。

表1 (2001~2010)4份期刊论文、参考文献、引文数据统计

表2 不同学科基于网络引文的期刊论文和参考文献数据统计

3.2 不同学科中存活及遗失的网络引文研究过程及结果分析

本文第二个目标是测试网络引文衰减率。也就是检测网络引文的持续访问程度。我们发现1158篇引文中仅有804篇引文, 而其余354已经遗失了。遗失最多的是2005年的引文占43.45%,其次是 2001年占42.02%。引文遗失率总体是逐年减少的,从 2001的42.02%到2010年的17.56%。这一点也证实了第三条假设。表3列出了不同学科引文遗失率。数据显示,引文遗失率与学科相关,在自然科学期刊和社会科学中分别占26%和52.73%,这一点也证实了2.1小节中的第三条假设。而造成引文遗失的原因主要分为五类(见表4):HTTP 403, HTTP 404, HTTP 500, HTTP502,HTTP502,其中HTTP 404:错误信息页占67.79%。

此外,造成引文遗失的原因还和域名和路径深度有关,域名主要分为以下几种:.org,.com/co,.edu,.gov,.ac,and.net,其中,域名是.net的具有较高的文章获取率,而.org,.com/co,获取率较低。遗失的网络引文还与URL的路径深度有关,这一点也证实了2.1小节中第四条假设,从下图可以看出:当路径深度为“3”时,遗失率最高,路径深度为“0”时,遗失率最低。但是根据皮尔森相关性分析,遗失的网络引文与URL的路径深度有关,但这种关联性还不是非常明显(p=.230)。

表3 不同学科存活和遗失的网络引文数据统计

表4 不同学科存活和遗失的网络引文数据统计

图 路径深度和引文的关系图

3.3 网络引文半衰期

所谓半衰期是指某学科(或某专业)现时尚在利用的全部文献中的一半是在多长一段时间内发表的。[8]计算期刊文献的半衰期一般使用泰勒(Tyler)Koehler 和Tyle公式:[9]其中,(0)表示出版期内的引文数;表示出版后的引文数,a为恒量。

网络信息的被引半衰期是指某一站点的某一时间段内被引用或被链接的所有信息中较新的一半是在最近多长时间内发表的。[6]网络信息被引半衰期的测度是通过URLs被引用的变化情况来判断的。本文半衰期是基本计算公式的修正:

通过式(2)计算本文样本半衰期计算结果(如表5所示),自然科学和社科类期刊的平均半衰期分别为11.5年和9年。

表5 不同学科期刊半衰期

3.4 研究小结

通过以上研究过程和结果分析,可以对假设问题做出回答:网络资源使用情况已经引起了研究者的广泛注意,但网络引文资源依然没有印刷型期刊使用多(见表1),造成网络引文未得到迅速增长的原因主要有两点:一是印刷型出版物的滞后;二是网络固有的不稳定和可靠性因素。并且相对于社会科学,自然科学的引用情况更少,因为自然科学更注重基础理论和信息的可信度。网络引文与期刊出版年呈负相关,论文资源发表时间越长文献遗失率越高。而网络引文与网络域名和URL有一定的相关性,相对网络管理者更倾向于维护常用的信誉较高的网站和路径较短的URL。选取的样本时间跨度越大,文献的半衰期也越长。

4 结论和展望

(1)网络引文作为一种新兴的文献资源类型已日益被科研人员所接受和认可,并正在得到越来越广泛的应用,但是网络资源兴起的同时也带来了一些新问题,网络资源的不稳定和不可靠性等等,为减小网络资源的衰减率,科研人员利用网络学术资源的意识和能力有待进一步提高。

(2)由于学科性质不同,科研人员在利用网络学术资源时,表现出很强的选择性,对网络学术资源的参考引用主要来源于一些信誉较高的教育网站或可信度很高的政府网站,以及一些科研机构的学术网站。因此,对网络学术资源的吸收、利用应与传统的方式有所差别,应选择多元化、多途径,多来源的网络获取方式。

(3)不同的文件格式适用于不同类型文献全文的处理,由于版权保护、市场竞争和技术条件等方面的原因,使网络资源数据出现多种文件格式和浏览软件,这对于用户利用网络学术资源来说,是一种障碍。因此,应该选择稳定的保存方式和网络搜索路径,并根据需求来改善网络信息资源,以延长资源的半衰期,加大学术期刊的利用价值。

[1]Sellitto C.A studyofmissingweb-cites in scholarly articles:towardsan evaluation framework[J].Journalof Ⅰnformation Science,2004,30(6):484-495.

[2]Yang S,etal.An empiricalstudyon theutilization of web academic resources in humanities and social sciences based on web citations[J].Scientometrics,2010,84(1):1-19.

[3]王恺荣.情报学核心期刊网络引文的计量研究[J].图书情报工作,2004(10):17-19.

[4]张翠英,等.Web引文数量探系[J].情报学报,2004,23(5):566-570.

[5]胡德华,金建彬.基于网络引文的网络学术资源利用效率研究[J].情报学报,2009,27(3): 379-383.

[6]DucutE,etal.An updateon uniform resource locators (URL)decay inMEDLⅠNEabstractandmeasures forit’s mitigation[EB/OL].[2011-07-12].http://www. biomedcentral.com/1472-6947/8/23.

[7] Bar-Ⅰlan J,Peritz BC.Amethod formeasuring the evolution ofa topic on theweb-the caseof“informetrics”[EB/OL].[2011-06-21].http://journal.webscience.org/32/1/WebEvolve2008-01.pdf.

[8]朱梦娴,等.不同内容网络信息资源的半衰期比较研究[J].情报杂志,2010,29(9):29-40.

[9]Tyler D,McNeil B.Librarians and link rot:a comparative analysis with somemethodological considerations[J].Portal:Libraries and the Academy,2003 (4):615-632.

G255.76;G255.2

A

1005-8214(2014)02-0030-03

高丽(1973-),女,工学博士,上海理工大学图书馆馆员;王宏光(1962-),男,教授,博导,上海理工大学图书馆馆长。

2013-09-09[责任编辑]杨 蕾

猜你喜欢

半衰期遗失参考文献
没有遗失的日记本
遗失的灵魂
The Muted Lover and the Singing Poet:Ekphrasis and Gender in the Canzoniere*
遗失的鱼鳞
Study on the physiological function and application of γ—aminobutyric acid and its receptors
基于引用半衰期的我国五官学期刊文献老化研究
基于CNKI数据的历史学学科半衰期探究*
遗失的爱
基于文献计量学的我国化学学科半衰期分析
The Review of the Studies of Trilingual Education in inghai