基于共时法的图书情报学领域期刊文献老化分析
2023-01-18刘清
刘 清
(重庆市少年儿童图书馆,重庆 400014)
0 引言
文献老化是指随着“年龄”的增长,文献内容日益变得陈旧过时而失去了作为情报源的价值,因而越来越少被人们利用的现象。随着科学知识的不断更新以及科学技术的不断进步,使得科技文献老化成为一种普遍的社会现象[1]。近年来,国家加强文化资源建设,加快了期刊的入藏、加工、传递和利用的速度,同时,电子数据库和开放存取机制的日趋完备,科研人员可以通过网络数据库第一时间获取即时文献,大大提高了科研效率,有力地推动“文献循环”[2],上述现象加快了文献老化的速度。研究文献老化能够更好地评价和选择文献信息,优化图书馆馆藏的配置,同时也能更好地揭示科学技术的发展过程和规律,从而更好地为读者和用户服务。
目前,文献老化研究一般从历时法和共时法两个角度展开。历时法通过对某一年发表的文献按一定的时间间隔观察并统计发表后的被引用情况。但历时法时间跨度较大,需要穷尽文献的“一生”,因此在统计上具有一定的难度。而共时法是在给定的一段时间内,以不同年限文献的被利用测度为基础观察其时序分布,共时法的提出使文献老化测度的可行性大大增加[3]。
自Gosnell C. F.[4]提出文献老化以来,科研人员围绕老化理论、度量指标[5-7]、数学模型[8-9]等进行了丰富的探索,研究范围覆盖到医学、心理学、新闻传播学、图书情报学等社会科学、自然科学领域,其实证研究更为丰富。国外研究现状如下:Gupta B.[10]以7年为引文窗口,研究遗传学领域文献老化趋势;Sangam S. L.[11]通过计算各种文献老化的指标,分析了心理学领域文献的老化现象;Lariviere V.[12]研究了1900年至2004年间科学文献的老化速度,发现在二次世界大战期间,科研人员更倾向于引用较新的文献;Zhang L.[13]通过共时法分析社会科学、自然科学文献的老化趋势及老化的原因。
目前国内研究现状如下:陈立新等[14]通过共时法研究力学文献老化速度的变化趋势;邱均平[15]以CSSCI在2006年至2008年收录的专业期刊文献为研究对象,利用共时法分析国内人文社会科学文献的整体老化规律;宋艳辉[17]通过共时法研究新闻传播学文献的老化规律,并分析了该学科文献老化背后的原因。针对图书情报学文献老化的实证研究也颇多,如黄利平[18]以图书情报学和管理学的核心期刊为研究对象,利用历时法对比分析了这两个学科文献的老化规律;朱红艳[19]利用共时法分析了图书情报学与档案管理学的老化规律,发现图书情报学领域的老化曲线符合负指数老化方程,并给出图书情报学的学科文献老化率;刘伙玉[20]基于CNKI数据库,结合共时法与历时法对比研究了图书馆学、情报学以及档案学的文献半衰期。
尽管目前国内对文献老化的实证研究较多,也有不少学者分别从共时法、历时法的角度分析研究了图书情报学领域文献的老化现象,但已有研究多是停留在学科层面,没有从更细、更深层次研究文献老化问题。Zhang L.[13]指出,在不同的层次上测度、对比文献老化指标对解释学科内部文献老化的差异非常重要。综上所述,本文拟从CSSCI(2019年至2020年)期刊中收录的图书情报学领域17个核心期刊为研究对象,从其整体学科、子学科、期刊和个体文献层面对比分析图书情报学领域文献的老化趋势,实现细粒度、深层次的文献老化分析,并从多层面解释文献老化的原因。
1 文献老化指标和模型
1.1 引文年限
引文年限是指被引文献的出版年代与其被引用年代的差值。例如,一篇2015年出版的文献在2018年被引用,那么它的引文年限就是3年。通常情况下,引文年限越大,其老化速度就越慢。
1.2 引文峰值
引文峰值即最大引文年限出现的时间。Price[7]认为,文献在发表后的第二年会达到曲线的顶端即引文峰值;邱均平[15]认为,随着学科的愈发成熟,其引文峰值会稳定到3至5年。
1.3 共时半衰期
Bernal J. D.[5]通过类比放射性物质的半衰期与文献资料利用率的衰减,从历时的角度提出文献老化“半衰期”的概念,推荐用半衰期来衡量文献的老化速度。1960年,Burton R. E.和Kebler R. W.[6]从共时的角度出发,认为这种半衰期(共时半衰期)称为中值引文年龄更为合适。共时半衰期指某学科所引用的文献中较新的一半是在多长时间内发表的,也可以理解为某学科引文年限的中位数。
1.4 普赖斯指数
普赖斯指数(Price Index)由Price D. J.[7]于1970年提出。他将出版年限不超过5年的文献称为现时有用文献,将出版年限超过5年的文献称为档案性文献。普赖斯指数的计算方法是:在某一学科中,其所引用不超过5年的参考文献占整体参考文献的比例,普赖斯指数反映了某学科对档案性文献的依赖程度,可用于衡量某一领域全部文献的老化情况,同时也可用于衡量某种期刊、某一作者甚至某篇文章的文献老化情况[21]。一般来讲,某一学科领域文献的共时半衰期越短,普赖斯指数越大,其文献老化速度就越快,普赖斯指数与共时半衰期成反比[14]。
2 实证研究
2.1 数据来源与处理
为使数据具有代表性,本文选取CSSCI(2019年至2020年)收录的图书情报学领域17个期刊(《信息资源管理学报》创刊于2011年,因此并不包含在本文的检索范围内)为研究对象。为保证采集数据的规范性,本文基于CNKI引文数据库中的被引文献数据库进行检索,检索时间为2019年11月10日至2019年11月17日,采集17个期刊在2018年、2008年的引文数据,并用python语言编程提取引文数据中期刊论文、学位论文的年代信息。共获取2008年5 055篇源文献的20 161条引文数据、2018年2 780篇源文献的37 872条引文数据,见表1所示。本文所采用的研究方法主要是引文分析法[22]和比较分析法。
2.2 结果分析
2.2.1 图书情报学领域文献总体老化趋势分析
按文献所属年份汇总2008年、2018年引文数据中的期刊论文和硕博论文的年代信息,根据文献共时半衰期、普赖斯指数计算样本文献的老化速度,统计、计算结果见表2。
由表1发现:图书情报学领域17个期刊的篇均引文量从4.0篇增长到了13.6篇,平均引文年限从2008年的3.7年增长到2018年的5.8年,增幅为56.8%;共时半衰期(引文年限中值)从3.4年增长到了4.6年,增幅35.3%;普赖斯指数从0.82降低到了0.63。不难发现,相比2008年,2018年文献的平均引文年限、共时半衰期增大,说明2018年引用了更多的“老”文献。普赖斯指数减小,说明引用现时有用文献的比例降低。上述变化说明图书情报学领域的文献老化呈现出变缓的趋势,也说明2018年图书情报学领域更倾向于引用档案性文献。
一个学科的引文年限分布曲线近似于该学科的文献老化曲线[7]。因此,为了更清晰地反映图书情报学领域文献老化的趋势,根据2018年(37 872篇)、2008年(20 161篇)的引文数据,绘制图书情报学领域的引文年限分布图,图中所选取的时间段是20年,如图1所示。横轴表示不同的引文年限,纵轴表示不同引文年限的引文占整体引文的比重。
由图1可知,两个年份的引文年限分布均呈现出先急速增长然后缓慢下降的趋势,虽然两个年份的引文峰值均出现在第2年,但是能观察到:第一,2018年的引文曲线更加平缓,引文年限为第2年、第3年的比重比较接近,2008年引文年限的第2年、第3年的比重有较大的差距;第二,引文峰值存在较大的差距,2008年的引文峰值的比重为23.2%,2018年为14.6%,两者相差百分点数为8.6;第三,相比之下,2008年引用了更多的现时有用文献,2018年引用了更多的档案性文献。
Fig.1 Citation age distribution in the field of library and information science图1 图书情报学领域引文年限分布
为了在结构上探究图书情报学领域文献的老化趋势,根据17个期刊所提取的引文数据年代信息,计算每一篇个体文献的普赖斯指数,然后按照所属年份进行汇总,最后得出2008年、2018年图书情报学领域个体文献普赖斯指数的分布图,如图2所示。横轴表示个体文献普赖斯指数的范围,纵轴表示该范围的文献占总体的比重。我们将普赖斯指数在[0,0.2]区间范围的个体文献称为“慢速老化文献”;普赖斯指数在(0.2,0.8]区间范围的个体文献称为“正常老化文献”;普赖斯指数在(0.8,1]区间范围的个体文献称为“快速老化文献”。
Fig.2 Price index distribution of literature in library and information science in 2008 and 2018图2 图书情报学领域文献2008年、2018年普赖斯指数分布
由图2可知:2008年图书情报学领域文献的普赖斯指数呈现出偏态分布,整体偏右;而2018年的普赖斯指数呈现近似正态分布,与2008年相比明显向左移动。具体表现为:第一,2018年个体文献普赖斯指数在(0.8,1]区间范围的比重明显低于2008年的相应比重,说明2018年快速老化文献的比重大大降低,符合2018年图书情报学领域减少引用现时有用文献的现象;第二,2018年个体文献普赖斯指数在(0.2,0.8]区间范围的比重大于2008年的相应比重,说明2018年正常老化文献的比重增加,这与2018年图书情报学领域更多引用档案性文献相吻合。在图书情报学领域文献的普赖斯指数分布上,同样能观察到图书情报学领域文献老化趋势减缓的趋势。
徐恩元[23]曾经提出,学科之所以呈现出不同的老化趋势,可能与文献的增长、学科发展阶段的差异有关。下面我们从这两个角度分析图书情报学领域的文献老化现象。
一方面,存在文献增长的差异。一般来讲,文献增长越快,文献老化也相应加快。但是根据CNKI数据库提供的发文量数据可知,2008年图书情报学领域的发文量为22 392篇,2018年下降到20 354篇。根据“文献增长越快,文献老化也会相应加快[23]”的规律,2008年图书情报学处于快速发展阶段,不断有新的理论知识补充进来,研究方法也不断地完善,学科文献呈指数增长,导致图书情报学领域文献老化较快且半衰期较短。而在2018年,经历了快速的发展之后,学科发展进入相对成熟的阶段,文献利用寿命加长,因此,引用文献的半衰期变长,对档案性文献的依赖程度增加,普赖斯指数变小,文献老化速度变缓。
另一方面,存在学科发展阶段的差异。2008与2018年的引文峰值均是在第2年,说明图书情报学领域的引文峰值符合普赖斯的观点。更进一步,邱均平[15]发现,Price认为的“学科最大引文年限出现在文献发表后的第2年”与实际情况是有出入的,随着学科的日趋成熟,文献的引文峰值大约在其发表后的2至4年,而管理学的引文峰值出现在第3年。根据图1可知,2018年引文年限为第2年、第3年的比重已经十分接近。在2008年,二者的差距为6个百分点。说明在10年的发展中,图书情报学领域的最大引文年限十分接近第3年,这与已有的研究结论“管理学及人文社会科学最大引文年限为3年[16]”一致。说明在最大引文年限方面,图书情报学领域变得已经接近于它所属的一级学科管理学,也从一个侧面反映出图书情报学领域基本具备了成熟学科文献老化的特征。
2.2.2 子学科文献老化对比分析
为探究图书情报学子学科文献老化的差异,将17个期刊按照所属图书馆学、情报学进行分类汇总,对于两栖期刊,如《图书情报工作》等图书馆学与情报学内容兼有的期刊,因更偏重图书馆学内容的研究,故将其计入到图书馆学,计算其老化指标,见表3所示。对比分析子学科文献老化与学科整体文献老化的异同。
表3 2008年、2018年图书馆学与情报学文献老化指标数值Table 3 Aging index values of library science and information science in 2008 and 2018
由表3可知:图书馆学的平均引文年限从2008年的3.7年增长到2018年的5.7年,增幅为54.1%;共时半衰期从2008年的3.3年增长到2018年的4.5年,增幅为36.4%;普赖斯指数从0.82下降到0.64;情报学的变化趋势与图书馆学基本一致,图书馆学与情报学的文献老化指标均有较大的变化。这说明:第一,在子学科层面,图书馆学与情报学的文献老化趋势与学科整体趋势类似,文献老化速度变慢;第二,2018年图书馆学、情报学引用现时有用文献的比例减少,引用档案性文献的比例增加。
为了更直观地观察两个子学科在2008年、2018年的引文年限的变化,根据图书馆学与情报学文献的引文年限数据分别绘制其在2018年与2008年的引文年限分布图,如图3、图4所示,所选取的时间段为20年。横轴表示不同的引文年限,纵轴表示该年限的引文量占总体的比重。
Fig.3 Citation distribution of library science literature in 2008 and 2018图3 图书馆学文献2008年、2018年的引文分布
Fig.4 Citation year distribution of information science literature in 2008 and 2018图4 情报学文献2008年、2018年的引文年限分布
对比图3、图4,发现:第一,图书馆学与情报学引文年限分布曲线呈现出相似的变化趋势,先急速增长然后缓慢下降;第二,图书馆学与情报学在2008年、2018年引文峰值均出现在第2年,但占总体比重却存在较大的差距,2018年两个子学科引文年限的第2年、第3年比重比较接近;第三,2018年,两个子学科均呈现出引用现时有用文献比例降低,引用档案性文献比例增加的趋势。由上述现象可知,图书馆学、情报学与学科整体的文献老化趋势相同。
但对比表3的老化数据,2008年图书馆学与情报学的文献老化指标大致相等,说明此时两个子学科的文献老化速度相似;而2018年图书馆学的共时半衰期小于情报学的共时半衰期,普赖斯指数则相反,说明2018年图书馆学的老化速度快于情报学。为了分析造成不同老化现象的原因,我们根据2018年引文数据的年代信息,绘制图书馆学、情报学文献引文年限分布的直方图,所选取的时间段为20年,如图5所示。横轴代表不同的引文年限,纵轴表示不同年限的引文占总体的比例。
Fig.5 Comparison of citation age of library science and information science literature in 2018图5 2018年图书馆学与情报学文献的引文年限对比
由图5可知,2018年图书馆学引用最多的文献都是在文献发表的第1年和第3年,情报学则是在第2年和第3年。相对图书馆学,情报学引用的文献发表时间总体滞后,这可能与学科差距、用户需求以及学科所在的情报环境有关[21]:首先,图书馆学拥有较长的发展历史,但由于近年来网络环境的发展,信息技术的不断完善,图书馆学更多地与网络环境、计算机技术相结合,使学科研究方向发生了较大的变化;其次,与图书馆学相比,情报学学者拥有更强的情报意识,对文献的检索以及利用更熟练,能够在有限的时间和空间环境下从时间范围更宽的文献中快速、方便地检索到自己所需的文献。
2.3 期刊文献老化对比分析
为探究各个期刊文献与图书情报学整体文献老化的差异,根据17个核心期刊引文数据的年代信息,计算每个期刊的文献老化指标,见表4。
表4 图书情报学核心期刊文献老化指标*Table 4 Aging index of core periodicals of library and information science*
由表4可知,R1、R2均大于等于0,可以表明2018年17个期刊的共时半衰期均大于等于2008年的共时半衰期并且2018年各期刊的普赖斯指数均小于2008年的相关普赖斯指数。这个现象说明17个期刊均呈现出文献老化速度减缓的趋势,这与整体学科、子学科的文献老化趋势一致。
邱均平[15]认为文献老化指标是科学知识修正速率的反映。随着时间的变化,17个期刊的普赖斯指数呈现出变小的趋势,表明该学科的修正速率正在变缓,也说明在过去10年中,图书情报学领域核心期刊引用现时有用文献的比重减小,引用档案性文献的比重增大。根据R1和R2的数值大小来看,图书情报学领域核心期刊文献的半衰期和普赖斯指数均有一定的变动,且R1与R2都为正数,说明在过去的10年中,随着学科研究的深入,该领域经历着飞速的发展,新理论在原来的基础上不断地更新和补充,研究方法不断完善,学科发展进入相对成熟的阶段,学科知识修正速率会变小,文献老化速度逐渐变缓。
但是在期刊层面上能发现一些有趣的现象。根据图2可知,图书情报学核心期刊2018年快速老化文献的比重降低,正常老化文献的比重增加,慢速老化文献的比重并没有太大的变化。与学科整体普赖斯指数分布差异较大的期刊是《图书与情报》与《图书馆杂志》。图6是这两个期刊文献的普赖斯指数分布情况,其中横轴表示不同的普赖斯指数范围,纵轴表示该范围的个体文献占总体的比重。
由图6可看出:2018年《图书与情报》期刊文献的普赖斯指数在[0,0.2]区间的比重明显小于2008年的相关指标,两个时间范围的普赖斯指数在(0.8,1]区间范围的比重大致相等,这说明2018年该期刊慢速老化文献的比重下降,快速老化文献的比重没有太大的变化;而《图书馆杂志》2018年个体文献的普赖斯指数在[0,0.2]和(0.8,1]区间范围的比重均大于2008年,表明该期刊2018年快速老化文献、慢速老化文献的比重均上升。
Fig.6 Comparison of price index distribution between Books and Information and Library Magazine in 2008 and 2018图6 《图书与情报》与《图书馆杂志》文献2008年、2018年的普赖斯指数分布对比
由表4可知:《情报理论与实践》的R1值为0.17,表明该期刊2018年普赖斯指数变化较大,即2018年该期刊文献老化的速度变缓;而R2值却为0,表明2018年该期刊的共被引半衰期与2008年的相关指标相等,即2018年该期刊文献老化的速度并没有变化。该期刊的普赖斯指数分布如图7所示,呈现出与图书情报学整体变化相同的趋势,即2018年快速老化文献比重降低、正常老化文献比重增加、慢速老化文献比例大致相同。
Fig.7 Comparison of price index distribution of Information Theory and Practice in 2008 and 2018图7 《情报理论与实践》2008年、2018年普赖斯指数分布对比
对比图书情报学整体层面与期刊层面的文献老化指标,有如下发现。第一,期刊层面的文献老化与学科整体的文献老化具有一定的差异。无论在文献老化速度的变化、不同老化程度文献的分布上仍有不同之处。期刊与学科整体是相互补充的作用,两个视角不能够互相替代。第二,17个期刊都有自己的引文特色,不同的期刊具有不同的老化速度。
3 结束语
本文鉴于已有文献老化研究中视角尚不全面、分析层次不足的现象,提出从整体学科、子学科、期刊和个体文献等不同层面分析文献老化问题。研究基于CNKI数据库,以CSSCI收录的图书情报学领域(2019年至2020年)17个期刊为研究对象,获取其2008年的5 055篇源文献、2018年的2 780篇源文献,提取上述源文献引用的期刊论文、学位论文(共58 033条)的年代信息。从共时法的角度运用引文分析法、统计分析法以及比较分析法,从整体学科、子学科、期刊和个体文献层面对比分析了2008年、2018年图书情报学领域文献老化趋势。
研究得出以下几点结论。第一,由于发文量的减少以及学科发展趋于成熟,2018年图书情报学领域的文献老化速度变缓,学科总体引文表现为“引用现实有用文献的比例减少,引用档案性文献的比例增加”的特点。第二,图书情报学领域的引文峰值趋近第3年,由于一级学科管理学的引文峰值一直稳定在第3年,因此从文献老化的角度来讲,图书情报学学科已具备成熟学科文献老化的特性。第四,由于学科自身特征和用户环境的不同,在子学科层面上,2008年图书馆学与情报学的老化速度大体一致,但在2018年,图书馆学文献老化速度快于情报学。第五,在期刊层面,17个期刊的文献老化趋势与学科整体趋势相同,文献老化速度变缓,即“引用现实有用文献的比例减少,引用档案性文献的比例增加”。在不同文献老化速度的分布上,2018年《图书与情报》慢速老化文献的比重增加,《图书馆杂志》快速老化文献的比重增加,这与图书情报学领域文献的整体分布有较大差异。