中外图书情报学老化规律对比研究
2022-09-01宋艳辉沈绪康邱均平
宋艳辉 沈绪康 邱均平
(1.杭州电子科技大学中国科教评价研究院,浙江 杭州 310018;2.杭州电子科技大学管理学院,浙江 杭州 310018)
文献老化是图书情报学学科研究的重要课题之一,科技文献作为知识载体,其有效性或实用性必然会随时间推移不断下降,探索学科老化规律与引文特征有利于客观有效利用文献的学术价值。自1944年美国纽约大学的Charles F G在其博士论文上对于文献老化问题研究以来[1],文献老化问题进入了一个新的阶段,同时也出现了新的问题,尤其是国内外的发展可能出现不平衡,有必要在该阶段展开探讨。
1 文献综述
目前文献老化研究主要围绕3个方面展开:一是文献老化方法模型的研究。Maurice B L等研究发现,共时法与历时法测度老化有所差异[2]。Stinson E R认为,共时法是合理且有效的[3]。周爱民对比研究概率分布函数曲线提出了文献老化对数正态分布模型[4]。陈京莲等首次尝试将Ye模型引入老化研究中并取得了很好的拟合效果[5]。Vieira E S等研究了2004年Web of Science中数学、物理、化学和生物论文被引情况,发现单指数和双指数泊松分布对于拟合论文被引频次的分布规律效果很好[6]。二是单一学科或细分学科老化问题的量化研究。刘伙玉对图书馆学、情报学与档案学的引用和被引半衰期进行研究,解释了影响半衰期的相关因素,揭示了被引半衰期和引用半衰期的相关关系[7]。童国平以中图分类号为划分依据,对社会学细分领域的引用和被引半衰期进行研究,进一步探究了学科内部老化情况[8]。李赞梅等统计出国外临床医学相关学科半衰期2005年为7.1年、2014年为7.6年,10年均值为7.3年[9]。2018年Gorbea P S等对3种墨西哥公共卫生杂志进行老化研究发现其半衰期为7.5年[10]。三是不同学科领域或期刊老化规律的对比研究。Nazan Ö U等根据分层采样技术,从4个基本学科领域(社会科学,纯粹科学,工程学,艺术和人文科学)选择样本数据,发现不同学科文献的引文特征有所差异[11]。邱均平等以CSSCI数据为样本,对人文科学七大学科进行对比分析,揭示了人文科学的整体老化现象[12]。Schloegl C等以图书情报学的40种SSCI国际期刊和10种德语期刊为样本,对比发现前者平均引用半衰期是5.1年,而后者的平均引用半衰期是28年[13]。宋雯斐等对图书情报学图书的引文数据进行研究,并与该学科外文期刊进行对比分析[14]。黄利平分别研究了图书情报和管理学领域25种期刊的最佳被引年限和历时半衰期[15]。
综上所述,国内外学者多采用半衰期、普赖斯指数等老化指标对单一学科或者期刊老化速率进行定量分析,但发现少有研究针对国内外学科老化规律进行对比分析,而单一进行国内或国外学科老化研究无法把握学科发展水平的差距。另外,现有的研究在探索新的老化规律模型和方法方面尚存在不足,因此本文将针对以下两个目标进行研究:①根据传统老化指标对比探究国内外图书情报学老化规律的不同;②在负指数模型基础上探索新的老化模型,对比分析两者的拟合效果。本文围绕这两个目标展开研究,以期冀帮助学者清晰把握国内外学科老化规律的差别,并在一定程度上丰富老化模型的应用研究。本文将选取社会科学引文索引(SSCI)和中文社会科学引文索引(CSSCI)来源期刊为研究对象,揭示国内外图书情报学的老化规律,通过对比老化指标和验证老化模型探讨国内外学科发展现状以及存在的差距。
2 数据、方法、模型
2.1 数 据
本文以SSCI收录的52种来源期刊和CSSCI收录的18种来源期刊为数据来源。本文所选取的外文期刊目录来自于Leydesdorff L等的研究,该研究从图书馆、情报与文献学期刊中筛选出52种与图书情报学相关的期刊[16],包含:AFR J LIBR ARCH INFO、ASLIB J INFORM MANAG、ASLIB PROC、AUST ACAD RES LIBR、AUST LIBR J、CAN J INFORM LIB SCI、COLL RES LIBR、ELECTRON LIBR、HEALTH INFO LIBR J、INF TARSAD、INFORM CULT、INFORM DEV、INFORM PROCESS MANAG等(详细名单见[16])。CSSCI期刊包含:《现代情报》《图书馆论坛》《情报学报》《情报杂志》《情报科学》《图书馆杂志》《图书馆建设》《图书情报知识》《图书与情报》《情报理论与实践》《图书情报工作》《国家图书馆学刊》《图书馆学研究》《大学图书馆学报》《情报资料工作》《中国图书馆学报》《信息资源管理学报》《数据分析与知识发现》。在剔除引文不规范和引文超出发表年等噪声数据之后,SSCI共检索到2017—2019年期刊论文数据为7 046篇,引文数据为289 689条;CSSCI共检索到期刊论文数据为10 383篇,引文数据为180 667条。
2.2 方 法
本文将采用半衰期、普赖斯指数、最大引文年限等指标分析比较中外学科文献老化情况。1960年,Burton R E等首次定义半衰期,即以现在为限,向前追溯学科正在利用的全部文献的一半占用了多长时间[17]。1970年,Price D S提出普赖斯指数(P)指标,以5年作为划分有应用价值和应用价值近似为零的文献的分界线,其数值即有应用价值的文献与全部文献的比值[18]。最大引文年限即引文最大值出现的年份,反映了学科文献最为活跃的时间。
2.3 模 型
负指数模型是文献老化经典的引文分布模型,由Bernal J D最早提出[19]。该模型一般采用如下函数形式:
C(t)=Ke-at
C(t)表示t年所发表的文献的被引用的次数,K表示常数,t表示文献出版年龄,a代表文献的老化率。该模型从总体上描述引文数量随着时间的增长而减少。
Barnett G A等在1989年提出了一个新的文献老化数学模型[20]。该模型假定时间t,将已发表论文分为4种类型:①已发表但目前尚未被引用的论文,以x(t)表示;②被引用的论文,以y(t)表示;③被引用过但陈旧的论文,以z(t)表示;④已发表但从未被引用过的论文,以w(t)表示。在一个特定时间,一篇论文只能处于这4种状态中的一种。且该模型假定以下两种论文状态的改变是单向的:x(t)→y(t)→z(t)或者x(t)→w(t)。以b(1)表示文献从x(t)→y(t)的比例,b(2)表示x(t)→w(t)的比例,c表示y(t)→z(t)的比例,b=b1+b2。那么,以下两个方程控制文献的引用过程:
方程2的求解取决于x的初始值,即t=0时x(0)的值。t=0时,0篇论文被发表。那么方程2变为:
y(t)=a(e-bt-e-ct)
其中,y(t)为t年前的文献在给定年的引文比例。A为正常数。这个模型假定t=0时,y(t)=0。并且,因为陈旧的被引文献的比例比未被引文献的比例高,所以c大于b。
发表和扩散延迟影响老化曲线。此外,年龄是个连续变量,只是接近某个整数年,而且文献常在发表之前就已被引用。实际上x(0)并不等于0,原因如下:①很多文献在发表之前就可获取并且引用,这种现象在网络环境下体现得尤为明显;②文献的发表年是以12个月的时间间隔,而不是某一个时刻。因此,发表日期是不精确的,发表年是一个不确定的参数。令y(0)=ed,方程(3)可以通过一个附加的参数d,方程3修改为:
y(t)=a(e-bt+d-e-ct)
系数a等于:
b(1)/(c-b)
其中,b(1)等于某文献衰减的速度。在该模型中,t=d/(b-c)时,y(t)=0;此后,y(t)从0开始增长,在达到最大值后,随着t→∞,y(t)→0。该模型意味着随着发表年的增长,引文会呈现一个逐步接近于0的引文衰退过程。
3 图书情报学老化规律
3.1 学科老化规律
基于Web of Science(WOS)平台,共检索到2 385、2 206、2 455篇外文文献,对应引文数为96 028、87 021、106 640条。基于CSSCI数据库统计,共检索到3 532、3 769、3 082篇中文文献,对应引文数为58 077、67 992、54 598条。根据来源文献数据绘制限定100年的引文年代分布图,得出结果如图1、图2所示。Price D S研究发现,学科的引文年限分布曲线近似等于学科文献的老化曲线,学科引文年限分布图可以反映学科的老化规律[18]。如图所示,国内外的引文年代分布基本符合负指数老化规律。国外引文峰值分别为8 639、7 295、9 254,国内引文峰值分别为11 721、13 581、11 211。2018年国外引文峰值相较于2017年有所降低,这是由于2018年来源文献负增长所致,来源文献减少必然导致引文数量减少。反观国内,2019年文献数量相较于2018年下降了18.23%,引文数下降了19.69%,篇均引用不会随着来源文献数的减少而减少。
图1 国外图书情报学引文年代分布图
图2 国内图书情报学引文年代分布图
3.2 中外老化规律对比
对比中外图书情报学的来源文献和引文数据可知,国内引文分布年份相对集中,超过2016年的引文占比仅为10%,而国外占比为20%,表明国内文献更侧重于引用近些年发表的论文。篇均引文方面,国外文献平均引文为40.3、39.4、43.4,中文文献平均引文为16.4、18.0、17.7;随着学科的成熟和科技的进步,国内外平均引文都呈现总体上升趋势,但由于中外学科发展阶段的差异,国内文献的引用广度相较于国外文献仍存在一定差距。这一点在文献引文年代分布图上也得到了印证,国外文献引文年代分布更为广泛,曲线斜率绝对值相对较小,国内文献引文年代分布更为集中,曲线斜率绝对值更大。当然,这也得益于国外学科发展起步较早,诸多经典文献应运而生。比如,文献计量学的很多定律都是由国外首先提出,正是这些定律奠定了学科发展的基础。
4 文献老化指标研究
4.1 老化指标分布
通过计算得出不同年份的老化指标,结果如表1、表2所示。由表1可知,国外文献半衰期呈现增长趋势,普赖斯指数总体呈现负增长趋势,半衰期大概为7.7年,且数值每年增长0.02,普赖斯指数约为0.33,最大引文年限是3年,这表明国外文献对于档案性资料具有较强的依赖性。由表2可知,国内总体变化趋势和国外近似,其半衰期分别为3.79、3.84、4.18,普赖斯指数分别为0.597、0.591、0.566。Egghe L研究发现,一个学科的老化过程中,普赖斯指数与半衰期之间存在着一定的数量关系[21]。通过计算可得每年国外文献乘数约为2.5,国内文献乘数约为2.3,印证了乘数为常数的规律。邓跃刚指出,不同学科领域文献引文的最大引文年限有所不同,最大引文年限反映引文最为活跃的时间[22]。国外达到引文峰值的时间为3年,国内达到引文峰值的时间是2年,说明了中外在引文最为活跃时间上的差异。
表1 国外图书情报学老化指标表
表2 国内图书情报学老化指标表
4.2 中外老化指标对比
老化指标量化学科的老化规律,以此来解释学科当前的发展阶段。对比发现,国内文献半衰期远小于国外文献,国外文献半衰期约为国内文献的两倍,国外的老化速度明显比国内慢得多,文献适用期更为长久。通过数值比对,国内外半衰期相差逐年递减,侧面反映了国内学科正在快速发展,国内外发展差距正在不断缩小。由此可见,由于国外图书情报学发展历史较长,高水平文献的积累为广泛引用提供了便利,文献具有更长远的生命周期;新文献的产生更多是对已发表文献的补充和拓展,为以后研究方向的质变奠定基础。通过数值变化可以看出国内图书情报学正处于快速发展时期,学科文献知识更新换代更为迅速,更加青睐于引用近些年发表的文献。随着大数据技术的兴起、数字出版的流行、开放存取的普及,老化规律的发展也将会受到新兴领域的理论、方法的影响[23]。
5 老化模型研究
5.1 国外老化模型研究
基于年代引文分布数据,对前文提到的负指数模型和Barnett模型进行检验,并采用Python工具绘制总体数据模型拟合图,结果如图3、图4所示。对比R square可知,负指数模型拟合曲线均值为0.945,Barnett模型拟合曲线均值约为0.997,Barnett模型的拟合优度明显高于负指数模型,方程显著性更强,故选用Barnett模型对年代引文数据进行拟合效果更好。
图3 国外文献负指数模型拟合图
图4 国外文献Barnett模型拟合图
表3 2017—2019年国外引文时间分布回归方程
5.2 国内老化模型研究
针对国内数据,同样采用负指数模型和Barnett模型进行对比,结果如表4所示。可以看出,国内数据也同样更适合采用Barnett模型进行拟合,负指数模型拟合的R square仅为0.76,而Barnett模型进行拟合的R square约为0.983,拟合效果相对更为理想,更符合国内引文年限分布趋势。
表4 2017—2019年国内引文时间分布回归方程
图5 国内负指数模型拟合图
图6 国内Barnett模型拟合图
5.3 中外老化模型对比
根据对模型分别进行检验的结果,可以看出国外的拟合效果均略优于国内,这同样表明国外图书情报学发展比国内要更加成熟和稳定。另外,Barnett模型的拟合效果明显优于负指数模型,这是由于负指数模型无法反映达到引文峰值之前的快速增长变化,而Barnett模型恰好能够弥补这一缺陷。因此选用Barnett模型进行拟合能够更好地把握引文过程的发展变化,国内外曲线的拟合优度都更为理想,R square均大于0.98,即2017—2019年的国内外引文时间分布函数均拥有图书情报学引文过程中98%的解释度,可以用以下方程表示:y(t)=a(e-bt+d-e-ct)。由前文可知,c表示被引用的论文到被引用但已陈旧的论文的比例,b(1)表示文献衰减的速度。从这两项数据上看,国外文献成为“档案性资料”的比例远高于国内文献,文献衰减的速度也远慢于国内,这也从不同角度印证了采用老化指标所呈现的结果。本文通过样本数据验证了Barnett模型在探索图书情报学文献老化规律上的有效性,该模型通过构建关于时间t的非线性回归函数,能够较为准确地描述随时间变化的引文数量。虽然仍需要进一步验证该模型对于描述其他学科文献老化规律的适用性,但目前来看该模型能够为扩展研究引文过程的老化模型的探索做出贡献,并且其较高的解释度也可以在构建文献剔旧标准和实践应用方面提供良好的判断依据。
6 老化规律研究对比
老化指标可以反映学科的老化规律,通过老化指标的纵向和横向对比不仅能够探究学科当前的老化规律,还可以探究更长周期、不同领域的老化规律变化。本节将汇总其他学者对于图书情报学和其他学科老化指标的相关研究。基于此,既可以验证本文数据结果的准确性,同时可以根据相关研究对比老化指标变化趋势。
2004年,Schloegl C等以图书情报学的40种SSCI国际期刊为样本得出引用半衰期为5.1年[13],宋雯斐等研究了2012—2014年WOS图书情报学期刊得出半衰期平均为7.27年[14]。本文研究得出国外文献半衰期平均为7.73年,由此可见国外文献这20年经历了从变化显著到轻微变化的转变。刘伙玉基于CNKI数据库得出2010—2012年中图书馆学、情报学与档案学半衰期为3.65年[7]。本文国内半衰期结果约为3.93年,相较而言变化并不显著,表明我国图书情报学仍保持较高的老化速度。Isbandini I对森林管理文献进行引文分析发现超过8岁的论文已经过时[24]。朱清发现大多数国外文学期刊半衰期在10年之上[25]。Tsay M以2002年的数据为样本发现物理、化学和工程学的引用半衰期大约为8年[26]。李赞梅等统计2005年国外临床医学半衰期为7.1年,2014年为7.6年,10年均值为7.3年[9]。2018年Gorbea P S对墨西哥的3种公共卫生杂志研究发现半衰期为7.5年[10],2006年陈立新等计算出力学的半衰期为10年[27],这表明相较于应用科学图书情报学半衰期更短,国外医学和图书情报学老化规律大致相同。
7 结 论
通过对比分析中外期刊样本数据,本文探讨了中外图书情报学发展现状,结果表明中外该学科所处的发展阶段有所差异,国外该学科已经相对成熟,国内发展阶段明显落后于国外,但正处于快速发展阶段,主要得出以下结论:
1)本文分别采用负指数模型和Barnett模型来描述引文分布,结果表明,后者比前者拟合效果更好,这是因为负指数模型不能描述引文高峰到来之前的引文分布。因此,本文所选取的Barnett模型能够更好地拟合引文时间分布。当然,本文仍存在一定局限性,该模型是否适合于其他学科文献的老化仍需进行进一步验证。
2)国外文献半衰期为7.7年,国内文献半衰期为3.9年。国内应当尽快挖掘文献的长时利用价值。普赖斯指数方面,国外文献普赖斯指数变化并没有国内文献变化显著,即国外对于档案性文献的依赖性处于稳定水平,学科处于稳定发展阶段;而国内学科修正速率较快,国内文献愿意更多引用近些年发表的文献,学科研究者应当密切关注学科前沿动态,把握学科发展方向。
3)学术研究具有承接性、延续性的特点,参考文献正是连接论文与前期研究成果的桥梁,能够使读者追本溯源。而国内文献在文献利用广度上明显落后于国外文献,国内文献篇均引文约为17,国外文献篇均引文约为41,这表明中外学者对学科发展前沿的把握能力和研究深度还存在着明显的差距。
通过对比老化指标可以清晰把握国内外文献老化规律的差异。经研究发现,国内外图书情报学均处于发展阶段,但其发展状态存在差异:国外发展平缓且处于相对成熟阶段,而国内发展相对较快。本文通过探究老化规律对比中外图书情报学存在的差距,发现这种差距不仅体现在高水平文献的缺失,也体现在学者引文利用广度的差距。本文期冀通过对比研究能够对当下国内学科建设和学术期刊发展有所助益。