网络传播环境下西夏学文献老化规律研究
2019-12-16王德平徐霖杰
□李 琼 王德平 徐霖杰
学科的文献老化是任何一个学科在发展过程中普遍存在的问题,也是信息计量学和科学计量学的一个重要研究课题。早在1944年,美国纽约大学的戈斯内尔(Gosnell)博士就对文献的老化问题进行过研究[1]。1958年著名科学家贝尔纳(Bernal)借用了放射化学术语“半衰期”来说明科技文献的老化速度。后来伯顿(Burton)和开普勒(Kebler)将“中值引文年限”定义为文献的半衰期[2]。1971年普赖斯(Price)提出了“普赖斯指数”,用来测度文献老化的快慢。随之,出现了许多应用老化指标来测度文献生命衰退周期的研究。国内文献老化研究最早涉及自然科学领域,随后人文社科领域也开始出现研究成果,而且近些年研究速度在加快。如2011年邱均平等以CSSCI 收录的2006—2008年的所有人文社会科学引文数据为样本,计量了各学科的半衰期、普赖斯指数、最大引文年限等文献老化指标[3]。接着,又有许多学者对人文社科领域的各子学科——社会学[4]、民族学与文化学[5]、宗教学[6]、历史学[7]、语言文字学[8]、管理学[9]等的老化规律进行了更加深入地分析和探讨。西夏学是中华民族传统文化的重要组成部分[10],对中国文化的传承具有重要的价值,已成长为一门具有国际性质的学科。经过对西夏学文献的梳理发现,国内对该学科主要以质性研究为主,量化研究不足[11]。本文以西夏学文献为研究样本,探析其在网络传播环境下的老化现象,以揭示该学科文献老化的数量特征,寻求更准确的数学解释,为西夏学文献的开发利用和科学评价提供依据,并为促进科学研究和信息交流,改善科技管理和制定科技政策服务提供积极的借鉴作用。
一、数据来源与方法
(一)数据来源
本研究以知网(CNKI)学术期刊数据库为文献来源,发表时间限定为2014—2016年,在高级检索项中设置检索主题分别为西夏、党项、黑水城、黑城、唐古特、唐兀。另外,由于西夏学科研力量薄弱,造成其研究成果不充裕,为了扩大研究样本来源,我们从知网(CNKI)的国内外重要会议论文全文数据库中选取了《西夏学》,尽管从严格意义上讲它并不属于期刊,但是它对西夏学研究人员具有重要的参考价值,因此也将其纳入研究范围,收集其2014—2016年的题录数据。我们首先从收集到的题录数据中删除了非学术类文献、重复发表文献,之后对涉及“黑水城”、“黑城”主题的文献,从中剔除了研究元代文书的文献。按照史金波先生对西夏学的定义,它是“利用过去的历史资料、近代出土的西夏文和其他文字文献以及文物资料,研究西夏历史、社会和文化的学科。除西夏时期外,还上及西夏建国前主体民族党项族的历史,下至西夏灭亡后西夏后裔的历史”[12],对所得题录数据再次进行筛选,并请宁夏大学西夏研究院高仁博士进行甄别,最终获得715篇题录数据。之后,收集这715篇题录的引文,剔除了少量查询不到出版年代和超过统计年的数据(如出版年写着“待刊发”)。最终,我们共获得10753条引文数据。
(二)文献老化指标
我们采用共时半衰期、普赖斯指数和最大引文年限来评价学科文献的老化趋势。共时半衰期的计算方法[7]:假设半衰期的整数部分为x年,a=x+1,b=x。则a引文≥50%,b引文≤50%(a引文、b引文为第a、b年的引文累积百分比),半衰期H=x+(0.5-b引文)/(a引文-b引文)。普赖斯指数的计算方法[13]:Pr=(出版年限不超过5年的被引文献数量/被引文献总量)×100%。半衰期和普赖斯指数是既有联系又有区别的两个衡量科学文献老化的定量指标。一般地,某一学科或领域文献的普赖斯指数越大,半衰期就越短,说明文献的老化速度就越快。最大引文年限指引文峰值出现的时间,对于数据统计年来说,在所有引文中哪一年出版的在该年被引用得最多,它距统计年的出版年限就是最大引文年限[3]。
(三)文献老化模型
贝尔纳早在1958年提出负指数老化模型,是利用共时数据得到的。该模型一般采用负指数函数形式[3]:C(t)=Ke-at。式中:C(t)为t年前发表的文献的被引用频次;K为常数,随不同学科而异;e为自然对数的底;t为文献的出版年龄;a为文献的老化率。如果以文献的出版年龄为横轴,现时正在使用的文献数量为纵轴,可绘制出一条负指数曲线,即为文献的老化曲线。它可以直观地表达文献的老化过程,反映了文献利用率的衰减现象。对引文数据老化规律研究采用引文分析共时法和回归分析法。采用Excel2011进行老化指标计算,采用Origin8.5软件制图、建立文献老化模型。
二、学科老化规律研究
(一)引文年代分布分析
2014—2016年分别获得西夏学来源文献239、209、267 篇,对应的引文量分别为3663、3079、4011条,计算各年被引文献的出版年距统计年的时间差(引文年龄),绘制引文年龄与引文频次的分布图,时间段限制在100年,结果见图1。文献引文分布可以有力地反映文献的老化规律,普莱斯研究发现,一个学科的引文分布曲线与其老化曲线极为相似[3]。由图1可见,西夏学引文年代分布呈震荡衰减模式,并不严格遵循负指数曲线的形式,但这并不影响用负指数曲线描绘西夏学学科文献的整体衰减状态。
2014—2016年西夏学文献引文峰值分别为142、128、164次。2015年引文峰值较2014年下降8.54%,2016年较2015年增长28.13%;2015年引文总量较2014年下降15.94%,2016年较2015年增长30.27%。分析可知,2015年引文峰值与引文总量呈现负增长,这可能与2015年来源文献较2014年出现下降有关,来源文献越少,引文总量就越少,引文峰值也随之降低。相较于2015年,2016年的引文峰值和引文总量快速爆发;2016年相较于2014年,引文峰值和引文总量分别增加了15.49%,9.50%。总体而言,西夏学来源文献有所增加,其引文总量、引文峰值也在增长,2016年引文的强度与文献之间联系的紧密度比前两年都大,且引文更加依赖于过去的文献。
(二)老化指标分析
1.总体概况。考察西夏学各年文献老化指标及其差值的变化(表1),结果发现2014—2015年和2015—2016年引文半衰期差值均为正值(0.33、0.27),表明引文半衰期呈逐年增长的态势;而普赖斯指数各年差值均为负值(-0.002766621、-0.007332143),表明普赖斯指数逐年减小;观察最大引文年限,发现2014年最低、为4年,2015年最高、为10年,2016年有所降低。科学文献老化的根本原因是科学知识的不断增长和更新。随着人类社会的延续,科学知识的增长过程由知识“叠加”和“更新”两个方面组成。由于知识更新的不断发生,必然造成科学文献的新陈代谢。对于科学文献的老化研究,实质是对科学知识修正速度的探索,而文献老化指标反映了科学知识的修正速率[13]。总体而言,文献半衰期、普赖斯指数变化不大,最大引文年限稍有波动,说明西夏学学科领域文献的科学价值较高,因此文献的利用寿命较为稳定。从年际动态变化看,2014—2016年西夏学文献半衰期不断增大,普赖斯指数不断减小,说明文献老化速率有放缓趋势。从文献的增长率方面看,该学科领域并没有出现指数级增长,再加上文献的半衰期较长,平均为16.71年,综合判断西夏学的研究阶段处在知识的积累期,学科仍在成长中。
表1 2014—2016年西夏学学科老化指标值及其比较
2.半衰期分析。邱均平研究发现,哲学、文学、历史学等人文科学的半衰期比经济学、法学、教育学、管理学等社会科学长很多,尤其是历史学,它的半衰期在17年以上,是社会科学的3倍长[3],印证了人文学科文献半衰期长于社会科学的规律。我们发现西夏学学科知识积累方式与人文学科的历史学、民族学、宗教学、艺术学学科相似[13]。张迪等对2010—2012年民族学与文化学学科的半衰期进行了分析,发现在9年左右[5];吴伟成计算2009—2012年宗教学学科的半衰期,其值在10年左右[6];张磊计算得到2008—2012年历史学学科的引文半衰期为11.02—12.89年[7]。如排除统计年的差异,西夏学的引文半衰期与人文学科中的历史学最为近似。本研究中,西夏学文献的半衰期在16年以上,且每年以0.3的速度递增,说明该学科信息老化速度很慢,而且老化速度还在不断减缓,推测2017年西夏学文献的半衰期为17.3、2018年为17.6。有研究表明,网络传播环境为旧文献的利用提供了便利,使其焕发了新的生命力,并直接导致了文献整体老化速度的降低。[14]西夏学文献老化速度的不断降低与网络传播环境密切相关,文献利用的“长尾效应”日益显现。
3.普赖斯指数分析。普赖斯将出版年限小于5年的文献称为“现实有用”文献,将出版年超过5年的称为“档案性”文献。邱均平计算了2006—2008年人文社科各学科的普赖斯指数,发现历史学学科对档案性文献的依赖最强(Pr=0.1364~0.1545),其次是哲学(Pr=0.2133~0.2197),依赖性最弱的是管理学(Pr=0.4632~0.4985)和经济学(Pr=0.4648~0.4861)。而在本研究中,与其他研究相比,西夏学普赖斯指数非常低,仅为0.0716,说明西夏学对档案性文献的依赖比历史学学科要强很多。我们统计数据时发现,西夏学引用最早的文献的出版年距统计年已有七八百年的历史,而且引用的文献多为传统媒介的图书、专著,数字资源明显偏少。
4.最大引文年限分析。普赖斯早在1965年提出:当年发表的文章被引用的峰值是该文章发表后的第二年。随后,相关学者深入发展了该理论,对最大引文年限进行了更广泛和多样化的研究,多数研究认为文献被引用的峰值大约在其发表后的2—4年[3]。与之相比,本研究中西夏学2014—2016年最大引文年限平均值为7.67,其值存在波动,2014年最小,为4年,2015年跃到10,总体上呈上升趋势,也就是说该领域当年文献发表后至少在4年以后才能达到被引的高峰。这表明在学科发展的不同阶段文献的最大引文年限不同,建议调整西夏学期刊“影响因子”的测度方法,以8年作为测度年限。对于图书管理人员以及情报工作人员,对于西夏学文献可以考虑以8年甚至更长时间为年限来优化馆藏、更新资源、提高文献情报服务效率。
5.老化指标间的关系分析。有研究表明,引文半衰期(H)与普赖斯指数(Pr)之间成反比关系,二者存在简单的数量关系:Pr(H)×H=C,C为常数。邱均平选取引文年限H=5,发现人文社会科学各个学科的C常数在2.6左右波动[3]。本研究中,西夏学引文半衰期与普赖斯指数之间的关系如下:2014年Pr(4)×H=16.40×0.076167076=1.25,2015年Pr(10)×H=16.73×0.073400455=1.23,2016年Pr(9)×H=17.00×0.066068312=1.12。可见,西夏学C常数在1.2左右波动,这与其他人文社会学科的研究结果有所不同。
(三)老化模型的建立
一般来说,学科在诞生和发展的初期,由于原始文献较少,文献数量会呈指数增长,文献的老化符合负指数函数关系。但是我们研究发现,对于诞生时间还不算长的西夏学来说并不符合这一规律,文献的发表数量并没有呈现指数级增长,甚至在2015年出现倒退,但是文献的老化规律仍然遵循了负指数分布形式。表2 中,2014—2015年各年份西夏学引文时间分布回归方程的R2在0.7左右,P值都小于0.001,说明方程有效,拟合效果较好。从图1中可以看出,西夏学引文分布的时间曲线震荡明显,总是在经历了一两个被引的小高峰后达到最大被引年限,之后还会有七八个比较大的被引高峰,引文才慢慢被研究者遗忘,真正到达生命的衰退期。
“西夏学是借助西夏文物考古而发展起来的,没有新文物、文献的发现就没有西夏学的今天。”[10]西夏学学科建立在发现黑水城等出土文献的基础上,这些文献也是该学科研究的主要内容。为了更广泛地传播考古文物、文献,传承人类精神和物质文明,它们中的许多会被翻拍、影印,以传统书籍或是电子资源的形式出版,由于这些文物本身就具有保护和收藏的价值,使得由它们制成的文献天然就具有“档案文献”的性质,所以在西夏学研究中档案性文献的占比之高在其他学科领域都是很少见的。这类档案性文献具有很高的引用价值,会在很长的一段时间内被反复引用。通过对西夏学文献第一作者的统计发现[11],2011—2016年国内仅有585 位,学科团队总体人数不多,而且多为瞬时性作者,固定作者较少。在这之前,西夏学学科的科研力量更为薄弱。因此,该学科的学术史很可能就是某几个学者、专家的成长史,他们在各个研究阶段和领域成为了代表人物,而个人的科研产出能力有限,产出的科研成果也就成为了经典文献。再者,因为研究人员少,多个人研究同一个问题或者文献的情况就比较少,学术争鸣少,等再次受到关注被引用时,可能就过去很久。更有甚者,西夏语文学研究主要集中在20世纪六七十年代,现在再有人研究,这些文献的寿命也都有四五十年之久。这些因素共同导致了该学科引文的波动性和反复性,以及引文的不稳定和不平衡。因此,西夏学文献从诞生到被引的高峰,再到衰落会经历很长的周期,而且中间会不断出现再次兴起的迹象,比如年龄在30、40年,甚至60、80年的文献还能出现被引的小高峰。
表2 2014—2016年西夏学文献引文负指数老化模型
三、结果与讨论
(一)结果
(1)西夏学学科仍处在新生阶段,以知识的“叠加”为主,知识“更新”较少。就文献老化指标而言,表现为半衰期很长(16.71),普莱斯指数则很小(0.0716),最大引文年限存在波动(4—10),学科对档案性文献的依赖很强。
(2)西夏学的文献老化规律基本符合负指数函数曲线,呈现震荡衰老模式。其引文的波动性和反复性很强,造成引文的不稳定和不平衡。
(3)西夏学引文半衰期与普赖斯指数之间存在简单的函数关系,即普赖斯指数×半衰期=常数,这个常数在1.2左右波动,不同于人文社会科学其他学科。
(4)西夏学学科半衰期以每年0.3的速度递进,推测2017年西夏学文献的半衰期为17.3、2018年为17.6。就西夏学最大引文年限而言,该领域当年文献发表后至少在4年以后才能达到被引的高峰,平均为7.67年,建议调整西夏学期刊“影响因子”的测度方法,以8年作为测度年限,图情人员也可以依此展开文献服务工作。
(二)讨论
我们的研究历经了两年,仅在基础数据的收集和整理上就花费了至少一年半的时间,该领域文献并不遵循统一的写作规范,对于参考文献的著录有些采取的是脚注的形式,有些则鲜明地列在文后。因此,在引文数据的收集上,尤其是对于采取脚注形式著录的参考文献我们需要仔细甄别。依据《中华人民共和国新闻出版行业标准:学术出版规范注释》(CY/T 121—2015),按功能将注释分为两种:出处注和内容注。出处注指正文中引用资料来源的注释,内容注指对正文中相关内容进行解释、校订、补充和扩展的注释。我们将出处注中的文献作为参考文献加以采集。另外,还有许多研究者并没有遵守参考文献的著录规则,如许多历史专著缺少出版年,我们通过超星的“读秀学术搜索”和“豆瓣”进行搜索,选取在学界评价良好、校刻精良(出版社为中华书局、上海古籍出版社等)、版本最新的出版年进行著录,这可能造成研究所得引文半衰期比实际值偏小,而普莱斯指数比实际值偏大。对于古籍的处理更难把握,如一些古籍中的卷号相当于现代书籍中的章节,对于此类参考文献在同一篇论文中多次出现时我们只著录一次;对于大部头的丛书和古籍,因为其每册(本)出版的时间都可能不同,我们对每册(本)的出版信息都加以采集;属于多人作品集合的专著,我们按汇编对待,即每个单篇作品都进行录入。在对古籍的著录中还有许多有待商榷的地方。
我们对网络传播环境下西夏学文献老化规律的研究印证了史金波先生对西夏学的介绍:“西夏学是一门新兴的学科。对西夏的研究虽然可以追溯到很早,但它作为一门真正的学科,其形成、发展只有大约百年的历史。”[14]在西夏学学科发展的初期,文献老化速度较慢,并存在放缓的趋势,建议在学科的发展和建设上,社会仍需给以重要和广泛的支持,吸引更多的研究人员投身其中,进行多学科、多角度、多层次的研究,拓宽研究领域,不断吸收其他学科知识,使其不仅在基础理论研究上有所突破,而且在人文社会和自然科学的应用研究上加快步伐,提高研究成果的利用速度和效率。在文献的传播利用上,建议加快数字资源平台的建设,尤其是西夏学文物、古籍善本、图书资源的开发与整合,提高资源使用的便捷性和可获得性。该学科的学术规范也需进一步提高,一是引文应遵循统一的著录格式,二是引文和注释应加以区分,以促进其在移动互联网时代信息计量学的深入发展。
(致谢:感谢宁夏大学农学院杨君珑博士在数据处理方面给予的帮助,感谢宁夏大学阿拉伯学院本科生黄恩贵、党璞在数据收集上给予的帮助!)