基于CNKI的国内西夏学文献计量研究
2018-11-23徐霖杰王德平
□李 琼,徐霖杰,王德平
众所周知,文献计量研究对人文社会科学评价体系的建设、评价指标的选取等具有重要的参考价值。已有的成果使人们初步了解了中国人文社会科学研究的性质和研究规律, 其中既包括对整体学科的宏观认识,也涵盖对各学科之间的微观认识。但是,一些具有地方性、民族性和区域性的学科是否能够适用这种研究结果,笔者认为仍须通过全面、系统、深入的研究加以验证和考察。西夏学作为这类学科的代表之一,近些年来随着宣传力量的加强、国家支持力度的加大和研究队伍的壮大,已成为一门国际“显学”。在这一背景下,一些学者专门针对这一学科进行了文献计量学研究。黄秀兰对1981—2000年西夏学研究论文的年代分布、期刊分布、被引情况、作者情况等方面的信息作了计量统计分析[1],马淑萍对1981—2001年西夏学专著的出版数量、核心作者分析、作者合作、被引情况等基础数据进行了统计分析[2],张祖群则统计了2012年以前西夏学学术论文的学科分布和期刊分布情况[3]。客观来说,这些研究成果普遍存在研究历史久远、不够系统和深入等问题。
为获得西夏学整体性、具有谱系性质的研究成果,笔者从“基本”工作入手,以CNKI(中国知网)2011—2016年相关数据为研究对象,通过文献计量学方法,从定量角度动态考察国内西夏学研究的整体特性和演变特征,考察这一“小众”学科的计量结果是否与已有的人文社会科学研究成果和文献计量学中的基本定律相符。此举既有利于学术界开展学科性质、学科分类、学科定位等方面的讨论,也为有关部门在评奖、项目申报、职称晋升等方面制定各种管理制度和相关研究人员了解学科知识的传播和交流模式提供了重要而基本的参考。
一、数据来源与研究方法
(一)数据来源
考虑到西夏学研究的“小众”性和研究文献并不丰富的现状,本文将采用有目的的大样本抽样方法,以保证数据的完整性和系统性。具体做法为:以CNKI “学术期刊数据库”为文献来源,发表时间限定在2011—2016年,分别以西夏、党项、黑水城、黑城、唐古特、唐兀为主题词进行检索并下载,下载内容包括论文题名、作者、单位、基金、关键词等相关信息。需要指出的是,《西夏学》尽管没有被CNKI列入“学术期刊文献来源库”,但鉴于其对西夏学研究的重要参考价值,特将其纳入研究范围。对搜集到的数据,先删除动态信息、文物介绍、鉴赏、书评、人物传记、抒情、会议综述等类型的非学术性文献和重复发表的文献,再剔除第一作者和发文机构属于国外的文献(翻译作品除外)。随后,依据史金波先生对西夏学的定义[4],特邀宁夏大学西夏学研究院高仁博士对所获数据进行筛选和甄别,共得到国内作者发表的西夏学文献1 242篇。
(二)研究方法
本文以西夏学研究特征的整体性、宏观性为出发点,着重考察论文作者、发表机构、发表期刊、基金来源、关键词集散度等相关信息,并以这些数据为基础进一步分析学科规模、学科生产方式、论文发表平台、学科受关注程度、学科知识积累方式等问题。具体分析框架见表1。
表1 数据分析框架
续表1
考察维度指标指标反映的含义学科生产方式合作度、合作率合作度和合作率越大, 说明学科生产方式越倾向于团队合作生产。反之,则越倾向于个人生产。论文发表平台实际期刊数实际期刊数量越多,说明论文发表平台越广阔。反之,则越狭窄。学科受关注程度基金数量、级别基金数量越多、级别越高,说明受重视程度越高。相反,则受重视程度越小。学科知识积累方式关键词集散度关键词的使用越集中,说明知识积累方式越倾向于线性增长方式。反之,则越倾向于多起点的往复增长方式。
二、学科规模分析
(一)文献数量变化分析
2011—2016年,西夏学文献发表情况如表2所示。各年西夏学文献发表篇数呈波动式发展,增长趋势并不明显。其中,2012年发表篇数最少, 2016年最多,其余年份变化不大。总体来看,近年来西夏学文献的发表情况并不符合文献计量学中的文献信息增长规律。
表2 西夏学文献发表概况
(二) 发文作者数量与核心作者分析
2011—2016年,共有西夏学文献作者734位,年度数量变化如表2所示(翻译作品只统计译者)。由此可见,作者数量波动不稳,每年有增有减;作者数量最少的年份是2012年,只有145位,最多的年份是2016年,达到211位。西夏学研究论文在作者数量上呈现出集中与分散的分布规律,对所有文章中的第一作者(包含译者)进行统计,得到作者585位。这些作者中发文量为1篇者有392位,占作者总数的67%。根据普赖斯定律[5],可以确定核心作者发文数量的方法。核心作者中发文数量最少应为N=0.749×(Nmax)1/2,Nmax是统计年限内最高产作者的发文量,即38篇。本研究中N=4.62,取整数5,即高产作者最低发文量为5篇。从结果来看,发文量≥5的作者达52位(表3列出了前15位发文量≥10的作者),占作者总量的8.89%,累计发文 472 篇,占发文总量的38%,比普赖斯提出的标准(50%)少12%。由此可见,我国西夏学研究领域严格意义上的核心作者群尚未形成,一个成熟、稳固的学科作者群还在成长之中。另外,西夏学研究阵地也不稳定,学科领域的固定作者较少,大部分属于瞬时性作者,缺少对学科的持久研究和深入探讨。总体而言,西夏学科研究队伍的整体规模较小。
(三)发文机构数量与高产机构分析
2011—2016年的西夏学发文机构共有280个,年度数量变化如表2所示。从2014年开始,研究机构的数量明显上涨,但涨幅不大。也就是说,2014年开始西夏学受到的全国关注越来越多。发文数量≥10的机构排序如表4所示,其中宁夏大学最多,年均发文近35篇;其次为中国社会科学院,年均发文近21篇。由此可见,宁夏大学和中国社会科学院在国内西夏学研究方面作出了比较突出的贡献。表4中18个研究机构的发文数占所有机构总发文量的60.79%,占了大多数。
统计每篇论文所属的第一单位并进行地区划分,西夏学研究论文区域分布前10位如表5所示。这些省份或直辖市的发文量占到全国发文总量的82.93%,是西夏学研究的主阵地。西北地区研究力量最为强大,撑起了西夏学研究的半边天,发文数占到49.59%,接近发文总量的一半。从省(区、市)来看,宁夏回族自治区发文最多,其次是北京市,再次是甘肃省和陕西省。除此以外,河北省、四川省、江苏省、上海市的相关研究成果也较多。
学科规模的分析结果表明,西夏学仍处于成长阶段,2014年前后研究人员和研究机构数量的明显增长,表明越来越多的学者和研究团队开始关注这一学科。但是,由于研究队伍缺乏稳定性,一些学者只是浅尝辄止,对西夏学缺乏连贯、持久和深入的研究。此外,因为研究团队的成长势头不足,核心研究机构和核心学者的影响力没有得到充分发挥,人才队伍的培养和壮大还有待加强。
三、学科生产方式分析
随着时代的发展,科学研究越来越复杂化、交叉化和高深化,科研合作愈来愈普遍。科研合作最为显著的表现形式之一就是合作论文,合作论文不但可以改善科学劳动组织,而且有利于增加科研成果数量,更能提高科学劳动效率。从表6的统计数据来看,2011—2016年的独著文献达到989篇,占文献总数的79.63%;2人合著的文献为227篇,占文献总数的18.28%;3人以上合著文献明显减少,只有26篇,仅占文献总数的2.09%。
为进一步了解西夏学作者的合作情况,本文统计了作者的合作度与合作率[6],年度西夏学作者合作度和合作率如表7所示。从数据来看,近6年的作者合作度平均为1.23,合作率平均为20.63%。从总体上说,西夏学研究领域作者的合作度和合作率均不高,论文产出方式仍以单干为主。
表7 西夏学学科领域作者合作度和合作率
四、论文发表平台分析
各年西夏学研究论文覆盖的期刊种数如表2所示,从74种到93种不等。总体来看,期刊种数除2015年偶有下降外,基本呈增长趋势,说明西夏学的发表平台越来越广阔。近6年来,有308种期刊发表过西夏学研究文章,分布范围较广。为进一步研究相关论文在这些期刊中的分布规律,利用文献计量研究学家布拉德福提出的有关文献信息集中与离散的分布定律,判定西夏学期刊的核心区(第一区)、相关区(第二区)和离散区(第三区)[6]。首先,西夏学研究文献的离散状况如表8所示,3个区的期刊种类之比为2∶32∶274=1∶16∶162。因此,西夏学研究的布拉德福离散系数为16。其次,根据3个区的平均载文密度判断西夏学研究具有非常明显的核心效应。该学科的布拉德福离散系数远高于一般学科,说明专门面向西夏学研究的期刊数量较少,很大一部分文献分布得过于广泛,可能不利于该领域的专家学者迅速而全面地了解学科最新研究成果。
表8 西夏学研究文献的离散状况
本文研究得出了两种严格意义上的西夏学核心期刊——《西夏学》和《西夏研究》,为方便研究人员参考,现列出登载文章篇数≥20的期刊(表9)。
表9 西夏学研究文献登载篇数≥20的期刊
五、学科受关注程度分析
科研基金的资助数量和级别是测度相关学科在科学研究中受关注程度大小的指标之一[7][8]。2011—2016年西夏学各年的基金论文数和年度占比,除2015年偶有下降外,基本呈快速增长状态,基金资助次数的变化也呈现出同样规律(表10)。基金资助来源日益多样化,国家级基金资助次数最多,占到总基金比的51.69%;其次是部委基金,占到总基金比的20.99%;各省厅、高校和科研院所基金资助项目也不少(表11)。总体来看,从国家到地方、高校、科研院所等各个层面都比较重视西夏学发展。
表10 2011—2016年西夏学基金论文数、资助次数分布情况
表11 西夏学研究论文各级别基金分布情况
六、学科知识积累方式
由于往复式增长方式更可能是人文社会学科知识积累的一种特征[9],所以本文将利用关键词集散度考察西夏学的知识积累方式。由表12可知,2011—2016年西夏学关键词的平均分散度较高,达到0.75,与汤建民对历史学、民族学、宗教学、艺术学等学科的关键词集散度计算结果相仿。包括西夏学在内,这些学科知识积累方式的往复性程度较高,很好地印证了克兰提出的知识的往复式增长模式:“新思想不是起源于最近的发展, 而是来源于这个领域的历史中任何一项早先的发展。在这个模式中,科学创新者往往从先前任何年代完成的著作中汲取灵感,而不是在最近的或彼此工作的基础上开展自己的研究工作。”[9]
表12 西夏学学科关键词集散度
七、结 语
(一)分析表明,近年来西夏学研究发展迅速,表现在学科规模越来越大、发表平台越来越广、关注度越来越高。但也应看到,西夏学的总体研究规模还较小,研究队伍不稳定,仍需多方面力量加强支持,鼓励更多学者和机构多角度、多层次地开展长期合作与联合研究。同时,巩固已有的西夏学研究阵地,以期更多有价值、有意义的研究结果问世。
(二)“已发表文章的增长是科学文献发展的最根本的规律之一”,西夏学文献逐年发表情况没有呈现出较为明显的增长趋势,与文献计量学中的文献信息增长规律不相符。这可能是因为本研究所选时段过短,在西夏学发展的整个历史长轴上仅是一个片断,难以窥见文献信息增长的总体趋势,需要加长年限再作考察。本文的研究结果验证了文献信息集中与离散的分布规律——布拉德福定律,“如果将科学期刊按其登载某个学科的论文数量的大小,以渐减顺序排列,那么可以把期刊分为专门面向这个学科的核心区和包含着与核心区同等数量论文的几个区。这时,核心区与相继各区的期刊数量成1∶a∶a2……的关系”。本文将期刊划分为3个区,得到a值约为16。西夏学论文在作者群体上呈现出集中与分散的分布现象,本文依据普赖斯定律,划定了西夏学研究的高产作者。
(三)本文在以下三个方面存在研究局限: 一是研究数据全部来源于CNKI数据库,数据库的质量(如数据录入的规范性、正确性、准确性等)会直接影响研究结论;二是研究结论为对西夏学“已经过去的事实”进行的统计描述,运用该结论预测学科未来或作一些延伸性应用时需要保持谨慎;三是研究数据只涉及学术论文,没有统计专著、学位论文等其他发表形式的数据,可能为研究结果带来一定程度的偏差。
(致谢:宁夏大学西夏学研究院高仁博士在学科界定和数据筛选与甄别方面给予了充分建议,研究过程中不吝赐教,在此表示衷心感谢!)