基于CI指数的法学类论文定量分析实证研究
2019-09-10吕俊杰黄欣班航航
吕俊杰 黄欣 班航航
摘 要:本文从CNKI“高校科研成果统计分析与评价数据库”选取六所政法类高校法学学科历年发文数据,借助CI指数理论模型评价单篇论文影响力。对各高校论文“数量”和“质量”方面进行整体科研水平的横向比较,通过修改模型的部分指标算法,得出较为客观的高校科研水平现状。基于CI指数的评价方式存在指标相对较少,可操作性较强,数据容易获取等优势。
关键词:CI指数;定量分析;论文评价
中图分类号:TP391;G250.2 文献标识码:A 文章编号:2096-4706(2019)07-0017-03
Abstract:This paper selects the data of six legal colleges and universities in the past years from the CNKI “Statistical Analysis and Evaluation Database of University Scientific Research Achievements”,and evaluates the influence of individual papers by means of CI index theory model. The horizontal comparison of the overall research level of the “quantity” and “quality” of the papers in each university is made. By modifying some of the index algorithms of the model,the objective status of the university’s scientific research level is obtained. The evaluation method based on CI index has the advantages of relatively few indicators,strong operability,and easy access to data.
Keywords:CI index;quantitative analysis;paper evaluation
0 引 言
中國知网于2015年发布的《中国学术期刊影响因子年报》中首次提出学术期刊影响力CI指数,该指数结合期刊的总被引频次和影响因子两个关键指标,通过数学模型对期刊进行了量化评价。其后学者杨浦认为该指标的选取还需要兼顾独立性和公平性原则[1],学者丁筠通过BP神经网络预测模型[2]对图书情报领域19种核心期刊CI值进行预测,结果显示了较高的预测精度,学者俞立平等对CI权重系数、归一化方式提出了修正[3],证明修正后的排序更加合理。
关于CI指数的研究目前还不算多,虽然它是用于量化期刊的指数,但其主要研究指标(被引频次和影响因子)、归一化方法和数学模型同样适用于对单篇论文进行量化。量化后的指数可以为高校科研成果进行定量分析,结合某学科的发文量等指标进行综合评价,为同类型高校同一学科提供了可横向比较的依据,从一定角度对比分析不同高校在某学科的科研成果差异。
本文将从CNKI“高校科研成果统计分析与评价数据库”,选取2010年到2017年六所政法类高校(中国政法大学、华东政法大学、西北政法大学、西南政法大学、中南财经政法大学、河南财经政法大学)法学学科科研数据为研究对象,通过描述分析和单篇论文CI指数横向比较这六所大学的法学学科科研力量。
1 CI指数原理
1.1 CI指数
1.1.1 期刊影响力排序空间
将同一学科期刊的总被引频次(TC)、影响因子(IF)标准化处理后,映射到二维空间,CNKI称为“期刊影响力排序空间”。
1.1.2 期刊影响力等位线
定义影响力最大的期刊为(1,1),各期刊与(1,1)点距离相等的点成连成的线即为期刊影响力等位线。假定每一个期刊都在总被引频次和篇均被引频次两个方向同时发展,“期刊影响力”即指向(1,1)点的向量尾部坐标为(A,B)的向量,其大小即为“期刊影响力指数”。
1.1.3 期刊影响力指数CI
期刊影响力指数(Academic Journal Clout Index,CI),是根据期刊统计年度总被引频次(TC)和影响因子(IF)综合计算所得,其计算公式为:
1.2 修正后的归一化处理方法
借鉴回归分析中处理异方差的方法,将被引频次与影响因子取对数,修正后的归一化方法使得数据分布更加均匀,降低了数据偏倚程度。A,B值和研究的整体数量有关,max,min是组内最大值和最小值。[3]
1.3 单篇论文指数
由于单篇论文同样存在总被引频次和该论文发表的期刊影响因子,运用以上原理可以得出单篇论文的CI指数。研究发现,论文的总被引次数随着发文时间的增加而变大,进行归一化处理后计算出的CI值,在按时间序列分析时会出现明显的整体趋势走低的情况,这和实际情况存在矛盾,因此,归一化处理被引频次时,笔者采用的是平均年被引频次(TC.AVG),再结合期刊影响因子(IF),通过式(1)、(2),计算出的CI.AVG能更好地体现高校在各年度的科研情况。
2 定量分析
基于以上理论和数学模型,从“高校科研成果统计分析与评价数据库”中选取六所政法类高校法学学科,2010年至2017年发表的中文论文共计36000余篇,其中核心期刊论文12000篇。数据字段包括单篇论文的题录数据及被引频次和期刊影响因子。笔者将从各年度发文数量、核心发文数量和CI.AVG指数等方面详细比较同类型高校中法学学科的科研成果差异。
2.1 CI.AVG指数量化
由于CI指数和研究的组内数量相关,论文的“数量”和“质量”同时影响整体CI指数,因此需要对整体数据分为三组进行分析。
2.1.1 CI.AVG.1整体发文量
以整体数据为一组研究对象。体现各个高校在各年度的整体科研力量。论文的“数量”和“质量”同时影响各高校总体CI指数,相对来说发文量越多的高校,其CI指数总和会越高,但可能存在总数大部分由低质量论文贡献的情况。
2.1.2 CI.AVG.2核心发文量
以核心期刊发文为一组研究对象。这组数据通过“核心期刊”进行了筛选,各高校总体CI指数中“质量”权重高于“数量”权重,但由于“数量”的不统一,同样存在核心发文量多的高校优势更加明显的情况。
2.1.3 CI.AVG.3统一发文量
六所高校各自进行CI指数排名,选取各年度分值最高的50篇论文进入六所高校整体分析,以相同“数量”为研究对象。完全按照论文“质量”为衡量科研力量的標准进行。
2.2 数据分析
根据公式计算出CI.AVG.1组指数见表1,CI.AVG.2组指数见表2。
从CI.AVG.1组和CI.AVG.2组数据的分布情况来看,和高校“发文数量”的层次分布和走向分布非常相似,六所院校大致分为三个层次,中国政法、华东政法、西南政法靠上,中南财经政法居中,西北政法和河南财经政法偏下。从发文数量和CI.AVG指数的相关性角度可以看出“数量”和“指数”存在高度正相关关系,由于CI.AVG.2组去掉了部分低质量的论文,因此其相关性更强。正是因为CI指数加入了“质量”因素,会比纯“数量”的评价更具说服力。
虽然发文的“数量”和“质量”同时体现了高校的科研力量,但是CI指数模型的原理导致会出现“数量”权重高于“质量”权重的问题,拉高高校整体CI指数分数的原因可能是有许多低质量的文章。以西南政法为例,该校“总发文CI.AVG指数”中50%的得分,是由其中66%的低质量论文贡献的,“核心发文CI.AVG指数”中50%的得分,是由其中60%的相对低质量论文贡献的,其他几所排名靠前的高校同样存在以上问题。为了单纯地比较论文“质量”,需要统一“数量”后进行CI.AVG.3组数据分析,详细指数见表3。
第三组数据的分布和走势与之前的数据存在较大的区别,相较于其他两组研究数据,从层次分布上看,中国政法、华东政法、西南政法、中南财经政法属于第一梯队,西北政法居中,河南财经政法靠后。从数据走势来看,得分靠上的几所高校,华东政法每年都在稳步增长,一直属于上升趋势,中国政法相对稳定,中南财经政法和西南政法在2014年后有了下降趋势。需要特别说明的一点是,文章的被引频次一般在3年达到高峰,由于2019年的数据缺失问题,各个高校在2017年的得分可能存在偏低的情况。
3 结 论
CI指数理论模型用于定量分析单篇论文的影响力是有意义的,但在模型指标的选取上需要做相应的改动,把“被引频次”修改为“年平均被引频次”,并把“线性归一化”处理数据的方式修改为“对数归一化”,修改后的CI指数应用于实际数据分析时能得出了更为客观的结果。
在横向比较高校整体科研成果时,需要同时考虑论文“数量”和“质量”问题,论文“质量”应该作为高权重衡量指标,CI指数在量化“质量”方面起到了很好的解释作用。例如中南财经政法大学在第三组数据中的变化与前两组相比特别明显,证明该校的高质量论文占比是研究中所有高校里最高的,该校的法学类平均科研水平属于较高的层次。
在评价单篇论文的影响力方面,学界还存在其他的一些方法,例如单篇论文H指数[4]、基于Altmetrics评价指标[5]、学术迹和影响矩[6]等,前辈学者们也通过实证研究证明了这些评价方式从不同的角度,对单篇论文的影响力起到了较好的量化和解释作用。一篇论文对学界的影响是多方面的,很难找出完全对应的评价指标,CI指数的评价方式也存在局限性,但是其优势在于评价指标相对较少,可操作性较强,数据容易获取,在实证研究中容易得出较为客观的结果,容易被理解和认可,因此为挖掘具有引用价值和高影响力的文献提供了新的视角和途径。
参考文献:
[1] 杨浦.学术期刊影响力指数剖析 [J].科技与出版,2017(3):108-111.
[2] 丁筠.学术期刊影响力指数(CI)预测模型的构建 [J].情报科学,2017,35(2):27-32+37.
[3] 俞立平,袁永仪,王作功.学术期刊影响力指数CI改进研究 [J].情报理论与实践,2018,41(11):69-72.
[4] 杨建林,严明.单篇期刊论文h指数的实证研究——以图书情报学为例 [J].图书情报工作,2010,54(12):145-148.
[5] 赵蓉英,郭凤娇,谭洁.基于Altmetrics的学术论文影响力评价研究——以汉语言文学学科为例 [J].中国图书馆学报,2016,42(1):96-108.
[6] 唐继瑞,叶鹰.单篇论著学术迹与影响矩比较研究 [J].中国图书馆学报,2015,41(2):4-16.
作者简介:吕俊杰(1984.08-),男,汉族,重庆人,技术部主任,馆员,硕士研究生,研究方向:图书馆信息技术、大数据分析。