影响矩作为测度单篇论著影响力的评价指标探讨
2015-01-30王术叶鹰
王术 叶鹰
摘要 把评价视向由针对学术主体转向针对学术客体,提出着眼于单篇论著影响力评价的影响矩指标。影响矩M被定义为单篇论著影响学者力A及其影响跨度D的乘积,M越大,影响越大。通过对测算样本集和校验样本集的数据分析,显示影响矩M与总被引C及h指数的相关系数都在0.6以上,表明影响矩可以作为测评单篇论著影响力的独立指标。
关键词 影响矩 影响学者力 论文影响力 单篇论著评价 学术评价指标
1 引言
当对各类学术主体进行评价时,我们已有能用于评价学者、机构、期刊乃至国家等层面的多种指标,其中比较有代表性的如篇均被引、皇冠指数、观众因子、篇均来源归一化影响等,乃至新兴的h指数、h型指数、I3、学术迹等。然而,当面对学术客体即针对学术论著本身进行评价时,我们大多采用定性的同行评议判断优劣,能用的定量评价指标很少。可是,学术论著才是学术评价的终极对象,尤其是单篇论著的学术影响力或学术价值判定构成评判的基石,因为只有在合理评价单篇学术论著的基础上评价学者、学术团体等的学术贡献才会有较强说服力。
长期以来,单篇论著的影响力指标通常只是用被引数C来衡量,h指数发现后,舒伯特用施引文献的h指数来评价单篇文献的思想值得借鉴。近年国内外学者还有一些新的提议,例如:钟文一等提出基于引文系数的论文影响力评价;韩毅等提出用继承与扩散、参考文献与引用文献的贡献率(HID)来反映单篇文献的知识继承与知识扩散联系,但随着回溯深度的增加,引用或施引的文献增长过快会难以收敛,导致计算困难,已有研究回溯引文当分母为阶乘时级数比较容易收敛,而当HID为零值或者无穷大时便无法比较;吴勤提出用引证强度来评价单篇论著,但过度排除自引也会引起新的问题,而且期刊量化等级主观因素很大;沈丽华等提出客观同行评议法,是用文献计量方法设定一个范围值,先筛选一部分文章,再让专家评审这些文章,将定量和定性分析相结合,这不失为一种好方法,但是操作起来需要专家投入较多时间和精力,不太适合对大量文献的影响力进行测评。其他通过算法设计用程序计算实现的指标则会以增加计算难度为代价。
为兼顾理论继承性和计算简洁性,本文针对单篇论著影响力测度进行如下探讨。
2 方法与数据
2.1 思想方法
继承引文分析思想,一篇论著的学术影响首先通过对相关学者的影响而体现,其次也表现在影响的时间跨度及引文分布上。由此思考,一篇论著的影响力可考虑以引用该论著的学者数为基础,学术论著最直接的影响学者是施引文献的作者,因此可用施引文献的作者数即影响学者力来衡量一篇学术论著的基础影响力,于是引进定义1:
定义1.影响学者力A:一篇论著的影响学者力是引用该论著的作者总数,也就是该论著影响的学者数,记为A。
这一测度可以有效避免作者自引、团体之间“互惠引用”导致的问题,因为一篇文章无论怎样自引,其影响学者人数都不会改变,或者只会增加与其合作者的新的合作者数量,团体“互惠引用”也不会增加影响学者人数。
同时,考虑引文分布,设论文发表tj,年的被引次数为cj,于是引进定义2:
定义2.影响跨度D:一篇论著的影响跨度D用公式定义为
其中tj,为论文从发表算起到第j年被引时经历的年数,cj为第j年的被引数,C为被引总数,n为该文发表时间至今的总年数。
这样,可以定义单篇论著的综合影响测度——影响矩M:
定义3.影响矩M:一篇论著的影响矩M是影响学者力和影响跨度的乘积,用公式定义为
由(式2)定义的测度M有类似物理学中力矩的属性(量纲为“人·年”):当把A看作“力”,则影响跨度D类似“力臂”,因此,称M为影响矩,既形象也实在。M越大,影响越大。
影响矩继承了信息计量学中单指标测度的简洁与明晰,兼顾了被引数量的年代分布,可望具有应用推广价值。
2.2 数据说明
本文选用两个数据样本进行实证研究。
样本一检索自Web of Science(WoS),检索策略:主题=(“h-index”or“h-type index”or“h-likeindex”)or标题=“An index to quantify*”,数据库选择包括SCI-EXPANDED,SSCI,A&HCI,CP-CI-S,CPCI-SSH,时间限定2005年至今,检索时间为2014年6月11日。数据经清洗后得到1244条检索结果。按照被引次序降序排列,选取被引次数前50的文献下载其全部施引文献记录,用分析功能进行作者分析,记录施引数据,见附表1。
样本二以沈利华等2012年发表的《“客观同行评议”方法探索性研究——一种基于引文分析法的学术论著影响力评价方法》中的数据为参照,用检索策略“作者=(PAN JW)and地址=(Univ Sci&Technol China)”检索中国科技大学潘建伟院士课题组2008—2012年发表并收录在SCI-Expended数据库中的所有论文成果(检索时间为2014年6月6日),记录论文52篇,见附表2。
样本一提供新指标测算样本,样本二作为已知定性结果的校验样本。
3 结果及分析
3.1 测算样本
对样本一施引文献数据集的有关指标进行计算,所得结果如表1所示。
表1中影响学者力A是通过WoS平台分析功能分析出来的施引文献中全部施引文献作者总数;施引h指数即舒伯特提出的单篇文献的施引文献h指数;影响跨度D是用(式1)计算的结果;影响矩M是用(式2)计算的结果;C-r是用被引数C排序的序次;H-r是用施引h指数排序的序次;A-r是按照学者影响力排序的序次;M-r是按影响矩排序的序次。
用SPSS软件分别对表1中C,M,h和C-r,M-r,h-r进行皮尔森相关性分析和斯皮尔曼等级相关性分析,结果见表2。
值得一提的是:依照斯皮尔曼等级相关系数的概念,用C-r,M-r和h-r相对量值进行相关分析获得的结果与用C,M和h绝对量值计算的结果一致。C、h、A、M四量的绝对数值分布图见图1。
从图1中四量曲线的直观走势看,影响学者力A与被引数C维持相似形态,而影响矩M则提供了另一相对不同的评判。
3.2 校验样本
以附表2中数据计算影响学者力A和影响矩M,并按照影响矩降序排列,得到前10个数据见表3。
表3中编号为1、2、3、6、8、7的加粗倾斜体的数据与《“客观同行评议”方法探索性研究——一种基于引文分析法的学术论著影响力评价方法》一文中用同行评议法得出的潘建伟院士前6篇高影响力论文完全相同。而用被引数C的评价结果不太理想,只能命中4篇;施引h指数的排序结果灵敏度不高。该检验结果提示:影响学者力A和影响矩M都有比被引总数C和施引h指数更好的单篇论著影响力评价效果(指与定性评价的一致性和区分度)。
如果把(式2)写成函数形式
M=M(A,D)=A·D(式3)叉影响,而D取决于引文分布,故导致M多变。
4 讨论
在表2体现的被引数C排序的序次C-r、施引h指数排序的序次h-r和影响矩M排序的序次M-r三者之间的相关性数据中,皮尔森相关系数和斯皮尔曼等级相关系数的数值都在0.6以上,表明具有正的强相关,但也有相对独立性;而由图1直观可见影响矩M和被引数C的区别巨大。因此,影响矩M具备作为一个独立评价指标的模样。
在校验样本集中,用影响矩M筛选出的靠前的6篇文献与用客观同行评议法选出来的6篇文献完全相同,表明这一指标能取得定量和定性方法相似的结果,可望具有一定实用性。
固然,任何评价指标都不是完美无缺的,影响矩M相对于总被引C和h指数等指标而言,数据采集难度和计算难度有所增大,希望能回报以提供独特参考信息的功效。
5 小结
综上所述,影响矩M可以作为测评单篇论著影响力的参考指标,M越大的论著影响也越大。该指标可望为评价单篇论著提供一个独特的参考视角,并期望能在应用中进一步发展和完善。