融合Altmetrics指标的领域高产学者综合影响力研究
2024-01-27宋艳辉魏新星邱均平
宋艳辉 魏新星 邱均平
关键词: 高产学者; 学者影响力; Altmetrics 指标; 评价指标
DOI:10.3969 / j.issn.1008-0821.2024.01.014
〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821 (2024) 01-0153-15
2020 年《中共中央关于制定国民经济和社会发展第十四个五年规划和二0三五年远景目标的建议》中指出, 要激发人才创新活力, 贯彻尊重劳动、尊重知识、尊重人才、尊重创造方针, 深化人才发展体制机制改革, 全方位培养、引进、用好人才, 造就更多国际一流的科技领军人才和创新团队, 培养具有国际竞争力的青年科技人才后备军。现今, 论文发表的数量已经成为衡量学者和机构对科学研究作出贡献的一个重要依据[1] 。并且随着研究的深入和扩展, 科研人员为促进彼此之间资源共享、提高科研攻关能力而越来越多地采取合作科研的方式[2] , 因此论文合著现象越来越普遍, 这有效提高了学者的科研产出量, 在领域内也逐渐形成了高产学者群。各个不同研究领域汇集着不同的学者群体, 而高产学者群是其中的骨干力量, 在科研工作中发挥着关键的导向作用, 能够推动该领域研究的繁荣与进步。普赖斯最早注意到高产作者研究的重要性, 他在1969 年发表的《小科学, 大科学》一书中指出: 撰写全部论文一半的高产作者的数量等于全部科学作者总数的平方根, 这就是著名的普赖斯定律[3] , 该定律是文献计量学领域获取主要学者分布数据的理论基础[4] , 并被学者们在甄别高产学者时广泛使用。评估高产学者的影响力有利于推动学者研究的积极性, 也可为上级引进优秀人才提供參考[5] 。普赖斯定律对高产学者的定义已经通过科研产出量这一单一指标对学者的影响力进行了一定的评判, 但合理的学者影响力评价方法在评价学者科研产出绝对数量的基础上还应考虑科研成果的质量, 对学者进行多维度的综合影响力评价研究。学者综合影响力是学者获得学术界和社会大众的重视及影响他们的作用力, 包括科研影响力和社会影响力, 对高产学者的综合影响力展开评价, 可以甄别领域内真正高质量的高产学者, 帮助学者摒弃唯发文量至上的观念, 促进领域研究的进步, 切实提升论文质量, 也能为政府引进优秀人才, 打造领先科研团队, 从而推动地区领域研究攀上新高度提供有效参考。
以往对于学者的影响力评价大多以传统文献计量指标为主。而近些年来, 越来越多研究采用Alt⁃metrics 指标来评价学者的影响力, Altmetrics 指标用于学者影响力评价的科学性和有效性已经基本得到证实, 并且大部分学者认为Altmetrics 指标主要适用于学者的社会影响力评价[6] 。Altmetrics.com 是Altmetrics 指标数据的主要搜集来源之一, Altmet⁃rics.com 会追踪记录包括News、Blog、Policy Docu⁃ment 等约20 项指标, 并给这些指标赋予一定的权重, 从而计算加权的Altmetric Score。自2012 年10月, Nature 杂志及其子刊开始对其2012 年1 月1日及之后发表的论文开始实时在线统计, NatureMetrics 为Nature 的每一篇研究论文提供CrossRef 数据(DOI 文献的被引用情况)、Web of Science 引用数据和在线关注数据(Altmetrics)[7] , 并提供Online Attention Score(Altmetric Score)。由于Altmetrics.com的评分标准历史上发生过几次变更, 并且官网也存在很多不够透明的信息, 所以仅根据Online Atten⁃tion Score 不足以判断某篇论文的社会影响力或水平, 需要对各项Altmetrics 指标做进一步分析。
本文以Nature 生物科技子刊为例, 为深入了解该领域高产学者的综合影响力, 选取了反映学者学术水平和科研合作程度的一系列传统指标作为待选指标, 同时融合Altmetrics 指标, 以3 本Nature生物科技子刊的官网为数据源, 试图从高产学者的科研影响力和社会影响力两个维度构建其综合影响力评价指标体系。通过相关性分析、因子分析、主成分分析等方法分别对高产学者的科研影响力和社会影响力进行评价, 并分析两个维度间的相互关系,最后得到高产学者影响力的二维评价结果。
1 国内外研究现状
1.1 基于传统文献计量指标的学者影响力研究
目前, 较多研究侧重从学者的学术、科研水平角度, 基于传统的文献计量指标对学者的影响力进行研究。2005 年, 美国物理学家Hirsch J E[8] 基于学者与其文献间的内在关联, 率先提出一项旨在评价科研学者科研绩效的新指标———h 指数(h-in⁃dex)。h 指数随即风靡世界的学术圈, 成为学术界被广泛应用的计量指标, 并催生出一些新的h 型指数。2006 年, 比利时计量学家Egghe L[9] 在分析h指数评价效果时, 提出了一种基于学者以往累积贡献的g 指数(g-index); 同年, 金碧辉等[10] 提出了R 指数和AR 指数, 作为h 指数的补充指标。随着对学者影响力的研究越来越全面, 学术文献测度指标也逐渐完善。叶鹰[11] 围绕发文量和引用量这两个基本的学术文献评价指标, 将学术文献评价指标归纳为均值测度指标(篇均被引频次、期刊影响因子、皇冠指数[12] 、活动指数[13] 、相对特化指数[11] 、引发距[11] 、h 指数)、高影响特征测度(R 指数[10] 、e 指数[14] 、AR 指数[10] 、调和h 指数[15] )、整体综合测度(调和R 指数[15] 、学术迹[11] 、集成影响因子[16] )3 类。学者们采用这些传统的文献计量指标对学者的影响力进行了众多实证分析。邱均平等[17]认为, 将核心期刊的发文量和h 指数相结合的方法在筛选高影响力作者时具有优势, 并通过对图书情报学领域的实证研究证明了该方法的有效性。刘萍等[18] 则在考虑传统引文指标的同时, 基于构建的加权文献引文网络模型, 收集图书情报学领域的16 种重要期刊文献数据, 利用引文对该领域的学者文献影响以及学者学术影响力分别进行了综合测度。
由于科研合作和跨学科研究的流行, 测度学者科研合作行为的计量指标也不断涌现, 如合作度[19] 、合作率[20] 、合作系数[21] 这些常用指标。进一步地,András S[22] 参照h 指数的设计思想, 同时考虑合作学者的数量及合作频次, 提出了评价学者科研合作水平的新指标: 合作能力指数, Guillaume C[23] 验证了该指数在计算机领域的适用性。不少学者也研究了合作能力指数与传统文献计量指标之间可能存在的关系。Ronald R[24] 指出“合作能力指数及其衍生指标在计量学领域、社会科学领域中具有潜在研究价值”。国内学者王卫等[2] 通过对图书情报领域522 位作者的实证分析, 得到合作能力指数与作者科研绩效指标(发文量、总被引、h 指数)存在正相关关系, 而合作度、合作率、合作系数这些指标却不具备上述特征的结论。
还有一部分研究在传统文献计量指标的基础上, 引入了社会网络分析的观点对学者的影响力进行研究。余波等[25] 选取了社会网络分析方法的点度中心度、中介中心度、接近中心度的测度指标,同被引频次、学者发文数等传统文献计量指标作为二级评价指标测度中国学术话语权。范如霞等[26]则结合发文量和度数中心度两个指标分别测度学者在不同时间维度下的个人影响力和在团队的影响力,以补充学者的动态学术影响力测评。
根据以上回顾总结, 梳理的评价学者影响力传统指标如表1 所示。
1.2 基于Altmetrics 指标的学者影响力研究
开放科学背景下, 在线学术交流日益盛行, 传统的学术评价方式已不能全面反映学术成果的多维度影响。美国学者Jason Priem 在2010 年首次于Twitter 上使用“Altmetrics” 一词, 并将其视为对传统文献计量指标的补充。经历了两年热议后,Altmetrics 指标因其客观性、时效性和开放性得到验证而逐渐受到学者们的广泛关注[28] 。
应用Altmetrics 指标评价学者影响力的研究越来越多。Li X 等[29] 以Nature 和Science 杂志上的论文为样本, 将WoS、Google 的被引数据与CiteU⁃Like、Mendeley 两个平台上的读者数据进行相关性分析, 结果表明读者数指标适用于论文学术影响力评价。郭颖等[6] 在分析国外Altmetrics 指标来源平台的基础上, 从国内相似平台的代表性平台: 知网、科学网、微信公众号、微博、百度百科以及新闻提及中选取Altmetrics 指标, 构建评价指标体系,用于我国学者的影响力评价。杨柳等[30] 则以机构知识库为数据源, 分别基于标准化Altmetrics 得分、Altmetric Score、标准化被引得分3 种方法进行学者影响力评价。
目前, Altmetrics 指标的研究工具主要有Alt⁃metrics. com、ImpactStory、Plum Analytics 和PLoSALMs, 各种研究工具在评价对象、面向用户、获取方式和服务形式上都存在着异同[31] 。本研究使用最常用的Altmetrics.com 作为Altmetrics 指标的研究工具, 依靠点击每篇Nature 论文的简介网页中的“Metric” 按钮从而跳转至Altmetrics.com。
1.3 结合传统计量指标和Altmetrics 指标的学者影响力研究
随着对学者影响力的研究日益深入, 学者影响力的评价从单一指标向多维指标转变, 许多学者采用传统计量指标和Altmetrics 指标相结合的方法对学者的综合影响力进行探究。王妍[32] 从学术维度和社会维度两方面测度学者影响力, 选取传统引文指标和Altmetrics 指標为待选指标, 通过因子分析法得到分别代表学术影响力和社会影响力的两个公因子, 将这两个因子投射到二维直角坐标系中, 以反映学者的科研角色。王菲菲等[33] 为研究基因编辑领域学者的综合影响力, 分别选取调和h 指数、调和R 指数等作为学术文献影响力的二级指标,选取Altmetric Score 均值、Altmetric-h 指数、Alt⁃metric 各项均值作为社会影响力的二级指标, 探究多类指标对各维度影响力的作用程度。
通过实证分析学者们也证实了Altmetrics 指标对传统计量指标的有效补充作用。Torres-Salinas D等[34] 比较了传统计量指标引文量和Altmetrics 指标的关系, 研究表明被引量最高的论文Altmetrics 得分也最高, 得到被引量和Altmetrics 得分之间具有正相关关系的结论。刘晓娟等[35] , 获得Mendeley与Web of Science 两平台的交叉文献集合, 通过具体分析证实了以阅读数和标签数为代表的选择性计量指标可以在一定程度上评估文献的影响力。范少萍等[36] 对比仅使用学术迹进行学者学术影响力的评价结果发现, 学术迹与F1000 因子的综合方法可弥补传统评价方式的不足。
根据前人的研究可知, 学者影响力评价的发展方向应为传统计量方法与Altmetrics 指标计量方法的结合。虽然在对学者的综合影响力进行评价研究时, 有学者考虑了多维度的影响力因素, 但都是对所有水平的学者进行的一贯评价。因此, 本文选定高产学者为样本学者, 预先界定了学者的水平, 作为一个新的角度, 融合传统指标和Altmetrics 指标对他们的综合影响力进行评价, 分析领域内不同发文量的高产学者的综合影响力差异, 探究学者的科研成果的高产量是否就同时意味着高质量。
2 高产学者综合影响力评价指标体系构建
构建高产学者综合影响力评价指标体系, 须初步采集科研影响力和社会影响力这两个维度的待选传统指标和Altmetrics 指标及其数据, 再通过一系列分析筛选可用指标, 最终完成评价指标体系构建。
2.1 高产学者综合影响力的评价指标选取
2.1.1 传统指标的选取
针对传统指标, 根据表1, 考虑从学者学术文献水平、科研合作行为及社会网络地位3 个评价角度分别筛选指标。
1) 学者学术文献水平角度
由于大部分论文的合著作者较多, 因此在前人研究的基础上, 同时考虑指标的代表性和学者署名次序, 经过谨慎遴选, 确定发文量、总被引频次、调和被引频次、调和h 指数、调和R 指数这5 个指标为待选指标。前两个指标为最基本的文献计量指标。由于学者的署名次序差异大, 采用简单的均值测度指标可能对研究结果产生影响, 因此用调和被引频次指标代替均值测度指标中的篇均被引频次。调和h 指数与调和R 指数分别为高影响特征测度和整体综合测度指标。
其中, 调和h 指数是指学者发表的N 篇论文中, 有h 篇论文的调和被引频次大于或等于h 次,而其余N-h 篇论文的调和被引频次均小于h 次[15] 。调和h 指数(harmonic h-core)中的调和被引次数(harmonic citations)考虑学者的署名次序进而分配不同的权重, 用c 表示作者第j 篇文献的被引频次,i 表示作者的署名次序, n 为作者人数[33] , 其计算公式如下:
2) 学者科研合作行为角度
确定合作能力指数为待选指标。主要考虑到合作度、合作率、合作系数这3 项指标通常作为一组整体指标对学者的科研合作行为进行测度, 而合作能力指数可作为一个单独的指标, 以不同的角度,在揭示作者的科研绩效方面更有优势。
合作能力指数的计算方法可表述为: 将某一作者的合作者按照其与该作者的合作频次降序排列,当合作者序号首次大于对应合作频次时, 该序号减1 即为该作者的合作能力指数[37] 。
3) 学者社会网络地位角度
确定点度中心度、中介中心度作为待选指标。点度中心度和中介中心度关注的都是某个节点与网络中其他节点的直接关系, 而接近中心度关注的是捷径[25] 。简单来说, 中介中心度表现控制能力,而接近中心度表现不被控制的能力, 为了对学者的影响力进行最直接的评价, 本文没有选取接近中心度这个指标。
点度中心度是在网络分析中刻画节点中心性的最直接度量指标。一个节点的节点度越大就意味着这个节点的点度中心性越高, 该节点在网络中就越重要[38] 。用C(N )表示节点i 的点度中心度, 用于计算节点i 与其他g-1 个j 节点(i≠j), 其计算公式如下:
2.1.2 Altmetrics 指标的选取
针对Altmetrics 指标, 为保证所有指标的时序一致性, 将Weibo、Google+、LinkedIn 和Pinterest这4 项分别于2015 年、2019 年、2014 年、2013 年不再被追踪记录的指标剔除, 将剩余19 个Altmet⁃ric.com 会记录的指标都纳入评价学者社会影响力的待选指标。
初步选取的高产学者综合影响力的所有评价指标如表2 所示。
2.2 数据来源及说明
作为科研创新的核心力量, 活跃高产的顶尖学者群体在引领学术发展和推动科学革命过程中发挥着关键作用[40] 。本文在Scopus 数据库中选择Bio⁃technology 学科类别, 选取2021 年CiteScore 前3 位的期刊: Nature Biotechnology、Nature Methods 和Na⁃ture Biomedical Engineering 作为数据源, 在3 本期刊的官网中采集所需数据。这3 本期刊中的论文是生物科技领域高被引的高水平论文, 论文质量与顶尖学者比例较高, 因此选择它们有助于采集到理想的指标数据, 得到更科学合理的研究结果。分别选取3 本期刊Research Articles 目录下类别为Article的文章, 综合考虑高产学者的活跃度、时效性, 与论文被引高峰因素, 将发表年份设置为2019—2021年, 数据采集时间为2023 年3 月。共检索得到727篇论文, 涉及8 675名不同的学者。根据普赖斯定律计算得出高产学者人数为√8675, 向上取整即为94 名。统计8 675名学者的发文数量并从大到小排序, 发现发文量大于等于3 篇的学者共95 名, 因此将这95 名学者全部纳入样本, 样本数量为95 个。
针对Altmetrics 指标, 由于Altmetrics.com 显示的指标相比Nature Metrics 更为完整, 因此以每篇文章为单位, 记录每篇文章下由“Metric” 按钮跳转至Altmetrics.com 详情页中的各项Altmetrics 指标值。發文量、总被引频次、调和被引频次、调和h指数、调和R 指数以及合作能力指数的计算是通过统计的期刊官网提供的各文章的CrossRef(DOI文献的被引用情况)数据, 以及每篇文章的作者总数及样本学者的署名次序、合作关系简单计算得出。点度中心度和中介中心度则利用Ucinet 软件计算得出。为了避免各项指标值在短时间内发生变动而对研究结果产生影响, 所有数据均在连续的3 天内采集完成。在全部指标计算完成后, 发现有12 名学者的重要指标值缺失, 因此将这12 名学者从样本中整体剔除, 得到有效样本学者83 名, 最终的作者合作网络也由这83 名学者所构建。考虑同一论文由83名学者中的多名学者共著的情况, 2019—2021 年83名学者共计发表不重复的论文310 篇, 具体发文量情况如表3 所示。
2.3 评价指标的描述性统计分析
为进一步了解样本数据的分布情况, 初步剔除表2 中表征能力较弱的评价指标, 利用SPSS 软件分别对Altmetrics 指标和传统指标进行描述性统计分析, 得到如表4 所示的结果。绘制P-P 图, 发现样本数据点均不在明显的一条直线上, 因此指标数据都不符合正态分布。观察表4 的指标覆盖率结果, 发现Altmetrics 指标中出现较多0 值, 共有5项, 为Syllabi、Q&A、Youtube、Citeulike Readers 和Connotea Readers。覆盖率低的Altmetrics 指标还包括Reddit(11.61%)、Research Highlights (11.29%)、Wikipedia(10.65%)、Video Uploader(4.19%)、Poli⁃cy Document ( 2.26%)、Peer Review (0.65%) 和F1000(0.32%)。考虑到覆盖率低的指标表征能力较弱, 本文借鉴王凯利等[41] 的做法, 剔除覆盖率值取整后低于25%的Altmetrics 指标, 剩余8 个Altmet⁃rics 指标, 分别为: ①Altmetric Score、②News、③Blog、④Patent、⑤Twitter、⑥Facebook、⑦MendeleyReaders、⑧Dimensions & WoS Citations。所有8 个传统指标均采集到数据, 指标覆盖率100%。从表4 可知, 初步筛选后的两部分指标数值的最大值与最小值差异显著, 说明指标数值的波动范围极大。两个维度指标数值的均值差异显著, 标准差也较大, 表明指标数值整体上具有离散程度较高的特征。最后,从分布形态上看, 高产学者综合影响力评价指标数值的偏度、峰度均为正值, 表明数值的分布均呈长尾偏右的尖顶曲线特征。因此这16 个评价指标在各自的维度内整体上差异显著, 表征能力较强, 保留这两部分共16 个指标以做下一步分析。
2.4 科研影响力评价
2.4 .1 指标相关性及信效度检验
样本数据都不符合正态分布, 因此采用Spearman相关性分析方法。将8 个传统指标依次用T1 ~ T8表示, 得到的Spearman 相关系数如表5 所示。分析表5 结果可知, 各指标间均存在显著相关的指标对, 故保留所有传统指标。
为保证所有数据可比, 运用SPSS 软件对8 个传统指标进行Z-score 标准化处理, 并对指标的信效度进行检验, 结果如表6 所示。通常, 可以通过Cronbach Alpha 系数的大小评价内在的信度的高低[42] , 分析检验结果可知, 传统指标的CronbachAlpha 值为0.844, 指标信度较高, 对全部传统指标进行保留, 指标筛选结束。
一般认为, 当KMO 值小于0.5 时, 不适合进行因子分析, 而KMO 值大于0.9 时, 则非常适合进行因子分析[43] 。由表6 可知, KMO 值为0.771, 大于0.5, Bartlett 检验的显著水平为0.000, 达到显著水平。因此, 本文的样本数据适合进行因子分析。
2.4.2 因子分析与主成分分析
在多指标综合评价中很多指标信息重复, 会增加计算工作量从而影响评价的准确性。主成分分析法就是通过降维将原来众多具有一定相关性的指标重新组合成一组新的互相无关、尽量少的综合指标来代替原来的指标, 这些新的综合指标保留了原始变量的主要信息, 同时彼此之间又不相关, 比原始变量具有更优越的性质, 从而更能反映问题的实质。确定主成分以及相应的权数一般可以用特征根大于1 作为纳入标准[44] 。根据表7 的总方差解释表, 实验对传统指标共提取出两个公共因子, 特征值均大于1, 累计方差贡献率为68.568%, 说明前两个因子可以揭示大部分变量的特征。
由因子分析得到成分矩阵, 通过最大方差法进行因子旋转后, 得到旋转成分矩阵表, 如表8 所示。因子载荷是变量与公共因子的相关系数, 当变量在某公共因子中的载荷绝对值越大, 表明该变量与该公共因子更密切[45] 。表中只显示了因子载荷大于0.5 的值, 因子载荷小于0.5 值已被隐去。观察表8 可知, 各指标间不存在交叉载荷, 说明筛选出的可用指标均有意义。
因子1 主要解释发文量、总被引频次、调和被引频次、调和h 指数、调和R 指数和中介中心度6个变量。其中, 一个学者发文量的多少会对论文的总被引频次产生影响, 基本上呈促进作用。而调和被引频次的计算需要依据单篇论文被引频次的数据最后得出一个加总数, 依托调和被引频次数据才能计算调和h 指数, 接着计算调和h 指数的平方根才可得到调和R 指数。因此这5 个变量环环相扣,同时在因子1 下显现。“中心性” 是社会网络分析的重点之一, 个人或组织在社会网络中具有怎样的权力, 或者说居于怎样的中心地位, 对于信息在整个网络中如何传播, 及其传播效果如何都有着十分重要的意义[46] , 点度中心度和中介中心度都是社会网络中心性分析的方法。生物科技领域高产学者的论文合著现象极多, 也就是说该领域的高产学者之间普遍存在科研合作的关系, 而社会网络分析方法正是以研究关系见长的一种方法[47] 。所谓“社会网络” 指的是社会行动者及其间的关系的集合[48] , 社会网络分析就是要对社会网络中行为者之间的关系进行量化研究[49] 。而发文量的多少就会影响论文作者(社会行动者)数量的多少, 即某一学者发文量越多, 涉及与其合作的作者就越多, 因此中介中心性同另外5 个传统文献计量指标共用一个公因子便有据可依了。这与李亮等[47] 的研究结论也是一致的: 发表文献比较多的作者同他人的合作也比较频繁。
因子2 解释合作能力指数和点度中心度两个变量。中介中心性着重刻画行动者对资源的控制程度, 而网络中某个节点的点度中心度则是根据网络中与该点有连接的点的数目来衡量, 即节点的连接数越多, 就代表该节点的社会关系越多, 其影响力就越强。合作能力指数也融有网络概念, 从考察学者的嵌入自我网络方式出发, 着重研究学者的合作行为是否稳定, 测度其高频合作水平如何。总体上, 合作能力指数和点度中心度都是度量科研合作网络中的一个节点(一位学者)与其他节点(其他学者)的联系密切程度, 所以两个变量同时在因子2下显现。
根据表7, 把进行因子旋转后的各因子方差贡献率占总方差贡献率的比重作为权重, 并进一步加权汇总, 得出生物科技领域高产学者的科研影响力得分计算公式如下:
根据上述公式计算得出每位样本学者的科研影响力得分, 得分排名前30 位的学者如表10 所示。
2.5 社会影响力评价
2.5.1 指标相关性分析及信效度检验
同样用SPSS 软件对样本数据进行Spearman 相关性分析。根据检验结果, 各Altmetrics 指标之间均存在显著的相关关系, 故保留所有指标。
接着对8 个Altmetrics 指标进行数据标准化处理, 进行信效度检验。剔除同时在两个因子中负荷较高的指标——Mendeley Readers 后, 得到表11 的检验结果。指标整体的Cronbach Alpha 值为0.91,表明指标的信度很高; KMO 值为0.671, 因此样本数据适合进行因子分析。
2.5.2 因子分析与主成分分析
根据表12 的总方差解释表, 实验对Altmetrics指标提取出两个公共因子, 特征值均大于1, 累计方差贡献率达到83.847%, 说明前两个因子可以揭示大部分变量的特征。
由因子分析得到成分矩阵, 通过最大方差法进行因子旋转后, 得到旋转成分矩阵表如表13 所示。结果显示各指标间不存在交叉载荷, 证明篩选出的Altmetrics 指标均有意义。
因子1 解释Altmetric Score、News、Blog、Twit⁃ter 和Facebook 5 个变量。News、Blog、Twitter 和Facebook 是最具代表性的几个Altmetrics 指标。其中, News 指示有几条新闻中提到了某篇论文; Blog指示一篇论文所引发的在线学术讨论的次数,Twitter 和Facebook 显示了由出版物引发的一般公众在社交媒体平台上发帖的次数[50] 。这4 个变量注重新闻、百科及社交媒体上这些学术界外的广泛影响力, 也是Altmetric Score 计分的主要来源。
因子2 解释Patent 与Dimensions & WoS Cita⁃tions 两个变量。Patent 指示论文被专利文件引用的次数, 即实体文件的引用次数, 已经脱离了互联网和媒体的范畴, 而Dimensions & WoS Citations 指标由于包含论文在Dimensions 和WoS 网站上的引用量数据, 因此两个变量共用一个公因子。
2.5.3 社会影响力评价指标函数的构建及结果评价
Altmetrics 指标各成分得分系数矩阵如表14 所示, 将表中的变量依次表示为Y、Y、…、Y, 两个成分分别表示为F3 和F4, 则可以得到以下因子得分函数:
根据上述公式计算得出样本学者的社会影响力得分, 分值排名前30 位的学者如表15 所示。表中同时显示了各学者的社会影响力得分排名与科研影响力得分排名相比的变化情况, 正数表示和科研影响力相比, 该学者的社会影响力排名有所上升, 负数表示排名下降。观察排名变动可知, 表中大部分的学者在两个维度的影响力排名变化较大。说明两个评价维度的结果差异明显, 单独使用任一维度的指标体系对高产学者的影响力进行评价都是不全面的。
3 高产学者的影响力二维测度
3.1 科研影响力及社会影响力相关性分析
对样本学者的科研影响力及社会影响力得分值结果进行Spearman 相关分析, 得到如表16 所示的相关系数表。根据相关分析结果, 两者的相关系数为0.629, 表明两者呈较强的正相关关系。因此,本文将科研影响力和社会影响力二者结合进行高产学者影响力评价具有一定的意义, 将两个维度结合得到的高产学者综合影响力结果更具合理性。本文故借鉴王妍[32] 的二维评价方法对高产学者的影响力进行测度。
3.2 二维测度
本文将样本学者的科研影响力得分值绘制于X轴, 社会影响力得分值绘制于Y 轴, 以代表平均水平的(0,0)点为原点, 并依据原点设置标准分界线,绘制的高产学者影响力的二维评价散点图如图1 所示。根据王妍[32] 的评价思想, 可将样本学者划分为以下4 类。
1) “名家学者”: 得分点落于第一象限, 共有14 位高产学者, 占比16.87%。他们同时具有高科研影响力和高社会影响力, 是其所在研究领域的关键人物。“名家学者” 中最突出的得分点来自美国康涅狄格大学病理生物学与兽医科学系(Depart⁃ment of Pathobiology and Veterinary Science, Univer⁃sity of Connecticut, Storrs) 的学者Tyler D.Gavitt,其3 年的发文量为53 篇, 并且于每篇论文中均是署名第二的作者。该学者的科研影响力与社会影响力排名都是第一名, 说明他为生物科技领域的研究做出了卓越的贡献。
2) “明星学者”: 得分点落于第二象限, 共有5位高产学者, 占比6.02%。这部分学者获得了较高的社会关注度, 但科研贡献度相对较低。以该区域的学者Jonathan S. Weissman 为例, 他来自美国加州大学旧金山分校细胞与分子药理学研究中心(Depart⁃ment of Cellular and Molecular Pharmacology, Univer⁃sity of California, San Francisco), 3 年间共发表4 篇论文, 论文News 累积提及量就有34 次, Twitter 累计提及量更是高达781 次, 被专利文件引用的次数也多达19 次, 因此其社会影响力排名较高, 为14名。相较之下, 该学者发表的4 篇论文的总被引频次为300 次, 而调和被引频次只有19.55 次, 其科研影响力排名仅为59 名, 两份排名结果悬殊。
3) “普通学者”: 得分点落于第三象限, 这个区域共有52 位高产学者, 占比62.65%, 是占全体样本学者比重最大的部分。这部分学者在科研贡献度和社会关注度方面都表现平平, 并且这个区域的大部分学者与坐标轴都有一定距离, 因此这部分学者无论是在提高科研水平还是获得社会关注度方面都应持续努力。
4) “专业学者”: 得分点落于第四象限, 共有12 位高产学者, 占比14.46%。“专业学者” 有着较强的科研能力, 却没能赢得大众的广泛关注。以该区域来自美国斯坦福大学病理学系(Departments ofPathology, Stanford University)的学者Caleb A.Lareau为例, 其在3 年间所发表的5 篇论文中就有4 篇署名第一或第二, 调和被引频次高达103.87 次。但这几篇论文的Blog 累计提及量仅为3 次, Facebook累计提及量仅为6 次, 显示出其发表的论文的较低社会关注度。因此“专业学者” 可以适当提高自身在社交媒体的活跃度[51] , 以期提升大众熟知度及其科研成果的社会影响力。
4 结论
本文为构建融合Altmetrics 指标和传统指标的高产学者综合影响力评价指标体系, 在前人的研究基础上, 初步遴选传统指标和Altmetrics 指标, 以Nature 生物科技子刊杂志官网为数据源, 采集相关指标数据。分别从科研影响力和社会影响力两个维度, 对样本学者的影响力开展评价并进行排序, 同时比较了两份排名的结果。结果发现, 大部分学者在两个维度的影响力排名结果差别较大, 即单独使用任一维度的评价指标体系对高产学者的影响力进行评价都是有局限性的。遂进一步对样本学者的科研影响力及社会影响力的得分结果进行Spearman相关分析, 得到两者呈较强的正相关关系, 说明本文将科研影响力即传统指标与社会影响力即Alt⁃metrics 指标二者结合进行高产学者的综合影响力评价具有合理性。最后本文得出高产学者影响力的二维测度结果。
同时, 观察高产学者的影响力排名与發文量关系可知, 在高产学者群体中, 部分发文数量较多的学者和发文量相对较少的学者相比, 其科研影响力和社会影响力却并不如后者。以3 年发文量为7 篇的学者Robert Langer 和发文量为3 篇的学者MikhailKolmogorov 为例作对比, 前者的科研和社会影响力排名分别为22 名和15 名, 而后者的排名为8 名和12 名, 即发文量少的这名学者的排名都比这名发文量多的学者靠前。说明高产学者科研成果的“高产出量” 并不完全意味着“高质量”。生物技术是促进经济社会可持续发展的有效途径, 各国(地区)在生物科技领域的竞争也日益加剧[52] 。领域内的科研学者应摒弃唯发文量至上的观念, 不能单纯关注科研产出的绝对数量, 在保证科研产出量的同时, 学者们还应切实提高成果的质量, 努力形成一支高质量的高产作者队伍, 不仅带领领域研究攀上新的高度, 也能促进经济社会的可持续发展,使研究成果成功转化为社会效益。
本文研究的不足之处在于仅选定了3 本Nature生物科技子刊的高产学者作为样本进行研究, 存在一定的局限性, 对于其他领域是否适用还有待进一步考证; 对传统指标的选择可能也不尽完善。未来的研究中, 会进一步扩大数据源, 增加样本的多样性, 同时选择更多具有代表性的传统指标, 使研究结果更具说服力, 以期对不同领域高产学者的影响力进行更加深入的评价研究。