融合Altmetrics指标的领域高产学者综合影响力研究

2024-01-27宋艳辉魏新星邱均平

现代情报 2024年1期

宋艳辉　魏新星　邱均平

关键词：高产学者；学者影响力；Ａｌｔｍｅｔｒｉｃｓ指标；评价指标

ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１００８－０８２１．２０２４．０１．０１４

〔中图分类号〕Ｇ２５０.２５２〔文献标识码〕Ａ〔文章编号〕１００８－０８２１（２０２４）０１－０１５３－１５

２０２０年《中共中央关于制定国民经济和社会发展第十四个五年规划和二0三五年远景目标的建议》中指出，要激发人才创新活力，贯彻尊重劳动、尊重知识、尊重人才、尊重创造方针，深化人才发展体制机制改革，全方位培养、引进、用好人才，造就更多国际一流的科技领军人才和创新团队，培养具有国际竞争力的青年科技人才后备军。现今，论文发表的数量已经成为衡量学者和机构对科学研究作出贡献的一个重要依据［１］。并且随着研究的深入和扩展，科研人员为促进彼此之间资源共享、提高科研攻关能力而越来越多地采取合作科研的方式［２］，因此论文合著现象越来越普遍，这有效提高了学者的科研产出量，在领域内也逐渐形成了高产学者群。各个不同研究领域汇集着不同的学者群体，而高产学者群是其中的骨干力量，在科研工作中发挥着关键的导向作用，能够推动该领域研究的繁荣与进步。普赖斯最早注意到高产作者研究的重要性，他在１９６９年发表的《小科学，大科学》一书中指出：撰写全部论文一半的高产作者的数量等于全部科学作者总数的平方根，这就是著名的普赖斯定律［３］，该定律是文献计量学领域获取主要学者分布数据的理论基础［４］，并被学者们在甄别高产学者时广泛使用。评估高产学者的影响力有利于推动学者研究的积极性，也可为上级引进优秀人才提供參考［５］。普赖斯定律对高产学者的定义已经通过科研产出量这一单一指标对学者的影响力进行了一定的评判，但合理的学者影响力评价方法在评价学者科研产出绝对数量的基础上还应考虑科研成果的质量，对学者进行多维度的综合影响力评价研究。学者综合影响力是学者获得学术界和社会大众的重视及影响他们的作用力，包括科研影响力和社会影响力，对高产学者的综合影响力展开评价，可以甄别领域内真正高质量的高产学者，帮助学者摒弃唯发文量至上的观念，促进领域研究的进步，切实提升论文质量，也能为政府引进优秀人才，打造领先科研团队，从而推动地区领域研究攀上新高度提供有效参考。

以往对于学者的影响力评价大多以传统文献计量指标为主。而近些年来，越来越多研究采用Ａｌｔ⁃ｍｅｔｒｉｃｓ指标来评价学者的影响力，Ａｌｔｍｅｔｒｉｃｓ指标用于学者影响力评价的科学性和有效性已经基本得到证实，并且大部分学者认为Ａｌｔｍｅｔｒｉｃｓ指标主要适用于学者的社会影响力评价［６］。Ａｌｔｍｅｔｒｉｃｓ．ｃｏｍ是Ａｌｔｍｅｔｒｉｃｓ指标数据的主要搜集来源之一，Ａｌｔｍｅｔ⁃ｒｉｃｓ．ｃｏｍ会追踪记录包括Ｎｅｗｓ、Ｂｌｏｇ、ＰｏｌｉｃｙＤｏｃｕ⁃ｍｅｎｔ等约２０项指标，并给这些指标赋予一定的权重，从而计算加权的ＡｌｔｍｅｔｒｉｃＳｃｏｒｅ。自２０１２年１０月，Ｎａｔｕｒｅ杂志及其子刊开始对其２０１２年１月１日及之后发表的论文开始实时在线统计，ＮａｔｕｒｅＭｅｔｒｉｃｓ为Ｎａｔｕｒｅ的每一篇研究论文提供ＣｒｏｓｓＲｅｆ数据（ＤＯＩ文献的被引用情况）、ＷｅｂｏｆＳｃｉｅｎｃｅ引用数据和在线关注数据（Ａｌｔｍｅｔｒｉｃｓ）［７］，并提供ＯｎｌｉｎｅＡｔｔｅｎｔｉｏｎＳｃｏｒｅ（ＡｌｔｍｅｔｒｉｃＳｃｏｒｅ）。由于Ａｌｔｍｅｔｒｉｃｓ．ｃｏｍ的评分标准历史上发生过几次变更，并且官网也存在很多不够透明的信息，所以仅根据ＯｎｌｉｎｅＡｔｔｅｎ⁃ｔｉｏｎＳｃｏｒｅ不足以判断某篇论文的社会影响力或水平，需要对各项Ａｌｔｍｅｔｒｉｃｓ指标做进一步分析。

本文以Ｎａｔｕｒｅ生物科技子刊为例，为深入了解该领域高产学者的综合影响力，选取了反映学者学术水平和科研合作程度的一系列传统指标作为待选指标，同时融合Ａｌｔｍｅｔｒｉｃｓ指标，以３本Ｎａｔｕｒｅ生物科技子刊的官网为数据源，试图从高产学者的科研影响力和社会影响力两个维度构建其综合影响力评价指标体系。通过相关性分析、因子分析、主成分分析等方法分别对高产学者的科研影响力和社会影响力进行评价，并分析两个维度间的相互关系，最后得到高产学者影响力的二维评价结果。

１国内外研究现状

１.１基于传统文献计量指标的学者影响力研究

目前，较多研究侧重从学者的学术、科研水平角度，基于传统的文献计量指标对学者的影响力进行研究。２００５年，美国物理学家ＨｉｒｓｃｈＪＥ［８］基于学者与其文献间的内在关联，率先提出一项旨在评价科研学者科研绩效的新指标———ｈ指数（ｈ－ｉｎ⁃ｄｅｘ）。ｈ指数随即风靡世界的学术圈，成为学术界被广泛应用的计量指标，并催生出一些新的ｈ型指数。２００６年，比利时计量学家ＥｇｇｈｅＬ［９］在分析ｈ指数评价效果时，提出了一种基于学者以往累积贡献的ｇ指数（ｇ－ｉｎｄｅｘ）；同年，金碧辉等［１０］提出了Ｒ指数和ＡＲ指数，作为ｈ指数的补充指标。随着对学者影响力的研究越来越全面，学术文献测度指标也逐渐完善。叶鹰［１１］围绕发文量和引用量这两个基本的学术文献评价指标，将学术文献评价指标归纳为均值测度指标（篇均被引频次、期刊影响因子、皇冠指数［１２］、活动指数［１３］、相对特化指数［１１］、引发距［１１］、ｈ指数）、高影响特征测度（Ｒ指数［１０］、ｅ指数［１４］、ＡＲ指数［１０］、调和ｈ指数［１５］）、整体综合测度（调和Ｒ指数［１５］、学术迹［１１］、集成影响因子［１６］）３类。学者们采用这些传统的文献计量指标对学者的影响力进行了众多实证分析。邱均平等［１７］认为，将核心期刊的发文量和ｈ指数相结合的方法在筛选高影响力作者时具有优势，并通过对图书情报学领域的实证研究证明了该方法的有效性。刘萍等［１８］则在考虑传统引文指标的同时，基于构建的加权文献引文网络模型，收集图书情报学领域的１６种重要期刊文献数据，利用引文对该领域的学者文献影响以及学者学术影响力分别进行了综合测度。

由于科研合作和跨学科研究的流行，测度学者科研合作行为的计量指标也不断涌现，如合作度［１９］、合作率［２０］、合作系数［２１］这些常用指标。进一步地，ＡｎｄｒáｓＳ［２２］参照ｈ指数的设计思想，同时考虑合作学者的数量及合作频次，提出了评价学者科研合作水平的新指标：合作能力指数，ＧｕｉｌｌａｕｍｅＣ［２３］验证了该指数在计算机领域的适用性。不少学者也研究了合作能力指数与传统文献计量指标之间可能存在的关系。ＲｏｎａｌｄＲ［２４］指出“合作能力指数及其衍生指标在计量学领域、社会科学领域中具有潜在研究价值”。国内学者王卫等［２］通过对图书情报领域５２２位作者的实证分析，得到合作能力指数与作者科研绩效指标（发文量、总被引、ｈ指数）存在正相关关系，而合作度、合作率、合作系数这些指标却不具备上述特征的结论。

还有一部分研究在传统文献计量指标的基础上，引入了社会网络分析的观点对学者的影响力进行研究。余波等［２５］选取了社会网络分析方法的点度中心度、中介中心度、接近中心度的测度指标，同被引频次、学者发文数等传统文献计量指标作为二级评价指标测度中国学术话语权。范如霞等［２６］则结合发文量和度数中心度两个指标分别测度学者在不同时间维度下的个人影响力和在团队的影响力，以补充学者的动态学术影响力测评。

根据以上回顾总结，梳理的评价学者影响力传统指标如表１所示。

１.２基于Ａｌｔｍｅｔｒｉｃｓ指标的学者影响力研究

开放科学背景下，在线学术交流日益盛行，传统的学术评价方式已不能全面反映学术成果的多维度影响。美国学者ＪａｓｏｎＰｒｉｅｍ在２０１０年首次于Ｔｗｉｔｔｅｒ上使用“Ａｌｔｍｅｔｒｉｃｓ” 一词，并将其视为对传统文献计量指标的补充。经历了两年热议后，Ａｌｔｍｅｔｒｉｃｓ指标因其客观性、时效性和开放性得到验证而逐渐受到学者们的广泛关注［２８］。

应用Ａｌｔｍｅｔｒｉｃｓ指标评价学者影响力的研究越来越多。ＬｉＸ等［２９］以Ｎａｔｕｒｅ和Ｓｃｉｅｎｃｅ杂志上的论文为样本，将ＷｏＳ、Ｇｏｏｇｌｅ的被引数据与ＣｉｔｅＵ⁃Ｌｉｋｅ、Ｍｅｎｄｅｌｅｙ两个平台上的读者数据进行相关性分析，结果表明读者数指标适用于论文学术影响力评价。郭颖等［６］在分析国外Ａｌｔｍｅｔｒｉｃｓ指标来源平台的基础上，从国内相似平台的代表性平台：知网、科学网、微信公众号、微博、百度百科以及新闻提及中选取Ａｌｔｍｅｔｒｉｃｓ指标，构建评价指标体系，用于我国学者的影响力评价。杨柳等［３０］则以机构知识库为数据源，分别基于标准化Ａｌｔｍｅｔｒｉｃｓ得分、ＡｌｔｍｅｔｒｉｃＳｃｏｒｅ、标准化被引得分３种方法进行学者影响力评价。

目前，Ａｌｔｍｅｔｒｉｃｓ指标的研究工具主要有Ａｌｔ⁃ｍｅｔｒｉｃｓ．ｃｏｍ、ＩｍｐａｃｔＳｔｏｒｙ、ＰｌｕｍＡｎａｌｙｔｉｃｓ和ＰＬｏＳＡＬＭｓ，各种研究工具在评价对象、面向用户、获取方式和服务形式上都存在着异同［３１］。本研究使用最常用的Ａｌｔｍｅｔｒｉｃｓ．ｃｏｍ作为Ａｌｔｍｅｔｒｉｃｓ指标的研究工具，依靠点击每篇Ｎａｔｕｒｅ论文的简介网页中的“Ｍｅｔｒｉｃ” 按钮从而跳转至Ａｌｔｍｅｔｒｉｃｓ．ｃｏｍ。

１.３结合传统计量指标和Ａｌｔｍｅｔｒｉｃｓ指标的学者影响力研究

随着对学者影响力的研究日益深入，学者影响力的评价从单一指标向多维指标转变，许多学者采用传统计量指标和Ａｌｔｍｅｔｒｉｃｓ指标相结合的方法对学者的综合影响力进行探究。王妍［３２］从学术维度和社会维度两方面测度学者影响力，选取传统引文指标和Ａｌｔｍｅｔｒｉｃｓ指標为待选指标，通过因子分析法得到分别代表学术影响力和社会影响力的两个公因子，将这两个因子投射到二维直角坐标系中，以反映学者的科研角色。王菲菲等［３３］为研究基因编辑领域学者的综合影响力，分别选取调和ｈ指数、调和Ｒ指数等作为学术文献影响力的二级指标，选取ＡｌｔｍｅｔｒｉｃＳｃｏｒｅ均值、Ａｌｔｍｅｔｒｉｃ－ｈ指数、Ａｌｔ⁃ｍｅｔｒｉｃ各项均值作为社会影响力的二级指标，探究多类指标对各维度影响力的作用程度。

通过实证分析学者们也证实了Ａｌｔｍｅｔｒｉｃｓ指标对传统计量指标的有效补充作用。Ｔｏｒｒｅｓ－ＳａｌｉｎａｓＤ等［３４］比较了传统计量指标引文量和Ａｌｔｍｅｔｒｉｃｓ指标的关系，研究表明被引量最高的论文Ａｌｔｍｅｔｒｉｃｓ得分也最高，得到被引量和Ａｌｔｍｅｔｒｉｃｓ得分之间具有正相关关系的结论。刘晓娟等［３５］，获得Ｍｅｎｄｅｌｅｙ与ＷｅｂｏｆＳｃｉｅｎｃｅ两平台的交叉文献集合，通过具体分析证实了以阅读数和标签数为代表的选择性计量指标可以在一定程度上评估文献的影响力。范少萍等［３６］对比仅使用学术迹进行学者学术影响力的评价结果发现，学术迹与Ｆ１０００因子的综合方法可弥补传统评价方式的不足。

根据前人的研究可知，学者影响力评价的发展方向应为传统计量方法与Ａｌｔｍｅｔｒｉｃｓ指标计量方法的结合。虽然在对学者的综合影响力进行评价研究时，有学者考虑了多维度的影响力因素，但都是对所有水平的学者进行的一贯评价。因此，本文选定高产学者为样本学者，预先界定了学者的水平，作为一个新的角度，融合传统指标和Ａｌｔｍｅｔｒｉｃｓ指标对他们的综合影响力进行评价，分析领域内不同发文量的高产学者的综合影响力差异，探究学者的科研成果的高产量是否就同时意味着高质量。

２高产学者综合影响力评价指标体系构建

构建高产学者综合影响力评价指标体系，须初步采集科研影响力和社会影响力这两个维度的待选传统指标和Ａｌｔｍｅｔｒｉｃｓ指标及其数据，再通过一系列分析筛选可用指标，最终完成评价指标体系构建。

２.１高产学者综合影响力的评价指标选取

２.１.１传统指标的选取

针对传统指标，根据表１，考虑从学者学术文献水平、科研合作行为及社会网络地位３个评价角度分别筛选指标。

１）学者学术文献水平角度

由于大部分论文的合著作者较多，因此在前人研究的基础上，同时考虑指标的代表性和学者署名次序，经过谨慎遴选，确定发文量、总被引频次、调和被引频次、调和ｈ指数、调和Ｒ指数这５个指标为待选指标。前两个指标为最基本的文献计量指标。由于学者的署名次序差异大，采用简单的均值测度指标可能对研究结果产生影响，因此用调和被引频次指标代替均值测度指标中的篇均被引频次。调和ｈ指数与调和Ｒ指数分别为高影响特征测度和整体综合测度指标。

其中，调和ｈ指数是指学者发表的Ｎ篇论文中，有ｈ篇论文的调和被引频次大于或等于ｈ次，而其余Ｎ－ｈ篇论文的调和被引频次均小于ｈ次［１５］。调和ｈ指数（ｈａｒｍｏｎｉｃｈ－ｃｏｒｅ）中的调和被引次数（ｈａｒｍｏｎｉｃｃｉｔａｔｉｏｎｓ）考虑学者的署名次序进而分配不同的权重，用ｃ表示作者第ｊ篇文献的被引频次，ｉ表示作者的署名次序，ｎ为作者人数［３３］，其计算公式如下：

２）学者科研合作行为角度

确定合作能力指数为待选指标。主要考虑到合作度、合作率、合作系数这３项指标通常作为一组整体指标对学者的科研合作行为进行测度，而合作能力指数可作为一个单独的指标，以不同的角度，在揭示作者的科研绩效方面更有优势。

合作能力指数的计算方法可表述为：将某一作者的合作者按照其与该作者的合作频次降序排列，当合作者序号首次大于对应合作频次时，该序号减１即为该作者的合作能力指数［３７］。

３）学者社会网络地位角度

确定点度中心度、中介中心度作为待选指标。点度中心度和中介中心度关注的都是某个节点与网络中其他节点的直接关系，而接近中心度关注的是捷径［２５］。简单来说，中介中心度表现控制能力，而接近中心度表现不被控制的能力，为了对学者的影响力进行最直接的评价，本文没有选取接近中心度这个指标。

点度中心度是在网络分析中刻画节点中心性的最直接度量指标。一个节点的节点度越大就意味着这个节点的点度中心性越高，该节点在网络中就越重要［３８］。用Ｃ（Ｎ）表示节点ｉ的点度中心度，用于计算节点ｉ与其他ｇ－１个ｊ节点（ｉ≠ｊ），其计算公式如下：

２.１.２Ａｌｔｍｅｔｒｉｃｓ指标的选取

针对Ａｌｔｍｅｔｒｉｃｓ指标，为保证所有指标的时序一致性，将Ｗｅｉｂｏ、Ｇｏｏｇｌｅ＋、ＬｉｎｋｅｄＩｎ和Ｐｉｎｔｅｒｅｓｔ这４项分别于２０１５年、２０１９年、２０１４年、２０１３年不再被追踪记录的指标剔除，将剩余１９个Ａｌｔｍｅｔ⁃ｒｉｃ．ｃｏｍ会记录的指标都纳入评价学者社会影响力的待选指标。

初步选取的高产学者综合影响力的所有评价指标如表２所示。

２.２数据来源及说明

作为科研创新的核心力量，活跃高产的顶尖学者群体在引领学术发展和推动科学革命过程中发挥着关键作用［４０］。本文在Ｓｃｏｐｕｓ数据库中选择Ｂｉｏ⁃ｔｅｃｈｎｏｌｏｇｙ学科类别，选取２０２１年ＣｉｔｅＳｃｏｒｅ前３位的期刊：ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ、ＮａｔｕｒｅＭｅｔｈｏｄｓ和Ｎａ⁃ｔｕｒｅＢｉｏｍｅｄｉｃａｌＥｎｇｉｎｅｅｒｉｎｇ作为数据源，在３本期刊的官网中采集所需数据。这３本期刊中的论文是生物科技领域高被引的高水平论文，论文质量与顶尖学者比例较高，因此选择它们有助于采集到理想的指标数据，得到更科学合理的研究结果。分别选取３本期刊ＲｅｓｅａｒｃｈＡｒｔｉｃｌｅｓ目录下类别为Ａｒｔｉｃｌｅ的文章，综合考虑高产学者的活跃度、时效性，与论文被引高峰因素，将发表年份设置为２０１９—２０２１年，数据采集时间为２０２３年３月。共检索得到７２７篇论文，涉及８６７５名不同的学者。根据普赖斯定律计算得出高产学者人数为√8675，向上取整即为９４名。统计８６７５名学者的发文数量并从大到小排序，发现发文量大于等于３篇的学者共９５名，因此将这９５名学者全部纳入样本，样本数量为９５个。

针对Ａｌｔｍｅｔｒｉｃｓ指标，由于Ａｌｔｍｅｔｒｉｃｓ．ｃｏｍ显示的指标相比ＮａｔｕｒｅＭｅｔｒｉｃｓ更为完整，因此以每篇文章为单位，记录每篇文章下由“Ｍｅｔｒｉｃ” 按钮跳转至Ａｌｔｍｅｔｒｉｃｓ．ｃｏｍ详情页中的各项Ａｌｔｍｅｔｒｉｃｓ指标值。發文量、总被引频次、调和被引频次、调和ｈ指数、调和Ｒ指数以及合作能力指数的计算是通过统计的期刊官网提供的各文章的ＣｒｏｓｓＲｅｆ（ＤＯＩ文献的被引用情况）数据，以及每篇文章的作者总数及样本学者的署名次序、合作关系简单计算得出。点度中心度和中介中心度则利用Ｕｃｉｎｅｔ软件计算得出。为了避免各项指标值在短时间内发生变动而对研究结果产生影响，所有数据均在连续的３天内采集完成。在全部指标计算完成后，发现有１２名学者的重要指标值缺失，因此将这１２名学者从样本中整体剔除，得到有效样本学者８３名，最终的作者合作网络也由这８３名学者所构建。考虑同一论文由８３名学者中的多名学者共著的情况，２０１９—２０２１年８３名学者共计发表不重复的论文３１０篇，具体发文量情况如表３所示。

２.３评价指标的描述性统计分析

为进一步了解样本数据的分布情况，初步剔除表２中表征能力较弱的评价指标，利用ＳＰＳＳ软件分别对Ａｌｔｍｅｔｒｉｃｓ指标和传统指标进行描述性统计分析，得到如表４所示的结果。绘制Ｐ－Ｐ图，发现样本数据点均不在明显的一条直线上，因此指标数据都不符合正态分布。观察表４的指标覆盖率结果，发现Ａｌｔｍｅｔｒｉｃｓ指标中出现较多０值，共有５项，为Ｓｙｌｌａｂｉ、Ｑ＆Ａ、Ｙｏｕｔｕｂｅ、ＣｉｔｅｕｌｉｋｅＲｅａｄｅｒｓ和ＣｏｎｎｏｔｅａＲｅａｄｅｒｓ。覆盖率低的Ａｌｔｍｅｔｒｉｃｓ指标还包括Ｒｅｄｄｉｔ（１１.６１％）、ＲｅｓｅａｒｃｈＨｉｇｈｌｉｇｈｔｓ（１１.２９％）、Ｗｉｋｉｐｅｄｉａ（１０.６５％）、ＶｉｄｅｏＵｐｌｏａｄｅｒ（４.１９％）、Ｐｏｌｉ⁃ｃｙＤｏｃｕｍｅｎｔ（２.２６％）、ＰｅｅｒＲｅｖｉｅｗ（０.６５％）和Ｆ１０００（０.３２％）。考虑到覆盖率低的指标表征能力较弱，本文借鉴王凯利等［４１］的做法，剔除覆盖率值取整后低于２５％的Ａｌｔｍｅｔｒｉｃｓ指标，剩余８个Ａｌｔｍｅｔ⁃ｒｉｃｓ指标，分别为： ①ＡｌｔｍｅｔｒｉｃＳｃｏｒｅ、②Ｎｅｗｓ、③Ｂｌｏｇ、④Ｐａｔｅｎｔ、⑤Ｔｗｉｔｔｅｒ、⑥Ｆａｃｅｂｏｏｋ、⑦ＭｅｎｄｅｌｅｙＲｅａｄｅｒｓ、⑧Ｄｉｍｅｎｓｉｏｎｓ＆ＷｏＳＣｉｔａｔｉｏｎｓ。所有８个传统指标均采集到数据，指标覆盖率１００％。从表４可知，初步筛选后的两部分指标数值的最大值与最小值差异显著，说明指标数值的波动范围极大。两个维度指标数值的均值差异显著，标准差也较大，表明指标数值整体上具有离散程度较高的特征。最后，从分布形态上看，高产学者综合影响力评价指标数值的偏度、峰度均为正值，表明数值的分布均呈长尾偏右的尖顶曲线特征。因此这１６个评价指标在各自的维度内整体上差异显著，表征能力较强，保留这两部分共１６个指标以做下一步分析。

２.４科研影响力评价

２.４ .１指标相关性及信效度检验

样本数据都不符合正态分布，因此采用Ｓｐｅａｒｍａｎ相关性分析方法。将８个传统指标依次用Ｔ１～Ｔ８表示，得到的Ｓｐｅａｒｍａｎ相关系数如表５所示。分析表５结果可知，各指标间均存在显著相关的指标对，故保留所有传统指标。

为保证所有数据可比，运用ＳＰＳＳ软件对８个传统指标进行Ｚ－ｓｃｏｒｅ标准化处理，并对指标的信效度进行检验，结果如表６所示。通常，可以通过ＣｒｏｎｂａｃｈＡｌｐｈａ系数的大小评价内在的信度的高低［４２］，分析检验结果可知，传统指标的ＣｒｏｎｂａｃｈＡｌｐｈａ值为０.８４４，指标信度较高，对全部传统指标进行保留，指标筛选结束。

一般认为，当ＫＭＯ值小于０.５时，不适合进行因子分析，而ＫＭＯ值大于０.９时，则非常适合进行因子分析［４３］。由表６可知，ＫＭＯ值为０.７７１，大于０.５，Ｂａｒｔｌｅｔｔ检验的显著水平为０.０００，达到显著水平。因此，本文的样本数据适合进行因子分析。

２.４.２因子分析与主成分分析

在多指标综合评价中很多指标信息重复，会增加计算工作量从而影响评价的准确性。主成分分析法就是通过降维将原来众多具有一定相关性的指标重新组合成一组新的互相无关、尽量少的综合指标来代替原来的指标，这些新的综合指标保留了原始变量的主要信息，同时彼此之间又不相关，比原始变量具有更优越的性质，从而更能反映问题的实质。确定主成分以及相应的权数一般可以用特征根大于１作为纳入标准［４４］。根据表７的总方差解释表，实验对传统指标共提取出两个公共因子，特征值均大于１，累计方差贡献率为６８.５６８％，说明前两个因子可以揭示大部分变量的特征。

由因子分析得到成分矩阵，通过最大方差法进行因子旋转后，得到旋转成分矩阵表，如表８所示。因子载荷是变量与公共因子的相关系数，当变量在某公共因子中的载荷绝对值越大，表明该变量与该公共因子更密切［４５］。表中只显示了因子载荷大于０.５的值，因子载荷小于０.５值已被隐去。观察表８可知，各指标间不存在交叉载荷，说明筛选出的可用指标均有意义。

因子１主要解释发文量、总被引频次、调和被引频次、调和ｈ指数、调和Ｒ指数和中介中心度６个变量。其中，一个学者发文量的多少会对论文的总被引频次产生影响，基本上呈促进作用。而调和被引频次的计算需要依据单篇论文被引频次的数据最后得出一个加总数，依托调和被引频次数据才能计算调和ｈ指数，接着计算调和ｈ指数的平方根才可得到调和Ｒ指数。因此这５个变量环环相扣，同时在因子１下显现。“中心性” 是社会网络分析的重点之一，个人或组织在社会网络中具有怎样的权力，或者说居于怎样的中心地位，对于信息在整个网络中如何传播，及其传播效果如何都有着十分重要的意义［４６］，点度中心度和中介中心度都是社会网络中心性分析的方法。生物科技领域高产学者的论文合著现象极多，也就是说该领域的高产学者之间普遍存在科研合作的关系，而社会网络分析方法正是以研究关系见长的一种方法［４７］。所谓“社会网络” 指的是社会行动者及其间的关系的集合［４８］，社会网络分析就是要对社会网络中行为者之间的关系进行量化研究［４９］。而发文量的多少就会影响论文作者（社会行动者）数量的多少，即某一学者发文量越多，涉及与其合作的作者就越多，因此中介中心性同另外５个传统文献计量指标共用一个公因子便有据可依了。这与李亮等［４７］的研究结论也是一致的：发表文献比较多的作者同他人的合作也比较频繁。

因子２解释合作能力指数和点度中心度两个变量。中介中心性着重刻画行动者对资源的控制程度，而网络中某个节点的点度中心度则是根据网络中与该点有连接的点的数目来衡量，即节点的连接数越多，就代表该节点的社会关系越多，其影响力就越强。合作能力指数也融有网络概念，从考察学者的嵌入自我网络方式出发，着重研究学者的合作行为是否稳定，测度其高频合作水平如何。总体上，合作能力指数和点度中心度都是度量科研合作网络中的一个节点（一位学者）与其他节点（其他学者）的联系密切程度，所以两个变量同时在因子２下显现。

根据表７，把进行因子旋转后的各因子方差贡献率占总方差贡献率的比重作为权重，并进一步加权汇总，得出生物科技领域高产学者的科研影响力得分计算公式如下：

根据上述公式计算得出每位样本学者的科研影响力得分，得分排名前３０位的学者如表１０所示。

２.５社会影响力评价

２.５.１指标相关性分析及信效度检验

同样用ＳＰＳＳ软件对样本数据进行Ｓｐｅａｒｍａｎ相关性分析。根据检验结果，各Ａｌｔｍｅｔｒｉｃｓ指标之间均存在显著的相关关系，故保留所有指标。

接着对８个Ａｌｔｍｅｔｒｉｃｓ指标进行数据标准化处理，进行信效度检验。剔除同时在两个因子中负荷较高的指标——ＭｅｎｄｅｌｅｙＲｅａｄｅｒｓ后，得到表１１的检验结果。指标整体的ＣｒｏｎｂａｃｈＡｌｐｈａ值为０.９１，表明指标的信度很高；ＫＭＯ值为０.６７１，因此样本数据适合进行因子分析。

２.５.２因子分析与主成分分析

根据表１２的总方差解释表，实验对Ａｌｔｍｅｔｒｉｃｓ指标提取出两个公共因子，特征值均大于１，累计方差贡献率达到８３.８４７％，说明前两个因子可以揭示大部分变量的特征。

由因子分析得到成分矩阵，通过最大方差法进行因子旋转后，得到旋转成分矩阵表如表１３所示。结果显示各指标间不存在交叉载荷，证明篩选出的Ａｌｔｍｅｔｒｉｃｓ指标均有意义。

因子１解释ＡｌｔｍｅｔｒｉｃＳｃｏｒｅ、Ｎｅｗｓ、Ｂｌｏｇ、Ｔｗｉｔ⁃ｔｅｒ和Ｆａｃｅｂｏｏｋ５个变量。Ｎｅｗｓ、Ｂｌｏｇ、Ｔｗｉｔｔｅｒ和Ｆａｃｅｂｏｏｋ是最具代表性的几个Ａｌｔｍｅｔｒｉｃｓ指标。其中，Ｎｅｗｓ指示有几条新闻中提到了某篇论文；Ｂｌｏｇ指示一篇论文所引发的在线学术讨论的次数，Ｔｗｉｔｔｅｒ和Ｆａｃｅｂｏｏｋ显示了由出版物引发的一般公众在社交媒体平台上发帖的次数［５０］。这４个变量注重新闻、百科及社交媒体上这些学术界外的广泛影响力，也是ＡｌｔｍｅｔｒｉｃＳｃｏｒｅ计分的主要来源。

因子２解释Ｐａｔｅｎｔ与Ｄｉｍｅｎｓｉｏｎｓ＆ＷｏＳＣｉｔａ⁃ｔｉｏｎｓ两个变量。Ｐａｔｅｎｔ指示论文被专利文件引用的次数，即实体文件的引用次数，已经脱离了互联网和媒体的范畴，而Ｄｉｍｅｎｓｉｏｎｓ＆ＷｏＳＣｉｔａｔｉｏｎｓ指标由于包含论文在Ｄｉｍｅｎｓｉｏｎｓ和ＷｏＳ网站上的引用量数据，因此两个变量共用一个公因子。

２.５.３社会影响力评价指标函数的构建及结果评价

Ａｌｔｍｅｔｒｉｃｓ指标各成分得分系数矩阵如表１４所示，将表中的变量依次表示为Ｙ、Ｙ、…、Ｙ，两个成分分别表示为Ｆ３和Ｆ４，则可以得到以下因子得分函数：

根据上述公式计算得出样本学者的社会影响力得分，分值排名前３０位的学者如表１５所示。表中同时显示了各学者的社会影响力得分排名与科研影响力得分排名相比的变化情况，正数表示和科研影响力相比，该学者的社会影响力排名有所上升，负数表示排名下降。观察排名变动可知，表中大部分的学者在两个维度的影响力排名变化较大。说明两个评价维度的结果差异明显，单独使用任一维度的指标体系对高产学者的影响力进行评价都是不全面的。

３高产学者的影响力二维测度

３.１科研影响力及社会影响力相关性分析

对样本学者的科研影响力及社会影响力得分值结果进行Ｓｐｅａｒｍａｎ相关分析，得到如表１６所示的相关系数表。根据相关分析结果，两者的相关系数为０.６２９，表明两者呈较强的正相关关系。因此，本文将科研影响力和社会影响力二者结合进行高产学者影响力评价具有一定的意义，将两个维度结合得到的高产学者综合影响力结果更具合理性。本文故借鉴王妍［３２］的二维评价方法对高产学者的影响力进行测度。

３.２二维测度

本文将样本学者的科研影响力得分值绘制于Ｘ轴，社会影响力得分值绘制于Ｙ轴，以代表平均水平的（０，０）点为原点，并依据原点设置标准分界线，绘制的高产学者影响力的二维评价散点图如图１所示。根据王妍［３２］的评价思想，可将样本学者划分为以下４类。

１） “名家学者”：得分点落于第一象限，共有１４位高产学者，占比１６.８７％。他们同时具有高科研影响力和高社会影响力，是其所在研究领域的关键人物。“名家学者” 中最突出的得分点来自美国康涅狄格大学病理生物学与兽医科学系（Ｄｅｐａｒｔ⁃ｍｅｎｔｏｆＰａｔｈｏｂｉｏｌｏｇｙａｎｄＶｅｔｅｒｉｎａｒｙＳｃｉｅｎｃｅ，Ｕｎｉｖｅｒ⁃ｓｉｔｙｏｆＣｏｎｎｅｃｔｉｃｕｔ，Ｓｔｏｒｒｓ）的学者ＴｙｌｅｒＤ.Ｇａｖｉｔｔ，其３年的发文量为５３篇，并且于每篇论文中均是署名第二的作者。该学者的科研影响力与社会影响力排名都是第一名，说明他为生物科技领域的研究做出了卓越的贡献。

２） “明星学者”：得分点落于第二象限，共有５位高产学者，占比６.０２％。这部分学者获得了较高的社会关注度，但科研贡献度相对较低。以该区域的学者ＪｏｎａｔｈａｎＳ. Ｗｅｉｓｓｍａｎ为例，他来自美国加州大学旧金山分校细胞与分子药理学研究中心（Ｄｅｐａｒｔ⁃ｍｅｎｔｏｆＣｅｌｌｕｌａｒａｎｄＭｏｌｅｃｕｌａｒＰｈａｒｍａｃｏｌｏｇｙ，Ｕｎｉｖｅｒ⁃ｓｉｔｙｏｆＣａｌｉｆｏｒｎｉａ，ＳａｎＦｒａｎｃｉｓｃｏ），３年间共发表４篇论文，论文Ｎｅｗｓ累积提及量就有３４次，Ｔｗｉｔｔｅｒ累计提及量更是高达７８１次，被专利文件引用的次数也多达１９次，因此其社会影响力排名较高，为１４名。相较之下，该学者发表的４篇论文的总被引频次为３００次，而调和被引频次只有１９.５５次，其科研影响力排名仅为５９名，两份排名结果悬殊。

３） “普通学者”：得分点落于第三象限，这个区域共有５２位高产学者，占比６２.６５％，是占全体样本学者比重最大的部分。这部分学者在科研贡献度和社会关注度方面都表现平平，并且这个区域的大部分学者与坐标轴都有一定距离，因此这部分学者无论是在提高科研水平还是获得社会关注度方面都应持续努力。

４） “专业学者”：得分点落于第四象限，共有１２位高产学者，占比１４.４６％。“专业学者” 有着较强的科研能力，却没能赢得大众的广泛关注。以该区域来自美国斯坦福大学病理学系（ＤｅｐａｒｔｍｅｎｔｓｏｆＰａｔｈｏｌｏｇｙ，ＳｔａｎｆｏｒｄＵｎｉｖｅｒｓｉｔｙ）的学者ＣａｌｅｂＡ.Ｌａｒｅａｕ为例，其在３年间所发表的５篇论文中就有４篇署名第一或第二，调和被引频次高达１０３.８７次。但这几篇论文的Ｂｌｏｇ累计提及量仅为３次，Ｆａｃｅｂｏｏｋ累计提及量仅为６次，显示出其发表的论文的较低社会关注度。因此“专业学者” 可以适当提高自身在社交媒体的活跃度［５１］，以期提升大众熟知度及其科研成果的社会影响力。

４结论

本文为构建融合Ａｌｔｍｅｔｒｉｃｓ指标和传统指标的高产学者综合影响力评价指标体系，在前人的研究基础上，初步遴选传统指标和Ａｌｔｍｅｔｒｉｃｓ指标，以Ｎａｔｕｒｅ生物科技子刊杂志官网为数据源，采集相关指标数据。分别从科研影响力和社会影响力两个维度，对样本学者的影响力开展评价并进行排序，同时比较了两份排名的结果。结果发现，大部分学者在两个维度的影响力排名结果差别较大，即单独使用任一维度的评价指标体系对高产学者的影响力进行评价都是有局限性的。遂进一步对样本学者的科研影响力及社会影响力的得分结果进行Ｓｐｅａｒｍａｎ相关分析，得到两者呈较强的正相关关系，说明本文将科研影响力即传统指标与社会影响力即Ａｌｔ⁃ｍｅｔｒｉｃｓ指标二者结合进行高产学者的综合影响力评价具有合理性。最后本文得出高产学者影响力的二维测度结果。

同时，观察高产学者的影响力排名与發文量关系可知，在高产学者群体中，部分发文数量较多的学者和发文量相对较少的学者相比，其科研影响力和社会影响力却并不如后者。以３年发文量为７篇的学者ＲｏｂｅｒｔＬａｎｇｅｒ和发文量为３篇的学者ＭｉｋｈａｉｌＫｏｌｍｏｇｏｒｏｖ为例作对比，前者的科研和社会影响力排名分别为２２名和１５名，而后者的排名为８名和１２名，即发文量少的这名学者的排名都比这名发文量多的学者靠前。说明高产学者科研成果的“高产出量” 并不完全意味着“高质量”。生物技术是促进经济社会可持续发展的有效途径，各国（地区）在生物科技领域的竞争也日益加剧［５２］。领域内的科研学者应摒弃唯发文量至上的观念，不能单纯关注科研产出的绝对数量，在保证科研产出量的同时，学者们还应切实提高成果的质量，努力形成一支高质量的高产作者队伍，不仅带领领域研究攀上新的高度，也能促进经济社会的可持续发展，使研究成果成功转化为社会效益。

本文研究的不足之处在于仅选定了３本Ｎａｔｕｒｅ生物科技子刊的高产学者作为样本进行研究，存在一定的局限性，对于其他领域是否适用还有待进一步考证；对传统指标的选择可能也不尽完善。未来的研究中，会进一步扩大数据源，增加样本的多样性，同时选择更多具有代表性的传统指标，使研究结果更具说服力，以期对不同领域高产学者的影响力进行更加深入的评价研究。

猜你喜欢

评价指标指标

一类带临界指标的非自治Kirchhoff型方程非平凡解的存在性

融合Altmetrics指标的领域高产学者综合影响力研究

猜你喜欢

杂志排行

现代情报的其它文章