APP下载

中国原始创新人才成长路径研究
——基于 《自然》 《科学》论文作者的分析

2022-02-15刘维树胡光元

中国科技论坛 2022年1期
关键词:自然发文学者

倪 蓉,刘维树,胡光元

(1.上海财经大学公共经济与管理学院,上海 200433;2.浙江财经大学信息管理与人工智能学院,浙江 杭州 310018)

0 引言

全球范围内的高层次人才争夺战日趋白热化,科技人才队伍已然成为国家提高原始创新能力、建设科技强国和助力科技自立自强的核心要素[1-2]。从科研成果来看,中国虽在2020或2021年实现SCI发文总量超越美国[3],然而 “发表大国”并不等于 “科技强国”[4],中国仍需加强基础研究工作,重视基础研究原始创新。在百年未有之大变局之时,如何提高原始性创新能力、培养和评价科技创新人才亦是国家科研治理的重要任务之一[5]。

中国于2005年提出 “原始创新”的概念,从基础科学研究领域看,托马斯·库恩强调旧的科学范式经由危机、科技革命发展成新的科学范式,原始创新便在此过程中产生[6]。评价原始创新能力的指标之一是原创性重要研究成果产出,其中在国际顶级学术期刊或国际顶级会议发表基础研究论文是原始创新能力的重要体现[7]。 《自然》 《科学》 (即Nature、Science,以下简称NS)是业界公认的国际顶级综合性学术期刊,其刊发的研究论文某种程度上代表着国际顶级科研水平和实力。之所以选择NS论文作者为研究对象,是因为NS研究性论文重视成果的原始创新性,能引发国际同行的关注,且具有强烈的向后关联性等特征。近年来,关于NS论文的研究主要围绕科研机构、研究热点、合著网络、主题演变等视角,运用文献计量法刻画中国学者在世界顶级期刊的发文情况[8-10]。鉴于作者姓名消歧问题难以解决[11],笔者发现,鲜有文献从原始创新能力视角对中国发表NS论文的学者进行深入研究。近期Scopus对姓名消歧问题做了大规模改进[12],从而使得学者层面的研究成为可能。

有鉴于此,针对中国大陆地区在2014—2015年发表过NS论文 (仅包括Article文献类型)的原始性创新学者,本文将描绘创新学者的基本概况、分析其学术能力、学术影响力,探寻学术年龄与学术活力波动规律。本研究通过探究原始创新人才的成长路径,力图为国家培养与评价科技创新人才、提升原始创新能力提供参考,因此具有重要的理论意义和实践价值。

1 研究方案

1.1 数据来源与处理

以Web of Science (以下简称WoS)核心集数据库、Scopus数据库为数据来源,通过作者信息、期刊ISSN号等进行匹配,从而构成本文的研究数据,具体过程如下。

首先,在WoS核心集数据库高级检索框里输入检索策略: (SO= (Nature OR Science)AND PY= (2014—2015)AND CU= (PEOPLES R CHINA)AND DT= (Article)),2020年10月15日访问上海财经大学图书馆,检索出304篇符合条件的论文。以2014年、2015年为采样时间的原因是:①本文不仅探索创新人才发表NS论文的数量与模式,还希望捕捉和比较学者在采样期前后的NS论文产出能力;②考虑到NS研究论文需要的研究时间和发表周期,从2020年向前预留5年时间,以便观测样本学者在采样点之后的学术发表情况。

其次,本文剔除3篇通信作者和第一作者皆为香港、澳门或台湾地址的文章,在剩下的301篇中,通信作者地址和第一作者地址为中国大陆的分别有95篇、109篇。将采样期发表多篇论文的同一作者合并统计,并且剔除4位经查是外国籍的学者 (Lifshitz Yeshayahu、Lam Tommy Tsan-Yuk、Mertens Jerome和Huerta-Sanchez Emilia),由此最终筛选出167位学者。需要注意的是,有部分文献存在共同通信作者和共同第一作者,在本文中忽略这两种情况,仅考虑第一作者和第一通信作者。

然后,根据167位学者的姓名、机构地址、NS论文标题和相应的论文唯一标识符 (DOI)信息,在Scopus数据库中检索作者简历和论文发表数据,所有发文数据 (仅限Article类型,截至2020年10月17日)共1.5万余条。Scopus近期对作者姓名消歧的处理较成功,且有相对较高的查全查准率[13]。笔者随机查验其中10位作者的发文信息,发现对于中国学者的发文信息检索亦有很高的查全查准率。例如,图1为颜宁教授的Scopus简历主页,从图中第1点 “附属机构历史记录”可获知有无境外研究经历,从第2点可以导出作者的所有发表记录,并筛选出类型为研究论文 (Article)的文献。

图1 颜宁教授的Scopus简历主页

最后,根据作者简历显示的有关数据和发文情况计算出相关指标。本文还将作者所发期刊与CiteScore2019中的数据进行匹配,从而得出每本期刊在各自研究领域的影响力。在CiteScore2019中存在少数期刊Percentile数值缺失的情况,本文检索到167位作者的所有发文数据 (仅限Article类型)共15512条,其中匹配Percentile成功的有13910条,成功率为90%。

1.2 研究指标

(1)学术产出。衡量学术产出量时,使用的是每位作者所发表的Article类型的论文数量,计数方式选择最广泛使用的全计数法。全计数法对同一篇文章的每个作者计数一次,赋予不同署名顺序的作者相等权重,这样难以衡量同一篇论文的各位作者对论文的贡献程度,这也是本文的一个不足之处。接下来用每位作者的学术成果数量除以其学术年龄,得到平均每年的学术产出量。

(2)期刊影响力。使用Scopus数据库中的CiteScore Percentile指标来衡量相关期刊的影响力,该指标用于表示期刊在某研究领域影响力的相对位置,在不同学科之间具有一定的可比性。例如某期刊的CiteScore Percentile值为95,则意味着该期刊影响力在本研究领域排名位居前5%。

(3)NS论文产出。NS论文产出指学者发表的 《自然》或 《科学》论文的总数量,在Scopus显示的作者已发论文数据中,本文统计了截至收集样本时每位学者发表的Article类型的NS论文篇数。

(4)学术年龄。学术年龄被用来衡量学者在其研究领域从事学术研究的时间长度[14]。本文中的学术年龄=结束年份-起始年份+1,其中以某作者最后有论文发表的年份为结束年份,以某作者在Scopus上可被检索出的第一篇Article文章的年份为学术生涯起始年份,此时学术年龄为1岁。

2 原始创新人才基本特征分析

从作者署名顺序、是否有境外学术经历、所属研究机构、学术年龄这4个维度对原始创新人才的概况展开分析。在所选样本中,通信作者总人数为79人 (占47.31%),第一作者为103人 (占61.68%),其中15位学者的署名同时为第一作者和通信作者,拥有境外学术背景的学者占比为65.87%。样本中NS发文作者的研究机构比较集中,109位 (占65.27%)学者来自中国科学院、清华大学、北京大学、浙江大学和复旦大学。笔者并未详述学者的研究领域,主要是考虑到学者的研究方向多涉及学科交叉,且以往研究表明目前中国在NS发表的研究多集中于生命科学领域,如细胞生物学、基因组学、神经科学等[15-16]。

样本中原始创新人才的学术年龄分布在1~43年之间,其中1~10年、11~20年、21~30年及30年以上的分别占比为31.14%、38.92%、24.55%和5.39%。数据显示,第一作者的学术年龄主要集中在1~10年以及11~20年这两组,而通信作者则主要分布在学术年龄较高的组别,如图2a所示。笔者进一步发现样本中无境外学术经历的57位学者集中在低学术年龄组,如图2b所示,且其中有52人为第一作者,表明这些无境外经历的学者有可能尚处于学术成长期。

图2 学者学术年龄分布情况

3 学术产出及期刊影响力分析

为把握样本学者的总体学术能力,利用在Scopus中检索到的167位学者的发文数据集 (仅限Article,截至2020年10月17日),本文先从学术产出数量和期刊影响力两个维度展开分析。研究发现,样本学者的总学术产出均值为93篇,其中发表论文最少为1篇,最多为730篇,学术产出量超过200篇的有24位学者,如图3所示。在样本中,有3位作者 (YingYing Guo、Qiao Shuai和Liu Ding)仅能检索到一篇发表于2014年的NS论文,再无其他Scopus收录的论文,具体原因有待进一步挖掘。笔者在谷歌学术、WoS上检索,也并未发现这些学者的其他发文信息,不排除由于各种原因,这些学者在发文后退出科研工作或者不再发表。为了减少学术年龄的影响,笔者用每位作者已发表的论文总篇数除以其学术年龄,计算出该学者平均每年的学术产出值,发现样本作者年学术产出的平均值为4.6篇/年,且不同学者间变化趋势与总学术产出相一致。

图3 作者总学术产出及年学术产出分布情况

进一步统计显示,样本中署名为通信作者的学者年学术产出量平均为6.90篇/年,第一作者平均为2.81篇/年,小于前者的二分之一;无境外研究经历的学者每年学术产出的均值为2.59篇,小于有境外研究经历学者年均5.64篇的产出。由此不妨假设,通信作者通常为已经进入学术领域多年的资深学者,因而每年学术产出显著多于样本中的第一作者;有境外研究经历的学者参与了更多国际学术交流与合作,故年学术产出的统计量相对较高。

期刊影响力是衡量期刊论文质量的一个重要方面,笔者将样本中每位学者所有研究论文所属期刊的Percentile值加总,再除以其论文总篇数,以此计算各学者发文的期刊平均影响力。结果显示,样本学者中该指标数值最低为57.2,最高为99,整体均值是85。其中,138位学者 (占82.6%)的期刊平均影响力高于75,更有59位 (占35.3%)高于90。总体而言,样本学者发表研究成果的期刊皆具有较高的影响力。

4 《自然》 《科学》论文发表情况统计分析

4.1 NS论文产出分析

分析样本内作者的所有发表记录发现,截至2020年10月17日,样本中的62位学者 (占37%)发表了1篇NS论文 (限定Article,不考虑署名顺序),121位 (占72%)学者发表NS论文数不超过3篇;样本内有17位学者已发表至少10篇NS论文,这17位学者的学术年龄在11~33年。样本中署名为通信作者的学者平均发表的NS论文数量为6.14篇,显著多于署名为第一作者的学者,见表1。这或许因为通信作者通常是课题组的负责人,有着更为丰富的学术经验;第一作者则通常为实验的主要实施者和文章的主要写作者,两者具有明显差异。数据同样表明,是否有境外学术背景影响NS的发文数量,拥有出境研究经历的样本学者发表NS数量显著高于其他学者。随着学术年龄的增加,样本学者平均发表NS论文数量增多,不同学术年龄阶段在NS发文数量上具有统计上的差异。

表1 样本学者的NS论文产出分析

4.2 首次发表NS论文的学术年龄分析

在国际顶级学术期刊发表论文,对学者的成长和发展具有重要影响。经过统计样本中各位原创性学者在 《自然》或 《科学》上发表第一篇论文的学术年龄发现,有77位 (占46.11%)学者在学术年龄不超过5年时发表了其首篇NS论文 (不考虑署名顺序),其中41位学者截至数据收集时无境外学术经历。由此不难看出,一些具有潜力的年轻学者与优秀研究团队结合后,较易产出高质量研究成果。此外,随着时代的发展和我国自主科研实力的提高,单纯由中国境内的学术环境培养的青年学者的科研实力正在不断增强。

统计样本学者首发NS论文的学术年龄发现,相较于通信作者,署名顺序为第一作者的学者首次发表NS论文时的学术年龄更小,无境外学术背景的学者首次在NS上发表文章的学术年龄也小于其他学者。对于此种现象,一个解读是这些学者得以在自身科研能力突出的基础上,较早进入到优秀的研究团队开展工作,个人与团队互相成就。结合不同学术年龄段的学者首发NS论文的时间,则显示出学术研究的 “世代效应”,即不同年龄段学者的出生时代不同,所接受的教育和学术训练存在世代差异[17]。随着技术的进步和人才培养方面的经验累积,相较于从前,中国拥有了更强的科研实力,并且发展出了更完备的学术训练体系,见表2。

表2 样本学者发表首篇NS论文时的学术年龄

4.3 NS论文作者的学术能力分析

样本学者在取样时间段 (2014—2015年)之前,是否已经在 《自然》或 《科学》上发表过学术文章?对此,本文分别列出2014年之前、2014—2015年及2015年之后样本学者在 《自然》或 《科学》上发表文章的情况,见表3。整体来看,样本所涉学者在2014年以前从未在NS期刊上发表过学术论文的有101位 (占60.48%),发过的有66位。在2014年前和2015年后均无NS发文记录的学者有67位,他们在样本中多数属于第一作者,此为类型1。类型2为采样前和采样期间有NS论文,但在2015年之后没有NS发文记录的学者,这部分有25位 (占14.97%)。类型3则表示在2014—2015年期间及2015年之后都有NS论文发表的学者,这部分占比20.36%,同样多数为第一作者且有境外学术经历。类型4代表了始终有NS论文发表的一批学者,他们发表的NS论文数量平均为10.9篇,学术年龄平均为21.22年,这些学者多数为通信作者且有境外学术背景。

表3 采样期前后样本学者NS发文情况对比分析

5 基于学术生命周期理论的创新学者成长规律分析

学术生命周期指学者从进入专门的学术领域 (通常指学术入职,或首次有学术成果)到不再从事学术研究活动的类似生命规律的整个历程。在学者的学术生涯中,学术产出效率会波动起伏,且通常与学术年龄密切相关。中国原始创新人才的学术产出和学术年龄之间同样存在关联,样本中学者在各学术年龄的发文数量和发文期刊平均影响力分布如图4所示。总体而言,随着学术年龄增长,样本所涉学者发表科研论文总量呈上升趋势,这是获取知识、积累经验、深化合作等多种因素共同作用的结果。统计显示,样本中学术年龄越大的学者,其研究成果所发表的期刊却有平均影响力下滑的趋势。针对一定程度上存在的 “SCI崇拜”的不良现象,科技部和教育部已于2020年2月起,陆续发布破除 “唯论文”评价方式的政策,鼓励高质量的研究和发表,推动了科研评价系统的改革。

图4 学术年龄与学术生产力

学术生涯中的不同阶段往往也意味着不同的学术活跃度。为了探寻学术活力的变化规律,本文计算并罗列了样本学者在各学术年龄点的发文数量均值,结果表明:学术年龄小于20年时,学术产出先平稳上升,达到一定阶段后呈现快速增长的特征,可将这两个阶段分别称为学术孕育期和发展期;自第21年起至第35年,学术产出量趋于稳定且保持在一个较高水平,随后则进入衰退期。假设研究者在25岁左右正式踏足专业领域从事科研工作,根据学术生命周期理论,结合样本实例可以看出,在高水平科研学者行列中,鲜有学者在45岁之前可以进入真正的学术成熟期。

中国现行科技人才评价体系通常对学者的年龄设有明确的限制性要求,例如国家级人才项目 “杰青”和 “优青”皆对申请者的年龄设有刚性限制,此项条件将一些稍微超出年龄界限的优秀学者 “拒之门外”。针对高端科技人才项目中的此类问题,在政协十三届全国委员会第三次会议第2270号 (科学技术类117号)提案中,徐景坤委员提出设立国家 “卓越学者”基金项目。对此,国家自然科学基金委员会回复,拟设立支持45周岁以上高水平科研人才的基金项目[18]。从顶层设计着手,对人才资助体系进行重塑升级、逐步完善资助链条,这有助于高水平人才从事研究工作的持续性和平稳性,有利于研究团队开展基础研究,提高原始创新能力。

6 结论与建议

在国家转型和科技评价体系改革的重要时刻,逐渐形成原始创新驱动社会经济发展的模式[19],是支撑国家核心科技自立自强、建设科技强国的重要环节,因此关注原始创新人才的成长路径在此环节显得尤为重要。本研究基于原始创新能力视角,围绕中国大陆地区在世界顶级期刊发表原创研究成果的学者,从学术产出、期刊影响力和学术成长周期等角度追根溯源,探寻原始创新人才的成长路径,以期为培养科技创新人才、提高原始创新能力提供理论支持和决策建议。本文研究结论是:①样本内不同原创性人才的发文篇数差异明显,但是其平均发文影响力的差异较小。②不同年龄段原创性人才所受教育与学术训练存在 “世代效应”,样本中无境外研究经历的学者首发NS论文的学术年龄相对较小,但署名为通信作者且有境外研究履历的学者始终表现出很高的NS论文产出水平。③学术活跃度与学术年龄具有高度的相关性,样本中的原始创新学者普遍在从事研究工作20年后 (45岁左右)逐渐进入学术成熟期。

鉴于此,笔者建议:①研究者在开拓自身的学术视野时,除注重国际学术交流与合作外,亦可与国内顶尖海归学者合作开展高质量研究。②科研单位在助力学者开展高质量研究时,需更为合理地分配科研、教学和管理工作,从制度层面为学者提供科研环境保障,使其抓住珍贵的 “学术黄金期”成长和发展。③在宏观政策方面,政府有关部门有必要在一定程度上打破人才资助的年龄限制,扩大高端人才资助体系,统筹衔接各项人才计划,从而保证高水平科研人才研究工作的长期性和稳定性,促进国家基础研究的发展。

此外,文章还存在一些局限需要在未来进一步研究完善。首先,笔者采用全计数法来统计学者的论文产出情况,此种方法忽视了同一篇论文因作者署名顺序不同而产生的论文贡献度区别,未来可采取不同计数法进行深入研究。同时,文中选取Scopus作为发文数据的来源,但部分国内高水平期刊可能未被收录,后期可将中国大陆学者发表的国内外期刊论文数据相整合,从国际与国内双重视角展开研究。

猜你喜欢

自然发文学者
学者介绍
学者简介
学者介绍
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
学者介绍
《自然》关注中国科技雄心