中国学者在顶级期刊发文的历史变迁与特征演化
2021-07-09汪雪锋于苗苗韦华楠刘玉琴
汪雪锋 于苗苗 韦华楠 刘玉琴
1. 北京理工大学管理与经济学院 北京 100081;2. 北京印刷学院新闻出版学院 北京 102600
1 研究背景
科技是历史的杠杆,是世界霸权更迭的根源,是大国崛起的支点[1]。1988年,邓小平同志在全国科学大会上提出:“科学技术是第一生产力”,这既是现代科学技术发展的重要特点,也是科学技术发展的必然结果[2]。科技论文是反映基础研究和应用研究的创新成果之一,一个国家或地区在国际高水平期刊上发表论文的数量通常可作为评价其基础科学研究水平的指标[3],很多有价值的科研成果都是以科技论文的形式公布于众,并成为后续科研工作者学习与研究的重要参考和借鉴[4]。施普林格—自然中国区科学总监Ed Gerstner认为衡量有影响力的科研成果主要有两个指标:(1)科研人员在顶级期刊上的发文数量;(2)科研人员在高影响力的期刊上发表文章的引文量[5]。过去的几十年里,中国在科学领域高速发展,许多方面取得突破性的成果,基础研究领域发表的国际论文数从2016年开始已在全世界名列第一[6]。但是“论文数量”和“学术质量”并不等同,在“破四唯”的政策导向下,应当破除对论文数量的迷信,重视论文质量的提升,关注高水平的国际期刊。
Cell、Nature和Science(以下简称CNS期刊)作为国际学术地位极高的三大期刊,科研成果的价值意义远胜过数量本身[7],世界各国研究人员发表在其上的论文往往代表着各国研究机构和学者最前沿领域和最顶尖水平[8]。因此,在CNS期刊上的发文量可作为衡量一个国家学术实力的重要指标之一,其文章内容也可反映一个国家的前沿研究方向。为了解当前我国在国际学术界的竞争力及学术地位,国内学者多数选择CNS期刊或领域顶刊文章进行分析获取答案,但相关分析主要集中于我国学者的期刊发文量、发文机构以及核心作者。周海花[9]对Nature和Science刊载的中国学者主导或参与的论文从年文献量、文献类型、核心作者、合作国家与机构、被引频次等方面进行分析,以期为提升中国学者国际竞争力提供建议。在此基础之上,赵蓉英[10]将Cell并入顶级期刊名列,增加研究主题分析,探究我国学者的研究聚焦点,了解我国目前最新的科研动态。在对文章属性进行分析时,大部分作者使用合著网络图,直接获取核心点。合著网络图是对数据进行整体的展示,并没有考虑时间因素,因此这类图形无法动态直观地展现作者、机构及主题的变化。为有效展示我国学者在CNS期刊发文的主题变化情况,本文利用ITGInsight工具[11],对中国学者在CNS期刊发表论文的演化情况进行探究。
为深入了解中国学者科研产出的质量水平、国际地位以及高产出特征,本文以中国学者在CNS期刊发表的学术论文为研究对象,从演化视角探究我国同其它国家/地区、机构及学者的合作情况、研究主题演化等。本文通过总结我国学者CNS期刊发文现状及其特征演化,以期对未来的研究发展提出建议,为中国科研人员提升科研能力提供借鉴。
2 数据来源与研究方法
2.1 数据来源
改革开放以来,中国的科学技术取得突飞猛进的发展,科技政策也走过很长一段不平凡的道路[12]。众多学者将我国科技政策的推进进行了阶段划分,其中扈春香[12]在其文章中将我国科技政策分为三个阶段:科学技术的恢复与重建阶段(1978–1985年)、科学技术的竞争与市场的发展阶段(1985–1993年)、科学技术的调整与创新阶段(1993年以来),据此本文认为中国的科学技术从1994年开始才处于一种稳定发展环境下。因此本文以1994年为起点,借助Web of Science平台,在核心合集数据库中,通过索引SCIE和SSCI索引,利用检索式SO=(Nature OR Science OR Cell) AND CU=(PEOPLES R CHINA),限定文献类型为Article,选取时间跨度为1994–2019进行检索,共获得2534条数据。本文的数据包含中国大陆及港澳地区学者发表的论文。
2.2 研究方法
本文研究主要采用统计分析、定性比较和数据挖掘相结合的方法,利用科研关系构建与可视化系统ITGInsight,对1994–2019年中国学者在CNS发表文章的合作国家、合作机构、合作作者和主题进行分析,以可视化的方式展示其动态演化结果,并对结果解读分析。ITGInsight主要进行科研关系的构建,主要考虑文献资源中的作者、机构、省市、国家、关键词、主题、学科等信息,依据这些信息的组合从各个角度进行科研关系构建,能够形成一个较为全面的关系体系,在日新月异的海量科技文献资源中迅速提取有价值的情报,尽快做出反应[11]。
3 中国学者CNS期刊发文情况变迁
在1994—2019年间,CNS期刊共收录Article类型论文54022篇,中国学者在CNS期刊共发表论文2534篇,占比为4.69%,年发表论文数呈显著上升趋势,如图1所示。自1994年起,中国的科学技术才开始处于较稳定发展环境,论文产出也逐步走上正轨,此时中国学者发表在CNS期刊上的论文数量相对较少。2006年,我国开始实施《国家中长期科学和技术发展规划纲要(2006–2020年)》(下称《纲要》),党中央、国务院做出“关于实施科技规划纲要、增强自主创新能力的决定”,明确提出今后15年科技工作的指导方针,即“自主创新,重点跨越,支撑发展,引领未来”[13]。政府逐步加大对科学基金的投入[14],带动学术成果的积累。2013年中国进入创新驱动发展阶段,创新真正成为推动中国经济社会转型发展的核心。2016年之后,《国家创新驱动发展战略纲要》(2016年)、《关于深化人才发展体制机制改革的意见》(2016年)和《“十三五”国家科技人才发展规划》(2017年)相继出台,助力科技发展和人才培育。2018年CNS发文量的陡增说明我国在科研领域还有很大发展空间。与绝对数量不同的是,中国学者发文占比从2007年–2019年一直处于向上攀登状态,这说明我国在国际上的科研竞争力在逐步增强,中国学者在顶级学术舞台的参与度逐渐增强,甚至发展为引导者。
图1 1994–2019年中国学者CNS期刊论文数量及占比变化
中国学者在CNS期刊上发文数据能够在一定程度上反映中国学者在国际学术舞台上的参与程度,而关注中国学者作为主导方在CNS期刊上发文量则更能反映中国学者在学术舞台上的话语权。许多文章将中国学者作为第一作者的文章称为中国学者主导的研究,但论文通讯作者通常是不可或缺的角色,因此第一作者和通讯作者在科研合作中扮演着同样重要的角色[15]。故本文将论文的主导国家界定为该篇文章第一作者或通讯作者所属的国家,如果某篇论文中国学者作为第一作者或者通讯作者,本文将其视为中国学者主导。截至2020年4月8日,中国学者在CNS期刊发表论文2534篇,中国学者主导发表1163篇,占比45.90%,如图2所示。
图2 中国学者发表CNS期刊论文的主导情况
中国学者科研活动主导权可分为两个阶段:(1)1994–2007年:探索期。此时中国在国际上的学术地位较低,与国外合作的机会较少,多数情况下独立完成科学研究。后期中国学者主导论文占比整体呈现下降趋势,大多以参与者而非主导者身份出现,可见中国学者对外合作逐步频繁,发表的论文也逐渐增多,这是我国各科研机构的奖励政策助推结果。有论文指出,从2000年起很多高校开始依据期刊影响因子进行奖励,奖励力度也呈逐年上涨趋势,2016年中国对于Nature和Science文章平均奖金高达43783美元[16]。(2)2007–2018年:上升期。2007年以后,随着中国科研在国际学术舞台上的地位逐渐提高,国家对于科研奖励的标准也更加严格,更加注重以主导身份发表文章的能力。通过研究各高校科研奖励办法,发现以第一或通讯作者身份发文,高校一般会奖励5万元~20万元不等,对于高影响力的期刊奖励更甚,但由于各高校实际情况不同,出台的奖励政策也有所差别[17]。总体而言,在CNS期刊发文的奖励十分丰厚,在一定程度上刺激了中国学术的提升和发展,因此中国学者主导占比开始呈现上升趋势,尤其到2015年之后,上升势头更加明显。在各级政府科研管理部门的领导下,我国学者在国际顶级期刊产出更多出色成果,也获得相应奖励,实现学术环境和科研人员成就双赢的局面。
4 中国学者CNS期刊发文的特征演化分析
4.1 合作国家演化
近年来,国际合作已经成为一个越来越受关注的领域[18-19],国际科技合作的协同效应有利于增强研究问题的前沿性,拓宽研究思路,提高研究者的研究能力。通过合作国家的动态演化分析(如图3),可以发现:美国一直是中国合作最多的国家。中国学者发表的CNS期刊论文一半以上都与美国有合作关系,甚至有继续加强的趋势。除美国外,中国最主要的两个合作伙伴是英国和德国。自1999年开始,中英合作趋势越来越明显,英国连续多年超过其他国家成为中国学者第二学术合作伙伴,但近些年中国与英国合作数并未随中国发文量上升而显著增加。中国与德国合作次数不亚于英国,但由于中德合作次数波动较大。中国与日本的合作虽有小幅波动,但始终稳定前列;中国与部分北欧国家,诸如挪威、芬兰及波兰等,合作强度在近年逐渐减弱;中国与意大利、澳大利亚、加拿大等国家的合作则位于较高频次。总体来看,随着时间的推进,与中国学者合作的国家呈点到面的发散式增长,合作国家变得多元化。
图3 1994—2019年合作国家演化图
4.2 合作机构演化
合作机构的变化能够反映各机构发表数量以及机构间合作关系,了解每个机构的发文情况和合作情况对于衡量一个机构的科技产出和科研实力具有重要参考价值,可以借此识别出中国CNS期刊发文核心机构,也可以动态观察其合作机构演变情况。根据每年发文量Top20机构绘制机构演化图,如图4所示,中国学者在CNS期刊发文的主要机构和合作特点可以从中国机构发表情况和中外机构合作情况两方面展开分析。
图4 1994–2019年合作机构演化图
从中国机构发表情况来看,可以发现:中国科学院(将中科院所属科研院所视为统一整体)CNS期刊论文的绝对数量一直以来占据较大份额。但从相对数量看,近年来CNS期刊论文发表数量略显下降趋势。除中科院外,发表CNS期刊论文数量最多的机构是清华大学,长期遥遥领先于其他大学或科研机构,其次是北京大学,均产生了众多突破性科研成果。除此之外,复旦大学、中国科学技术大学、浙江大学、南京大学等也处于优势地位。作为党中央国务院批准创办的第一所研究生院——中国科学院大学自2012年成立以来,展现出不俗实力,CNS期刊发文量的增长速度十分明显,在2018年时仅次于中科院。
而从中国机构和国外机构合作角度则可以发现:1994–2009年间,除中科院外,占据份额较大的机构都是国外机构,甚至于多个年度CNS期刊论文量第二的机构都是国外机构,说明此阶段中国的合作大都是通过中科院和国外机构进行,中国科研实力相对较弱。从2009年开始这种情况有所改变,北大、清华、复旦等高校开始纷纷崛起,中国机构逐渐在中国发表CNS期刊论文中占据重要位置,这表明中国机构的科研实力逐步上升,重要科研成果严重依赖于国外的情况日渐得到改善。此外,中国合作的国外机构由“五花八门”逐渐向具有最突出优势的机构变化。中国合作的国外机构中,哈佛大学和中国学者的合作十分醒目,伯克利大学、牛津大学等几个国外机构合作较为频繁。
总体来看,中国学者在CNS期刊发文从最开始依赖于中科院,到向国内多家机构蓬勃发展、百家争鸣转变,从星星点点到面面俱到;中国学者发表的CNS期刊论文逐渐由同国外机构合作向国内机构间合作转变,国内合作占据比例不断增大;中国学者发表CNS期刊论文与国外机构间的合作从面向点凝聚,慢慢聚焦于国外顶尖科研机构。
4.3 合作作者演化
作者合作网络分析可以了解作者间的研究兴趣,并有研究表明:科研合作不但能促进学者的科研产出,而且能提高科研成果的质量和影响力[10]。对CNS期刊论文的合作作者进行演化分析,能够有助于识别核心作者与核心团队,结合不同时间阶段的作者合作图更能洞察核心团体的变迁,本文将1994–2019年较为均匀的划分为五个区间,如图5所示。总体来看,可以发现中国学者在CNS期刊发文的核心团队、核心作者不断变化,从核心作者为单一领域到多领域;团队数量不断增加,从单个团队到多个团队;团队间的交流也愈加频繁。分阶段对学者合作情况进行观察,可以发现:
图5 1994–2019年发文量top50作者合著图
1994–1999年,中国学者在CNS期刊发文形成了3个较为核心的研究团队:以中国地质科学院赵文津为核心的研究团队、以中科院古脊椎动物与古人类研究所徐星为核心的研究团队、以及以西北大学张兴亮为核心的研究团队。赵文津团队发表论文数量较多,合作密集且队伍庞大,但团队成员以国外学者为主,其他团队则多以中国学者为主。
2000–2004年,徐星的发文量超越赵文津居首位,并和同机构的汪筱林形成了一个庞大的团队,零零星星地与周边团队开始开展合作。张兴亮团队与“水稻第四号染色体测序及功能分析”论文的参与者王升跃合作团体之间的连线较多,说明这两个合作团体关系密切。
2005–2009年,以华大基因成员杨焕明和王俊为首的团队变得醒目,成为中国在CNS期刊上占有重要地位的主力军。另一个规模相当的团队是以美国国家航空航天局Gehrels N和Kouveliotou C为核心的合作团体,但该团队位置并不显著。
2010–2014年,华大基因研究团队不断扩大,加入了李英睿、徐讯等一批优秀学者,形成一支规模宏大、结构合理的高素质科技人才队伍。该阶段核心作者位置基本被该团队占据,拥有大量文章。华大基因研究团队以中国学者为核心,同时也有不少著名的外国学者加入其中,如英国桑格研究所的Durbin Richard、哥本哈根大学的Kristiansen Karsten。同时,回国学者、结构生物学高精尖创新中心施一公团队崭露头角,施一公教授与其学生闫创业、同事王佳玮开始占有一席之地。
2015–2019年,合作网络逐渐变得均匀,研究团队以数量相当、规模相似为特点出现在CNS期刊舞台上。华大基因研究团队规模开始缩小,团队与周边学者合作增多,王俊逐渐远离队伍处于边缘地带,徐讯建立了自己的小团队。施一公团队规模逐渐扩大,加入了颜宁、白蕊、黄高兴宇等施一公的学生,团队核心转换为雷剑林。段镶峰团队、施一公团队内部合作紧密,但很少与其他团队进行合作,其他团队间合作较为频繁。
4.4 合作主题演化
主题演化反映研究主题随时间的变化,包括主题内容或强度随时间的推移发生变化。对于科研人员来说跟踪主题的后续发展是一个非常重要的话题[20]。如何有效组织这些大规模文档数据,并且按照时间段来获取文档中研究主题的演化特征,非常具有实际意义。主题演化的原理是使用固定时间窗口方法对检索到的论文数据进行划分,在每个时间段内以论文中的关键词作为学科主题表征,分别构建共词网络,接着对该网络进行处理,通过社区发现算法找出每个时段上的网络社区,并为每个社区赋予主题标识。利用相关性算法,探测前后时段中网络社区间的相似性以此确定社区间的演化关系,即整个研究主题的演化过程[21]。本文选择每年的核心主题词开展主题演化分析,详见图6。该图展示主题产生、增强、减弱、聚合、裂变、消亡的过程,连线粗细代表主题间关系的强弱,不同颜色则代表不同研究主题[22]。
图6 1994–2019年合作主题演化图
值得指出的是,Cell主要关注生命科学领域最新研究发现;Nature则涵盖生命科学、自然科学、临床医学、物理化学等多领域;而Science主要关注原创性科学研究和科研综述,因此Science和Nature几乎涵盖所有学科。通过对中国学者在CNS期刊上发表的论文进行主题演化分析即可以透视出中国学者的科学研究在各领域的前沿发展。
1994–1998年间,中国学者在CNS期刊上的发文涉及领域较少。中国学者发表CNS期刊论文主题主要来自三个领域:一是生物学,主要涉及主题有“细胞”“蛋白质”“基因突变”和“催化粒子”等,生物学相关主题在之后的年份里持续出现。二是古生物学,主要涉及主题有“龙骨坡洞穴”“食人鸟”“中寒武纪”“晚侏罗纪”等。三是地质学领域,主要涉及的主题有“西伯利亚火山活动”“印度地壳”“圣安德烈亚斯断层”等。1999年开始,中国学者在物理学上的研究成果逐渐显现,诸如“相对论”“磁单极子”“电子反中微子”“量子存储器”“螺旋狄拉克费米子”等现代物理学相关主题接连出现且未曾中断。随着时间推移,物理学相关研究更加深入,相关主题也逐渐演变为“普朗克尺度”“光子速度”“费米弧”等,之后物理学相关主题持续出现且更加深入。
2006年开始,天文学领域,诸如“黑洞”“银河宇宙射线”“太阳风”等主题频繁出现;信息科学和数学相关主题开始显现;以“肝癌”“心脏肥大”“心肌梗死”“肝硬化”“结肠直肠癌”等疾病为研究对象的医学研究开始占据重要位置。随后,化学、能源、地理学相关研究主题也接连迸发。此外,交叉学科的发展开始崭露头角,医学和生物学相结合的“基因组学”“基因工程”“全基因组复制”“同源重组”等生命科学相关主题也开始出现。此阶段,中国学者在CNS期刊上发文所涉学科越来越多,呈点到线式的发展。
2011年开始,各学科领域相关研究更加细化。以“温室气体排放”“气候变化”“工业时代的变暖”为代表的环境生态领域开始发展;对“拉沙病毒”“H7N9病毒”“禽流感病毒”等病毒相关研究日渐增多;生态系统多样性研究,诸如“栖息地的丧失”“物种灭绝速度”等逐渐萌发。此外,社会科学相关研究逐渐增多,有对社会发展相关的研究,其关注“农村地区”“受教育程度”“城市群”等主题;有与商业贸易相关的研究;有与文化风土相关的研究。此时,众多交叉学科也开始纷纷出现,合成生物学便是其中之一,中国学者在CNS期刊上的发文领域呈线到面式的发展。
2016–2019年,“T细胞”“干细胞”“基因表达”“组蛋白”等主题处于显著位置,这些主题属于生命科学领域的范畴。生命科学领域属于较为年轻的领域,中国在该领域具有较强的实力,其中以生物蛋白相关的研究最甚。
总体而言,中国学者在CNS期刊上发文主题的变化经历了由点到线再到面的过程,快速扩展成一个网络。这主要从两个角度展现:一是单个学科内的主题由单一逐渐丰富,并和其它学科进行交叉;二是学科的种类变得繁多,从少数几个学科扩展到各个学科。
5 结论与建议
1994–2019年间,中国科技创新格局发生了历史性转变,越来越多的中国研究正挺进“无人区”[23]。中国在空间科学、人工智能、四代核电、量子通信等多领域的论文数量实现从0~1的跨越,经历了从无到有的发展。中科院植物生理生态所覃重军教授[24]的论文提出“通过生物合成技术,把酿酒酵母的天然16条染色体人工减少到1条,创造‘人造生命体’的奇迹”,这是从0~1的原创性科研成果。1994年,中国学者仅发表CNS期刊论文15篇,占CNS期刊发文总量的0.66%,不足1%,居世界第16位,至2019年,中国学者发表CNS期刊论文达到330篇,居世界第4位,由此可见,中国学者在国际学术舞台上的地位有了大幅度提升,逐步占据国际科学研究前沿。
从演化视角来看,中国在CNS期刊上发文呈现出不断变化的特点。合作国家从少数几个开始向全球发散,已经具备了自主研发能力的中国学者开始和越来越多的国家进行合作。从合作机构来看,中国机构逐渐丰富,共同进步,合作的国外机构由发散到集中;从合作作者的角度来看,核心作者逐渐转换为中国学者,合作团队从壁垒分明到携手共进,形成了一支支拥有世界水平的科学队伍;主题丰富度实现了从零散到稀疏再到密集的变化,并在生命科学等新兴领域拥有十分重要的地位。总体来说,中国学者的科研实力在许多领域从“跟跑”实现了“并跑”,并在某些领域能够“领跑”,获得突出进步。例如,施普林格—自然中国区科学总监Ed Gerstner表示,材料对于技术创新和工业应用来说至关重要,中国不是全面铺开式的,而是围绕已有的优势不断发展。“我们编辑觉得像钢铁、合金这些东西已经是很好的技术领域,不应该产生太多的创新型的成果,但是惊喜恰恰就是在这些领域,用中国的话来说,老树开了新花”。[25]
不可否认的是,我国科技领域仍然存在一些亟待解决的突出问题,我国基础科学研究短板依然突出、关键核心技术受制于人的局面并没有得到根本性改变、顶尖人才和团队还比较缺乏、集中于“量”的超越而“质”的发展尚不足够等[26],目前主要存在以下问题:
(1)目前中国学者在CNS期刊上发表论文数有很大程度的提升,2019年CNS期刊论文发表数量居世界第4位,但从绝对数量上来看,我国和美国相比仍有不小差距,还没有实现对德国和英国的跨越,未来仍有很大提升空间。2019年发布的π指数报告,全球π因子TOP500中,哈佛大学以π因子266.36遥遥领先于全球其他机构;中国科学院以π因子80.07稳居全球第八,可见差距仍很明显[27-28];2018年哈佛大学一所高校发表CNS期刊论文数量达到203篇,而中国学者2018年发表论文仅310篇。
(2)中国人务实的特点下,改革开放后经济快速发展,追求短、平、快热点学科,很多需要沉淀的学科和技术却被忽视[29]。我国在CNS期刊上发表论文的领域范围逐渐向外扩展,并在多领域开始拥有一席之地,但仍存在大量科研人员集中热门学科,选择更易产出成果的领域进行攻关的现象。例如,在欧美发达国家只有顶级学霸才报考医学,而中国的顶级学霸们大多选择赚钱更快的金融管理和应用工科,因为相比计算机应用工程师,培养一名合格的医生需要经历漫长的学习生涯、更多项学科学习和考试[29]。此外,同一领域也会出现“极热”“极冷”的现象。生命科学领域中,在CNS期刊主刊上发表经典生物合成技术相关论文难度非常大,但生物蛋白结构属于目前的科研热点,是CNS期刊论文高产领域,2019年,中国学者主导发表的CNS期刊主刊论文中,生物蛋白机构领域的论文占比非常高。相比其他生命科学领域需要多年的实验数据才能有重大的科研成果,生物结构蛋白产出成果快的特点是中国各大高校科研人员纷纷转型的原因。在看到中国科研进步的同时,更期盼大家站在更高的角度去思考中国科研领域发展的长久之计,呼吁越来越多的科学家甘做科研冷板凳,啃硬骨头,解决中国缺医少药的困局。
(3)中国在基础理论和技术领域原创性成果较少。目前,中国科研看起来很繁荣、很热闹,但如果把中国科研放到世界竞争大格局里,站在科技发展大视野上回望,就会发现:不管是基础研究理论、还是重大技术突破,成果都不突出。我国虽在论文数量上有了重大进展,但论文数量和科技实力是两回事,不能过于迷信论文数量增长,论文不是目的,科技实力的提升才是,而基础研究没有捷径可走,要有十年磨一剑的专注精神,潜下心来把冷板凳坐热,才能有所成就。
因此不能得意于已取得的成就,而应立足现实,意识到我国科学技术发展形势仍然严峻、有待提升,从问题出发,寻求更好发展。当前,新一轮科技革命蓬勃兴起,科研范式和组织模式深刻变革,交叉融合成为科学技术发展潮流,应对全球性挑战和满足国家重大需求对源头创新的需求更加迫切。党的十九大明确了建设科技强国的奋斗目标,确定了新时代基础研究发展的新任务、新要求。国家对基础研究高度重视并寄予厚望,基础研究迎来了难得的历史机遇和前所未有的巨大挑战[30]。我国学术道路仍有很长要走,要培养一批踏实、刻苦、真心热爱学术的人才,重视多个方面共同发展。