科技论文视域下的我国百年科技创新发展
——基于1900—2020 年Cell、Nature 和Science 论文数据分析
2022-04-15汤建民徐培培
汤建民,徐培培
(1.杭州电子科技大学中国科教评价研究院;2.杭州电子科技大学管理学院,浙江杭州 310018)
2020 年10 月,习近平总书记在主持中央政治局第二十四次集体学习时强调,当今世界正经历百年未有之大变局,科技创新是其中一个关键变量。进入新时代,加强引领世界科技创新能力、跻身世界创新强国前列已成为我国的奋斗目标。根据Web of Science(WoS)数据库历年收录的论文量显示,我国国际科技论文数量在近40 年来连续攀升,继2002 年超过意大利、加拿大和法国跃居全球第5 位后,在2008 年超过了日本居全球第2 位,且在2019年首次在数量上超过美国跃居全球第1 位。2008 年,我国的国际科技论文被引次数排在全球第10 位,2013 年提升至第5 位,2017 年起跃升至第2 位并保持至今。在此背景下,认真贯彻落实党的十九大报告提出的瞄准世界科技前沿,强化基础研究,实现前瞻性基础研究、引领性原创成果重大突破这一总要求,已成为我国下一步科技工作的主要任务。基于此,本研究分析我国学者在Cell、Nature和Science(以下简称“CNS”)这3 个全球顶级期刊发表的论文数,简要回顾我国近百年来的科技创新征程,分析我国当前科技发展中的优势和不足以及面临的机遇与挑战,并预测未来发展趋势。
1 文献综述
21 世纪是世界科技创新空前活跃的时期,也是世界科技竞争日渐白热化的时期。时值中国共产党成立百年之际,站在前人的肩膀上梳理我国科技创新发展的百年历程,对我国加快建设世界科技强国、实现中华民族伟大复兴具有重要意义。梳理文献发现,关于我国科技创新发展的百年历程,学者们更多是站在宏观角度进行研究,如尚明瑞[1]总结了中国共产党对科技领导的百年历程,阐述了党如何在发展中逐步取得科技领导权并总结了建党百年来的科技发展经验和教训;范芙蓉等[2]从哲学的角度,将我国科技自立自强思想的确定分为了基础萌芽、起步探索、初步形成、丰富发展和成熟完善5 个阶段,并对每一阶段发展科技的原因及重点进行了详细阐述;樊春良[3]以科技追赶战略为视角,对比了改革开放前后我国科技追赶战略,详细介绍了各个时期战略的具体内容。但目前鲜有学者从论文数据这个角度对我国科技创新发展的百年历程进行量化描绘。
作为科技工作者开展科学研究的系统总结和理论结晶,科技论文无疑是衡量科技创新活动的重要评价标准之一。一个国家或地区发表论文的情况,尤其是在顶级期刊CNS 上发表论文的数量通常可以反映这个国家或地区基础科学的研究水平。目前,已经出现不少对我国学者发表的CNS 论文进行研究与分析的实例,例如,周辉等[4]以1994—2002 年我国学者以第一作者发表在Nature和Science上的83 篇论文为基础数据,从发文数量、学科分布、作者情况、作者单位情况等方面进行了定量研究;周海花等[5]以1978—2010 年我国在Science和Nature的论文数据为基础,对发文总况、论文类型、核心作者、国家与机构合著网络进行了定量分析;赵蓉英等[6]对我国学者2000—2015 年在Cell、Nature和Science上发表的论文进行了研究,除了对发文量、作者合著网络图、高产机构合著网络图的剖析外,还通过对关键词词频和共现的分析得出了研究热点逐渐从古生物学转变成生命科学的结论;张勇刚等[7]对Nature和Science的载文以定性定量相结合的研究方法,从期刊载文量、期刊受基金资助论文量、期刊主要栏目和期刊论文主要来源等方面进行比较分析,并在此基础上对我国科技期刊未来发展提出了4 点建议。在已有相关研究中,一些研究开展的时间较早,部分研究样本数据只涵盖CNS 中的2 种期刊或研究期不长,难以反映出我国学者在顶级期刊上发表论文的最新进展。
综上,本研究从CNS 论文数据的视角出发,对我国百年科技创新征程进行简要回顾。选择这一视角的主要理由如下:首先,旨在对我国近百年来的科技创新征程实现一次长时期的、可比较的和较客观的定量观察,决定了所选的数据库也必须是一个能覆盖百年的、权威的、可靠的数据库;其二,考虑到数据采集的可获得性以及数据清洗等研究工作的繁杂性,只能选择有限的、具有代表性的部分数据作为数据来源,而CNS 全球顶级期刊所发表的论文往往涉及某个学科领域的重大发现,受到全球学者的关注。特别需要说明的是,在科技评价中我们要谨防出现“唯论文”的不良倾向,但分析我国学者的CNS 论文发表情况,对我国的科技创新工作,特别是基础研究等领域进行评价,对我国在新发展格局下如何续写新时代科研新篇章具有极为重要的参考意义。
2 数据来源与研究方法
2.1 数据来源
以国际权威的引文索引数据库WoS 核心合集为数据库来源,具体检索式为:SO=(CellorNatureorScience) AND CU=China,时间设定为1900—2020年(检索时间为2021 年1 月7 日),得到我国学者分别在Cell、Nature和Science发表的475 篇、1 894篇和1 795 篇科技论文,共计4 164 篇(以下简称“样本”),具体的发文类型及期刊分布如表1 所示。
表1 样本论文类型分布
2.2 研究方法
对样本数据的计量方法主要采用了BibExcel 数据分析软件、机构合作网络图等知识图谱绘制采用了VOSviewer 可视化应用软件。另外,为了从横向上总体判断我国科技创新水平的全球地位,对2020年CNS 期刊的所有发文机构数据进行了比较分析。
3 研究结果
3.1 发文量呈增长态势,近10 年增幅显著
样本论文中,CNS 最早收录的我国论文是山东大学堂(现山东大学)1904 年发表在Nature上的“The flowering of the bamboo”[8]。由图1 可见,我国百年科技创新征程始于清末民国初期,随后在20 世纪、21 世纪之交论文量开始加速发展,最近几年则进入乘风破浪式大踏步前进的繁荣时期。
图1 样本论文发表年份分布
3.2 国际排名持续上升,最高排名第四
样本论文在Cell、Nature和Science上的发文量分别约占各刊总发文量的 2.170%、0.740% 和1.139%,分别处在全球第 9 位、第12 位和第9 位。从时间轴角度看,1978 年以后,若简单地以每10年作为一个阶段划分,那么就可以发现我国论文在Cell、Nature和Science的国际排名都呈现出不可阻挡的连续上升态势(见表2)。如1979—1989 年,我国学者在Cell、Nature和Science上的发文量分别排在全球第34 位、第27 位和第21 位,但到2010—2020 年,该项排名已经分别上升到全球第4 位、第5 位和第5 位,若仅仅考虑2015—2020 年的情况,我国学者的CNS 论文总量已排在全球第4 位。
表2 我国CNS 论文数量及国际排名
然而,和美国、英国等发达国家相比,我国学者的CNS 论文量还有一定差距。由图2 可见,样本论文中2020 年共478 篇,占CNS 总发文量的8.57%,排名第4 位;美国则以2 299 篇的发文量排在第一位,占了CNS 总发文量的41.24%;英国以675 篇排在第2 位,占CNS 总发文量的12.11%;德国为523 篇,占CNS 总发文量的9.38%,排名第3 位。由此可见,经过近百年的努力,我国的科技创新水平已有所提升,但必须清醒地认识到,我国与美国等发达国家还有较大差距,离支撑实现“两个一百年”奋斗目标仍然差距不小。
图2 2020 年世界主要科技大国CNS 论文产出数量及占比
3.3 科研队伍越来越强,已涌现一批领军人才
从CNS 论文的第一作者或通信作者人数来看,由图3 可见,在样本文献中,2010 年前均在50 人以下,2011 年都达到了53 人,到2015 年双双突破了100 人大关,分别达137 人和120 人,2019 年分别达209 人和292 人,2020 年则分别达225 人和317 人。
图3 样本论文中第一作者/通信作者数量的年度分布
从学者个人的发文量看,在样本文献中,1979—2020 年发文最多的是华大基因的王俊,他主要从事基因组学和生物信息学的研究,共计发文65 篇,被引次数达85 670 次,篇均被引次数高达1 318.0 次,并被Nature杂志评选为“2012 年世界科学界年度十大人物”;除了王俊外,与他来自同一单位的李英睿、杨焕明、汪建等学者的发文量也分别达到39 篇、38 篇、35 篇。此外,发文量较多的我国学者还有清华大学、西湖大学的施一公(33 篇)、清华大学的闫创业(28 篇)、北京生命科学研究所的张昱(27 篇)、清华大学的颜宁(27 篇)、中国科学院大学的李伟(26 篇)、清华大学的王佳伟(25篇)、清华大学的雷建林(24 篇)、华大基因的徐迅(23 篇)、西安交通大学的张伟(22 篇)、中国科学院古脊椎动物与古人类研究所的徐星(22 篇)、华大基因的张国杰(20 篇)等。
3.4 研究机构发展迅速,已涌现一批世界一流机构
我国研究机构的CNS 论文数量增长也十分显著。从第一机构或通信机构数看,由图4 可见,在样本论文中,2013 年前为50 家以下,2014 年开始突破50 家,其中第一机构数达到了54 家、通信机构数达到了51 家,2017 年分别达到62 家和100 家,2020年则分别达84 家和175 家,增长态势非常显著。
图4 样本论文的第一机构/通信机构数量年度分布
从各机构的发文数量看,在样本论文中,1979—2020 年发文量最多的是中国科学院,共有1 563 篇,占样本论文总数的37.73%;除中国科学院外,其他高产机构大部分为高校,主要有清华大学(405 篇)、北京大学(360 篇)、中国科学院大学(268 篇)、复旦大学(213 篇)、香港大学(195篇)、上海交通大学(170篇)、中国科学技术大学(164篇)、浙江大学(145 篇)、南京大学(116 篇)和中山大学(105 篇)等。中国科学院系统的中国科学院上海生物研究所、中国科学院古脊椎动物与古人类研究所、中国科学院生物物理研究所等机构的发文数量也很高,分别达到了178 篇、139 篇和123篇。从企业看,华大基因的发文量达到了113 篇,已成为全球领先的生命科学前沿机构。
另外,从全球CNS 论文高产机构的合著情况看,笔者发现,国际化合作已非常普遍,目前处于CNS合作网络中心的科研机构中,除了美国的斯坦福大学、哈佛大学、哈佛大学医学院、加州大学伯克利分校,英国的剑桥大学、牛津大学,以及德国的马克斯·普朗克学会等研究机构外,我国的一些机构也已表现不俗,其中中国科学院作为中国科学研究的领军者,位于该网络的我国合作机构中心;同时我国的高校也表现不俗,如清华大学、北京大学、中国科学院大学、南开大学、中山大学以及近年迅速崛起的南方科技大学等都在该网络中占有了一席之地。然而,和美英德等发达国家相比,我国目前高产机构数量偏少、影响偏弱。
3.5 合作方式多样,正逐步向领跑和主导转变
我国在2016—2018 年期间的WoS 国际合著论文数量一直居世界第2 位,已成为美英德法等国在基础研究领域最重要的国际合作伙伴之一[9]。从合作方式的主导态势角度看,我国CNS 国际合作论文的主导地位近年来已迅速增强,正从跟随和参与逐步向领跑和主导转变,这一变迁可以划分为4 个阶段(见图5):
图5 样本论文中国际合著论文的第一作者/通信作者占比年度分布
(1)1980 年前为第一阶段,我国的国际合著论文很少,我国学者一般独自完成论文,且在CNS国际合作论文中我国学者作为第一作者/通信作者的占比基本为100%。
(2)1981—1997 年为第二阶段,我国CNS 国际合作论文占比迅速提升,其中我国学者作为第一作者/通信作者所占比例在50%上下剧烈波动,且通信作者的占比远小于第一作者占比,甚至在个别年份为0。论文第一作者一般是科技论文初稿的主要完成人和研究课题的具体实施人,而通信作者一般是主要学术思想的提出者和研究课题的总负责人,处于主导地位[10],因此,通信作者的占比远小于同年第一作者的占比显示出在这一阶段我国学者在国际合著论文中的主导程度很低。
(3)1998—2015 年为第三阶段,我国的CNS国际合作论文中,我国学者作为第一作者/通信作者所占比例在40%~70%上下波动,相比于前2 个阶段,波动幅度明显收窄,通信作者的占比和第一作者占比接近一致,但一直未超过第一作者的占比。做进一步细分,这一阶段可分为先降后升(1998—2008 年)和“V”型结构(2008 年后)两个阶段。其中,我国学者作为第一作者/通信作者所占比在前一个阶段虽有所波动,但整体上不断降低,而在后一阶段该比例整体上不断提升。
(4)2016 年至今为第四阶段,我国的CNS 国际合著论文中,我国学者作为第一作者/通信作者所占比例都达到或接近50%以上,且通信作者的占比连续5 年超过第一作者的占比,表明我国学者在国际科技合作中的主导地位逐步增强,我国的科学合作已从被动式、参与式的国际合作转变成主动式甚至是主导式。
3.6 学科发展水平不断提升,生命科学、材料科学等学科已进入世界前列
通过统计样本论文的学科分布可见(见图6),从发文数量看,论文数量最多的是在分子生物与遗传学、物理学、地球科学、生物与生化、化学、环境/生态学等领域。其中,分子生物与遗传学的论文数量最多,有1 008 篇;材料科学领域论文占该领域CNS 论文总量的比例最高,达到17.63%,其次是药理学与毒物学、农业科学,占比分别为9.24%和8.33%。由此可见,我国在宏观生命科学领域,如农业科学、药学、生物学等领域的发展水平已接近世界前列;分子生物科学领域的布局也已完成且发展迅速[11]。我国越来越多学科领域的发展水平已经追上世界的脚步,甚至完成了从跟随者到领跑者的转变。然而,我国在医学、管理学、心理学等学科领域的CNS 论文数量较少。
图6 2003—2020 年我国CNS 论文学科分布
4 结论和建议
4.1 研究结论
本研究通过对WoS 数据库中收录的1900—2020年我国学者的4 164 篇CNS 论文进行研究,从论文总量、国际排名、高产作者、高产机构、第一作者/通信作者占比、第一机构/通信机构占比、学科布局分析等多方面进行定量计算和数据分析,得出以下结论:
(1)从论文数量上看,我国CNS 论文最早始于清末、民国初期,在20 世纪末、21 世纪初开始加速发展,近10 年来则进入乘风破浪式大踏步前进的繁荣时期,目前我国CNS 论文总量已排在全球第4 位。然而,目前我国和美国等发达国家的科研水平差距还较大。
(2)从研究力量上看,一方面,我国科研队伍的规模正在不断扩大,据统计,我国WoS 论文作者数量在2008 年时为23 万人,2015 年达到64 万人[12],自2013 年超过美国后,已连续6 年稳居世界第一[13];另一方面,在CNS 等世界顶尖期刊发文的我国一流学者数量也增长迅速,并已涌现了一批拥有重大原创性科学成果和国际顶级水平的科研人才,以及一批世界一流的科研机构、研究型大学和创新型企业。
(3)从作者、国家与机构合作上看,在学科高度融合和全球化的共同驱动下,我国国际合作发文量不仅在稳步增长,而且近年来已经成为国际科学研究合作网络的中心节点之一,我国学者在国际科研合作中的角色已经从跟随和参与逐渐向领跑和主导转变。
(4)从学科布局看,我国生命科学、材料科学等学科的发展水平已进入世界前列,还有越来越多的学科领域已经追上全球顶尖发展水平的脚步,甚至完成了从跟随者到领跑者的转变。然而,从CNS发文量看,我国在医学、管理学、心理学等学科领域与美英等发达国家相比仍有较大差距,需要继续砥砺前行。
4.2 对策建议
在遭受新冠肺炎疫情冲击和面临百年未有之大变局的新形势下,如何加快建设面向未来的世界科技强国,已成为我国现代化建设全局的关键。随着科技体制改革的不断深入、科研条件的不断优化,相信厚积薄发的我国科技创新一定会继续乘势而上,为人类作出大国应有的贡献。世界科学中心转移的一般规律告诉我们,世界科学中心不可能永远留在某一国家,因此,未来的很大一种可能是呈现双中心或多中心的格局,对此,我国必须高度重视,以系统思维谋划制定出积极的发展策略,在解放思想、完善人才政策、加快世界教育中心建设、加大政府支持力度、科学布局前沿研究和颠覆性技术创新领域等方面作出全面努力[14],争取早日促成双中心或多中心的格局,为中华民族复兴奠定科技基础。
另外,需要特别指出的是,本研究以我国CNS论文为例,并非要鼓励我国科技工作者将最好的科技成果都投到这些期刊,恰恰相反,笔者认为,科学进步需要科学的交流与合作,特别是在科技发展的不同阶段,在国外顶尖期刊发表论文有其合理性、必然性和进步性,但是其中也存在“唯SCI 论文”等弊端,导致出现论文投稿发表和数据库使用过程中的经济损失、技术泄密、科研选题脱离国家需求、科技成果评价和人才评价中出现逆向淘汰等问题[15],对此我们必须有清醒、理性的认识。在新的时代和新的发展背景下,我们当前特别要做好两件事:一是要积极引导我国高质量论文发表在国内的高质量期刊上,将论文写在祖国大地上;二是要抓紧做好世界一流科技期刊的建设工作,因为科技期刊是科技知识和信息的最重要载体,对于引领科技发展、保护科技成果、维护国家安全与稳定起着极为重要的作用,一个国家如果没有相应数量的国际知名的世界一流科技期刊,就不可能真正成为世界科技强国[16]。