我国院士基本特征分布及学术特征分析
——以1991—2020年增选医学相关院士为例
2022-08-16张耀元舒安琴
罗 瑞,张耀元,舒安琴
(1. 重庆大学附属肿瘤医院《中国医院用药评价与分析》编辑部 北京 100053; 2. 重庆市卫生健康统计信息中心 重庆 401120;3. 重庆大学附属肿瘤医院中国药房编辑出版中心 重庆 400042)
院士是某些国家所设立的科学技术方面的最高学术称号,一般为终身荣誉。在中国,院士通常是指中国科学院院士或中国工程院院士,代表我国科学最高学术水平。了解现有院士的基本分布特征和学术特征有利于分析中国高技术科技工作者与世界高技术科技工作者在学术上的差异,可以为新时代中国高技术人才的培育、遴选和调整提供参考依据[1-2]。目前关于院士分析的研究较少,已有研究主要涉及院士的基本特征(如地区、成长影响因素分析、年龄和学历构成等[3-4])和论文评价指标分析(院士的论文被引次数和影响因子分析[5])等,但研究时间较早,分析内容较局限。基于此,本文采用计量学研究方法,选择1991—2020年中国工程院和中国科学院评选的院士中明确从事医学相关研究的院士(简称:医学院士)为研究对象,分析其增选年龄、地域分布、求学经历、院士的学术成果特征和最高被引论文特征等,以期为新时代中国高技术人才的培育、遴选和调整提供参考 依据。
1 对象与方法
1.1 研究对象
选择1991—2020年中国工程院和中国科学院增选的医学院士共163人作为研究对象,其中中国工程院医药卫生学部院士66人,中国科学院生命科学和医学学部院士97人。排除标准:①1940年以前出生的院士(年龄>80岁);②中国科学院生命科学和医学学部院士中明确非医学领域院士(水生物学、植物学、动物学等);③在百度学术未搜索到相关信息的院士;④总成果数(包括期刊、会议、专著及其他)少于200的院士。最终纳入84名医学院士进行基本信息收集和学术特征分析。
1.2 方法
1.2.1 基本信息收集
通过中国工程院院士官网(http://www.cae.cn/ cae/html/main/col48/column_48_1.html)、中国科学院院士官网(http://casad.cas.cn/ysxx2017/ysmdyjj/ qtysmd_124280)及百度百科、院士所在单位官网等搜集医学院士的基本信息,包括性别、出生年、出生地、增选院士的时间、学历、本科毕业院校、留学经历、研究领域等。
1.2.2 相关学术信息收集
根据百度学术(http://xueshu.baidu.com)搜索院士名字(若搜索出现重名或多个结果,则根据院士增选时的就职单位进行遴选),进入院士学者主页面,搜集院士学术相关的信息,包括学者主页面“看过人数”、总成果数(期刊、会议、专著及其他)、总被引频次、H指数、G指数、发表期刊数(带院士名字的所有论文所在的期刊)、期刊被国内外数据库收录情况、院士发表成果数最多的年份、院士发表成果最高被引年份、院士年最高发表成果数、院士发表成果年最高引用频次、单篇论文最高被引频次、单篇最高被引论文所在的期刊、单篇最高被引论文的发表年份、期刊的影响因子、出版国家、JCR分区、院士以第一作者发文数、最近一年发文数、最近一年发表的中文期刊数等。
1.2.3 国内外数据库评价
根据国内外不同机构对科技期刊的收录和评价统计期刊被国内外常见数据库的收录情况,包括美国科学信息研究所“科学引文索引”(简称SCI)、美国科学信息研究所“科学引文索引扩展版”(简称SCIE)、美国工程师学会联合会“工程索引”(简称EI)、北京大学图书馆“中文核心期刊”(简称北大核心)、中国科学院文献情报中心“中国科学引文数据库”(简称CSCD)、中国科学技术信息研究所“中国科技论文统计源期刊”(简称统计源)。
1.3 统计学处理
采用WPS软件进行数据录入,再用SPSS21.0统计学软件进行分析。呈正态分布的计量资料以x±s表示,采用两独立样本t检验;非正态分布的计量资料以M(IQR)表示,采用秩和检验;计数资料以率或构成比表示,采用χ2检验;以P<0.05为差异有统计学意义。
2 结 果
2.1 医学院士的基本特征分布
2.1.1 性别、年龄分布
84名医学院士中男69人(82.1%),女15人(17.9%);年龄51~80岁,平均(66±8)岁。增选为医学院士时的年龄41~76岁,平均(56±6)岁;增选时间1991—2020年,其中1991—2010年间增选33人,2011—2020年间增选51人。1991—2010年增选医学院士平均年龄为(55±6)岁,2011—2020年增选医学院士平均年龄为(57±6)岁,二者比较差异无统计学意义(χ2=3.181,P=0.078)。
2.1.2 地域分布特征
84名医学院士出生地主要包括江苏、山东、浙江、安徽、河北等省市(占53.6%),见图1;增选为医学院士时就职单位主要分布在北京、上海、浙江、山东、江苏等省市(占72.6%)。
图1 医学院士出生地分布图Fig.1 Distribution of birthplaces of medical academicians
2.1.3 求学经历
84名医学院士中有80人本科就读于国内大学(占95.2%),主要包括复旦大学、北京大学、陆军军医大学、海军军医大学、吉林大学、山东大学、华中科技大学、清华大学、浙江大学、蚌埠医学院、第四军医大学、河北医科大学、南京医科大学、南通医学院、上海交通大学、中国科学技术大学、中国医科大学;有 4人本科就读于国外大学(占4.8%),分别为日本国立弘前大学、日本国立九州大学、英国史查克莱大学、法国巴黎第七大学。
84名医学院士中有62人有明确的国外留学经历(占73.8%),包括到国外就读、工作、作访问学者、进修等,但不包括到国外参加学术会议、作学术报告等短期出国行为,另有22人留学经历不详。留学的国家以美国为主,有36人(42.9%);其次依次为日本、德国、法国、英国;有11人到过其他国家留学,其中有院士最多去过3个国家留学,见图2。1991—2010年增选医学院士中72.7%(24/33)有出国留学经历,2011—2020年增选医学院士中74.5%(38/51)有出国留学经历,2组院士留学经历比较,差异无统计学意义(χ2=0.000,P=0.986)。
图2 医学院士出国留学的国家分布图Fig.2 Distribution map of countries where medical academicians study abroad
医学院士的最高学历中有博士后6人(7.1%)、博士57人(67.9%)、硕士12人(14.3%)、学士4人(4.8%)、另外5人(6.0%)最高学历不详。1991— 2010年增选医学院士中博士及以上学历占69.0% (20/29),2011—2020年增选医学院士中博士及以上学历占86.0%(43/50),2组博士及以上学历比较,差异无统计学意义(χ2=0.204,P=0.086)。
2.1.4 研究领域
从研究领域看,医学院士的研究领域主要包括肿瘤学(23.8%)、免疫学(8.3%)、外科学(8.3%)、临床检验诊断学(6.0%)、细胞生物学(6.0%)、中医药(6.0%)、中西医结合(4.8%)、人体解剖与病例生理学(3.6%)、病理学与病例生理学口腔医学(2.4%)、流行病与卫生统计(2.4%)、微生物(2.4%)、分析化学(2.4%)等,其他研究领域占21.4%。
2.2 学术特征分析
2.2.1 学术基本特征
每位医学院士百度学者页面登录人数中位数为12236人;每位院士总成果数的中位数为684,其中发表论文数的中位数为471篇;总被引频次中位数为12520次;H指数为54.7±20.3;G指数为97.8±39.5,见表1。
表1 医学院士学术基本特征分布Tab.1 Distribution of basic academic characteristics of medical academicians
2.2.2 发表成果特征分析
医学院士在(52±7)岁时发表成果数最多;有的院士1年的成果数多达228,1年的成果数中位数为56。医学院士在(58±8)岁时成果数达到最高被引量,成果数最多与被引量最高时间间隔平均(6±4)年。
2.2.3 发表论文特征分析
医学院士最多发表了2180篇论文,平均发文中位数为471篇,其中在SCI期刊上发表论文中位数为57篇,在中国科技核心期刊(中国科技论文统计源期刊)上发表论文中位数为222篇,在其他非核心中文期刊或者非SCI英文期刊上发表论文中位数为140篇。
84名医学院士的单篇论文最高被引频次累计最高达7885次;单篇最高被引论文发表时医学院士的年龄为(53±10)岁;以第一作者发文中位数为 147篇;最近1年发文中位数为11篇,最近1年在中文期刊上发文中位数为3篇,见表2。
表2 医学院士发表成果特征分析Tab.2 Analysis of characteristics of published achievements of medical acad emicians
2.2.4 最高被引论文的基本情况
84名医学院士发表的论文中被引量最高论文有62篇发表在英文期刊上(73.8%),有22篇发表在中文期刊上(26.2%),见表3。根据2020年公布的SCI影响因子结果显示,62种英文期刊的影响因子范围为1.247~292.278,影响因子中位数为9.530。被引量最高论文主要(≥2篇论文)发表在The New England Journal of Medicine(3篇)、Nucleic Acids Research (3篇)、Cancer Research(2篇)、Cell(2篇)、Fitoterapia(2篇)、International Journal of Cancer (2篇)、Nature(2篇)、Oncogene(2篇)、中华医学杂志(2篇)上。影响因子>20的期刊包括CA:A Cancer Journal for Clinicians、The New England Journal of Medicine、Jama the Journal of the American Medical Association、Nature、Cell、Nature Medicine、Cell Metabolism、Journal of Hepatology。期刊出版地主要为美国(29篇)、英国(18篇)、荷兰(9篇)及其他(7篇)。根据JCR分区,35篇论文所在期刊属于Q1区、5篇属于Q2区、3篇属于Q3区、1篇属于Q4区、有 18篇暂无JCR分区。
表3 每位院士的最高被引论文所在期刊(≥2篇论文)的基本情况Tab.3 Basic information of journals(≥2 papers)of most cited papers of each a cademician
3 讨 论
3.1 医学院士区域分布极不平衡
研究表明教育发展水平取决于经济发展状况,且经济是影响高等教育非常重要的决定因素之一,而新中国成立以来,我国东部地区的经济水平不仅程度高,而且发展速度快[6-8]。本研究结果显示84名医学院士主要出生在江苏、山东、浙江、安徽等东部发达地区,与以往研究一致,表明出生在东部经济发达地区的居民接受教育或接受高等教育的可能性更大。根据“2020年自然指数年度榜单”显示,北京已经超过纽约、波士顿及旧金山-圣何塞(硅谷地区)成为世界科研能力最强的地区,中国的上海、南京、武汉、广州、合肥也进入排名前20位;同时在科研机构排名中,中国科学院名列综合研究实力榜第一位,中国科学技术大学和北京大学也跻身前十;中科院大学、中国科学技术大学和上海交通大学成为排名提升最快的研究机构和学术机构[9]。2016—2019年的多个创新相关报告结果显示,国内创新能力主要集中在东南沿海地区或具有政治优势的直辖市和省会城市[10]。一项对2001—2009年中国工程院增选院士地区分布的分析显示,东部与中部、西部和东北之间马太效应依然存在[1]。本研究结果还显示医学院士主要集中在北京、上海、浙江、山东、江苏等地从事学术研究工作(72.6%),院士所在的地域分布不平衡,与以往研究基本一致,提示目前我国科研能力存在明显的地区分布差异,应该充分发挥科技和人才作用,注重中西部地区高技术人才引进等,以促进区域协调发展。
3.2 医学院士求学经历相似且呈高学历态势,增选年龄低于其他学科院士
本研究结果显示医学院士中有明确留学经历的占73.8%,博士及以上学历的占75.0%,且1991—2010年与2011—2020年间增选医学院士留学及学历比较,差异均无统计学意义(P>0.05),说明增选医学院士的求学经历差异不大,且始终呈高学历态势。本研究还发现医学院士留学的国家主要包括美国、日本、德国、法国、英国等。研究表明近代世界科学中心有过5次大的转移,包括意大利、英国、法国、德国、美国,且美国、英国、德国、法国也是诺贝尔获奖者最多的国家[11],说明医学院士留学国家主要以世界科学中心为主。
以往研究显示1980—2001年历届增选院士的平均年龄在60.19~63.00岁[12];2009年中国工程院院士增选结果发布会结果显示中国工程院在2001年以前增选院士的平均年龄为63~64岁,到2009年增选院士的平均年龄首次低于60岁,为56.2岁[13];另一项对中国科学院院士年龄的调查分析显示2001—2013年院士平均增选年龄从61岁降到54岁左右,并在54岁左右徘徊[4],说明总体上院士增选年龄在下降,最后维持在一个相对稳定水平。本研究纳入的84名医学院士的增选时间为1991—2020年,时间跨度为30年。结果显示:随着时间的推移,1991— 2010年与2011—2020年医学院士平均增选年龄分别为55、57岁,差异无统计学意义(P>0.05),说明医学院士增选年龄低于其他学科院士,且始终维持在一个低年龄水平,与以往研究结果不一致。分析原因可能与纳入样本不一致有关,本文仅纳入的是中国工程院和中国科学院的医学院士。
3.3 45~65岁为医学院士成果产出力和影响力的高峰期
本研究结果显示医学院士平均增选年龄为(56±6)岁,在(52±7)岁时发表成果最多,在(58±8)岁时成果数达到最高被引量,成果数最多与被引量最高时间间隔平均(6±4)年,提示其成果产出力达到最大的时间主要集中在增选为院士前,医学院士成果影响力达到最大主要集中在增选为院士后,即45~65岁是医学院士整体成果产出力和影响力的高峰期,较2015年一项关于中国科学院数理学部和信息技术科学学部院士的研究结果年龄提前。该项研究表明, 院士发表的论文产出力与影响力的高峰期为56~ 70岁[3],说明医学院士科研产出达到峰值的时间较其他学科院士早,这可能也是医学院士增选年龄低于其他学科院士的一个原因。一项关于诺贝奖获奖者的学术影响力与年龄的关系研究显示,诺贝尔生理学或医学奖获奖者平均获奖年龄为56.04岁,与本研究医学院士获选年龄基本一致;但诺贝尔生理学或医学奖获奖者学术影响力峰值年龄为43岁,与本文差距较大,可能与研究对学术影响力的定义不同有关。本文将最高被引频次作为衡量医学院士研究成果影响力的标准,而以往研究影响力是以5年个人的发文和引用来计算的[14],因此,应该加大对45~65岁的医学科研工作者的关注和投入力度。
3.4 医学院士发表论文影响力高,但高被引论文主要发表在外文期刊上
本研究表明医学院士平均发文中位数为471篇,其中在SCI期刊上发表论文中位数为57篇,在国内三大核心期刊数据库(CSCD、北大核心、中国科技核心)上发表论文中位数为119、153、222篇,在其他非核心中文期刊或者非SCI、SCIE、EI英文期刊上发表论文中位数为140篇,说明院士的论文主要发表在国内的三大核心期刊数据库和SCI、SCIE、EI三大国际知名的学术检索系统收录的期刊上。
以往研究结果表明,H指数与总被引频次高度相关[15-16]。1名科研人员的H指数是指他至多有H篇论文分别被引用了至少H次,H指数越高表明他的论文影响力越大。2018年Guide2Research网站发布全球计算机科学和电子领域H指数排名显示:H指数≥40的学者中中国大陆地区有22位被收录[17];一项截至2011年的分析显示,64位诺贝尔经济学奖获得者平均 H 指数为 8.7[18],平均总被引频次 1268.98次;另一项关于1901—2012年201位诺贝尔生理学或医学获奖者研究显示平均H指数为53.42[19]。而本研究结果显示医学院士平均H指数为54.7,中位总被引频次为12520次,说明医学院士发表论文的影响力高。
本研究还发现,医学院士有84篇最高被引论文73.8%(62篇)发表在英文期刊上,根据2020年公布的SCI影响因子结果显示,62篇最高被引论文对应的英文期刊的影响因子中位数为9.530,其中35篇论文所在期刊属于Q1区,主要包括以The New England Journal of Medicine、Nature、Science、Cell为代表的国际权威期刊,说明高被引论文主要发表在外文期刊上,且促进学术交流并引起学术关注。
综上所述,本研究选择1991—2020年中国工程院和中国科学院评选的从事医学相关研究院士作为研究对象,研究其基本资料和学术特征。结果显示:目前医学院士所在机构的地域分布不均,主要集中在东部及经济发达地区;医学院士普遍有留学经历,以博士及以上学历为主;增选年龄普遍低于其他学科,且维持在56岁左右;45~65岁是医学院士科研产出力和影响力的高峰期;院士论文主要发表在核心中文期刊和SCI、SCIE、EI收录期刊上;医学院士发表论文影响力高,但高被引的论文主要发表在英文期刊上。
3.5 小结
同时,本研究也存在一些不足之处。由于本次选择的是1991—2020年医学相关的院士,样本量小,并且由于这些院士可能先后就职于多个单位,可能会导致收集的学术相关信息不完整,进而影响结果的分析。今后可在增加样本量的同时考虑纳入所有学科院士进行对比分析或与诺奖获得者进行比较分析,以期了解我国不同学科院士之间的差异或与诺奖获得者的差距,更好地为我国高层次人才培养、遴选、调整提供参考。■