我国两院院士区域分布存在马太效应吗?
2020-12-24唐家龙天津工业大学
文/唐家龙(天津工业大学)
一、 我国院士制度和两院院士简况
我国的院士和院士制度均为舶来品,院士的英文是Member of Academy 或Fellowof Academy。中国最早的院士产生于1948 年[1],是中国知识分子学习西方“赛先生”的重要成果。1948 年3 月底,中国的第一批院士正式“诞生”。和目前的院士制度有所区别的是,那时的院士不仅仅包括科学技术领域的顶尖人才,如华罗庚、陈省身、吴大猷、竺可桢等,还包括人文和社会科学领域的顶尖人才,如金岳霖、冯友兰、胡适、陈寅恪、马寅初等。
1949 年,伴随着新中国的诞生,中国科学院成立。但对于原中央研究院的院士,中国科学院成立时并没有得到承认[2]。后来,决定采用学部委员制作为向院士制度的过渡阶段。1955 年,建立学部委员制,国务院批准了233 位学部委员人选(其中172 名自然科学类委员)。1957年,增选了18 位。文化大革命之后,1980 年,各学部再次增选了283 位(后期除名1 位)。1991 年,增选了210 位(后期除名1 位)。因此,在1993 年中国科学院学部委员改称中国科学院院士之前,我国共累计产生学部委员742 名。
1993 年,国务院第十一次常务会议决定中国科学院学部委员改称中国科学院院士后,原中国科学院学部委员转为院士。1977 年,中国社会科学院成立,原中国科学院哲学社会科学部转到中国社会科学院的学部委员均未能变更为院士。1993年11 月中国科学院增选了59 名中国科学院院士,是学部委员制改为院士制后增选的第一批中国科学院院士。截至1993 年底,共有中国科学院院士545 人。随着对外开放进程的加速,1994 年,中国科学院修订了院章程,将“对中国科学技术事业做出重要贡献,在国际上具有很高学术地位的外国籍学者、专家”纳入选举范畴,同年选举产生了首批14名中国科学院外籍院士。1994 年中国工程院成立,同年选举产生了96名中国工程院院士。随后,制度化的院士遴选启动,中国科学院逢奇数年每两年进行一次,每次增选按规定不超过60 人,近两年有所突破,但均在60 人左右的范围。中国工程院在1994—1997 年连续5 年增选后,改为与中国科学院一样每两年增选一次的方式,前期增选极无规律性,每年增选数量波动较大,近几届增选时则保持在50~80 名的额度。自此,我国的院士制度迈向较为规范化的历程。
1993—2019 年期间,中国科学院开展了14 轮增选,中国工程院开展了15 轮增选,院士数量大幅增加,如表1 所示。中国科学院院士数量在1993 年底545 人的基础上,新增了691 人;中国工程院院士更是从无到有,增加了1148 位(其中有一部分院士人选来自原中国科学院院士),累计数量几乎与中国科学院持平。从2020 年9 月18 日的两院官网查询数据显示,剔除已故院士,科学院现有院士818 人,工程院现有院士908 人,其中当选中国科学院院士后跨院当选中国工程院院士目前有30 人。因此,中国工程院院士现有院士数量已经超过了中国科学院。
表1 中国科学院和中国工程院历年增选院士(学部委员)数量
二、两院院士省际分布情况
1.两院院士出生地和工作地的空间分布
国内目前可见的关于院士在省际间分布不均衡的文献不多。较早的一篇文献是吴殿廷等人关于两院院士工作地、出生地的分析[4]。该研究分析的对象包括了1955—2005年当选的1027 位院士(1993 年以前为学部委员)和1994—2005 年增选的702 位院士。这项研究很重要的一个贡献是获取并分析了院士(或学部委员)出生地所属省份的信息。
总体来看,院士的出生地主要集中在东南沿海及京津冀地区。卜晓勇认为这是马太效应以相加的优势累积形成的结果[5]。如表2 所示,院士的出生地分布相当集中,按31个单元计算,每个省份平均贡献50位院士,但只有11 个省份贡献数量在50 位以上,按降序依次为:江苏、浙江、上海、福建、湖南、山东、广东、河北、北京、四川。前三位省份院士数分别占在统1490 名院士的17.52%、13.02%、10.87%,共计占比41.41%。但工作地则主要集中在北京(780 人),其次是上海(155 人)、江苏(98 人),三地占比分别达到52.35%、10.40%、6.58%。
北京成为院士集聚首位度最高的城市。北京的院士数量是各个省份平均拥有院士数量的15 倍以上,是出生在北京的院士数量的12 倍以上。这说明北京作为首都,又是科教资源和高新技术发展的重要阵地,具有极强的人才吸引力,从全国各地吸引了大量的院士人才汇集。
对东中西部(港澳台单列)院士数量的汇总分析发现,院士出生地位于东部地区的占到了71.21%,中部地区占18.46%,西部地区占9.06%;工作地位于东部地区的占到了80.60%,中部地区占10.20%,西部地区占7.79%。由此可见,从三大区域划分角度看,院士工作地的集中度远胜于出生地的集中度[4]。这说明,虽然顶尖人才的孕育成长可能具有一定的集中性,但顶尖人才在实际的生产生活活动中具有地理空间上的集聚性。这与我国经济发展的总体格局和科教资源、产业能力的发展格局具有高度相关性,充分反映了经济、科技和人才之间的内在关联性。
2.两院院士空间分布的洛伦兹曲线
针对前述历史数据,本文引入洛伦兹曲线来描述院士在省际间的
分布的不均衡性。在边长为1×1 的正方形区域,横轴代表省份,纵轴代表按省份累计的院士数量占总体的百分比,数量占比越低的越靠近原点,所有省份累计占比为100%,即坐标点(1,1)。洛伦兹曲线与绝对平等线之间包围的面积占直角三角形的面积之比就是众所熟知的基尼系数。洛伦兹曲线包围的面积越小,不平等程度越小,基尼系数越小;洛伦兹曲线包围的面积越大,不平等程度越大,基尼系数越大。绝对平等时,洛伦兹曲线与绝对平等线重合,基尼系数为0。当某一省份拥有所有的院士时,分布绝对不平等。
表2 中国科学院和中国工程院院士的出生地和工作地的空间分布(1955—2005 年)
首先,考察将北京包含在内的院士空间分布的洛伦兹曲线,如图1 Panel A 所示。可以看到,院士出生地和工作地的洛伦兹曲线距离绝对平等线都比较远,但后者较前者更加地远离绝对平等线,这意味着院士的工作地分布相对于出生地分布更加不平等。按省份计算的院士出生地分布的基尼系数为0.589,而院士工作地分布的基尼系数达到了0.766。
如果将北京排除在工作地和出生地分析之外,如图1 Panel B 所示,院士工作地和出生地的洛伦兹曲线近乎重合,按出生地计算的基尼系数基本与全样本(含北京)时一致,但按工作地计算的基尼系数则下降到0.601。再次表明,北京对北京市外出生的院士人才具有巨大的集聚力,导致全国院士工作地的分布不平等度提升了15.5%。
3.基于工程院院士候选人数据的进一步分析
笔者获得了中国工程院2017年院士有效候选人的籍贯数据,手工收集整理了工作单位所在省份数据。尽管只有当世代居住地与出生地一致时,籍贯与出生地才是一致的[6],但二者具有较强的相关性。参考胡兆量等人的观点[7],研究认为,由于改革开放前期人口的流动性较低,可以合理地推测院士候选人大多在原籍接受初等和中等教育,使用籍贯作为出生地具有一定的合理性。因此,可以从院士候选人的籍贯省份和工作省份角度再来考察一下院士省际分布情况。
参照前面分析,区分了院士候选人包括北京和不包括北京的情况。研究发现,2017 年中国工程院院士候选人在籍贯地和工作地的省际分布模式,以洛伦兹曲线为参考,与前述结论基本一致,但在曲线的凹凸度上有所差异。如图2 Panel A,当样本中包含北京时,籍贯地代表的院士来源分布曲线较工作地代表的现状分布曲线更加靠近绝对平等线。图2 Panel B 中,籍贯地和工作地院士分布曲线近乎重合。基尼系数的测度发现,含北京样本时,院士籍贯地分布的基尼系数为0.506,工作地分布系数为0.650;不含北京样本时,籍贯地分布系数为0.507,工作地分布系数为0.488。对比1955—2005 年间的院士分布相关基尼系数,可以发现,无论是否包含北京样本,候选人的出生地或籍贯地基尼系数下降了8%左右,工作地基尼系数下降了11%左右。
图1 院士出生地和工作地空间分布的洛伦兹曲线
图2 2017 年中国工程院候选人工作省份和籍贯省份分布的洛伦兹曲线
因此,可以得出两个相对谨慎的结论:一是从候选人角度看,顶尖人才的来源(籍贯地)分布更加均等化了,这是解放后国内各省市教育发展的重要成果;二是北京对候选人才来源地分布的影响不大,但对工作地院士候选人的分布影响较大,直接将基尼系数从0.488 提升到了0.650。这事实上意味着,相对于2005 年之前而言,院士分布的马太效应并没有加剧,反而由于更多省份涌现出院士候选人参选,可能减缓了这种马太效应。
但这一结论的使用必须谨慎,因为这是候选人属地曲线分布的结果,而不是实际当选为院士后的结果。将一年的数据用于做洛伦兹曲线和基尼系数分析存在较大的偶然性,用单独年份的数据来考察虽然能够反映出一些问题,但由于院士遴选规模的限制,其结果难免有失偏颇。
4.2000 年以来增选院士工作地分布的变化
各省市院士分布的差异和不均衡性不是一天形成的。如果我们将这种差异分解到各个年份每个省市增选的结果,这种不均衡性会更加直观。陈仕伟对中国科学院增选院士的工作地分布做了分析。他发现2001—2009 年间中国科学院两年一度共5 次的增选中,当选院士主要来源于16 个省份,贵州、西藏、重庆、青海、宁夏、内蒙古、新疆、海南、广西和江西等10 个省级行政区没有一人被增选为中国科学院院士,院士增选的马太效应已经显现[8]。
如图3 所示,中国科学院和中国工程院每年增选院士数量约为60~140 人,2001 年增选137 人后,增选数逐年下降,到2007 年降到最低的62 人,然后整体呈上升趋势,到2019 年时共增选139 人。可以看到,院士增选数量的年度波动极大。北京每年当选院士的比例在35%~50%,占有巨大的优势。
进入新世纪以来,中国科学院和中国工程院分别进行了10 轮增选,共计遴选出两院院士1106 名。笔者对2001—2019 年间进行的10次增选当选代表和候选数据进行了初步整理。根据披露的增选信息中的工作单位,通过手工查询形成了2001—2019 年间当选的两院院士的工作地所在的省份表,如表3 所示。
图3 2001—2019 年中国科学院和中国工程院院士新增数量变化及北京新增人数占比
更具体地,将每年各个省份当选的院士数量展开,可以观察到明显的省份差异。全国33 个省市区,在过去20 年,0 人当选的省份:内蒙古、海南;1 人当选的省份:青海、宁夏、澳门;2 人当选的省份:西藏;3人当选的省份:重庆、贵州、台湾;5人当选的省份:江西。对于任一年度,最多有26 个省份有人当选,最少时只有18 个省份有人选入围。这一结果,相对于北京动辄几十位院士的入选数量,悬殊巨大。
表3 2001—2019 年中国科学院和中国工程院当选院士工作地分布 单位:人
三、 两院院士区域分布的马太效应
限于时间、精力和数据可得性,研究没有搜集整理院士出生地或籍贯数据,在这里仅对当选院士的工作地分布进行分析。同前,引入洛伦兹曲线和基尼系数来刻画院士当选情况的省际分布不均衡情况。利用可得数据,对比研究了1955—2005年期间和2007—2019 年期间的院士的区域分布情况,来考察院士区域分布是否存在马太效应。
首先,对包含北京(院士)数据在内的情况进行了分析。如图4 所示,1955—2005 年期间,院士工作地的累积分布曲线比2007—2019 年的累积分布曲线更加外凸,意味着1955—2005 年相对于2007—2019年院士分布更加不均衡,即院士分布的不均衡性随着时间推移在下降,区域分布的马太效应在减弱。从具体数值看,1955—2005 年间的院士分布基尼系数为0.7804,而2007—2019 年间的院士分布基尼系数为0.7100,说明院士分布的区域不均衡性减弱。
其次,考察不包含在北京工作的院士的分布情况。洛伦兹曲线形态与包含北京时基本一致,但无论是1955—2005 年的累积分布曲线还是2007—2019 年的累积分布曲线,都更加接近于绝对平均线,但1955—2005 年的曲线仍然更加外凸。从具体数值看,不包含北京样本情况下,1955—2005 年间的院士分布基尼系数为0.6150,而2007—2019 年间的院士分布基尼系数为0.5437,仍然表明院士分布的区域不均衡性下降了。
图4 2006 年前后当选院士的工作省份分布对比
同时,研究发现,北京对院士区域分布的不均衡性具有重要的影响。北京因素导致1955—2005 年期间的基尼系数上升了0.1654,2007—2019年期间上升了0.1563。
此外,研究还发现,确实存在着较为严重的院士人才分布的不均衡现象,但分布不均衡的马太效应似乎在近些年并没有得到加强。
因此,如果参考收入基尼系数的标准,基尼系数在0.35 以下是可以接受的,超过0.4 就太高了[9],那么我国院士人才的区域分布是极度不均衡的,北京对人才的高吸引力更是加剧了这种区域人才的不均衡性。当然,对人才的分布采用收入基尼系数标准可能并不完全合理。
但是必须承认,人才向北京、上海等一线城市集聚具有内在的合理性。已有文献表明,吸引人才主要基于经济因素和社会公共服务因素,其中经济水平、产业结构、科技氛围会显著提高人才吸引力[10]。因此,既要看到院士人才分布的不均衡性,也要考察背后的原因。北京拥有中国科学院、清华大学、北京大学等全国最优质的高校院所资源,上海拥有多家中科院研究所和复旦大学、同济大学、上海交通大学等一流院校,同时这些区域的经济总量、财政科技投入、国际化程度都远远超过了同侪城市,这些因素推动了高端人才的局部集中。
四、 关于加强院士人才研究的思考
一些文献指出院士区域分布存在着人才极化或马太效应的现象,认为一个地区的院士数量增加会引致这个地区出现更多的院士[8]。我们发现,尽管存在着院士区域分布极其不均衡的现象,但近年来的院士增选结果表明,这种马太效应有所减缓。这意味着各个地区和各个领域的科学家、工程师通过自身的努力,理论上和事实上都可以成为国内有重要作用的科技领军人才。
当前,从区域层面应当更多激励人才面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,体现自身特色和不可替代性,在国内做出重要贡献,在国际占据重要地位。从制度层面需要更多地转向对院士制度公平性、合理性的关注,尤其是院士遴选程序、标准和规范的研究。从个体层面需要更多地转向对院士候选人的成长历程、对经济和社会、科技发展的贡献的研究,挖掘他们成长的故事,为更多更好地培养优秀人才提供参考和借鉴。