近15 年国家自然科学基金重点项目立项特征研究*
2020-09-16李建辉李永新
李建辉 刘 鑫 李永新
(西京学院理学院,西安710123)
科学技术是国家重要的战略资源,国与国之间的竞争逐渐上升到科技实力的比拼。 为了推动我国科学技术体制改革,变革科学研究的经费拨款方式,国务院于1986 年批准成立国家自然科学基金委员会,确立“科学民主,鼓励创新,平等竞争”的制度体系,以发挥“稳定、激励、导向”的功能。 经过多年的不断钻研、探索与发展,已经形成包含“项目”“人才”“环境条件”三大系列、二十多类资助项目的多样化资助格局[1]。
学者们利用文献计量和数据分析等方法,在基金项目相关问题的研究中取得了丰硕成果。 张志强[2]等通过对国际主要的科学基金进行系统分析,总结了地学资助的战略特点,并给出了对我国地球科学资助战略的启示与建议;蒋颖[3]等对国家自然科学基金面上项目的资助情况进行分析研究,给出了科技论文与国家自然科学基金的相关关系,并对消除基金项目资助地区分布差距等问题进行了深入分析;付宁[4]等以年度资助项目为重点,对2011—2019 年国家自然科学基金中的音乐类项目按数据侧重点进行分析,从中归纳出音乐类项目对国家自然科学基金等的价值和意义;韩兆州[5]利用国家自然科学基金统计学项目的相关数据,对我国统计学发展导向问题进行了探讨;段依竺[6]等通过对广东省自然科学基金资助项目成果管理现状的分析,结合实际情况,给出了成果管理等问题解决方案和新思路;蔺晓源[7]等通过统计和分析国家自然科学基金高血压项目的相关数据,了解到其研究目的及意义;辛督强[8]等以2003—2016 年核技术及国家自然科学基金研究立项项目为样本,总结了核技术研究的发展状况及存在问题,并给出了相关建议;吴闻川[9]等运用国防科研院所项目管理能力评价指标体系的构建研究,总结了该领域研究过程中所取得的成绩和存在的不足;陈挺[10]等利用数据统计分析与文本挖掘等方法对美国国家科学基金会(National Science Foundation, NSF) 材 料 学 部2007—2016 十年基金资助项目的态势及趋势进行了深入分析;耿树青[11]通过对部分已出版的基金资助成果图书进行引用影响力分析,发现了基金项目对于学术发展的推动作用;王丽伟[12]等以2016—2019 年中国农业科学院农业资源与农业区划研究所国家自然科学基金项目申报和资助情况为研究对象,总结和剖析了人才培育和学科建设等相关问题。 这些成果对科研基金项目的管理、评价和实施等方面进行了分析和总结。 然而,却鲜有从数据分析的角度对国家自然科学基金重点项目的现状及其发展趋势进行深入分析和观测。
自1986 年国家自然科学基金设立以来,重点项目始终是基金体系的重要组成部分,支持从事基础研究的科学技术人员针对已有较好基础的研究方向或学科生长点开展创新型研究。 其特点是有限目标、有限规模、重点突出,重视学科交叉与渗透,要求科研人员有效利用国家和部门科学研究基地的条件,积极开展实质性的国际合作与交流。 重点项目主要资助科学技术人员进行深入、系统的创新性研究,促进学科发展,从而推动若干重要领域或科学前沿取得突破。 作为国家自然科学基金重要层次,对推动科技进步,促进经济、社会的发展等方面有着至关重要的作用。 对重点项目的现状及发展趋势、学科分布、研究人员情况和地域分布等方面进行实时有效的观测,可直接促进全面掌握重点项目的综合信息,有助于重点项目申报和管理等方面经验的累积与借鉴,有利于优化重点项目时空布局等。 鉴于此,本文使用探索性数据分析方法对2005—2019 年重点项目的立项项数与金额、科学部的分布、研究人员情况及地区分布等现状及发展趋势进行了统计分析。
1 立项数据的描述统计
1.1 总体分析
2005—2019 年,重点项目的立项总数7,756项,其中高等学校5,644项,科研院所2,053项,其他单位59 项;资助金额总计 2,049,726万元,其中高等学校 1,497,806万元,科研院所 536,794万元,其他单位151,26万元。 高等学校在重点项目研究中发挥着重要作用,其主导地位较为明显,其发展趋势与总体趋势同步,变化率与总体变化率基本持平。 从立项数据的变化趋势来看,15 年间,重点项目立项数与资助金额显著提高/稳步增长:立项数增长131.35%,年平均增长率7.08%;资助金额增长354.62%,年平均增长率12.88%(图1)。
平均资助强度,即平均每项的资助金额在15年间发生了巨大变化:“十一五”期间均值为162.15 万元,标准差为31.07;“十二五”期间均值为296.13 万元,标准差为20.44 万元;“十三五”期间均值为288.25 万元,标准差为7.94 万元。平均每项资助金额的变化几乎与“五年规划”同步发生跳跃性增长,15 年对应的3 个“五年计划”时期内的均值越来越大,而标准差越来越小,这表明增长逐渐趋于稳定(图2)。 要说明的一点是,2015 年之后的平均经费较2014 年都有所下降,其原因是自2015 年起基金委采用的经费预算模式发生了变化,直接经费和间接经费分开预算,数据库查询到的仅是项目的直接经费,并不包括间接经费[6]。
1.2 各科学部的项目分布
国家自然科学基金委由数理科学部、化学科学部、生命科学部、地球科学部、工程与材料科学部、信息科学部、管理科学部和医学科学部组成,2005—2019 年,各科学部的立项项数均呈递增趋势,年平均增长率依次为7.50%、6.53%、3.86%、8.34%、5.79%、9.13%、7.87%和7.76%,变化趋势见图3。 要说明的是,医学科学部是为了适应医学科学前沿发展的趋势,于2009 年从生命科学中独立出来的。 这便是生命科学部的立项项数在2009 年之前均是遥遥领先,而之后却有所下降的原因。 2005—2019 年,各科学部立项项数与资助金额的分布存在明显差异(图4),立项项数排序为:生命科学部>工程与材料科学部>地球科学部>数理科学部>信息科学部>医学科学部>化学科学部>管理科学部,且资助金额与立项项数高度相关。 出现此种分布差异性的原因是各科学部对应的学科领域不同,研究科学问题的角度不同,有些侧重于理论、思想、方法和手段的探索,有些则注重研究科学现象、揭示事物内在规律和本质等,这便导致各科学部对于资金需求有所不同,且自2011 年至今均处于相对稳定的态势。
图1 立项项数和资助金额变化趋势Fig.1 Change Trend of the Number of Projects Approved and the Amount of Subsidies
图2 平均资助强度的变化趋势Fig.2 Variation Trend of Average Funding Intensity
2 项目研究人员的情况分析
2.1 项目主持人的年龄分布分析
对2005—2019 年重点项目支持人的年龄进行统计(表1)可见,主持人在26 岁以上的不同年龄段均有分布,有约95%分布在区间[36,65],约85%分布在区间[41,60],约73% 分布在区间[41,55]。 观察数据的变化规律,可得到如下结论:1)年龄在46 ~50 岁的比例最高, 那么年龄众数应落在区间[46,50]中;2)由于主持人年龄在25 ~45 岁的比例为 25.73%,年龄在 25 ~50 岁的比例为55.84%,那么年龄中位数也应落在区间[46,50]中。
图3 各科学部立项数量变化趋势Fig.3 Variation Trend of the Number of Projects Approved by the Science Department
图4 各科学部立项项数和资助金额Fig.4 Total Number of Projects Approved and Amount of Subsidy for Each Subject Division
表1 项目主持人年龄分布统计Tab.1 Age Distribution Statistics of Project Facilitators
由于年龄众数与中位数均落在区间[46,50]中,于是有理由猜测年龄均值是否也在区间[46,50]之中。 经研究发现主持人年龄序列在2010 年出现了变点,即序列均值发生变化,2005—2010年平均年龄序列均值为49 岁,2011—2019 年平均年龄为50 岁。 但从总体数据来看项目主持人的平均年龄为50 岁,标准差为0.84 岁,具体变化趋势见图5。
图5 项目主持人平均年龄时间序列图Fig.5 Time Series of the Average Age of the Project Leader
为了进一步探索年龄分布情况,对数据进行了详细地统计分析。 由图6 可见,频率分布曲线与正态分布的概率密度函数曲线较为相似。 加之,根据前面的分析,项目主持人年龄的众数、中位数和均值三者分布较为集中,因此可认为项目主持人的年龄近似服从正态分布。
2.2 项目组成员的情况分析
图6 项目主持人年龄分布频率图Fig.6 Age Distribution Frequency of the Project Leader
项目组成员由在职专业技术人员、博士后和研究生组成,从总体上来说,2005—2019 年间共计236,810 人,其中在职专业技术人员按职称分为高级职称(69,082人,占比29.37%)、中级职称(28,830 人, 12.14%) 和 初 级 职 称 (6,109 人,2.60%),研究生按层次分为博士后(10,271人,4.32%)、博士生(69,974人,29.51%)和硕士生(52,544人,22.06%)。 项目组成员构成情况随时间在一个相对稳定的范围内变化,具体变化趋势见图7。 高级职称人员和博士生占比均比较高,事实上重点项目主持人以高级职称居多,而博士生则是项目组的中流砥柱。
为具体观测人员构成的变化,对专业技术人员与博士后和研究生的人数进行对比分析结果显示:专业技术人员的占比在40% ~50%范围内浮动,总体随时间呈递减趋势,由49.29%下降至44.10%;博士后和研究生占比50% ~60%范围内浮动,总体随时间呈递增趋势,最低50.71%,最高59.08%(图7)。 这说明博士后和研究生在重点项目研究过程中起到了非常重要的作用,这是研究队伍人员构成的鲜明特征,也是重点项目研究队伍实现可持续发展的重要保证。
3 基于地区的数据分析
区域经济发展水平、区域产业特征和区域科技基础等是影响我国科技资源空间分布的主要原因[12]。 本部分将对重点项目地区分布及其原因进行分析。
3.1 重点项目的地区分布
图7 项目组成员构成比例及其变化趋势Fig.7 The Proportion of Project Team Members and Its Changing Trend
表2 按地区统计数据Tab.2 Statistics byRegion
表2 中给出了2005—2019 年各地区重点项目的立项项数和资助金额,涉及到的省级地区共有28 个,立项项数和资助金额均有较大差异,北京最多(2,517 项,647,133 万元),青海最少(3项,690 万元)。
为了从总体上分析重点项目的地区分布,在此采用洛伦兹曲线[13]和基尼系数[14]从不同的角度对各地区15 年间的资助金额进行分析,以衡量区域内资源配置的均衡度等问题[15]。 洛伦兹曲线越接近对角线说明分配越均衡,反之越不均衡,由图8 可见,各地区分布的差异较为明显,同时15 条曲线分布较为集中,这说明15 年间地区的差异性无明显改善。
图8 各地区项目经费的洛伦兹曲线Fig.8 Lorentz Curve of Project Expenditure in Each Region
基尼系数是一个[0,1]区间上的指数,越接近0 说明分配越均衡,越接近1 说明分配越不均衡。 按照国际惯例,区间[0,0.2)内表示分配绝对均衡,区间[0.2,0.3)内表示分配比较平均;[0.3,0.4)表示分配相对合理;区间[0.4,0.5)内表示分配差距较大,基尼系数落在区间[0.5,1]以内则表示差距悬殊。 基尼系数的计算方法很多,在此参照文献[16]来计算基尼系数:
其中,N表示地区数,μ表示N个地区资助金额的平均值,Nj表示整体的子区域个数,μj表示Nj个子区域资助金额的平均值,yij表示第j组中第i个地区的资助金额。
由式(1)可计算得到15 年间资助金额对应的基尼系数,这样针对资助金额进行分析的原因是立项项数与资助金额的的变化规律基本相同,相关度较高,二者对应的基尼系数仅存在细微差别。 由图 9 可见,15 年间,2005 年的基尼系数最小为 0.5941,2007 年最大为 0.6881,平均值为0.6612,这表明一直以来重点项目的地区分布都存在很大差异。
3.2 科研力量与重点项目的相关性
图9 2005—2019 年各地区项目经费的基尼系数Fig.9 Gini Coefficient of Project Funds of Each Region from 2005-2019
造成地区差异如此之大的可能原因是各地区的科研力量差距较大,每个地区的高等学校和科研院所数量和规模参差不齐。 为了验证其相关性,在此将立项项数和金额与“985”高校、“211”高校、“双一流”高校和科研院所的数量进行相关性分析,首先利用极差平移变换对数据进行无量纲处理,然后对处理后的数据绘制矩阵散点图。 由图10 可见,立项项数与“211”高校和科研院所数量的相关度较高,“985”高校和“双一流”高校数次之。
为了从量化的角度描述其相关性,在此计算变量之间的相关系数,计算公式为
图10 重点项目的立项数据资助金额与科研单位数量矩阵散点图Fig.10 Project Approval Data and Funding Amount of Key Projects and Scatter Diagram of Number of Research Institutions Matrix
其中,ρ表示向量(X1,X2,…,Xn)和 (Y1,Y2,…,Yn) 的相关系数,n表示样本容量。
利用式(2)计算得到立项项数与“985”高校、“211”高校、“双一流”高校和科研院所4 类科研单位数量的相关系数依次为0.9132、0.9635、0.9148 和0.9707;而资助金额与其的相关系数依次为 0.9150、0.9643、0.9160 和 0.9694。 计算结果表明,立项项数和资助金额都与4 类科研单位数量存在高度相关性。 实际上,重点项目的分布大都集中在重点科研单位,这与文献[8]的研究结果较为类似。 图11 为2017—2019 年重点项目资助总经费6000 万元以上(恰为排名前15)的依托单位分布,其中年平均资助金额6000 万元的单位有5 个,分别是北京大学、浙江大学、复旦大学、上海交通大学和清华大学;南京大学和中国科学技术大学的年平均资助经费超过了3000 万元。这些依托单位所在地区的重点项目分布排名基本都在前列(表2),进一步说明了重点项目的地区分布很大程度上依赖于重点科研单位的地区分布。
图11 2017—2019 年总经费6000 万元以上的依托单位分布Fig.11 Distribution of Supporting Units with a Total Expenditure of More than 60 Million Yuan in 2017-2019
3.3 经济发展与重点项目的相关性
重点项目的地区分布差异大、分布不均衡,还可能与地区经济、社会发展有着密切的关系,而GDP 是衡量经济发展的重要指标。 鉴于此,利用回归分析的方法,对重点项目与GDP 的依赖程度进行分析。 以N表示立项项数,M表示资助金额,G表示GDP 年度数据,经过数据分析与数值试验,发现lnN和lnM均与lnG存在线性关系,具体模型为
其中,ε和ξ均表示回归模型中的残差,且都服从正态分布。
使用最小二乘法求解回归模型,并代入数据(以北京为例),得到了回归系数的无偏估计值。为了描述模型的正确性和精确性,对模型进行了验证。 由图12 可见,两个模型的拟合效果均较好,残差几乎都在置信区间以内。
下面将进行进一步分析和验证。 对于式(3)有
图12 回归直线与残差图Fig.12 Regression Lines and Residuals Plot
对式(4)有
相应的判定系数r22=0.9564 ,检验统计量F2=263.5208> F0.05=4.7500 ,概率P2=0.1569×10-7<0.05 ,残差的方差δ2=0.1448×10-4,表明模型的显著性高,拟合效果较好。
文献[12]中提到区域经济发展水平是影响科技资源空间分布的重要因素,在此也得到了的同样的结论,地区经济的发展与科技的发展是相辅相成的。
4 结论与建议
本文从数据统计分析的角度对2005—2019年国家自然科学基金重点项目的总体态势与发展趋势、学科分布特征、研究人员情况和资助地区分布与演变情况等进行了定量分析。 主要得到以下结论:
1)立项项数与资助金额持续增长,资助强度不断加大。 国家自然科学基金重点项目总体发展态势良好,立项项数与资助金额的年平均增长率分别为7.08%和12.88%。 平均每项的资助金额增幅明显,基本与“五年规划”同步,呈现跳跃式增长的趋势。
2)医学科学部持续领跑,民生大计备受关注,取之于民用之于民。 生命科学部和医学科学部的相关学科领域的发展关系到整个国家医疗水平的提高。 为了更好地关注民生,不断提高人民群众健康保障水平,促进经济和社会全面协调可持续发展,重点项目对生命科学部和医学科学部的支持持续跟进,近10 年,其立项总项数与资助总金额均领先于其他科学部。
3)研究人员结构稳定,年富力强,分布特征明显;人才培育跟进,研究生比例递增。 重点项目主持人的平均年龄服近似从均值为50 岁,标准差为0.84 岁的正态分布。 项目组成员的构成中高级职称人员与博士研究生占比60%,高层次人才持续领航;博士后、博士研究生和硕士研究生占比近60%,人才梯队持续跟进,后续力量储备充足。
4)资助地区分布差距较大,科研力量分布悬殊。 重点项目资助的地区分布不均衡,主要集中在一些重点科研单位较多的地区,如北京、上海、江苏、广东、湖北、陕西和浙江等地区。 这些地区有着高等教育发达、辖区内科研院所较多的共同特点。 同时重点项目资助的地区分布与各地区的经济、社会发展相关性高。
为各科研单位更好地组织实施项目申报科学基金,国家自然基金委员会完善科研项目管理措施,各级政府更好地进行科研管理和部署,本文提出以下建议:
1)重视基础研究,积累原创性基础研究成果,促进科技全面可持续发展。 一个时代的进步和国家综合国力的提升,首先在于基础研究中取得突破性进展。 基础学科的发展,对于整个学科体系来说都有着重大意义,既是理论依据,也是技术支撑,例如众多工程技术问题其本质上都是数学问题,工程技术上的难题往往在于数学上难以攻克。 基础科学研究都具有厚积薄发的特点,要提高对基础科学研究的支持力度,鼓励广大基础科学领域的研究人员树立十年磨一剑的匠心精神,潜心研究,多出原创性的基础科学研究成果。 同时要在重大工程技术问题的转化与凝练上多下功夫,揭示科学问题的本质,实现多学科交叉融合,努力探索基础科学应用新领域。
2)进一步探索差异化学科管理方式,推动学科布局与资助的精细化管理。 统一化的学科资助政策与管理方法不利于各学科更好更快发展。应深入分析学科特点和规律,制定更精确的学科资助政策。 在学科结构的布局与调整上实施基础理论研究与学科应用研究相互贯通,评议方式的变革上实施差异化和精确化,资源配置优化等方面不断探索,持续推进管理方式的创新。
3)加强地区间交流合作,深化各地区科技协同创新,实现多地区协调发展。 由于重点项目的地区分布差距较大,因此有必要针对现状,努力扶持边远地区、少数民族地区和科学基础薄弱地区。 各地区间努力开展重点领域核心技术的深度合作研发,以此促进落后地区更好更快发展。深度开发服务地区经济、社会发展的基础科学课题,加强科技成果转移转化等方面的地区合作,促进经济、社会全面协调可持续发展,使落后地区走上良性循环的道路。 发挥科学研究项目在人才培育方面的优势功能,稳定和凝聚优秀科研人才,改善因区域经济落后而导致的人才流失。进一步强化地区基金,努力消除科学基金项目地区分布的马太效应带来的负面影响,最终实现多地区协调发展。