国家自然科学基金数据分析与管理策略研究
——以昆明理工大学2012-2021年数据为例
2022-11-10李贞阳刘洪喜王志浩褚重明戚满婷
张 莹,王 奇,李贞阳,刘洪喜,王志浩,褚重明,戚满婷
(1.昆明理工大学 科学技术院,云南 昆明 650500; 2. 红河学院 科学技术处,云南 蒙自 661100;3.昆明理工大学 材料科学与工程学院,云南 昆明 650500)
0 引 言
国家自然科学基金(以下简称NSFC)设立于1986年,历经30多年的发展,已逐步成为我国基础研究和应用基础研究的重要渠道,也是高校获得基础研究项目经费的主要来源之一[1-2],对高校的基础研究、学科建设、人才培养、地方经济发展、特色学科与特色研究等起到了极大地促进和支撑作用[3-4].NSFC的批准资助数量在一定程度上体现了高校基础研究水平,是衡量高校创新能力和水平的重要标志.
昆明理工大学是一所以工为主,理工结合,行业特色、区域特色鲜明,多学科协调发展的综合性大学,隶属国防科技工业局和云南省人民政府共建高校[5].NSFC支持了学校的基础研究、应用基础研究、技术转移与转化及微小型科技企业孵化,在学校人才培养、学科建设、科技创新等方面发挥着重要的支撑作用.
本文以昆明理工大学2012-2021年集中受理期间NSFC资助情况为例,综述了NSFC申请与资助的整体情况、项目类别、学部、申请人学位和年龄、累计获批数等,利用多元线性回归和边际产出方法对统计数据作了进一步挖掘,结合2022年NSFC实际资助情况的验证结果,探索了NSFC的发展规律,并提出了相应的管理策略,为学校今后的NSFC发展提供了新的发展思路.
1 2012-2021年NSFC申请与资助总体情况
1.1 申请与资助情况
昆明理工大学2012-2021年NSFC项目集中受理期间共申请 7 846 项,获批 1 403 项,科研经费 58 361.42 万元,平均资助率17.90%(低于全国平均值21.75%).近十年来总申请数(项)、批准资助数(项)、实际资助率、全国平均资助率等详细统计结果如图1所示.由图1可知,2012-2015年,学校NSFC项目的申请数、批准资助数、资助率均呈增长态势,2012-2013年批准资助数实现了大幅增长,2014年与2013年持平,到2015年,批准资助数及资助率均达到峰值,2016年后,批准资助数、资助率开始回落,2016年为127项,2017-2021年批准资助数基本保持稳定,均数为139项.
图1 昆明理工大学2012-2021年NSFC项目申请与资助情况汇总Fig.1 Specific changes of NSFC project applications and funding in KUST from 2012 to 2021
1.2 项目类别情况
2012-2021年获批的 1 403 项中,地区科学基金项目(以下简称地区项目)955项,占资助总数的68.1%;面上项目137项,占资助总数的9.8%;青年科学基金项目(以下简称青年项目)286项,占资助总数的20.4%;3类项目共计 1 378 项,占资助总数的98.3%,是我校获资助项目的主要类别.其他类别的项目25项,占资助总数的1.8%.其中,国家杰出青年科学基金项目2项,重点项目10项,联合基金项目2项,国际合作与交流项目2项,优秀青年科学基金项目3项,专项基金项目6项.不同类型项目的资助数和占总资助数的比例情况如图2所示.
图2 昆明理工大学2012-2021年批准资助的NSFC项目类别分布Fig.2 Category distribution of funded NSFC projects in KUST from 2012 to 2021
2012-2021年地区、面上、青年项目批准资助数及批准资助率如图3和图4所示.由图4可知,地区项目、青年项目、面上项目的平均资助率分别为21.4%、15.6%和11.8%.地区项目批准资助数最多,但资助率呈下降趋势,资助数相对稳定;面上项目和青年项目增长趋势不甚明显,资助总数亦比较稳定.
图3 昆明理工大学2012-2021年地区、面上、青年项目批准资助数Fig.3 Funded NSFC projects of regional, youth and general programs in KUST from 2012 to 2021
图4 昆明理工大学2012-2021年地区、面上、青年项目资助率Fig.4 Funded rates of NSFC projects of regional, youth and general programs in KUST from 2012 to 2021
1.3 学部分布情况
2012-2021年获资助的 1 403 项基金项目集中分布在除交叉学部外的其他8个学部.其中,工程与材料科学部584项,占资助总数的41.6%;化学科学部148项,占资助总数的10.5%;信息科学部146项,占资助总数的10.4%;生命科学部、地球科学部、医学科学部、数理学部、管理科学部资助数分别为126、121、107、100、71项,占批准资助总数的9%、8.6%、7.6%、7.1%、5.1%.各学部具体的申请及批准资助情况如图5所示.
图5 昆明理工大学2012-2021年各学部NSFC项目申请及批准资助情况Fig.5 Specific changes of NSFC project applications and funding in each division in KUST from 2012 to 2021 year
1.4 人员分布情况
图6是获资助项目负责人的学位分布情况.从获批项目负责人的学位分布来看,2012-2021年间,博士学位人数平均占比95%,2021年高达99%,硕士、学士学位人数平均占比5%.可见,具有博士学位的项目负责人在NSFC项目的获批上具有显著竞争优势.
图6 昆明理工大学2012-2021年NSFC获资助项目申请人学位占比Fig.6 Degree proportions of NSFC funded applicants in KUST from 2012 to 2021
图7是获资助项目负责人的年龄分布情况.从获资助项目负责人年龄分布来看,2012至2013年,项目负责人平均年龄大幅下降,主要原因为2013年获批青年项目数增加(如图3所示),导致平均年龄下降.2013-2017年平均年龄开始逐步上升,原因为NSFC项目竞争较为激烈,前期研究基础好的年长申请人更容易获得资助.2017-2018年小幅回落后,2019-2020又逐步上升.总体而言,2012-2021年间,获批项目的平均年龄为39岁,40岁以下人员平均占比64%,项目负责人年龄结构趋向于以中青年为主的稳定格局.
图7 昆明理工大学2012-2021年NSFC获资助项目申请人年龄分布Fig.7 Age composition of NSFC funded applicants in KUST from 2012 to 2021
图8是近十年来项目负责人累计获资助数情况.从项目负责人累计获批数来看,2012-2021年间,892人获批了 1 403 项NSFC项目,人均1.57项.其中,获批1项的有523人,占比为58.6%,获批2项的有250人,占比为28.1%,获批3项的有102项,占比为11.4%,获批4项及以上的有17人,占比为1.9%.可以看出,NSFC项目对科研人员的成长和发展具有基础支撑作用.截止2021年12月31日,学校在职的高职和具有博士学位人员共计 1 731 人,其中,共计853人获批了 1 592 项NSFC项目.从未主持过NSFC项目的共计878人,占总人数的50.72%.
图8 昆明理工大学2012-2021年 项目负责人累计获资助数Fig.8 Cumulative NSFC funded projects of individual applicants in KUST from 2012 to 2021
2 多元线性回归分析
从定性分析的角度来讲,NSFC项目获批受到多种因素的影响,诸如项目类别、所属学部、申请者科研能力、申请书质量等.鉴于申请者研究水平等难以量化,且地区、面上、青年项目批准资助数占资助总数的98.3%,其他类型项目虽然对反映高校科研水平具有重要意义,但批准资助数过少,为此,本文主要根据地区、面上、青年项目申请与批准资助的变化情况进行多元线性回归分析,以探索学校NSFC项目的申请与批准资助规律,为后期科研管理工作的开展提供可靠的参考资料和科学的决策依据,使未来的管理工作和决策过程更科学、合理、有效[6].
昆明理工大学2012-2021年地区、面上、青年项目申请数及批准资助数如表1所示,利用Stata 16.0建立多元线性回归模型[7-8]如式(1):
yT=β0+β1×xR+β2×xS+β3×xY+μ
(1)
式中:yT为被解释变量,代表地区、面上、青年项目批准资助总数;xR、xS、xY为解释变量,分别代表地区、面上、青年项目的申请数量;β0为常数项,β1、β2、β3分别为解释变量xR、xS、xY对应的回归系数;μ为扰动项.
表1 昆明理工大学2012-2021年地区、面上、青年项目申请数及批准资助数
对该理论模型进行OLS(最小二乘法)估计,得到多元线性回归方程如式(2):
(2)
对模型进行多重共线性检验[7],得到解释变量xR、xS、xY对应的方差膨胀因子(VIF)分别为1.80、1.41和2.01,VIF均小于10,说明不存在多重共线性.
为确定解释变量间的相关性,对模型进行相关性检验[7],得到相关系数矩阵如式(3):
(3)
由式(3)可知,青年项目与面上、地区项目间均呈现负相关关系.其中,青年项目与地区项目间相关系数对应p值为 0.038 2,小于给定显著性水平α(0.05),说明青年项目与地区项目呈显著负相关关系.
通过作残差平方与批准资助总数间的散点图,初步判断该模型不存在异方差[7].进一步对模型进行Park和White检验,得到其对应的p值分别为 0.947 3 和 0.382 7,表明模型不存在异方差.
由于该模型仅将地区、面上、青年项目申请数作为解释变量,存在影响被解释变量的其他难以量化的解释变量均被纳入扰动项.因此,需要对总体回归模型中扰动项随机变量间的自相关关系进行检验.通过对扰动项进行Breusch-Godfrey检验[7],得到p值为 0.771 8,故接受原假设,即不存在自相关性.
经观察发现,2015年NSFC项目批准资助数远高于其他年度,说明该样本可能存在极端观测值.通过对观测数据进行分析得到回归系数的影响力值(leverage)[7]如表2所示.
表2 回归系数的影响力值
由表2可知,回归系数的最大影响力值仅为平均值的1.51倍,初步判断观测值对回归系数无显著影响.为得到稳健的对比结果,将全样本(Full sample)及删除2015年度观测值的子样本(Subsample)进行回归,得到观测值对应的影响力值如表3所示.其中,子样本最大影响力值仅为平均值的1.43倍.说明采用全样本回归分析时,不存在高影响力的极端观测值.
表3 年度观测值对应影响力值
综合以上可知,该回归模型不存在多重共线性、异方差、自相关性和极端观测值,说明理论模型设计合理,由于存在较多的其他难以量化的解释变量(如申请者科研能力、申请书质量等),导致拟合精度不够高.
将理论模型进行无常数项处理后再次进行OLS估计[7],得到回归方程如式(4):
(4)
通过对无常数项多元线性回归模型进行多重共线性检验[7],得到解释变量xR、xS、xY对应的VIF分别为56.87、50.97和11.32,VIF均大于10,说明舍去常数项后解释变量间存在一定多重共线性,这可能是仅采集了2012-2021年的观测数据导致样本容量较小的缘故,也可能是源于遗漏变量对模型的影响[10].样本再次进行解释变量间的相关性检验,其结果与含常数项时相同.
对无常数项多元线性回归模型进行Park和White检验,其对应的p值分别为 0.819 3 和 0.328 8,表明在显著水平α(0.05)下,接受同方差假设.另外,Breusch-Godfrey检验得到p值为0.701 5,说明亦不存在自相关性.
2022年昆明理工大学面上、青年和地区的申请数量分别为146、234、585项,由式(4)可预测获资助总数为177项,相对于实际资助的183项,准确率高达97%.
综合以上可知,无常数项多元线性回归模型拟合精度很高,但其所呈现的趋势规律与原始多元线性回归结果相同,即青年项目与地区项目和面上项目间均呈负相关关系,其中,青年项目与地区项目间呈显著负相关关系,说明青年项目申请数量增加会导致地区和面上项目申请数的减少,反之亦然.由于具有青年项目申请资格的申请者亦可申请地区和面上项目,但通常,这些申请者的职称多为中职,即会受到限项政策的影响,故在申请总数不变的前提下,增加青年项目申请数势必会减少地区项目和面上项目的申请总数.另外,注意到面上项目对批准资助总数的相对贡献率较小,需进一步分析解释变量的边际效益.
3 边际产出分析
为确定地区、面上、青年项目的边际效益,定义边际产出(MP)为增加一单位要素所增加的产出[11],可表示为:
(5)
式中:Si表示第i年度的批准资助数,Ai表示第i年度的申请数.MP值为正,表明批准资助数与申请数变化趋势相同;MP值为负,表明批准资助数与申请数变化趋势相反.通过计算得到2012-2021年度地区、面上、青年项目的边际产出如表4所示.
表4 地区、面上、青年项目的边际产出Tab.4 Marginal outputs of the funded NSFC projects of regional, youth and general programs
由表4可知,地区项目的MP值于2015-2017年达到峰值,随后呈现递减趋势.面上项目的MP值变化趋势则不够明朗,2017和2021年度均出现申请数增加而批准资助数减少的现象.相对来说,青年项目的MP整体表现较好,其中2017、2018和2020年度的边际产出异常高.
根据2022年面上、青年和地区项目获资助数量(即28项、47项、108项)和式(5)可知其MP值为3.00、0.275和0.218,即地区项目的边际效益进一步降低,证明了地区项目申报数量的增加对于提升获批总数上的效能是最低的.尽管2022年青年项目的边际效益高于地区项目,但相对于大多数年份仍显逊色.相反,面上项目在2022年表现出超高的边际效益.由于面上项目多年出现负边际效益,使得整体规律不够清晰.
4 NSFC管理策略
4.1 提高申请书质量,提升整体资助率
申请书质量不高是学校NSFC项目资助率远低于全国平均资助率的主要原因.学校已从重点学院单独动员、专家个别辅导及校、院二级单位组织评审等方面进行了精心组织和周密安排,并对正式答辩前的会评项目开展模拟预答辩,由相关领域的专家对答辩内容、答辩技巧及注意事项等进行专门指导,进一步提高会评项目的批准资助率.
学校下一步工作重点应由申请量的扩增向内涵式发展转变,适当控制申请数量,进一步提高申请书质量.组织申请过程中应提倡竞争,择优申请,避免盲目申请.对于低水平研究项目,学校应做好扶持培育工作,引导项目申请者待条件成熟后再行申请[12].
4.2 调整申请结构,存量转增量
地区项目是目前学校获资助项目的主要类型,对学校吸引、稳定和凝聚人才队伍起到了积极的促进作用[13-15].但从多元线性回归和边际产出分析可知,地区项目已呈现持续性边际效益递减趋势.相对来讲,青年项目和面上项目申请数的增加对于批准资助总数的贡献率较大.鉴于青年项目与地区项目间呈显著负相关关系,因此,可适当提高青年项目和面上项目的申请数,减少地区项目的申请数.通过调整申请结构,合理分配面上、青年和地区项目申请量,可在总申请量不变的前提下将存量转为增量,实现获批数的最大化.
可借助学校“十四五”期间引才红利,鼓励青年科研人员优先申请青年项目.另外,面上项目是重大、重点等高水平项目的源头,获批数在一定程度上反映了学校较高的基础研究实力,对于提升学校基础研究水平、学科发展及青年科技人才成长等方面将发挥重要作用[12].因此,亦应鼓励具有较好研究基础的科研人员积极申请面上项目.
4.3 保持学科优势,促进学科均衡发展
工程与材料科学部批准资助数占比最大,突显了学校理工见长的学科特色及优势,但目前工程与材料科学部的批准资助数已趋于饱和.如何保证优势学科的较高资助率并稳步提升新兴学科和交叉学科的资助率,仍是今后学校科研管理工作的重中之重.
学校下一步的工作重点仍然是在继续保持理工特色的基础上,加大其他学科的人才引进力度,加强学科梯队建设,扶持新兴应用型学科,进一步缩小与传统优势学科之间的发展差距.同时,依托学校多学科优势,积极凝练学科研究方向,促进学科之间的交叉、融合和提升,冲击国家基金委交叉学部项目,为学校基础研究注入新动能.
4.4 坚持人才强校,外引内培双向发力,突破高水平项目
高级别项目获批数少,说明学校创新型科学技术人才严重匮乏,亟需培养和引进在基础研究领域锐意进取、开拓创新并取得一定成就的青年科技人员.重大研究计划项目、创新研究群体项目、国家重大科研仪器研制项目始终没有突破,说明学校缺乏领军型的科学技术人才和团队.
学校应持续深入实施人才强校战略,坚持瞄准国家重大战略需求,围绕“双一流”创建目标,汇聚海内外一流人才,持续加大领军型人才的培养和引进力度,充分调动现有高层次人才的科研积极性,使其发挥“头雁效应”,争取在高水平项目获批方面有所建树.
4.5 设立培育项目,加大项目储备
目前,高职且具有博士学位但尚未获批NSFC项目的占比超过一半.通过统计基金委历年全文反馈意见可知,未获资助项目普遍存在研究基础薄弱、科研积累不足、申请书质量不高等问题[16].
鉴于此,学校可通过设立培育项目,支持尚未获批项目的申请者深入挖掘科学问题并开展一些前瞻性和探索性的基础研究.通过为更多科研人员提供前期研究基金,进一步激励科研人员的创新思维,逐步提高项目竞争力,形成学校的项目储备库,从而为NSFC项目的持续发展储备力量.
5 结 论
通过对昆明理工大学2012-2021年集中受理期间NSFC项目的申请与资助情况进行统计,基于多元线性回归和边际产出方法分析,探索了NSFC项目申请和批准资助规律:青年项目与地区项目和面上项目间均呈现负相关关系,地区项目的边际效益呈现持续性递减趋势.研究结果在2022年NSFC资助情况中得到很好的验证,其中,所建立的多元线性回归模型对获批项目的预测准确率高达97%.通过对近十年间NSFC申请与资助情况的全面分析和数据挖掘,认识到了NSFC项目发展过程中存在的不足.结合学校现状,提出了相应的对策和建议.在申请数量稳定的前提下,应优先提高面上项目和青年项目的申请量,从而提升整体资助率.同时,在保持传统优势学科的基础上,注重交叉学科和新兴学科的培育和发展.通过设立校内培育项目,大力支持尚未主持过NSFC项目的申请者进行前期科研积累,帮助其实现零的突破.另外,需多方施措,全面提升各类型NSFC项目申请书的质量.模型构建和分析结果可为“十四五”及今后一段时期学校深入实施“学术立校,人才强校,质量兴校”战略及人才引培、学科发展、NSFC项目申请等方面的决策提供科学依据.