基于Almon与SBM-BP的长江经济带基础研究绩效评估
2020-02-05王嘉璇
顾 平, 王嘉璇
(1.江苏科技大学 经济管理学院,江苏 镇江 212100;2.镇江市创新人才发展研究院,江苏 镇江 212000)
1945年,Bush著名的报告《科学——无止境的前沿》中强调基础研究不仅是科技发展的先导,而且是经济发展的最初源头,基础研究首次作为科学政策术语被提出[1]。2016年,中共中央、国务院发布的《国家创新驱动发展战略纲要》指出,科技创新是提高社会生产力和综合国力的战略支撑,科技创新能力是国家力量的核心支撑,面对经济发展进入新常态的现状,必须创新培育新的经济增长点。2018年,国务院发布的《关于全面加强基础科学研究的若干意见》指出,强大的基础科学研究是建设世界科技强国的基石,要充分发挥创新作为引领发展第一动力的作用,瞄准世界科技前沿,强化基础研究,着力实现前瞻性基础研究、引领性原创成果重大突破,全面提升创新能力,全面推进创新型国家和世界科技强国建设。
政府相继出台的政策屡次提到基础研究对于创新与科技的重要性,可见基础研究不仅关乎国家创新能力的高低,更关乎一国科技实力的强弱,是由“科技大国”向“科技强国”转变的重要保障。近年来,我国对基础研究的经费投入日益增加,2009-2018年基础研究经费由270.3亿元增长至2019.4亿元,基础研究经费占研究与试验发展(以下简称R&D)经费比重由4.66%增长至5.54%。在国家对基础研究不断重视下,基础研究产出取得了显著成效,但日益增加的产出究竟是由经费投入增加所带来的,还是由经费使用效率的提高所带来的却不得而知,缺乏系统的体系对基础研究进行绩效评估。
长江经济带自2016年《长江经济带发展规划纲要》批准后正式上升为国家战略。长江经济带经济发展速度快,科教事业发达,拥有较强的人力资源优势。2018年,长江经济带人口占全国40%,GDP占全国45%,基础研究经费占总经费37%,高校占全国40%,是今后我国经济增长潜力较大的区域。这决定了长江经济带在推动全国经济高质量发展、实现“科技强国”进程中承担无可替代的功能和分工[2]。因此,对长江经济带进行基础研究绩效评估具有重要意义。基于此,笔者以2014—2018年为研究区间,对长江经济带基础研究进行绩效评估。
一、 文献综述
目前,已有不少学者对基础研究绩效评估进行了研究,并取得了一定成果。Martin等最早提出基础研究绩效评估的四个维度:科学维度、教育维度、技术维度、文化维度[3]。Barry等在对美国能源部资助的28个基础研究项目分析后得出基础研究不是以直接的技术应用为目标,但专利、软件等技术成果也常常是基础研究的产出[4]。李兴国等从学术成果、奖励与专利、人才培养和诱发项目四个方面出发构建省级自然科学基金指标体系,运用BP神经网络对相关数据进行处理,验证了所构建模型的可行性[5]。范旭等以基础研究经费与人员全时当量为投入,科技奖励、发明专利申请受理数与授权数、SCI收录论文数为产出,运用层次分析法(以下简称AHP)研究广东和江苏的基础研究能力,发现广东基础研究能力较弱[6]。花芳等通过文献计量法评估清华大学航天航空学院5个研究方向的基础研究绩效水平,发现清华大学固体力学研究成果的影响力小于哈佛、剑桥等高校,结果获得了评估对象的认可[7]。姜群构建以基础研究经费与人员为投入,科技论文、科技著作、国家自然科学基金项目数和有效发明专利为产出的指标体系,运用数据包络分析(以下简称DEA)和Malmquist分析我国30个省市基础研究效率,发现仍有一定提升空间[8]。何郁冰等以人员与经费投入强度、产学研合作、产业结构、基础研究规模、政府重视程度、开放度等相对变量指标,运用超效率(super)——基于松弛变量的测量模型(以下简称SBM)和探索性空间数据分析方法研究了中国30个省市基础研究效率的空间分布特征,研究发现上述方面存在较大的发展空间[9]。
综上所述,可以发现: 针对基础研究绩效评估的投入指标主要是经费与人员,产出指标基本上是从Martin所确定的四个维度出发,根据研究对象与研究方法的不同对指标进行适当完善;研究对象主要集中在项目、高校、省级乃至全国等,但对国家重点发展区域(如长三角、珠三角、长江经济带、“一带一路”等)的研究相对缺乏;研究方法较为广泛,可行性较高的方法主要是DEA、AHP、BP神经网络和文献计量法等,DEA由于不需要设定生产函数、参数及权重而被广泛应用,但多数学者考虑到传统DEA的局限性,大多对DEA进行了完善。此外,值得重视的是,多数学者判断基础研究滞后期时多是根据前人的研究或主观判断,甚至忽视滞后期的影响。这不仅削弱了计算结果的客观性,更不能反映真实的绩效结果。
针对基础研究滞后期的研究,国内外学者鲜有涉及,但是针对科研方面滞后期的判断已有部分学者开展了相关研究。目前,使用较为广泛的方法主要有定性分析、回归分析方法、分布滞后模型、向量自回归模型等,也有部分学者使用了灰色关联分析法或GM(1,1)等。根据国内外学者的研究,科研方面的滞后期大多集中在2~4年。考虑到主观因素的影响,定性分析已不常使用;向量自回归模型需要估计的参数较多,适合样本容量较大的情况,若样本容量较小,参数估计的误差极易变大,因而其使用具有局限性;回归分析及分布滞后模型都是针对有限滞后分布问题,能最大限度地节约自由度,避免多重共线性的干扰,因而使用最为广泛。
笔者通过借鉴学者们的研究确定基础研究绩效评估指标体系,以Almon多项式确定指标体系滞后期,在此基础上选取2014年数据为投入数据,2018年数据为产出数据,结合SBM模型与BP神经网络方法对长江经济带基础研究进行绩效评估。Almon多项式在确定滞后期方面具有独特优势,它能减少待估参数的个数,解决多重共线性问题,保证参数估计中的自由度。非径向DEA-SBM模型考虑到松弛变量对计算结果的影响,弥补了传统DEA的不足,可以直接处理决策单元(以下简称DMU)投入冗余及产出不足问题,最大化提高改善程度;而BP神经网络方法具有极强的非线性映射能力,不受指标数量限制,因而可以扩大指标的选取范围,还可以对多个同时有效的DMU进行进一步区分。上述方法的有机结合不仅充分发挥了Almon多项式、SBM与BP神经网络各自的优势,还弥补了DEA在绩效评估中的不足,进而使计算结果更具有区分度和可靠性,为长江经济带基础研究的进一步发展提供了更为科学的参考。
二、 基础研究绩效评估指标体系的构建
(一) SBM指标体系
笔者以长江经济带11个省市为研究对象,根据DMU为投入指标、产出指标两倍之和选取合适的指标数量,最终选取的指标总数为6个。借鉴前人学者的研究及数据可获得性,同时考虑到基础研究的广泛性,笔者选取的SBM指标体系见表1。投入指标选取基础研究内部经费与基础研究人员全时当量,产出指标选取SCI数、发明专利授权数、科技奖励数(国家自然科学奖和技术发明奖)和研究生培养数(全日制研究生毕业人数)。
表1 SBM指标体系
(二) BP神经网络指标体系
SBM指标体系仅为绝对指标,然而不同省市的实际发展水平相差甚远,绝对指标下的绩效结果往往不能体现省市的真实水平。因此,构建BP神经网络指标体系时参考前人学者的研究[10-11],从配置比例和投入强度两方面选取相对指标:在配置比例上,选取基础研究内部经费/R&D内部经费、基础研究人员全时当量/R&D人员全时当量;在投入强度上,选取基础研究内部经费/GDP、基础研究人员全时当量/常住人口、人均基础研究经费。由于BP神经网络仍需要相应的期望输出,因而选取SBM绩效结果作为BP神经网络的产出指标。具体见表2。
表2 BP神经网络指标体系
三、 实证分析
(一) Almon滞后分析
Almon 于1965年提出Almon多项式,其通过多项式转换,新模型变量个数少于原模型,减少待估参数个数,解决多重共线性问题,保证参数估计中的自由度。笔者以SBM指标体系的数据作为分析数据,以其滞后期作为基础研究滞后期。
1.标准化处理
SBM指标体系投入产出数据量纲并不一致,无法直接同时进行比较,对数据进行对数标准化处理,可得到指标趋势。由图1可知,基础研究经费与SCI的发展趋势较为一致,因此笔者选取二者进行滞后分析,以其滞后期作为基础研究滞后期。
图1 标准化后的指标趋势
2.ADF单位根检验
利用Almon进行滞后分析需要保证时间序列数据的平稳性。因此,笔者运用EVIEWS对基础研究经费和SCI进行ADF单位根检验后发现,基础研究经费二阶后拒绝原假设, SCI原序列含趋势项和截距项下拒绝原假设,均小于显著水平5%的ADF临界值,都为平稳序列,可以进行Almon滞后分析。具体见表3。
表3 ADF单位根检验结果
3.滞后分析
笔者运用EVIEWS对数据进行滞后分析,根据CROSS命令初步判断滞后长度s为2,则多项式次数m取1。依次增加滞后长度,根据运行结果发现:当s为4时,AIC和SC同时取得最小值,可知滞后期为4,滞后分析结果见表4。
表4 Almon滞后分析结果
(二) SBM模型绩效评估
Charnes和Banker等人先后提出CCR和BCC模型,由于其不需要设定生产函数、参数及权重,得到的计算结果受主观因素影响较少,计算结果更具客观性,是评估具有相同目标的多投入多产出绩效问题的有效方法,因此得以广泛运用。但是,传统的CCR和BCC模型都为径向模型,忽视了松弛变量对计算结果的影响,计算松弛变量是同比例减少投入或扩大产出,得到的结果可能不够精确。为此,Tone提出了基于松弛变量的SBM模型[12],可以最大化提高改善程度。因此,笔者运用SBM模型进行第一部分的绩效评估。
根据滞后分析得到滞后期为4年,以2014年数据为投入,2018年数据为产出。笔者运用DEA SOLVER PRO软件,基于投入角度下的规模报酬可变的SBM模型进行绩效评估,绩效结果见表5。由表5可知,长江经济带区域整体绩效结果较好,11个省市中7个省市绩效值均达到有效,仅4个省市绩效结果非DEA有效。非DEA有效省市分别为四川、安徽、云南和贵州,平均值为0.595 8。除贵州外,其余3个省市绩效值均低于平均值,其中,四川省绩效值最低,仅0.452 7。
表5 长江经济带基础研究的绩效评估结果
为了进一步分析非DEA有效省市的原因,对非DEA有效省市的生产前沿面进行投影分析,投影分析见表6。笔者通过分析发现:
表6 非DEA有效省市的生产前沿面投影分析
在投入方面,4个省市在经费与人员上都存在不同程度的冗余。其中,四川的经费与人员冗余程度最为严重。四川应在原有基础上减少63.5%的经费投入与46.0%的人员投入。而安徽应减少46.1%的经费投入与41.3%的人员投入,云南应减少42.2%的经费投入与42.1%的人员投入,贵州应减少28.3%的经费投入与14.0%的人员投入。
在产出方面,4个省市的各项产出也存在不足。其中,贵州的产出情况最为严峻。贵州除发明专利授权数应增加16.2%的产出外,其余各项产出指标增幅都应在90%以上;四川应在原有基础上,增加44.7%科技奖励的产出与2.5%研究生培养的产出;安徽应在原有基础上增加22.2%SCI的产出;云南应在原有基础上增加19.7%SCI的产出与33.1%发明专利授权数的产出。
(三) BP神经网络绩效评估
BP神经网络由Rumelhart等于1986年提出,是一种基于误差反方向传递算法的多层前馈网络,是目前使用最为广泛的神经网络之一。运用BP神经网络进行绩效评估不需要确定指标的权重,可以精确拟合指标体系中的隶属关系,根据相关模型进行模拟,再现评估专家的经验和知识,计算结果也不受指标数量的限制。但BP神经网络方法需要训练样本及相应的导师值,此过程仍然需要借助其他方法辅助评估。因此,笔者以SBM模型为导师值,通过构建新的投入指标,对输出结果进行更为精确的调整,使得计算结果更具有区分度和可靠性,从而弥补SBM模型的不足。
[i_train,ps_input]=mapminmax(I_train,0,1); %数据归一化
i_test=mapminmax('apply',I_test,ps_input);
[o_train,ps_output]=mapminmax(O_train,0,1);
net=newff(i_train,o_train,[12],{'logsig','purelin'},'traingdx'); %创建网络
net.divideFcn=”;
net.trainParam.epochs=1000; %设置训练参数
net.trainParam.show=50;
net.trainParam.goal=0.001;
net.trainParam.lr=0.01;
net=train(net,i_train,o_train); %训练网络
y_train=net(i_train);
y_test=sim(net,i_test); %仿真测试
Y_train=mapminmax('reverse',y_train,ps_output); %数据反归一化
Y_test=mapminmax('reverse',y_test,ps_output);
E_train=O_train-Y_train; %误差
E_test=O_test-Y_test
根据图2可知,当网络训练到358步时,训练误差达到期望误差,网络停止训练。期望输出与实际输出的回归分析的相关系数R=0.997 09,具有较高关联度。为了验证模型的适应性,笔者将测试样本数据输入训练好的网络中进行验证,训练样本与测试样本的误差分析见表7。可以发现,训练样本和测试样本的误差都在接受范围之内,误差最大值为0.033 7,最小值为-0.000 5,平均误差为0.011 7,误差在期望误差范围之内,数据运行结果达到目标要求,建立的网络具有较强的泛化能力。
图2 BP神经网络运算结果
表7 长江经济带基础研究的误差分析与绩效评估结果
(四) 绩效评估结果与分析
笔者在SBM模型的绩效结果基础上,运用BP神经网络方法对绩效结果进行二次评估,发现多数省市的实际输出较期望输出而言都有所提高,排名由高到低依次为浙江、江西、重庆、湖南、上海、江苏、湖北、贵州、云南、安徽和四川。可见,经济发展水平较高的省市绩效结果较好,但并不是完全正相关。在两次绩效评估中,长江经济带平均绩效均较为稳定,SBM模型评估数据为0.853 0,BP神经网络评估数据为0.850 4,说明数据运算结果具有较高的稳定性及可靠性。值得注意的是,绩效结果有效或接近有效的省市主要集中在长江三角洲城市群和长江中游城市群,浙江在两次评估中绩效都为最佳;成渝城市群在两次绩效评估中绩效结果都较为不理想,四川在两次评估中都位于最低,有关部门应引起重视。为了找出绩效差异的内在原因,应分别对浙江和四川两省绩效情况进行分析。
浙江作为长江经济带与长三角区域的重要省份,在承接国家发展战略的同时也不断发挥自身的优势,为加快高质量发展进程、推进创新型省份建设,主要从人才引进、投入渠道与评价机制等方面为基础研究的发展提供了保障。
第一,围绕重点产业和科技创新重点领域,引进与培养一批具备自主创新能力的领军人才及学术带头人,通过151人才工程、百千万科技创新人才工程、“千人计划”等政策引进海内外高层次人才。此外,建立产权激励制度、科研院所激励机制,设立“浙江省杰出创新人才奖”奖励有突出贡献的人才;改善工资分配方式,激发人才活力与维护人才的合法权益。
第二,引导社会各界加大对基础研究的投入。在政府层面上,提倡县级以上政府加大支持力度,鼓励社会各界与政府合作建立联合基金,投入5 000万以上的联合资助可给予基金冠名权;在社会层面上,鼓励企业参加基础研究的投入研究,对资助基础研究的企业实施税前扣除政策。
第三,健全项目与人才评价机制,针对不同项目与人才应采取不同的评价机制。如,突出原始创新导向的项目以同行评议为主;自由探索类和实施周期3年以下的目标导向类项目不作过程评价;明确各类人才分类评价标准,高校、科研院所人才侧重考察学术能力、高水平论文和著作发表等;企业人才侧重考察技术创新、成果产业化、专利获取等。
相比之下,四川在基础研究领域距离江浙沪等发达省市有较大差距,仍处于“跟跑”状态。笔者根据统计指标分析发现,2009—2018年四川在基础研究经费与基础研究人员全时当量投入上均位于11个省市中的第3名,仅次于江苏。但产出情况却不容乐观,各项产出在11个省市处于中等或偏下水平。根据对SBM模型绩效结果进行的投影分析发现,四川绩效不佳的主要原因在于经费与人员的冗余以及科技奖励与研究生培养的不足。其中科技奖励尤为不足。这说明四川在具有先进性、创造性的重大科学发现与重大技术发明方面较为欠缺,存在投入方面资源利用率低、产出方面成果转化率低等问题。2019年,四川省政府召开首届基础研究工作会议,其发布的《四川省基础研究发展白皮书》指出四川基础研究存在重大原创成果较少、研究队伍建设仍需加强、成果转化不足等问题,与本文的研究结果极为相符。为提升四川基础研究绩效,笔者提出三点建议:第一,建立项目评价机制,加强资源的利用程度,尽可能减少资源借着研究的旗号被浪费;第二,加强产学研合作,通过财政政策引导和鼓励企业参与基础研究项目,加快研究成果转化为生产的速度;第三,尽可能容许科研的失败,健全激励制度与保障措施,为科研人员开展基础研究提供更为宽松的学术氛围。
四、 研究结论
笔者运用Almon多项式确定基础研究指标体系的滞后期,以2014年数据为投入、2018年数据为产出,将SBM模型与BP神经网络方法相结合,以此评估长江经济带区域基础研究绩效,有效解决了滞后期问题以及评估模型的科学性和有效性问题。笔者得出研究结论如下:
第一,SBM模型下长江经济带区域基础研究绩效水平总体较好,11个省市中有7个省市达到有效状态,虽然各项投入与产出都存在冗余或不足,但绩效无效省市主要原因在于基础研究经费冗余与SCI产出不足。
第二,运用BP神经网络对SBM模型的绩效结果进一步修正与完善,发现绩效结果较好的省市主要为经济发达地区。两次评估绩效均值均在0.850 0~0.854 0,较为稳定,说明计算结果较为可靠。
第三,综合两次评估结果发现,长江经济带基础研究绩效评估结果整体较好,绩效结果较好的省市主要集中在长江三角洲城市群和长江中游城市群,而成渝城市群绩效结果却相形见绌。贵州、云南、安徽和四川在两次评估中仍然处于非有效状态,其中四川在两次评价中都为最低,应该引起当地有关部门的高度重视。
第四,长江经济带基础研究绩效仍有较大的提升空间,提升绩效的主要方向是把控基础研究经费与增加SCI产出,主要对象是成渝城市群,二者是提升长江经济带基础研究整体绩效的关键。