基于主成分分析-支持向量机的我国农业科技创新能力评价
2019-09-19秦薇万忠康乐
秦薇 万忠 康乐
摘要 針对目前我国在农业科技创新能力评价中时间维度研究缺失、指标选取过多、指标相关性不足的现状,该研究采用主成分分析法,将影响农业科技创新能力的众多因素进行降维,从而找出重要影响因素作为支持向量机模型的输入层,建立精度更高、数据需求量更少、计算时间更短的农业科技创能力评价模型。运用该模型得到我国2005—2016年农业科技创新能力水平,得出农业科技创新能力由投入产出以及研发能力共同决定。最后,根据该研究结果提出提升我国农业科技创新能力的相关建议。
关键词 农业科技创新;评价指标;主成分分析;支持向量机
中图分类号 S-058文献标识码 A
文章编号 0517-6611(2019)16-0245-05
doi:10.3969/j.issn.0517-6611.2019.16.070
开放科学(资源服务)标识码(OSID):
Evaluation of Innovation Ability of Agricultural Science and Technology in China Based on Principal Component Analysis and Support Vector Machine
QIN Wei1,2,3,WAN Zhong1,3,KANG Le1,3 (1.Institute of Agricultural Economics and Rural Development,GAAS,Guangzhou,Guangdong 510640;2.Agricultural Information Institute of CAAS,Beijing 100081;3.Key Laboratory of Urban Agriculture in South China,Ministry of Agriculture,Guangzhou,Guangdong 510640)
Abstract In view of the current situation of lack of time dimension research,excessive selection of indicators and insufficient correlation of indicators in the evaluation of agricultural science and technology innovation ability in China,we used principal component analysis (PCA) to reduce the dimensionality of many factors affecting the innovation ability of agricultural science and technology,to find out the important factors as the input layer of SVM model,establish the evaluation model of agricultural science and technology innovation ability with higher accuracy,less data demand and shorter calculation time.This model was used to obtain the level of agricultural science and technology innovation ability in China from 2005 to 2016.According to the results,it is found that the innovation ability of agricultural science and technology is determined by the input and output as well as the research and development ability.Finally,according to the results of this study,some suggestions are put forward to improve the innovation ability of agricultural science and technology in China.
接下来,对经过标准化及检验的数据进行主成分分析 ,即使用主成分分析法为因子选取的方法,并采用正交旋转法使得因子更具有解释性,这里基于特征值大于1提取主成分,得到累积特征值占总方差的比重(表2)。可以看到2个主成分的累积贡献率就已经达到了89.2%,因此2个主成分能够代表原来的9个变量,于是初步确定提取m=2个主 成分。
从旋转后的因子载荷矩阵(表3)可以看出,第一主成分在X 1(R&D人员比例)、X 2(研发机构平均经费投入)、X 3(R&D人均经费投入)、X 5(重点实验室人员占比)、X 6(R&D人均经费支出)、X 7(重大科技成果)、X 9(发表科技论文篇数)这7个指标上具有较大的载荷;第二主成分在X 4(R&D课题数)、X 8(专利申请数)2个指标上具有较大载荷。根据观察,在第一主成分上具有较大载荷的变量和农业科技创新的投入和产出具有很强的关系,所以将第一主成分定义为农业科技创新投入产出能力因子;第二主成分上有较强载荷的变量和研发能力具有一定关系,所以将第二主成分定义为农业科技创新研发能力因子。最终确定2个主成分。再由表2可知,第一主成分的累计方差贡献率为67.334%,即农业科技创新投入产出能力是影响农业科技创新能力的主要因素;第二主成分,农业科技创新研发能力对农业科技创新能力的影响紧随其后。
最后,确定各主成分表达式,从而得到农业科技创新能力综合评价函数。主成分表达式系数由因子载荷矩阵的数据除以主成分相对应的特征根开平方得到,且根据上述过程可知,2个主成分的特征根分别为6.071和1.956,于是主成分表达式如下:
Z 1=0.403×ZX 1+0.284×ZX 2+0.398×ZX 3+0.124×ZX 4+ 0.381×ZX 5+0.393ZX 6+0.379×ZX 7-0.112×ZX 8+ 0.355×ZX 9
Z 2=-0.059×ZX 1-0.158×ZX 2+0.024×ZX 3+0.671×ZX 4+ 0.183×ZX 5+0.155×ZX 6-0.037×ZX 7+0.683×ZX 8- 0.009×ZX 9
其中Z 1,Z 2分别为第一主成分和第二主成分,ZX 1、ZX 2、ZX 3、ZX 4、ZX 5、ZX 6、ZX 7、ZX 8、ZX 9依次分别为标准化后的指标 数据。
再由2个主成分的贡献率0.674和0.217,得到农业科技创新水平综合评价函数:
Y=0.258×ZX 1+0.157×ZX 2+0.273×ZX 3+0.229×ZX 4+ 0.296×ZX 5+0.298×ZX 6+0.248×ZX 7+0.072×ZX 8+ 0.237×ZX 9
根据上述综合评价函数,即可得到2005—2016年我国农业科技创新水平情况(表4)。
2.2 基于支持向量机(SVM)的评价体系的验证与完善
支持向量机(support vector machine)方法是建立在结构风险最小原理以及統计学习理论的VC维理论基础上的,是根据有限的样本信息在模型学习能力(即无错误地识别任意样本地能力)和复杂性(即对特定训练样本的学习精度)之间寻求最佳折中,以期获得最好的推广能力。在机器学习领域,支持向量机是一种有监督地学习,针对线性及非线性、分类及预测问题,支持向量机均能有效的解决。且相比于其他分类预测方法来说,支持向量机有正确率高、不存在过度学习等优点。
基于主成分分析法构建模型的结果,选取结果的60%作为训练集,40%作为测试集,并将投入产出能力(Z 1)、研发能力(Z 2)作为输入变量,综合能力Y作为目标值,进行线性支持向量机方法的模拟,得到预测变量重要性对比图(图1)以及预测-实测对比图(图2)。
由图1、2可知,2个主成分作为输入变量对于模型的构建都不可或缺,且利用支持向量机构建的模型所产生的预测值与实际期望值基本一致。利用训练好的支持向量机对2005—2016年我国农业科技创新水平进行综合评价。
由表5可知,以综合能力Y作为训练支持向量机的目标值,投入产出能力和研发能力作为支持向量机的输入变量,运用支持向量机方法对我国2005—2016年农业科技创新水平进行评价,所得的结果与排名和利用主成分分析法所得到结果与排名基本一致,从而说明利用主成分分析法与支持向量机相结合的方法进行农业科技创新水平的评价,减少了支持向量机在构建模型时的复杂度,消除了主观因素对模型的影响,并提高了支持向量机的学习速率以及泛化能力,最终进一步保证并增加了模型的准确性。
3 农业科技创新能力评价分析
3.1 农业科技创新能力影响因素分析
根据上述研究,农业科技创新能力主要由农业科技创新投入产出能力和农业科技创新研发能力共同作用决定。其中,投入产出能力的方差贡献率达到67.4%为科技创新能力的主要影响因素;研发能力的方差贡献率为21.7%,为次要影响因素。对投入产出能力影响最强的因素为R&D人员比例;而对研发能力影响很强的因素为专利申请数和R&D课题数;综合2个能力作用得到的农业科技创新能力中影响最强的因素则为R&D人均经费支出[17]。
3.2 2005—2016年我国农业科技创新能力评价
2005—2016年我国农业科技创新能力变化趋势见图3。观察可得,2005—2016年我国农业科技创新能力总体呈上升趋势。其中,研发能力在2009年前一直处于高于投入产出以及综合能力的正数水平状态,此后经过明显下降至负数水平,然后上升一直较缓慢,直到2013年重新恢复正数水平;投入产出水平在2005—2016年一直保持上升态势,2009年超过研发能力,2010年从负数水平达到正数水平;综合能力总体处于上升趋势,到2011年后达到正数水平。具体对比发现,投入产出能力及综合能力上升态势较明显,而研发能力在2008年间发生过1次较大程度下降,并在2009年降至负数,该时期综合能力的上升也明显减缓,水平开始低于投入产出能力。此后,研发能力的上升较平缓,直到2013年间才重新达到正数水平,综合能力也是在相同时期恢复至2009年前高于投入产出能力的水平。最终在2016年研发能力才达到与2008年下降前相同水平,此时综合能力也同时恢复到下降前的相对水平。通过对原始数据的观察,发现对研发能力产生重要影响的专利申请数在2008—2009年有过1次非常明显的下降。反观历史信息发现,我国《专利法》在该时间段进行过1次较大程度修订,此后专利申请数量便一直处于较低水平,这也就解释了研发能力产生明显下降状况的 原因[18]。
4 结论与建议
(1)该研究从农业科技创新投入产出及研发3个方面出发建立了我国农业科技创新能力评价指标体系,为我国农业科技创新能力评价提供了依据,并根据该体系得到2005—2016年我国农业科技创新能力时间维度的对比[19]。
(2)将主成分分析法与支持向量机相结合,先将影响我国农业科技创新能力的因素通过主成分分析法进行了一定程度的降维,然后在此基础上运用支持向量机对降维后的数据进行训练,建立了一个有效的基于主成分分析-支持向量机的我国农业科技创新能力评价模型,通过输入新的数据可以快捷、准确地分析出我国农业科技创新能力的发展状况。
因此,根据上述研究结果提出以下建议:
(1)建立健全农业科技创新能力评价指标体系,对农业科技创新能力相关数据的统计需要更加全面,同时,在空间与时间维度上均需要建立科学合理的农业科技创新能力评价指标体系,并不断尝试加入新的指标与方法对该体系进行完善,在此基础上形成相关规则,养成定期考核,定向自查改进的习惯。
(2)农业科技创新能力的提高需要抓重点、补不足,根据研究结果,要想提高农业科技创新能力,最重要的就是提高投入产出能力,尤其是研究人员的比例以及研究经费,除此之外,针对2008—2009年研发能力下降导致综合能力上升减缓这一情况,建议推动农业科技成果的创造与农业相关专利的申请,鼓励农业相关工作者们积极投入到农业科技成果的创造之中,对于已经产生的科技成果给予一定的重视,对于符合专利申请条件的,相关部门应全力支持其申请工作。
(3)农业科技创新能力提升要全面进行,农业科技创新能力的评价是由多个指标因素共同作用的结果,需要全方位共同协调才能使得农业科技创新能力得到更快、更稳定的 提升[20]。
5 讨论
研究证明了利用主成分分析法与支持向量机相结合的方法对农业科技创新能力进行评价不仅是有效、可行的,还可以缩减训练时间,提高收敛速度和精度,具备信息需求量少、计算精度高等优点。但需指出的是,该研究所选取的指标一定程度受限于数据的可获取性,不能完全涵盖所有农业科技创新能力评价的相关指标,但随着研究的深入,指标的选取也会进行相应的完善,以期得到该模型的最佳效果。
参考文献
[1] 蒋和平,刘学瑜.我国农业科技创新体系研究评述[J].中国农业科技导报,2014,16(4):1-9.
[2] 张淑辉,郝玉宾.农业科技成果低转化率的主要原因探讨[J].理论探索,2014(1):98-101.
[3] 卢江勇,蒋和平.我国农业科技创新能力实证研究[J].中国农业科技导报,2008,10(S1):78-85.
[4] 曹琼,李成标.基于熵权TOPSIS法的农业科技创新能力评价:以湖北省为例[J].南方农业学报,2013,44(10):1751-1756.
[5] 张莉侠,俞美莲,王晓华.农业科技创新效率測算及比较研究[J].农业技术经济,2016(12):84-90.
[6] 梁凯,龚祖文,和平.基于支持向量机和因子分析法的配电网线损计算[J].电工技术,2018(22):53-56.
[7] 李远远,梅红波,任晓杰,等.基于确定性系数和支持向量机的地质灾害易发性评价[J].地球信息科学学报,2018,20(12):1699-1709.
[8] 王肖芳.基于因子分析-BP神经网络的河南省生态农业效益评价[J].经济经纬,2015(4):37-42.
[9] 万忠,吴美良,林佩珍,等.科技进步在东莞农业发展中的作用[J].农业现代化研究,2000,21(6):337-340.
[10] 杨宗霄,毛智杰,杨本渤,等.基于因子分析与神经网络的输电网安全评价[J].电网技术,2009,33(14):26-30.
[11] 卢文喜,初海波,王喜华,等.基于因子分析的Hopfield神经网络在水质评价的应用[J].水土保持通报,2012,32(1):197-200,237.
[12] 孟嘉伟.基于BP人工神经网络的水质评价模型[D].天津:天津大学,2010.
[13] 王江思,马传明,王文梅,等.基于SPSS和GIS的BP神经网络农用地适宜性评价[J].地质科技情报,2013,32(2):138-143.
[14] 朱庆锋,徐中平,王力.基于模糊综合评价法和BP神经网络法的企业控制活动评价及比较分析[J].管理评论,2013,25(8):113-123.
[15] 王碧云.大学科研创新力评价及中国提升策略研究[D].武汉:武汉大学,2016.
[16] 耿迪.高校科技创新能力评价研究[D].武汉:武汉理工大学,2013.
[17] 尤丹君.京津冀区域科技创新能力评价研究[D].石家庄:河北经贸大学,2014.
[18] 李洪文,黎东升.农业科技创新能力评价研究:以湖北省为例[J].农业技术经济,2013(10):114-119.
[19] 尹伟华,张亚雄.我国工业企业自主创新能力分析[J].调研世界,2016(2):3-9.
[20] 黄红星,刘晓珂,万忠.科技引领广东农业供给侧结构性改革的思路和方向[J].江西农业学报,2018,30(11):147-150.