基于小波-PSOSVM 的陕甘宁新农业资源可持续利用评价
2023-07-04王辰璇张安安
王辰璇,陈 莉,张安安
(1.厦门理工学院 经济与管理学院,厦门 361024;2.安徽建筑大学 经济与管理学院,合肥 230601)
0 引 言1
【研究意义】西部大开发战略的推进,促进了陕甘宁新地区经济发展,减小了与发达省份的发展差异,但该地区生态资源仍存在脆弱性。我国陕甘宁新地区地域广袤,民族众多,是我国重要的战略高地和生态屏障。2020 年《关于新时代推进西部大开发形成新格局的指导意见》指出,西部大开发对于巩固西部生态壁垒、破除西部发展障碍具有重要意义。选取西部地区的代表省份陕西、甘肃、宁夏和新疆(以下简称“陕甘宁新”)为研究对象,研究其农业资源的可持续利用问题具有重要意义。【研究进展】罗其友等[1]提出农业资源可持续利用是一种低耗能高效益的资源利用方式,为资源与环境的持续发展创造条件;叶得明等[2]、白晶等[3]、丁金梅等[4]均对生态环境与经济协调发展模式进行了分析。在农业资源可持续利用指标体系构建方面,成果丰富。侯智惠等[5]从农业资源、农业生态压力、农业生态保护、农业经济及社会发展等方面构建评价指标体系,运用因子分析法确定权重,并计算内蒙古自治区各盟(市)农业资源利用的综合指数;侯佳等[6]以河北省11 个地级市2007—2016 年的农业资源为研究对象,从经济、社会和生态方面构建指标体系,运用熵权法和DEA 模型进行实证分析;陈家金等[7]从土地资源、水资源、畜牧资源、农村能源、生产条件、农业效益等方面构建指标体系,研究表明福建省大部县(市)土地利用处于基本可持续利用阶段;刘军[8]从社会、生态、经济方面,构建包括社会资源、土地资源、水资源、生物资源、经济资源的湖南省农业资源可持续利用评价指标体系,发现水资源对农业资源可持续利用影响较大;刘双等[9]从土地利用条件、土地利用结构与程度、土地利用效益和土地可持续利用保障4 个方面评价土地资源可持续利用,认为南宁市处于可持续利用发展阶段;郭艳荣等[10]将四川省农业资源评价体系分为土地资源、水资源、生物资源、环境资源、经济资源及社会资源等方面;张杰等[11]从水资源条件系统、社会系统、经济系统及生态环境系统等方面,研究广西省水资源的可持续利用情况;钟锦玲等[12]从“经济-社会-生态”角度,构建包括土地社会环境、土地经济效益、土地生态保障3 个方面的广西土地资源可持续利用评价指标体系,结果表明广西土地资源可持续利用水平在波动中上升。此外,刘秀丽等[13]运用生态足迹模型分析了甘肃省耕地资源的可持续利用问题;刘夏等[14]、陈南祥等[15]分别运用系统动力学方法对塔里木河流域资源利用、河南省水资源可持续利用进行评价;雷宏军等[16]运用模糊评价对郑州市水资源可持续利用进行分析。
农业资源可持续利用指标体系主要涵盖经济、社会、生态三大方面,较多关注水资源可持续,目前农业资源可持续利用指标体系还需要进一步完善。在农业资源可持续利用评价建模中,随着影响因素的增加,评价模型的空间维数也会增加,人工智能的引入为农业资源的可持续利用评价提供了新思路。支持向量机(Support Vector Machine,SVM)对样本要求不高,也没有模型选择、维数灾难和局部极小等不足,在解决高维问题方面优势明显。然而,当样本数据量较大时,SVM 的计算速度会变慢,为此,专家学者提出采用人工智能优化SVM 参数,提高SVM 性能。SVM、智能优化SVM 已得到较好应用。任永泰等[17]运用GA-SVM 模型对水资源可持续利用进行评价;季敏等[18]运用SVM 对渔业资源可持续利用分析;卢敏等[19]采用SVM 对水资源可持续利用评价;王亚云等[20]将PSOSVM 模型应用于土地资源的适宜性评价;聂笃宪等[21]采用PSO 优化SVM 模型应用于水质资源评价。因此,智能优化SVM 模型能较好地用于农业资源可持续利用评价。
在采用人工智能优化数据之前,一般都需要先进行数据预处理。农业资源可持续利用指标体系包括经济、科技、社会、生态、自然资源、环境治理的集合,农业资源可持续利用是在不断提高资源的生态效率前提下实现的。提高生态效率是农业资源可持续利用研究的永恒主题,特别是对于那些稀缺资源,如中国的土地资源、旱地的水资源等,提高资源的生态效率愈显意义重大,因此,本文将农业生态效率纳入指标体系。【切入点】从已有学者对农业资源可持续利用研究表明,缺少对原始数据进行降噪预处理,缺少运用人工智能技术针对陕甘宁新的农业资源可持续利用研究。【拟解决的关键问题】为此,本文采用小波分析进行数据降噪预处理,与微粒群算法(Particle Swarm Optimization,PSO)支持向量机结合,对陕甘宁新地区农业资源可持续利用进行评价,为小波-PSOSVM 模型应用于农业资源可持续利用评价提供参考。
1 材料与方法
1.1 研究区农业资源利用概况
陕西省光照条件较好,但热量与降水匹配失衡,季节性缺水问题严重,夏季6—8 月降水约占全年总降水量的50%,光照资源在农业发展上得不到充分发挥[22]。甘肃省人均耕地占有量是全国人均占有量的1倍多,降水分布不均使得甘肃省农业资源在空间上差异明显[23],甘肃省旱地与水田的占比约为99.8∶0.2,虽然近些年省内耕地面积有所增长,但旱地比例仍然远高于水田,农作物结构单一、农业现代化水平较低的问题日益突出[23]。宁夏虽然人均耕地占有量约为0.189 hm2,土地资源丰富,但南部分布大量丘陵沟壑,水土沙漠化现象严重,生态环境相对脆弱[24]。中部地区平均年降水量不足300 mm,土体沙化问题限制了农作物的增长。新疆约占我国陆地总面积的1/6,但可利用的耕地资源有限。年平均降水量不足200 mm。塔克拉玛干沙漠占据了南疆的大部分面积,极度干旱的情况下,水资源难以保障农业生产[25]。
图1 研究区年均降水量Fig.1 Average annual precipitation in the study area
图2 资源可持续利用评估排名Fig.2 Ranking of resources sustainable utilization evaluation
1.2 研究方法
1.2.1 支持向量机
支持向量机(Support Vector Machine,SVM)是基于VC 维理论和结构的风险最小化理论提出的[26]。农业资源可持续利用评价问题包含多个评价属性,其中存在着非线性,对给定的训练样本集D={(xi,yi)|xi∈Rd,yi∈R},i=1, 2, …,l,支持向量机将原始变量空间x映射到新的高维空间φ(·),即寻找ω和b,使得回归函数f(x)=ωTφ(x)+b的结构风险最小化,即min½ωTω。支持向量机训练精度与惩罚系数C、核函数g以及不敏感系数Ɛ有关,而这3 个参数与支持向量机本身没有确定关系,常需借助于其他人工智能算法[27-28]。考虑到微粒群算法具有全局寻优、简单易实现等优势,本文采用PSO 并与小波变换结合构建小波-粒子群算法支持向量机模型,再与未经小波变换的结果进行对比。
1.2.2 小波-PSOSVM 实现步骤
1)粒子群算法原理
粒子群优化是一种群体演化算法,把它想象成一个在D维最优搜索空间中,无体积的粒子,各个微粒的位置、速度和适应值均不同,每次迭代的过程都有迹可循,若找到一个更好的解决方案,它将被视为找到下一个解决方案的基础。该方法效率高、鲁棒性强。初始化微粒群,迭代寻求最优解,微粒在追随个体极值pbest和全局极值gbest的过程中不断更新。直至寻找到这2个最优值,微粒依据以下计算式更新其速度和位置。
PSO中任一微粒i的速度:
微粒群中任一微粒i的位置:
式中:Vi是粒子i的速度;Xi是粒子i的位置;Pi代表pbest;Pj代表gbest;惯性权重用W表示;c1、c2为加速度常数;Rand为(0,1)区间的随机数[29]。
2)小波-粒子群优化支持向量机的步骤
①对经过筛选后确立的指标体系进行小波变换:将筛选后农业资源可持续利用评价指标,进行一维离散平稳小波分析,进行数据预处理。②将小波变换后的农业资源可持续利用评价数据种群初始化,设定初始参数C及g、微粒群规模、微粒开始位置和速度、最大迭代数和精度要求等。③初始化后,利用每个参数的初始值对训练集进行训练,构造回归模型。④对训练集进行训练,计算各微粒的适应度值⑤比较各微粒当前的适应度值F(Xi)与微粒最佳适应度值F(Ppbest),如果F(Xi)
2 结果与分析
2.1 陕甘宁新地区农业资源可持续利用评价指标体系建立
对遴选的2017—2019 年的辽、京、津、沪、冀、鲁、苏、浙、闽、粤、桂、琼、陕、甘、宁、青、新、川、云、贵、藏、渝、黑、吉、晋、蒙、皖、豫、鄂、湘、赣共31 个省份的150 个备选指标进行显著性与相关性分析,本文借鉴前人[30-31]的经验,依据科学性、可比性原则初步构建150 个备选指标,对相关系数大于0.7 的指标进行合并,最后建立包含经济、科技、社会与生活、自然环境、资源、生态治理6 个子系统62 个具体指标的农业资源可持续利用指标体系(表1)。
表1 农业资源可持续利用指标体系Table 1 Index system of sustainable utilization of agricultural resources
其中,农村居民人均可支配收入、城乡居民收入比、农村居民人均消费支出、人均社会消费品零售总额、单位面积作物产量、装机容量、村卫生室、设卫生室的村数占行政村数比例、乡镇文化站、水库库容量、太阳能热水器、国家级自然保护区个数、耕地占农用地比例、园地占农用地比例、林地占农用地比例、草地占农用地比例、农用塑料薄膜使用量、农用柴油使用量、农药使用量、水田占耕地比例、第一产业增加值占地区生产总值比例、洪涝灾成灾面积、风雹灾成灾面积、冷冻灾成灾面积、台风灾成灾面积、人工造林面积、飞播造林面积、当年新封山(沙)育林面积和人工造林更新面积均来自于2018—2020 年《中国农村统计年鉴》计算得到。人均耕地面积、农业结构调整减少耕地面积、无害化卫生厕所普及率、沙化耕地、森林覆盖率、草原鼠害危害面积、草原火灾受害面积、森林火灾受灾森林面积、地质灾害数、退耕地造林面积、建设占用减少耕地面积、灾毁耕地、生态退耕、矿业开采累计占用损坏土地和本年矿山恢复面积均来自2018—2020 年《中国环境统计年鉴》计算得到。农村贫困人口(2010 年标准)、农村居民年末计算机拥有量数据来源于2018—2020 年《中国住户调查年鉴》;农业机械化水平、地震灾害次数来源于2018—2020 年《中国统计年鉴》;公有企事业单位农业技术人员数据来源于2018—2020 年《中国人口和就业统计年鉴》,乡村大专及以上受教育百分比根据《中国人口和就业统计年鉴》的数据计算得到;行政村公路通畅率数据来自2018—2020 年《中国交通年鉴》;保护耕地来自2018—2020 年《中国水利统计年鉴》。农业科技投入的数据参考吕屹云等[32]的研究,使用《中国科技统计年鉴》省(自治区、直辖市)科研费用支出的7%作为农业科技投入的变通量。国家农业科技园区、国家现代农业产业园、农业农村信息化示范基地个数、国家农业科学观测实验站个数、数字农业农村发展水平评价先进县个数、数字农业农村发展水平评价创新项目数分别根据科技部公示的第六、第七、第八批国家农业科技园区、农业农村部发布的国家现代农业产业园创建名单、农业农村部关于认定全国农业农村信息化示范基地名单、农业农村部办公厅关于确定国家农业科学观测实验站名单、农业农村部信息中心《关于全国县域数字农业农村发展水平评价先进县及创新项目和优秀组织奖单位的通报》整理得出。种业骨干企业个数由中国种子协会网、中国种子协会关于中国种业信用骨干企业和中国蔬菜种业信用骨干企业认定结果、中国种子行业信用评价结果整理出。种子储备量数据来源于CnOpenData 中国种子储备数据,以及中国种业大数据平台。农业生态效率采用超效率 SBM(super-efficiency slack based measure)模型测算请见参考文献[33]得出。
2.2 基于小波-PSOSVM 的陕甘宁新地区资源可持续利用评价综合分析
进行小波-PSOSVM 和小波-SVM 的陕甘宁新地区资源可持续利用评价,并与未经小波预处理的模型对比,结果见表2、表3。
表2 基于小波-PSOSVM、PSOSVM 资源可持续利用评估结果Table 2 Evaluation results of sustainable utilization of PSOSVM and PSOSVM based on wavelet
表3 运行结果比较Table 3 Comparison of operation results
表2 显示我国31 个主要省区(自治区、直辖市,由于港澳台地区数据缺乏及统计口径差异,本文研究区域不包括港澳台地区)小波-PSOSVM 和PSOSVM资源利用可持续评估评价结果。陕甘宁新地区农业资源可持续利用评价在全国排名分别为20、22、24、27 名,这4 个省区(自治区)比较,新疆排名第一,甘肃排名第二,陕西排名第三,宁夏排名第四。
由表3 可知,小波-PSOSVM 农业资源可持续评价均方误差MSE为9.411 5×10-5,运行时间为56 s,相关系数为0.967 9;而PSOSVM 在同样的训练集以及同样的测试集下,得到的均方误差MSE、运行时间、相关系数分别为0.015 3、60 s、0.967。说明小波处理后,PSOSVM 预测的精度有所提高,收敛稍加快。小波-SVM 农业资源可持续评价均方误差MSE为20.836,运行时间为824 s,相关系数为0.748;而SVM在同样的训练集以及同样的测试集下,均方误差MSE、运行时间、相关系数分别为30.903 2、838 s、0.634,也同样说明,小波处理后,SVM 预测的精度提高,收敛也稍快。
比较小波预处理前后的PSOSVM 与SVM,会得到一致的结论:PSOSVM 预测的精度提高较多,收敛也快得多。综上所述,指标数据经小波分析后,训练模型的复杂度降低了,小波-PSOSVM 的训练速度也随之加快,并且预测结果较满意,小波-PSOSVM模型是比较科学的。
PSOSVM 的MSE比SVM 的MSE显著降低的原因是:支持向量机训练精度与惩罚因子、核函数参数及不敏感系数有关,而这3 个参数与SVM 本身没有的确定关系,常借助于其他人工智能算法。PSO 是一种基于群体进化的随机全局优化算法,它的搜索始终遍及整个解空间而又不依赖梯度信息,搜索效率高,具有很强的鲁棒性。该方法从种群随机初始化出发,对种群内的个体计算适应值、种群根据适应值进行复制,通过迭代寻找最优解;整个搜索更新过程是跟随当前最优解的过程,它通过追随当前搜索到的最优值来寻找全局最优。在大多数的情况下,所有的粒子可能更快的收敛于最优解。本文通过PSOSVM 参数,提高了训练的精度。
为进一步研究影响陕甘宁新农业资源可持续利用水平的敏感指标,通过灰色关联分析,得出各因素与农业资源可持续利用水平的灰色关联度。其中,灰色关联度前5 名的分别为人工造林更新面积、耕地占农用地比例、农村居民年末计算机拥有量、本年矿山恢复面积、无害化卫生厕所普及率,灰色关联度依次为0.882 5、0.874 9、0.869 0、0.864 5、0.857 9,属于生态治理、资源、科技、社会与生活4 个子系统,说明这些因素与农业资源可持续利用水平关联度较高,其中人工造林更新面积和耕地占农用地比例可能与陕甘宁新农业资源可持续利用水平关系关联较为密切。
3 讨 论
陕西省单位面积作物产量47 132.54 kg/hm2,排名27;农业机械化水平5.6 kW/hm2,排名17;行政村公路畅通率97.23%,排名25;森林覆盖率41.43%,排名10;农业生态效率15.16%,排名17;种子储备量119.5 万kg,排名17;保护耕地606.5×103hm2,排名17。综合分析,陕西省农业资源可持续利用评价结果排名24。
甘肃省单位面积作物产量96 588.75 kg/hm2,排名7;农业机械化水平5.5 kW/hm2,排名19;行政村公路畅通率90.77%,排名30;森林覆盖率11.28%,排名27;农业生态效率3.84%,排名28;种子储备量130 万kg,排名15;保护耕地面积496.5×103hm2,排名20。综合分析,甘肃省农业资源可持续利用评价结果排名22。
宁夏回族自治区单位面积作物产量54 732.17 kg/hm2,排名26;农业机械化水平5.4 kW/hm2,排名21;行政村公路畅通率99.19%,排名23;森林覆盖率11.89%,排名26;农业生态效率11.71%,排名18;种子储备量80 万kg,排名21;保护耕地面积194 ×103hm2,排名26。综合分析,宁夏农业资源可持续利用评价结果排名27。
新疆维吾尔自治区单位面积作物产量121 777.96 kg/hm2,排名第1;农业机械化水平4.5 kW/hm2,排名23;行政村公路畅通率97.63%,排名24;森林覆盖率4.24%,排名31;农业生态效率2.91%,排名29;种子储备量60 万kg,排名23;保护耕地面积2 591.5×103hm2,排名8。综合分析,新疆农业资源可持续利用评价排名20。
综上所述,新疆的农业资源可持续利用水平在陕甘宁新地区处于领先位置,宁夏的农业资源可持续利用水平整体偏低。从单位面积作物产量分析,新疆位列全国第1,甘肃居第7,陕西和宁夏均位于20 名之后;从森林覆盖率、农业生态效率和农业机械化水平分析,在陕甘宁新地区中,陕西最优;从种子储备量分析,甘肃最优,陕西次之;从行政村公路畅通率分析,宁夏最优,新疆次之,陕甘整体排名较低。
陕甘宁新农业资源可持续利用评价与王海燕[34]研究对比,王海燕[34]对30 个省农业资源可持续利用进行分析,从环境水平指数看,新疆优于陕西、甘肃、宁夏;从区域生态水平指数看,陕西、甘肃、宁夏均较低,新疆稍微优于陕西、甘肃、宁夏区域生态水平指数;从区域抗逆水平指数看,宁夏、新疆的抗逆能力稍劣于陕西、甘肃。从环境水平指数、生态水平指数、抗逆水平指数分析,新疆的农业资源可持续利用略优于陕西、甘肃、宁夏,宁夏农业资源可持续利用水平处于相对较弱。本文的实证分析结果和王海燕[34]分析基本吻合。本研究与罗其友等[35]的研究结果一致,罗其友等[35]认为,2000—2013 年山东农业环境可持续、四川农业生态可持续性发展较好,江苏农业环境可持续性、生态可持续性也较好,西藏、黑龙江在这2 个方面有待发展,辽宁农业环境可持续性有待提升。
通过对陕甘宁新农业资源可持续利用数据进行小波分析数据预处理,达到对数据降噪目的,以帮助PSOSVM 模型做出更准确的判断,从而提高预测的精度,将31 个省区放在一个尺度上比较,找出陕甘宁新农业资源可持续利用在全国的排位,按照前文综述,经济资源、社会资源、生态资源、环境资源、自然资源都是常考虑的,在自然资源中,耕地、水、生物、气候这些资源都是常考虑的,因此指标体系对不同地区相关研究具有参考性。由于研究数据有限,目前仍在省域进行分析,下一步将把模型扩大研究范围,争取可以应用到县域农业可持续资源利用中,推动农业可持续发展。
4 结 论
1)与未经过小波分析数据预处理的PSOSVM 模型进行比较,本文的小波-PSOSVM 模型预测精度高,实现简单;小波-PSOSVM 模型与小波-SVM 模型比较,前者模型更优,因此,小波-PSOSVM 模型适合应用于农业资源可持续利用评价。
2)指标体系基本可以真实反映我国31 个主要省(区)的农业资源可持续利用状况,增强度量的准确性,指标统计口径要求一致,使比较分析具有现实指导意义。所以,南方省份的指标是有具有参考性的。
3)不同气候区的指标也是具有参考性的。在自然环境子系统中风雹灾成灾面积、冷冻灾成灾面积、台风灾成灾面积、灾毁耕地等都体现气候资源,水库库容量、沙化耕地、森林覆盖率、水田占耕地比例体现水资源。所以,指标体系对不同气候区的指标有参考性。
(作者声明本文无实际或潜在的利益冲突)