灰色系统理论在陕西省农作物秸秆可收集量预测中的SAS应用
2018-05-14王涛,宋喜芳,常小箭,赵永锋,王辉
王涛,宋喜芳,常小箭,赵永锋,王辉
摘要 [目的]在SAS环境下,运用灰色系统理论对陕西省农作物秸秆可收集量进行预测。[方法]以草谷比和可收集系数估算2005—2015年陕西省农作物秸秆可收集量。以农村就业人口、农作物播种面积、农用化肥施用量和农业机械总动力作为影响农作物秸秆可收集量的4个主要因素进行灰色关联度分析。在SAS环境下,利用GM(1,1)灰色模型和基于GM(1,1)的多元回归模型对2016—2020年的陕西农作物秸秆可收集量进行预测,并对模型精度与误差进行分析比较。[结果]基于GM(1,1)的多元回归模型预测精度高于GM(1,1)模型的精度,较准确预测了2016—2020年陕西农作物秸秆的可收集量。[结论]准确预测农作物秸秆可收集量可为政府开展农业面源污染防治、提高秸秆综合利用提供强有力的数据支撑。
关键词 陕西;秸秆;可收集量;灰色预测;SAS 模型
中图分类号 S-058 文献标识码 A 文章编号 0517-6611(2018)06-0186-04
Application of Gray System Theory in the Prediction of Shaanxi Province Straw Resource Collectable Amount Based on SAS
WANG Tao,SONG Xifang,CHANG Xiaojian et al (Xian Agricultural Technology Extension Center, Xian, Shaanxi 710061)
Abstract [Objective]To predict Shaanxi Provinces straw resourcecollectable amount based an SAS by using gray system theory.[Method]Collectable amount of straw resource from 2005 to 2015 was estimated based on the residue to grain ratio and collection coefficient.To analyze the rural employ population,crop sown area,consumption of chemical fertilizers and total power of agricultural machinery as four major factors affecting collectable amount of crop straw. GM (1,1) gray model and multiple regression model based on GM (1,1) were used to predict the collectable amount of crop straw in Shaanxi from 2016 to 2020, using SAS.[Result]The prediction accuracy of multiple regression model based on GM (1,1) was higher than GM (1,1) prediction.It accurately predicted the collectable amount of crop straw in Shaanxi Province from 2016 to 2020.[Conclusion]The reliable prediction of crop straw′collectable amount in Shaanxi provides a strong data support for carrying out the prevention and control of agricultural surface pollution and improving the comprehensive utilization of straw for the government.
Key words Shaanxi;Crop straw; Collectable amount;Gray prediction; SAS model
能源短缺和環境污染问题已经成为制约人类社会发展的主要瓶颈。生物质能以其可再生、资源丰富、生态环境友好而逐渐成为一种重要的新替代能源,它仅次于煤炭、石油和天然气而居于世界能源消费总量第4位[1]。农作物秸秆作为农业生产的剩余物,是一种重要的生物质资源,其中相当一部分农作物秸秆可作为能源资源进行规模化利用。有效利用这部分生物质资源不但可缓解能源需求压力,消除废弃生物质资源带来的环境污染,而且是振兴农村经济、增加农村就业、提高农民收入、改善农村人居环境的需要[2]。对陕西省秸秆可收集量进行分析及预测是建立和发展农村生物质能项目的前提和基础,可为打好农业面源污染攻坚战提供数据支持。目前,已采用常规方法对陕西省秸秆资源量进行估算[3-5],但是尚无陕西省秸秆可收集量的影响因素分析及预测。为此,笔者基于灰色系统理论利用SAS统计分析软件,对陕西省秸秆可收集量进行分析和预测。
灰色系统是指部分信息已知、部分信息未知的系统,它介于一无所知的黑色系统与全部确知的白色系统之间。灰色预测在形式上只运用预测对象自身的时间序列建立模型。与其相关联的因素表面上没有参与运算和建模,并不是说那些因素对预测对象没有影响和作用。灰色系统的“灰”正体现在这里,如影响陕西省秸秆的可收集量与作物品种、耕作制度、收获方式等有密切的关系,同时也受到自然条件、科学发展等方面的制约,是多种因素综合作用的结果,秸秆可收集量也具有某种灰色性。秸秆可收集量可看成是既有一定已知信息又含有未知信息的灰色系统[6]。
根据2005—2015年陕西省主要农作物产量的统计数据,通过对近年相关研究文献的综合分析,确定主要农作物草谷比、作物秸秆可收集系数等估算参数,对陕西省秸秆可收集量进行估算,并利用灰色系统理论对陕西省农作物秸秆可收集量的影响因素进行灰色关联分析,并在SAS环境下利用GM(1,1)的多元回归模型进行预测。
1 陕西省农作物秸秆可收集量的估算
陕西省主要农作物产量数据是对秸秆可收集量进行科学准确估算的基础。结合相关文献,采用草谷比的方法对农作物秸秆可收集量进行估算。
1.1 估算方法 陕西省的主要农作物包括小麦、玉米、水稻、棉花、油菜籽等。农作物秸秆可收集量估算公式如下:
Pe=niηi(λi·Gi)
式中,Pe为农作物秸秆可收集量(t);i为农作物秸秆编号(i=1,2,3,…,n);ηi为第i种农作物的收集系数;λi为第i种农作物的草谷比;Gi为第i种农作物的年产量。
1.2 草谷比及收集系数的整理 综合王亚静等[7]、李逸辰[8]的研究成果,确定草谷比。结合陕西实际,选用王亚静等[7]对农作物秸稈收集系数的研究数据,确定可收集系数。主要农作物产量数据来源于历年《陕西统计年鉴》。陕西主要农作物草谷比及可收集系数见表1。
1.3 估算结果 经计算得出陕西省2005—2015年农作物秸秆的可收集量依次为1 365.70万、1 222.99万、1 247.81万、1 393.94万、1317.04万、1 361.56万、1 408.01万、1 457.98万、
1 421.05万、1 416.03万、1 436.23万t。由此可知,从2005年以来,陕西省农作物秸秆可收集量总体呈波浪型增长趋势,2015年较2005年增长了5.16%,较2006年增长了17.44%。
2 农作物秸秆可收集量影响因素的灰色关联度分析
灰色关联度分析是灰色系统理论的一种分析方法,是将因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。灰色关联度分析法是将研究对象及影响因素的因子值视为一条线上的点,与待识别对象及影响因素的因子值所绘制的曲线进行比较,比较它们之间的贴近度,并分别量化,计算出研究对象与待识别对象各影响因素之间的关联度,通过比较各关联度的大小来判断待识别对象对研究对象的影响程度。
参考文献[2]的研究成果,农业生产条件是影响农作物秸秆可收集量的主要因素,依次是农村就业人员、农作物播种面积、农用化肥施用量和农业机械总动力。采用以上4个因素作为陕西秸秆可收集量的影响因素指标进行分析,各影响因素历年指标值及均值化关联分析后的关联度结果见表2。
由表2可知,4个影响因素的关联度都大于0.700 0,按照关联度由大到小依次为农作物播种面积、农村就业人员、农用化肥施用量和农业机械总动力。
3 农作物秸秆可收集量的灰色模型预测
灰色预测法是一种对含有不确定因素的系统进行预测的方法。灰色系统分析实质上是将一些已知的数据序列,通过一定的方法处理,使其由散乱状态转向规律化,然后利用微分方程拟合,并由外延进行预测。灰色系统分析方法对于信息不完整或不完全的实际情况具有良好的适用性。
基于少量数据模型 GM(1,1)的预测被称为灰色预测,是灰色系统应用的重要领域。由于该模型对数据量的要求少、不要求典型的概率分布,因而在许多领域有着广泛的应用。模型在农业生产中得到了较为广泛的运用[9]。现采用GM(1,1)模型预测和基于GM(1,1)的多元回归模型预测2种方法预测陕西省农作物秸秆可收集量。
3.1 GM(1,1)模型预测 以2005—2015年陕西省农作物秸秆可收集量为单一变量,运用国际通用标准统计软件SAS基于灰色系统理论建模,对2016—2020年陕西省秸秆可收集量进行灰色预测,SAS程序综合了颜杰等[9]和孔超等[10]的研究成果。
判断构建的拟合模型是否可信,误差是否很大,必须对其精度进行检验。检验误差有4种:相对误差、关联度、均方差比值和小误差概率。模型检验是建模后必不可少的工作。对灰色预测模型的检验一般有残差检验、关联度检验和后验差检验。一般情况下,最常用的是残差检验中的相对误差检验方法[11]。GM(1,1)预测的相对误差平均值为2.34%,预测精度为三级。陕西省农作物秸秆可收集量GM(1,1)模型的预测结果见表3。
3.2 基于GM(1,1)的多元回归模型预测
3.2.1 多元回归方程。根据灰色关联分析的结果,选取农村劳动力(X1)、农作物播种面积(X2)、农业机械总动力(X3)、化肥施用量(X4)这4个影响因素作为自变量,秸秆可收集量(Y)为因变量,进行多元回归分析。基于2005—2015年陕西省秸秆可收集量及各影响因素的数据,应用SAS软件建立多元回归方程,回归模型拟合如下:
Y=38.535 01-0.526 67X1+4.033 61X2+1.344 51X3 -0.089 95X4
在α=0.01的置信度水平,F比值的概率为0.000 7,模型达到极显著水平,表明回归模型拟合效果优良。从回归方程可见,农作物播种面积(X2)、农业机械总动力(X3)与秸秆可收集量呈正相关,增大农作物播种面积、提高农业机械总动力可以提高秸秆可收集量。
3.2.2 4个因素的GM(1,1)模型预测。以2005—2015年农村劳动力、农作物播种面积、农用化肥施用量和农业机械总动力4个影响因素的历史数据为基础,运用GM(1,1)模型分别对各影响因素2016—2020年的发展趋势进行预测,结果见表4。
模型检验,一般要求平均相对误差越小越好,从表4的平均相对误差可见,乡村就业人数、农用化肥施用量预测精度均为二级,农作物播种面积、农业机械总动力预测精度均为一级。
3.2.3 基于GM (1,1)的多元回归模型预测。将4个因素的真实值和未来5年的预测值代入上述多元回归方程,可得出2005—2015年陕西省农作物秸秆可收集量的多元回归模拟值和2016—2020年基于GM(1,1)的多元回归组合预测值。
由表5可知,基于GM(1,1)模型的多元回归模型对历史数据的预测精度为1.11%,预测精度为二级,较GM(1,1)模型预测精度有很大的提高。可见,基于GM(1,1)的多元回归模型集成了回归分析及灰色理论的优点,因此获得了较好的预测效果。
4 讨论与结论
GM(1,1)模型本身运用灰色系统理论,利用SAS程序实现模型分析与预测,仅从陕西省农作物秸秆可收集量的数据序列本身去寻找数据变化规律,并没有考虑其他相关影响因素对可收集量的影响,因此相对误差略高,精度较低。
基于GM(1,1)的多元回归预测模型从灰色关联度的视角,选取4个影响因素进入回归分析模型,分析事物发展变化的影响因素及影响程度,通过GM(1,1)模型预测影响因素的变化趋势,然后按照回归分析的建模思想再构建预测模型。该预测方法集成了回归分析及灰色理论的优点,因此相对误差降低,预测效果较好。
加大农作物播种面积和提高农业机械总动力,将提高陕西省农作物秸秆可收集量。通过基于GM(1,1)模型的多元回归模型预测结果可见,陕西省农作物秸秆可收集量在2010—2015年呈不断增长趋势,到2020年将达1 570.49万t,该研究可为政府开展农业面源污染防治、做出秸秆综合利用决策提供数据支撑。
参考文献
[1] 石金明,范敏,席细平,等.江西省秸秆资源量分析[J].能源研究与管理,2012(1):1-4.
[2] 崔胜先,谢光辉,董仁杰.灰色系统理论在黑龙江省农作物秸秆可收集量预测中的运用[J].東北农业大学学报,2011,42(8):123-130.
[3] 朱建春,张增强,李荣华.陕西关中地区作物秸秆资源的综合利用现状及其影响因素模型[J].农业环境与发展,2011,28(2):12-17.
[4] 王宁堂,王军利,李建国.农作物秸秆综合利用现状、途径及对策[J].陕西农业科学,2007(2):112-115.
[5] 朱建春,李荣华,张增强,等.陕西作物秸秆的时空分布、综合利用现状与机制[J].农业工程学报,2013,29(S1):1-7.
[6] 冯蕾,王效华.江苏省农作物秸秆资源量的灰色预测[J].能源研究与利用,2010(4):1-3.
[7] 王亚静,毕于运,高春雨.中国秸秆资源可收集利用量及其适宜性评价[J].中国农业科学,2010,43(9):1852-1859.
[8] 李逸辰.陕西省农作物秸秆资源量及其经济价值评估[D].长沙:中南林业科技大学,2014.
[9] 颜杰,相丽驰,方积乾.灰色预测模型及SAS实现[J].中国卫生统计,2006,23(1):75,85.
[10] 孔超,刘元凤,沈续雷.灰色预测模型的SAS程序改进[J].中国卫生统计,2008,25(6):640-641.
[11] 刘树,王燕,胡凤阁.对灰色预测模型残差问题的探讨[J].统计与决策,2008,3(1):9-11.