基于灰度极限学习机的粮食产量预测
2018-04-09曹培格郭亚菲杨铁军
樊 超, 曹培格, 郭亚菲, 杨铁军
(河南工业大学信息科学与工程学院,河南郑州 450001)
无粮则不稳,粮食生产是粮食安全的基石,不仅关系国计民生,而且直接影响社会稳定和经济发展。虽然我国目前已经基本实现了粮食总量平衡、年年有余的目标,但仍面临着人口多、耕地少且可耕地面积日益萎缩的状况,严重影响国家的粮食安全。为此,研究粮食产量的变化规律并对其发展趋势作出准确预测,对于保障国家粮食安全、指导政府部门制定科学的发展规划和政策具有重要意义。
由于粮食生产受社会、经济、气候等多种因素的影响,导致粮食产量预测成为复杂的农学和统计学问题。为准确预测粮食产量,目前普遍采用遥感技术预测模型[1]、统计动力学生长模型[2]、气象产量预测模型[3]以及基于自回归滑动平均模型(auto-regressive and moving average model,简称ARMA模型)和灰度理论等的时间序列预测等方法[4-7]。这些方法虽然在一定程度上能够对粮食产量作出预测,但均不同程度地存在所需数据量大、预测成本高以及预测精度不理想等缺点。
由于粮食生产受到多种显性和隐性因素的影响,具有明显的灰度特征,因此可以使用灰色模型预测粮食产量。传统的灰色模型能有效地预测少量数据序列,但随着数据的增多和波动性的增大,该模型逐渐失去它的优势[8]。而极限学习机较适用于对大样本数据进行预测,一般情况下,训练数据越多,对样本数据规律拟合得越好,预测误差越小。为此,本研究结合粮食产量的数据特点,将灰色预测算法和极限学习机算法相结合,提出基于灰色极限学习机的粮食产量短期准确预测模型。
1 灰色预测模型
灰色预测模型的基本原理是对杂乱无章的原始数据列进行累加,生成新的单调递增数据列,增加原始数据列的规律性,弱化其波动性;按照累加后序列的增长趋势建立预测模型,得到1组单调递增数据序列;然后对预测数据采用累减的方法进行逆运算,恢复原时间序列,得到预测结果。其中 GM(1,1) 是目前灰色模型中使用最广泛的模型,其建模步骤如下。
(1)生成累加序列。设原始时间序列X(0)包含n个非负元素,即:
X(0)=[x(0)(1),x(0)(2),…,x(0)(n)]。
(1)
由该序列生成一次累加序列X(1),
X(1)=[x(1)(1),x(1)(2),…,x(1)(n)]。
(2)
其中
(3)
式中:x(0)(r)指原始时间序列中的第r个元素。
(2)生成累加序列X(1)的紧邻均值序列Z(1):
Z(1)=[z(1)(1),z(1)(2),…,z(1)(n)]。
(4)
这里:
(5)
(3)构建累加序列X(1)对时间t的一阶微分方程:
(6)
式中:参数a、b可由式(7)计算得出。
[a,b]T=(BTB)-1BTY。
(7)
式中:
(8)
(4)求解微分方程,得到如下GM(1,1)模型:
(9)
(5)由累加序列还原原序列:
(10)
2 极限学习机预测算法
(11)
式中:wi为输入神经元与第i个隐含层节点的连接权值;βi为第i个隐含层节点与输出神经元的输出权值;bi为第i个隐含层节点的偏置;tp为第p个输入样本的输出值。式(11)等价于:
Hβ=T。
(12)
式中:
(13)
(14)
式中:T为网络输出矩阵;H为极限学习机的隐含层输出矩阵,其第i列为第i个隐层节点的输出向量,该向量与输入值x1、x2,…,xN有关。因此,对于一个含有M个输入节点、L个隐层节点,且激励函数为g(x)的标准极限学习机,其算法过程可包括如下3步:(1)随机设置输入权值ωi和偏置bi,1≤i≤L;(2)计算隐层输出矩阵H;(3)计算输出权值β=H+T,其中H+为H的Moor-Penrose(MP)广义逆。
从上述过程可以看出,ELM算法可随机产生输入层和隐含层的连接权值ωi及隐含层神经元的偏置bi,且在训练过程中无需调整,只须选定激励函数、设定隐层节点个数,即可得到唯一的最优解。因此,ELM算法具有学习速度快、泛化性能好等优点。
3 灰色极限学习机组合预测算法
灰色极限学习机预测算法主要由灰色预测算法和极限学习机算法等2个预测模型组合而成。灰色预测模型适用于小样本的数据预测,在大样本的数据预测问题上,效果较差,但可以选取距离待预测年份较近的少量样本数据进行建模;而极限学习机通常适用于大样本的数据预测,且训练数据越多,模型对样本数据规律的拟合性越好,能够较全面地反映数据序列的变化规律。因此,灰色极限学习机预测算法可通过使用不同的样本集分别构建灰色预测模型和极限学习机模型,然后根据2个模型对数据序列的预测效果进行加权,克服单一预测方法的不足,从而得到较为准确的预测结果。
假设时间数据序列含有N个数据元素,记为X=[x1,x2,…,xN],且数据序号越大(即在序列中越靠后)的元素其时间点越靠后,距离待预测数据时间越近。灰色极限学习机算法步骤可描述为:
(2)计算灰色模型拟合误差序列Eg:
(15)
(3)计算灰色模型权值qg。在预测领域中,距离预测时间点越近,数据的预测误差越重要。因此,基于该思想的合理性,权值计算公式为
qg=|εN|+r|εN-1|+…+rN-l+1|εN-l+1|。
(16)
式中:r为权值因子,0≤r<1。
(17)
(18)
(5)计算极限学习机模型的拟合误差序列Eε:
(19)
(6)计算极限学习机模型权值qε。具体计算公式为
qε=|εN-j-1|+r|εN-j-2|+…+rN-j-2|ε1|。
(20)
式中:r为权值因子,0≤r<1。
(7)分别使用步骤(1)、步骤(4)所建立的灰色预测模型和极限学习机模型对序列X进行预测,得到预测序列Yg和Yε。
(8)使用步骤(7)并结合步骤(3)、步骤(6)得到的权值qg、qε以及最终预测序列Y。
(21)
综上所述,灰色极限学习机预测模型的算法步骤如图2所示。
4 基于灰色极限学习机的粮食产量预测
为验证基于灰色极限学习机组合模型的粮食预测效果,选取1949—2013年我国的粮食产量数据作为研究对象,构成原始时间序列X。为方便验证模型,将该序列中1949—2010年的数据作为训练子序列X1,2011—2013年的数据作为预测子序列X2。首先从训练子序列X1中挑选2000—2010年共11个元素构成新的时间序列,使用灰度建模方法建立该序列的GM(1,1)模型,利用该模型对2011—2013年粮食产量数据进行预测,预测结果如表1所示。其次,对训练集样本X1进行数据归一化处理,处理公式为:
X1′(i)=[max(X1)-X1(i)]/[max(X1)-min(X1)]。
(22)
式中:X1为原序列;X1′为归一化后的序列;X1(i)、X1′(i)分别为序列X1、X1′的第i个元素。选取极限学习机的滞后阶数为5(即极限学习机的输入节点数为5),构建结构为5-11-1的极限学习机预测模型,其中学习机的激励函数为Sigmoid函数。利用训练好的网络模型对2011—2013年的粮食产量进行预测,通过反归一化处理得到的预测数据见表1。分别计算灰度模型和极限学习机模型的拟合误差,选取权值因子r=0.9,根据公式(16)、公式(20)分别计算灰度模型、极限学习机模型的权重系数qg/(qg+qε)=0.48、qε/(qg+qε)=0.52。然后根据公式(21)得到基于灰色极限学习机组合模型2011—2013年的粮食产量。
从表1可以看出,由于2011年距离训练集样本最近,因此,使用GM(1,1)模型得到的预测产量最精确,但GM(1,1)模型建模时所用数据元素较少,随着时间的增加,预测误差明显增大。而极限学习机方法结合了较多产量数据的历史信息,使得预测误差总体较为平稳。由于灰度极限学习机算法结合了灰度模型和极限学习机模型各自的优势,使得其产量预测效果较好,2012、2013年的粮食产量预测误差明显小于其他2种方法。3种方法3年的平均预测误差分别为2.65%(极限学习机)、3.25%(灰度模型)、1.19%(灰度极限学习机模型),由此可见,灰度极限学习机模型可以准确预测未来3年的粮食产量数据。
表1 各种模型得到的粮食产量数据
5 结论
粮食安全是关系国民经济健康发展和全面建设小康社会的重大问题,因此对粮食产量的短期、精确预测对于保障国家粮食安全和协助粮食管理部门作出科学有效决策具有重大意义。本研究根据粮食产量数据灰度性特点,将灰色模型的小样本短期预测功能和极限学习机大样本规律预测功能相结合,采用灰度极限学习机组合模型对粮食产量进行短期预测。对2011—2013年粮食产量的预测结果表明,该组合方法能够准确预测未来3年的粮食产量,平均预测误差约为1.19%,为粮食产量的短期精准预测提供了新的技术手段。
参考文献:
[1]谭昌伟,罗明,杨昕,等. 运用PLS算法由HJ-1A/1B遥感影像估测区域冬小麦理论产量[J]. 中国农业科学,2015,48(20):4033-4041.
[2]张虹. 基于系统动力学的我国粮食安全问题研究[D]. 成都:成都理工大学,2009.
[3]刘春琼,刘萍,吴生虎,等. 基于DCCA方法分析气候变化对四川省粮食产量的影响[J]. 中国农业气象,2016,37(1):43-50.
[4]范成方,史建民. 基于Holt-Winters及趋势-ARMA组合模型的粮食种植成本预测分析——以山东省玉米、小麦为例[J]. 中国农业资源与区划,2014,35(3):45-51.
[5]张超,何翔宇,吴荣涛,等. 基于等维新息GM(1,1)模型的河南省粮食产量预测[J]. 河南农业大学学报,2015,49(4):556-560,572.
[6]禹建丽,黎娅. 基于人工神经网络的粮食产量预测模型[J]. 河南农业科学,2005(7):44-46.
[7]杨雨时,董连杰,管琳. 基于粗糙集理论和BP神经网络的粮食产量预测方法[J]. 农机化研究,2014(11):34-37.
[8]杨克磊,张振宇,和美. 应用灰色GM(1,1)模型的粮食产量预测研究[J]. 重庆理工大学学报(自然科学),2015,29(4):124-127.
[9]Huang G B,Zhu Q Y,Siew CK. Extreme learning machine:a new learning scheme of feedforward neural networks[C]//2004 IEEE International Joint Conference on Neural Networks. Hungary:Budapest,2004.