

农业工程学报 2017年10期


(1. 东北农业大学工程学院,哈尔滨 150030;2. 黑龙江科技大学机械工程学院,哈尔滨 150022)

为提高农机总动力增长变化预测结果的准确性和可靠性,根据农机总动力增长变化与其影响因素之间具有在各时间尺度明显的非线性波动特征,提出以1986—2013年农机总动力增长为研究对象,分别对农机总动力增长及其影响因素时间序列数据进行经验模态分解(empirical mode decomposition,EMD),对得到的各时间尺度下的波动分量分别建立BP神经网络预测模型。将EMD-BP网络预测结果与多元线性回归、支持向量机、BP神经网络进行对比分析,结果表明:基于EMD-BP网络建立的农机总动力增长预测模型,拟合和预测平均相对误差分别为0.99%和1.29%,相关决定系数约为0.999,均方根误差为316.35 MW,模型评价等级为“好”,各项精度评价指标都优于其他方法,因此该预测模型精度高、可靠性强。研究成果为农业机械化发展规划的制定和出台相关政策提供有效参考。

农业机械;模型;支持向量机;经验模态分解;BP 神经网络;农机总动力;预测

王金峰,闫东伟,鞠金艳,王金武. 基于经验模态分解与BP神经网络的农机总动力增长预测[J]. 农业工程学报,2017,33(10):116-122. doi:10.11975/j.issn.1002-6819.2017.10.015

Wang Jinfeng, Yan Dongwei, Ju Jinyan, Wang Jinwu. Prediction of total power growth of agricultural machinery based on empirical mode decomposition and BP neural network[J]. Transactions of the Chinese Society of Agricultural Engineering(Transactions of the CSAE), 2017, 33(10): 116-122. (in Chinese with English abstract)


0 引 言




经验模态分解、奇异谱分解和小波分解等方法均可对时间序列进行多尺度分解,提取出代表原时间序列不同成分的信号,但奇异谱分解和小波分解均需预先给定基函数,无法根据数据自身的时间尺度特征进行分解,可能会分解出无效的波动分量[19-20]。Huang等提出的经验模态分解法(empirical mode decomposition,EMD)无需预先设定任何基函数,利用高斯白噪声具有频率均匀分布的统计特性,自适应地将数据序列分解为包含了原始数据的不同时间尺度局部特征信号的有限个本征模态函数(intrinsic mode function,IMF)和表示信号发展趋势的趋势量,对信号的分解具有客观性和稳定性的特点[21-22]。BP神经网络具有较强的非线性映射能力,在农机总动力预测领域得到较好的预测效果[5-8]。因此,本文采用EMD法对1986—2013年农机总动力增长及其影响因素时间序列进行分解,然后分别对分解后的相同时间尺度下的时间序列建立非线性BP神经网络模型,并对各预测结果进行重构得到农机总动力增长预测值,建立基于 EMD-BP神经网络的农机总动力增长预测模型,为农机总动力的准确预测提供新方法,预测结果为农机总动力快速发展,农机管理部门根据农业机械化发展情况制定农业机械化发展规划提供有效参考依据。

1 影响因素的选取与数据获得


农机总动力增长主要影响因素的选取是分析农机总动力增长变化和合理预测的基础。目前,选取的方法主要有主成分分析法、相关分析法和灰色关联分析法等[23-28]。本文运用统计分析软件SPSS 18.0,采用主成分分析法对影响因素进行分析,得到第一和第二个成分的特征值均大于1,分别为8.252和1.326,其他成分的特征值均小于1,且这2个成分的累积贡献率已达到95.782%,远大于根据累计贡献率选取主成分的临界值 80%,说明这 2个成分可以较好的解释原始变量数据的信息。因此,提取这 2个成分作为主成分,各主成分与原始变量之间的因子载荷矩阵见表1。

表1 主成分因子载荷矩阵Table 1 Factor loading matrix of principal component

由表1可知,主成分1在农民人均纯收入、政府财政投入、劳均播种面积和燃料价格指数 4个指标上的载荷值较大,其贡献率高达82.521%,说明主成分1与这4个指标的相关性较高,并且农机投入能力及播种面积增大状况对农机总动力增长有重要影响,是保障农机总动力持续增产的推动力;主成分 2在第一产业从业人员数和机械化农具价格指数 2个指标上的载荷值较大,其贡献率为13.261%,说明农业从业人员的减少和农具价格的降低对农机总动力增长起积极引导作用。进一步对农机总动力增长各影响因素进行相关性分析,得出农民人均纯收入与粮食单产和农业劳均产值相关性极显著,燃料价格指数与机械化农具价格指数、初中文化以上农村劳动力比例和非农产业的发展相关性极显著,相关系数均在0.85以上。为简化模型,最终选取影响因素中劳均播种面积、政府财政投入、农民人均纯收入、燃料价格指数和第一产业从业人员数作为模型输入因子,对农机总动力增长进行预测。


表2 1986—2013年农机总动力增长及其主要影响因素数据Table 2 Data of growth of agricultural machinery total power and its main influencing factors from 1986 to 2013


2 分解和预测方法

2.1 EMD分解法


2.2 BP神经网络预测法


图1 三层BP神经网络结构图Fig.1 Structure of BP neural network with three layers


3 EMD分解与预测分析

3.1 农机总动力增长及其影响因素的EMD分解

采用EMD分解法对1986—2013年农机总动力增长进行分解,得到2个本征模态函数IMF1、IMF2及1个趋势量。IMF1、IMF2的波动时间尺度分别为4~6 a和10 a左右,波峰波谷均匀出现;趋势量反应了农机总动力增长的长期变化趋势,如图2所示。

图2 农机总动力增长及其经验模态分解结果Fig.2 Growth of agricultural machinery total power and its empirical mode decomposition

1986—2013年农机总动力增长各影响因素的 EMD分解结果如图3所示,由图3可知,政府财政投入和第一产业从业人员数分解后分别得到波动时间尺度为 10 a左右的本征模态函数和趋势量;劳均播种面积和燃料价格指数分解后均得到波动时间尺度约为4~6 a和10 a左右的 2个本征模态函数及趋势量;农民人均纯收入无明显波动现象,分解后不产生本征模态函数,只有趋势量。由EMD分解结果可知,各影响因素分解得到的波动时间尺度为 4~6 a的本征模态函数与农机总动力增长IMF1的波动时间尺度相同,可认为是影响农机总动力增长波动周期为4~6 a的主要因素,因此可利用各影响因素波动尺度4~6 a的时间序列对农机总动力增长IMF1进行预测,同理可利用各影响因素波动尺度10 a左右的时间序列和趋势量分别对农机总动力增长 IMF2和趋势量进行预测。

3.2 农机总动力增长预测与分析


图3 主要影响因素经验模态分解结果Fig.3 Empirical mode decomposition results of main influence factors

1)将农机总动力增长及各影响因素分解后得到的波动时间尺度相同的时间序列列为一组,因此得到趋势量和波动时间尺度为10 a、4~6 a的3组数据。


① 确定模型输入、输出因子

将劳均播种面积、政府财政投入、农民人均纯收入、第一产业从业人员数和燃料价格指数经 EMD分解后得到的趋势量作为BP神经网络的输入因子,因此输入层的节点数为5;输出层的输出因子为农机总动力增长的趋势量,节点数为1。

② 样本数据的预处理

BP网络训练样本集为 1986—2009年数据,验证集为2010—2013年数据。为消除量纲的影响及避免神经元过饱和,对输入数据和输出数据进行标准化处理,将各数值换算至[0,1]内,以提高网络的收敛性能和泛化能力,应用Matlab软件编程实现,再将输出层得到的农机总动力增长趋势量预测结果进行反归一化。

③ 模型结构设计和函数选择

本文采用含有一个隐含层的BP网络,误差精度的提高通过增加隐含层神经元数目来获得。根据隐含层节点数的确定公式式中,i、m和n分别表示隐含层、输入层和输出层的节点数,δ表示0~10之间的常数,计算得到隐含层节点数的初始值为 3,采用试凑法进行训练对比得到最佳节点数为6。网络训练函数为Trainlm,隐含层和输出层分别采用Sigmoid和Pureline传递函数。

④ 设定网络训练参数

设定BP网络的相关参数,如学习精度为10-5,迭代步数为 1 500,学习速率为 0.01,利用初始化函数 net=init(net)来初始化网络的权值和阈值,然后对BP网络模型进行训练。

3)根据第二步的原理,对农机总动力增长的 IMF1和IMF2分别进行预测。预测农机总动力增长的IMF1,BP神经网络的输入为劳均播种面积和燃料价格指数经EMD分解后得到的波动时间尺度为4~6 a的分量,因此输入层的节点数为2,输出层为农机总动力增长的IMF1,节点数为1,隐含层节点数确定为7。预测农机总动力增长的 IMF2,BP神经网络的输入为劳均播种面积、政府财政投入、第一产业从业人员数和燃料价格指数的波动时间尺度为10 a的波动分量,因此输入层的节点数为4,输出层为农机总动力增长的IMF2,节点数为1,隐含层节点数确定为6。

4)将各 BP神经网络模型预测得到的 IMF1、IMF2和趋势量结果进行重构,即相加求和得到农机总动力增长的最终预测值。BP神经网络预测农机总动力增长IMF1、IMF2和趋势量的结果见表3,由表3可知,IMF1、IMF2和趋势量的预测值与目标值之间的相关决定系数分别约为0.997、0.999和0.999,平均相对误差分别为7.90%、1.96%和0.09%,趋势量和IMF2的预测值与实际值的拟合效果均表现出极强的相关性,平均相对误差较低;IMF1的预测模型的相关决定系数较高,但平均相对误差较大,主要是因为IMF1的原始数据序列较小,对于变量的波动情况表达明显,因此平均相对误差较大。

表3 农机总动力增长各波动分量预测结果统计Table 3 Prediction results summary of each fluctuation item of growth of agricultural machinery total power

将农机总动力增长 IMF1、IMF2和趋势量的预测结果进行求和重构得到最终的预测值,训练样本和检验样本的预测结果见表4。由表4可知,EMD-BP神经网络模型预测得到的农机总动力增长预测值与实际值具有极高的相关水平,1986—2009年训练样本的平均相对误差为0.99%,最大相对误差为3.75%,最小相对误差为0.05%,2010-2013年检验样本的平均相对误差为1.29%,最大相对误差为2.60%,最小相对误差为0.17%,均在误差的允许范围内,可见EMD-BP预测模型具有较好的拟合和预测能力,可以满足农机总动力增长预测的精度要求。

3.3 模型精度评价方法

3.3.1 对比模型的建立

为科学、合理的评价EMD-BP模型的预测精度,分别选取多元线性回归模型(multivariate linear regression,MLR)、支持向量机模型(support vector machine model,SVM)和BP神经网络模型对农机总动力增长进行预测,并对预测模型进行对比分析。

多元线性回归模型、SVM模型和BP神经网络模型的输入为影响农机总动力增长变化的 5种主要因素的时间序列,输出为农机总动力增长时间序列。SVM模型参数的选取对预测精度影响较大[33-34],因此为提高预测精度,利用遗传算法(genetic algorithm,GA)对SVM模型进行优化,选择径向基函数(radical basis function,RBF)作为算法核函数,通过多次优化,确定SVM模型的最佳参数c=47.427 6、g=5.887 8、p=0.0463 18。BP神经网络模型隐含层为1个,隐含层神经元为6个,训练函数为Trainlm,传递函数分别为Sigmoid和Pureline,设定网络的学习精度为10-5,迭代步数为2 000,学习速率为0.01等。

表4 不同预测方法的农机总动力增长预测值与误差Table 4 Predicted results and errors of growth of agricultural machinery total power using different models

3.3.2 模型精度评价

应用多元线性回归模型、基于遗传算法优化的支持向量机模型(GA-SVM)和BP神经网络对农机总动力增长进行预测。采用决定系数R2、均方根误差(root mean square error,RMSE)、平均相对误差(mean relative error,MRE)、后验差比和小误差概率等指标分别对各预测模型进行效果评价,评价结果见表5。由表5可知,多元线性回归模型的平均相对误差较大,模型等级评价为“合格”,预测效果最差;BP神经网络模型预测误差、决定系数和模型等级评价效果都优于GA-SVM模型,可见BP神经网络对非线性函数的拟合能力优于 SVM 模型。EMD-BP神经网络模型的决定系数约为0.999,RMSE为316.35 MW,拟合和预测平均相对误差分别为 0.99%和1.29%,后验差比为0.02,模型的各项评价指标都较好,模型等级评价为“好”,结果表明EMD-BP神经网络输出值与目标值偏差较小,是十分有效的预测方法。

表5 不同预测方法的农机总动力增长预测结果评价Table 5 Prediction results evaluation of growth of agricultural machinery total power using different models

4 结 论


1)采用主成分分析和相关性分析相结合的方法,确定劳均播种面积、政府财政投入、农民人均纯收入、燃料价格指数和第一产业从业人员数 5个因素为影响农机总动力增长预测的输入因子,采用 EMD分解法对1986-2013年农机总动力增长及其影响因素进行多时间尺度分解,得到波动时间尺度为4~6 a和10 a左右的各本征模态函数及表示信号序列长期发展趋势的趋势量,并确定影响农机总动力增长各本征模态函数IMF1、IMF2和趋势量变化相对应的因素。

2)应用EMD-BP神经网络建立农机总动力增长预测模型,预测值与实际值的平均拟合和预测相对误差分别为0.99%和1.29%,决定系数约为0.999,均方根误差为316.35 MW,通过后验差比和小误差概率评定模型等级为“好”,预测值与实际值呈极显著相关。通过将EMD-BP神经网络模型与多元线性回归、GA-SVM、BP神经网络模型的预测结果进行对比,表明EMD分解法可以清晰地表达出原始时间序列在不同时间尺度上的波动情况,解决多时间尺度序列的预测问题,BP神经网络是一种能有效处理多因素非线性农机总动力增长变化预测的方法。


Prediction of total power growth of agricultural machinery based on empirical mode decomposition and BP neural network

Wang Jinfeng1, Yan Dongwei1, Ju Jinyan2, Wang Jinwu1
(1.College of Engineering,Northeast Agricultural University,Harbin150030,China;2.College of Mechanical Engineering,Heilongjiang University of Science and Technology,Harbin150022,China)

The traditional time series prediction models and multi-factor linear regression prediction models for total power of agricultural machinery are difficult to meet the actual analysis and forecasting demand. The total power growth of agricultural machinery and its influencing factors have strong correlation and obvious nonlinear fluctuation characteristics in various time scales. Taking the time series data of the total power growth of agricultural machinery and its influencing factors from 1986 to 2013 as the research objects, the prediction model for the total power growth of agricultural machinery was proposed to improve the accuracy and reliability of prediction results based on empirical mode decomposition (EMD) and BP (back propagation) neural network. The total power growth of agricultural machinery was affected by many factors such as government macro policy,farmers’ income growth, production scale expanding, production capacity improving, and so on. In order to determine the main influencing factors, the principal component analysis method was adopted to analyze the main contribution factors, and then the correlation analysis method was used to analyze the correlations between factors. The less affected factors were eliminated,and ultimately, planting area per labor, government finance investment, per capita net income of farmers, fuel price index and the number of first industry practitioners were determined as the main influencing factors, which were used to forecast the total power growth of agricultural machinery. The EMD method was adopted to decompose the total power growth of agricultural machinery and its main influencing factors from 1986 to 2013 in multi-time scale, the intrinsic mode functions (IMFs) with different time scales and the trend items were obtained, and then the nonlinear relationships between each IMF component and trend item of the total power growth of agricultural machinery and volatile component of influencing factors were established using BP network. At last, the results were reconstructed to forecast the total power growth of agricultural machinery. In order to evaluate the accuracy of developed EMD-BP model, the comparative models of multiple linear regression (MLR), support vector machine (SVM) model and BP neural network were developed. The prediction results of EMD-BP network, MLR,SVM model and BP neural network were analyzed. The average relative error of EMD-BP model fitting and prediction was 0.99% and 1.29% respectively, the relevant decision coefficient was 0.999, the standard error was 316.35 MW, and the evaluation grade of the model was good, and thus the accuracy evaluation indicators of EMD-BP network were better than other methods and had high precision and reliability. The results show that the EMD method can clearly express the volatility of original time series in different time scales, which can solve the prediction problem of multi-time scale sequence. The BP neural network is a kind of effective prediction method for the total power growth of agricultural machinery with nonlinear fluctuation. The developed EMD-BP neural network can determine the fluctuation relationships between the total power of agricultural machinery and its main influencing factors in each time scale, which can effectively solve the forecast problem of the total power growth of agricultural machinery and improve the accuracy of predicted results. The EMD-BP neural network offers a new method for quantitatively predicting the total power growth of agricultural machinery, and provides effective references for developing agricultural mechanization development plan and publishing relevant policy.

agricultural machinery; models; support vector machine; empirical mode decomposition; BP neural network;agricultural machinery total power; prediction








王金峰,男,黑龙江哈尔滨人,博士,副教授,从事田间作业机械和农业机械化生产管理的研究。哈尔滨 东北农业大学工程学院,150030。


