APP下载

精准扶贫指标
——农机总动力基于BP神经网络SAS分析预测

2017-05-09雷凯栋张淑娟

农产品加工 2017年6期
关键词:年龄结构农业机械动力

雷凯栋,张淑娟

精准扶贫指标
——农机总动力基于BP神经网络SAS分析预测

雷凯栋,*张淑娟

(山西农业大学工学院,山西太谷030800)

主要研究了农业机械总动力预测分析,创新思路,从容易忽视的年龄结构因子进行数学建模,分析预测农业机械总动力,并基于BP神经网络和SAS数据分析进行预测。结果显示,农机总动力维持不变,但会优化农机总配备结构模式。

BP神经网络;SAS数据分析;农业机械总动力

0 引言

我国是农业大国,拥有世界最多的农村人口数量。而在“十三五”规划时期我国将大力推进农业机械化进程[1-2]。为此,研究从人们容易忽略的影响因子(如年龄结构、播种面积、农民人口数量等)对农机总动力的关联影响着手,与发达国家进行对比,随着年龄结构的日益老龄化、农民比例对一个国家的现代化、机械化、智能化有较强相关,制定相关执行方案,并提供了一些参考信息,将会对未来趋势科学合理的把握,以及政策制定、优化资源配备等发挥积极作用。在生产实际中,任意的某些因子在一个层面里看似毫无关系,但是当进入第2层或者更深层次时都存在间接的影响。研究所收集了7个因子数据,数据背后往往隐藏着事物发展的趋势和事实的真相。采用科学的数学建模理论和SAS数据分析预测组合分析预测农机总动力,来验证这一趋势。

1 数据分析及构建模型

1.1 问题描述

在实际农业生产中,有很多因素影响着农业机械总动力的增长。以下将研究农用大中型拖拉机数量、年末总人口、0~14岁人口、15~64岁人口、64岁以上人口、农作物总播种面积、农民人口数量等7个因子对农机总动力未来趋势的影响。

影响农业机械总动力增长的趋势有很多因素,经济发展、国内生产总值、受教育程度、农民人数、年龄结构、作物播种面积等因子影响[3-5]。在数据统计处理分析中,经常用到时间序列模型和回归模型,而时间序列不能很好地利用影响大的因子和其他因子,导致数据分析不准确。本研究创新思路,从人们容易忽视的因素(年龄结构对农机总动力的影响)进行挖掘数据背后的意义。同时,构建BP神经网络、SAS数据分析进行组合预测,从而挖掘数据背后的趋势。

1.2 数据分析

前期收集的数据来源为2002—2016年中国统计年鉴,列出7个预测因子和实际农业机械总动力(Y)作为输入和目标向量。预测因子为农用大中型拖拉机数量(台)(X1)、年末总人口(万人)(X2)、0~14岁人口(万人)(X3)、15~64岁人口(万人)(X4)、65岁及以上人口(万人)(X5)、农作物总播种面积(千公顷)(X6)、农民人口数量(万人)(X7),一共收集15个学习样本。

1.3 BP神经网络建模及SAS数据分析预测

BP神经网络由输入层、隐含层和输出层及各层神经元之间连接组成,其中隐含层可以为单层,也可以是多层。一个3层网络由输入层、隐含层和输出层组成,输入层与隐含层、隐含层与输出层之间连接权值的大小体现神经元之间的连接强度。BP神经网络是系统预测中应用特别广泛的一种网络形式,根据BP网络的设计网络,可以通过单隐层的BP网络实现。输入向量有7个因子,网络的输入向量有7个因素,网络的中间层神经元经过经验公式和后期网络训练试验值为11时,效果最好。

1.4 BP网络训练与测试

训练回归见图1,训练最优、训练、目标关于均方误差见图2。

图1 训练回归

图2 训练最优、训练、目标关于均方误差

由图1可知,所得图为运用MATLAB编程进行训练所得训练图。训练结果:R=0.805 19,训练结果很稳定。图1中横坐标为训练对象,纵坐标为输出结果;图2为此次训练过程最优、训练、目标关于均方误差图(均由MATLAB编程得出)。

2 结论分析

BP网络预测误差见表1。

表1 BP网络预测误差

基于表1误差结果分析,该误差在生产实践中是可以接受的。基于BP网络模型预测下一年为111 662.348 5 WKW,总动力有所下降,经查阅资料分析可能以下原因导致:①所建模型误差所致;②国家政策指导优势机械总动力优化配备结构;③城镇化加速;④农业生产模式向农场转变等很多因素。

2.1 SAS设计数据处理及分析预测

此次收集的相关数据为随机变量,称之为随机型多元样本,并对试验研究进行多元回归设计(Multiple regression designs),即具有2个以上自变量(因子)的回归试验设计。回归模型未知时,可采用线性模型和多项式模型进行设计。

2.2 多元回归设计及分析

自变量因子为7个,分别以X1,X2,X3,X4,X5,X6,X7表示,效应总数为8,试验方案至少需要9个处理。表2为1.2中1996—2015年农业机械总动力(Y)与7个因子的回归方差分析。

回归方差分析见表2。

表2 回归方差分析

将表2所示数据样本创建为SAS数据表sasuser. nongjiyuce01.,利用reg过程在进行回归分析时作回归诊断,语句modle选项p指定输出回归诊断的条件指数,语句Plot residual.*X1residual.*X2residual.*X3residual.*X4residual.*X5residual.*X6residual.*X7residual.*predicted。

由表2中分析可知,此设计p<0.000 1,决定系数达0.999 6,模型极其显著且拟合精度较高。7个因子自变量的方差膨胀系数因子VIF均远大于10,是强相关;条件指数CIN大于100,为强相关。此模型的决定系数达0.996,p<0.000 1,回归模型极其显著并具有较高的拟合精度。

回归参数的估计和检验见表3。

分析其参数可知,X2,X3,X6对Y不显著。

多重共线性诊断见表4。

由表4共线性诊断结论得出,复相关数0.999 40据分析得出回归方程。

表3 回归参数的估计和检验

回归诊断:回归诊断的方法之一是残差分析,可诊断样本的正态性和方差齐性。

输出的统计数据分析见表5。

预测分析:经SAS建模处理分析预测,存在一定的误差,也还在接受范围,农业机械总动力为106 982.79 WKW。

表4 多重共线性诊断

表5 输出的统计数据分析

3 结论

经研究分析,最后得出结论,年龄结构也是一项重要因素。看似毫无关系的因素在实际生产中起着微小的作用,但所有微小的作用聚集,将会产生很大的波动。经过SAS建模处理和BP神经网络进行组合预测分析,决定系数达0.999 6,作拟合预测非常可靠,2种模型互补。据估计参数显示,年末总人口、0~14岁人口对农业机械总动力影响不是很显著,但是农用大中型拖拉机数量、农民人口数量、15~64岁人口及农作物总播种面积等影响很大,说明随着社会年龄结构的变化和老龄化的加剧,农业机械化关系到国家的发展。对比发达国家,年龄结构也是农业机械化加快的趋势;而国家大力推进农用大中型拖拉机的惠民政策也是一个显著因子。

经研究分析预测,未来我国农业机械总动力不会有大幅的增加,而是保持在一定的农机总动力的范围,完善优化各类先进农业机械,淘汰低效率、单一作业,转而向智能化、信息化、远程遥感的高精端农业机械配备,实现全程自动化。以科学的数学模型和统计分析佐证这一预测,数据背后的趋势正是时代的趋势,此预测将对政策进一步执行、农机总动力优化配备提供一项可靠的参考信息。

[1]葛哲学.神经网络理论与MATLAB R2007实现[M].北京:电子工业出版社出版,2007:73-86.

[2]姜启源.数学模型[M].北京:高等教育出版社,1998:54-57.

[3]徐国祥.统计预测和决策[M].上海:上海财经大学出版社,2005:100-120.

[4]涂志强,杨敏丽.关于我国农业机械化发展趋势的思考[J].中国农机化,2005(5):3-7

[5]韩磊,李锐,朱会利.基于BP神经网络的土壤养分综合评价模[J].农业机械学报,2011,42(7):109-115.◇

Precise Poverty Alleviation Index:Analysis of the Total Power of Agricultural Machinery Based on BP Neural Network SAS

LEI Kaidong,*ZHANG Shujuan
(Institute of Technology,Shanxi Agricultural University,Taigu,Shanxi 030800,China)

In this paper,we study forecast analysis of total power of agricultural machinery.Innovation mentality,from the easy to overlook the age structure of the factor for mathematical modeling,analysis of forecast agricultural machinery total power.Will be based on the BP neural network and SAS date analysis,make a prediction.The conclusion of agricultural machinery total power remain unchanged,but always in optimization of agricultural machinery equipped with structural patterns.

BP neural network;SAS data analysis;total power of agricultural machinery

F224

A

10.16693/j.cnki.1671-9646(X).2017.03.049

1671-9646(2017)03b-0074-03

2017-03-13

国家自然科学基金(31271973);山西省自然科学基金(2012011030-3)。

雷凯栋(1992—),男,在读硕士,研究方向为农业机械化。

*通讯作者:张淑娟(1963—),女,博士,教授,研究方向为农业机械装备。

猜你喜欢

年龄结构农业机械动力
具有年龄结构的麻疹传染病模型的稳定性分析
学习动力不足如何自给自足
人口总数变化的比例进入潜伏或染病群体的年龄结构传染病模型及稳定性
宜宾市农业机械研究所
胖胖一家和瘦瘦一家(10)
具有Markov调制的随机年龄结构种群系统半驯服Euler法的指数稳定性
动力船
农业机械自动化在现代农业中的应用与发展趋势
电子信息技术在农业机械中的应用
长江口凤鲚繁殖群体的年龄结构和生长特性