APP下载

一种优化极限学习机的果园湿度预测方法*

2019-04-10邓小龙

传感技术学报 2019年3期
关键词:温湿度湿度果园

匡 亮,华 驰,邓小龙,施 珮

(1.江苏信息职业技术学院 物联网工程学院,江苏 无锡 214153;2.南京信息工程大学 物理与光电工程学院,南京 210044; 3.南京航空航天大学 计算机信息科学与技术学院,南京 210016;4.中国水产科学研究院淡水渔业研究中心,农业部淡水渔业和种质资源利用重点实验室,江苏 无锡 214081)

水蜜桃是华东华南地区具有巨大经济价值的农作物之一。水蜜桃的生长除了品种影响因素外,还与种植的环境有着密切联系。基于前人对水蜜桃影响因子的研究可以发现[1-2],除了不同肥料比例、pH和紫外线等因素,湿度也是果园中重要的环境参数之一,与果树的病虫害及果子品质有着密切的联系。精准、实时的果园湿度监控系统对水蜜桃的产量和品质有重要影响。

目前,有很多专家学者搭建基于WSN的湿度监控系统,也展开了湿度的监控、插补和预测研究。郭秀明等[3]搭建了基于WSN的苹果园温度采集系统,研究空气温湿度的果园分布特征;谢新华等[4]在番茄温室大棚中,利用WSN监控系统分析和研究温湿度的变化规律;邓雯等[5]基于能量平衡和物质平衡原理,建立了蔬菜大棚的温度和湿度的预测模型,模型的输入参数不易测量,实用性不强。赵新蕖等[6]建立基于改进灰色模型的粮仓温湿度预测模型,模型对历史数据依赖性强,没有考虑其他相关因素之间的联系。邹伟东等[7]提出改进极限学习机的日光温室温湿度预测模型,考虑隐含层节点数的确定问题,但忽略了随机参数对模型的影响,同时缺少对模型输入变量的分析。在水蜜桃的果园种植中,无线监测系统的使用仍然较为贫乏。同时,基于无线监测系统的果园湿度预测其预测模型的输入数据较为冗余,预测精度较低。

针对上述问题,本文基于水蜜桃无线传感监测实验基地,提出基于主成分分析(PCA)的粒子群优化算法(PSO)改进极限学习机(ELM)果园湿度预测方法。首先,利用PCA对影响湿度的气象因子进行分析,获得模型的预测输入变量,降低数据维度。再利用PSO算法改进ELM,获得最优初始权值和阈值,比较不同激活函数下改进ELM的预测模型效果,以果园环境监测系统中9天(1296组)的数据为训练和测试对象,完成PSO-ELM湿度预测模型的验证,并将预测模型应用到无锡水蜜桃果园的温湿度监测预警中。

1 研究方法

1.1 主成分分析

主成分分析PCA(Principal Component Analysis),又称主分量分析,是将原来众多具有相关性的指标,利用降维的方法将多个指标转换为少量相互不相关的指标,从而简化模型的一种统计方法[8]。主成分分析是数学建模中常用的方法,广泛应用于人口统计、模式识别等领域[9]。设原变量X1,X2,X3…,Xm分别表示各对象的特征,可以用N×m矩阵表示,则

(1)

主成分分析步骤如下:

①原始数据进行标准化处理,得到标准矩阵Y,即

(2)

②计算特征值和特征向量

R=X*TX*/(N-1)

(3)

式中:X*为标准化后的数据矩阵。求得相关矩阵的特征值λ1,λ2,…,λm和相应的特征向量u1,u2,…,um。

③计算主成分贡献率和累计贡献率

主成分贡献率:

(4)

累计贡献率:

(5)

④确定主成分个数和主成分矩阵

一般选取前p(p

主成分对应的特征向量为Um×p=[u1,u2,…,up],则p个主成分构成的矩阵为:

(6)

1.2 粒子群算法

粒子群优化算法PSO(Particle Swarm Optimization)是按照群鸟觅食的模型来求解优化问题的[11]。每个粒子都能够表示问题的一个潜在解。粒子特征用粒子的位置、速度和适应度值来表示。每次粒子移动的方位和距离均由粒子自身速度来决定。根据其他粒子的移动情况,粒子的速度也可同时调整,达到在可解空间寻优[12-13]。在每次迭代寻优的过程中,粒子速度和位置都要通过个体极值和全局极值来更新,可用如下公式表示:

(7)

(8)

式中:w为惯性权重;k为当前迭代次数;Vid表示粒子速度;c1和c2为加速度因子。r1和r2分别为[0,1]内的随机数。

1.3 PSO优化ELM算法

极限学习机ELM(Extreme Learning Machine)是一种快速、高效的前馈神经网络学习算法[14-16]。其包含输入层、隐含层和输出层。在包含n个样本的集合(xi,yi)中,隐含层个数为L,激活函数为g(x),则该网络输出可表示为:

(9)

wj为第j个隐含节点与输入节点间权值;bj为第j个隐含节点的偏置;β为隐含节点与输出节点间权值;H为ELM网络隐含层的输出矩阵。则n个样本的等式可写成:

Hβ=Y

(10)

虽然极限学习机学习速度快,泛化能力好,但输入层与隐含层间的连接权值、隐含层神经元的阈值,隐含层神经元个数对极限学习机精度有很大影响[17-19]。因此,本文选用粒子群优化算法确定这些最优化的参数值,以期获得最优的ELM预测模型。其主要步骤如下所示:

①建立ELM网络,确定ELM网络的拓扑结构,输入变量X=[X1,X2,…,Xm]T,输出变量Y=[Y1,Y2,…,Yk]T。对粒子群参数进行初始化,包括种群规模M、惯性权重w、迭代次数k、加速度因子C1、C2和粒子维数D等。

②根据自身适应度函数计算得到PSO适应度值fitness,并得到个体极值和群体极值。

③对粒子的速度和位置进行更新,计算粒子适应度值,对更新后的个体极值和群体极值进行判断,当达到迭代次数或最小误差时,粒子群寻优终止。

④得到ELM算法所需的最优输入权值矩阵abest和隐含层偏置bbest。

⑤计算隐含层的输出矩阵H。

(11)

通过确定的隐含层输出矩阵H,利用线性系统最小二乘解的求解方法,得到隐含层节点与输出节点之间的输出权值β,公式如下所示。

(12)

式中:H+为输出矩阵H的广义逆。

基于PSO优化ELM算法分为ELM神经网络隐含层确定、PSO优化和ELM神经网络预测插补值3个部分,算法流程图如图1所示。

图1 PSO优化ELM算法流程图

1.4 激活函数

在ELM中,激活函数在ELM网络中拥有重要地位。合适的激活函数能够优化网络性能,提高算法的精度和泛化能力。反之,不合适的激活函数则会降低网络性能,无论怎么优化都实现不了好的学习效果。目前,ELM常用的激活函数包括4种[20],如下所示:

①Sigmoid函数:

(13)

②Sine函数:

g(x)=sin(aix)

(14)

③hardlim函数:

g(x)=2 hardlim(aix)

(15)

hardlim激活函数的返回值为0或1。若输入元素大于0,则返回1,;否则即返回0。

④Rbf(Radial basis function)函数

(16)

式中:ai为函数的中心,σ为激活函数的宽度参数,控制函数作用范围。

2 果园湿度预测模型构建

2.1 研究区域

本文中的无线传感网温湿度监测系统布局在江苏省无锡市阳山水蜜桃种植基地。试验基地25亩桃林中共铺设3个微型果园无线传感网监测系统。每个系统由多个传感器构建无线传感器网络,如图2所示。监控系统可以对温度、湿度、压强、光照、风速、风向和二氧化碳进行数据采集,每10 min采集一组数据,选取其中一个监测系统 2016年7月22日至7月30日9 d内全天的监控数据,共计1 296条数据。取前1 152组(8 d)数据为训练集,剩余144组(1 d)数据作为测试集,对果园的湿度指标进行预测。此实验周期为水蜜桃大量成熟的时间,天气环境无极端情况。

图2 果园无线传感网监测系统

2.2 数据标准化

为避免各维数据之间数量级差别太大,使得其某些分量失去了对整个网络的调控能力,需在极限学习机构建神经网络过程中,将样本数据进行归一化处理[21]。本文使用最大最小法(Max-Min Normalization)分别对原始气象数据中温度、湿度、压强、光照、风速、风向和二氧化碳含量数值进行归一化,如公示(17)所示。

xk=(xk-xmin)/(xmax-xmin)

(17)

式中:xmin为该维数据中的最小数,xmax为该维数据中的最大数。

2.3 预测体系构建

本文以果园湿度指标为预测对象,首先利用PCA方法对归一化后的1296组样本7个影响因素进行主成分分析。由计算可获得 7个影响因子的特征值和方差贡献率,如表1所示。其中3个主成分的累积方差贡献率为86.865%,故选择表1中的3个主成分来代表综合指标。各主成分因子载荷矩阵如表2所示。事实上,各个主成分对应的各输入指标的载荷值反映了该指标所表征的信息量,载荷越大,信息量就越大。主成分1的贡献率为39%,可表征湿度、温度及二氧化碳3个影响因素。主成分2的累计贡献率为67%,可表征压强和风向两个影响因素。主成分3的累计贡献率为86%,可表征光照影响因素。由此,可确定湿度预测模型的输入维度,即温度、二氧化碳、压强、风向和光照5个指标,并构建湿度预测模型的输入输出模型。

表1 特征值及方差贡献率

表2 主成分因子载荷矩阵

2.4 湿度预测模型的参数设置

经过主成分分析,确定湿度预测模型的输入输出指标。在MATLAB R2014a的运行环境下,对PSO-ELM中的PSO优化部分和ELM算法的参数进行设置,完成模型的训练和预测。

①PSO优化部分。在PSO优化算法中,设置种群大小为40,迭代次数为200,加速度因子c1和c2分别为2.8和1.3。为了均衡全局搜索和局部搜索能力,采用线性递减惯性权重方法,设置初始惯性权重为0.9,迭代结束时惯性权重设置为0.4。

②ELM神经网络部分。在ELM网络中,包含5个输入节点和1个输出节点。在隐含层节点数的确定上,为了避免出现“欠适配”、“过适配”的问题[22],借鉴“试错法”,通过不断试验和改变模型的拓扑结构,最终确定预测模型的隐含层节点数为26。

2.5 性能评估

为了对PSO优化极限学习机算法的预测性能进行评估,选择均方根误差RMSE(Root Mean Square Error)、平均绝对百分比误差MAPE(Mean Absolute Percent Error)和平均绝对误差MAE(Mean Absolute Error)等指标作为模型预测性能判断的标准[23]。各评估指标的计算公式分别为:

(18)

(19)

(20)

3 实验结果与分析

3.1 模型的选择

本文的预测模型以温湿度监测系统的一个监测点为例,对构建的1 296组训练样本和144组测试样本进行对比分析。

在PSO-ELM预测模型中,由于ELM的激活函数有多种,且激活函数对模型的预测效果有重要影响。为了选择适宜的激活函数,本文选择“Sigmoid”、“Sine”、“hardlim”和“Rbf”4种常用激活函数进行预测,根据预测的性能效果确定模型的激活函数,结果如图3所示。

图3 PSO-ELM不同激活函数预测效果

由图3信息可知,这4类常见激活函数均可实现湿度的预测,输出湿度预测值;从预测性能上看,Sigmoid函数获得了最小的MAE、RMSE和MAPE值,Sine函数和Rbf函数的预测精度相差不大,hardlim函数的预测性能最差,该激活函数不适宜处理该湿度的预测过程。从预测精度最高的原则出发,最终确定性能最优的Sigmoid作为PSO-ELM预测模型中隐含层的激活函数,从而确定预测模型的拓扑结构。

3.2 预测模型比较

经上述实验,最终确立以Sigmoid激活函数的PSO-ELM预测模型。PSO算法和ELM算法的参数如2.4节所述,对构建的湿度预测训练集和测试集进行测试。模型的迭代曲线如图4所示,从图中可以发现模型的收敛速度较快,适应度达到了较高的精度。

图4 PSO-ELM 迭代误差图

为了验证PSO-ELM湿度预测模型有较好的性能,将PSO-ELM算法与单纯ELM算法进行对比试验。本文中单纯ELM预测模型的输入指标同PSO-ELM,将PCA方法中确定的5个指标作为预测模型的输入,输出为湿度,其中ELM的初始权重和偏置通过随机的方式获得。图5为PSO-ELM和ELM模型的预测值和真实值对比。由图5可以发现,PSO-ELM模型的拟合曲线与实际值一致,拟合效果较好,且明显优于ELM模型拟合效果。在ELM预测中,有较大部分数据偏离真实值,误差较大,且预测精度起伏较大,预测性能不稳定。整个测试集合中,PSO-ELM模型的预测曲线与实际数据曲线之间虽存在较小的误差,但实际预测效果能较好的反映真实数据的变化趋势。

图5 预测效果对比图

为了进一步分析PSO-ELM和ELM模型的预测性能,本文对两预测模型进行了比较,如表3所示。PSO-ELM的预测性能RMSE、MAPE、MAE相较于ELM模型分别提高了89.07%、89.31%和89.39%。该模型预测精度稳定,总体预测性能明显优于ELM模型。PSO算法有较好的寻优能力,能够得到ELM所需最优权值和隐含层偏置,因此PSO-ELM更适于实现湿度的预测。

表3 PSO-ELM、ELM模型插补性能评估对比

本文同时也引入传统线性回归方法,获得不同预测方法的预测精度对比结果,其中仅显示其中部分数据如表4所示。

表4显示,本文提出的PSO-ELM算法的实际预测值更接近真实值,平均相对误差优于线性回归法,且预测效果稳定。线性回归算法的预测精度优于ELM模型,两模型均存在预测精度差异较大的问题,预测性能不稳定。这是因为线性回归法较适用于单调函数,在震荡剧烈、局部极值点不明确的情况下,线性回归易发生偏差。而ELM模型的参数随机获取,预测结果易出现较大误差。改进的ELM预测模型克服了这些问题,可以对果园湿度指标实现可靠、准确的预测。

表4 不同预测方法预测精度对比

4 结束语

针对水蜜桃对温湿度条件要求较高的情况,本文利用无线传感果园温湿度监测系统,实时获取果园环境、天气状况。并通过PCA算法联合PSO和ELM,构建PCA算法下的PSO-ELM预测模型对果园的湿度进行预测。基于果园种植条件下,空气湿度主要受多种环境因素影响,本文将PCA方法分析各影响因素的关系,降低输入变量的维度,去除变量间相关性;利用PSO算法优化ELM模型的输入权值和阈值;通过训练和测试发现,以Sigmoid为激活函数的PSO-ELM模型,RMSE为0.5038预测精度较高,与传统线性回归法、ELM法相比有明显的提升。PSO-ELM适用于多变量输入的预测模型,不仅能为果园湿度预测提供切实可行的方法,也为其他环境指标的预测提供新的思路。

猜你喜欢

温湿度湿度果园
天、空、地一体化“未来果园”看一下
路基上CRTSⅡ型板式无砟轨道湿度场分析
秋天的果园
基于AT89C51的数字型蚕用温湿度计的设计
基于DSP的多路温湿度监测系统
基于温湿度控制的天气预测装置
我家果园丰收了
蒸发冷却温湿度独立控制空调系统的应用
跟踪导练(二)(2)
城市草坪对空气温度和湿度的影响