APP下载

LM-BP神经网络在湖泊营养状态评价中的应用

2013-11-19王泽平

环境科学导刊 2013年3期
关键词:训练样本湖泊神经网络

王泽平

(云南省水文水资源局丽江分局,云南丽江674100)

湖泊营养状态的客观评价对于湖泊的可持续管理和保护都具有重要意义。目前湖泊营养状态的评价方法主要有模糊度法、多目标模糊灰色决策法、模糊数学运算法、灰色局势决策、灰色聚类法、灰色层次决策法、主分量分析法等等,这些研究取得了一定的成果,但也存在一些问题。由于湖泊营养状态的评价是通过与湖泊营养状态有关的一系列指标及指标间的相互关系,对湖泊的营养状态做出准确的判断[1],识别过程具有高维、非线性的特征,适宜借助诸如人工智能、模糊识别、知识工程等方法建立模型,以处理多指标系统的综合识别问题[2]。人工神经网络 (Artifical Neural Network,ANN)具有较强的非线性映射能力、鲁棒性、容错性和自适应、自组织、自学习等许多特性,适宜解决高维、非线性系统问题,BP网络 (Back-Propagation Network,BP)无疑是ANN最为常用的神经网络模型之一,广泛应用于湖库营养状态研究中[3~5]。然而,标准BP神经网络存在着学习收敛速度慢、易陷入局部极值的不足,针对这一缺点,笔者依据我国湖泊营养状态评价标准和BP原理及方法,提出LM-BP神经网络湖泊库营养状态评价模型,采用随机内插的方法在各分级标准阈值间生成训练样本和检验样本,在训练样本和检验样本达到期望的精度要求后,用于丽江程海及泸沽湖2008~2012年营养状态评价,并构建RBF神经网络模型作为对比,为湖泊营养状态的评价提供新的途径和方法。

1 LM-BP富营养化程度评价模型

1.1 BP神经网络概述

BP神经网络是一种单向传播的多层前馈神经网络,其主要特点是信号前向传播,误差反向传播。在前向传播中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态,如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近期望输出。由非线性变换单元组成的BP神经网络,不仅结构简单 (仅含输入、输出和隐节点3层),而且具有良好的非线性映射能力。BP网络主要应用于函数逼近、模式识别、分类和数据压缩等领域。限于篇幅,其网络的拓扑结构及算法步骤可参阅相关文献 [6~9]。

1.2 Levenberg-Marquardt改进算法

由于标准梯度BP算法在最初几步下降较快,但随着接近最优值,梯度趋于零,导致误差函数下降缓慢,而牛顿法则可在最优值附近产生一个理想的搜索方向。Levenberg-Marquardt法实际上是梯度下降法和牛顿法的结合,其比传统的BP及其他改进算法有迭代次数少、收敛速度快和精确度高等优点。L-M算法基本思想是使其每次迭代不再沿着单一负梯度方向,而是允许误差沿着恶化的方向进行搜索,同时通过在最速梯度下降和高斯-牛顿法之间自适应调整来优化网络权值,使网络能够有效收敛,提高网络的收敛速度和泛化能力。

其权值调整公式为:

式中:e为误差向量;JT为误差对权值微分的雅可比矩阵;μ为标量。MATLAB中的工具函数trainlm()即对应Levenberg-Marquardt法的改进算法[8]。

2 湖泊营养状态评价

2.1 评价指标及标准

依据水利部《地表水资源质量评价技术规程》(SL395-2007)湖泊营养状态评价标准[10],选取叶绿素a(Chla)、总磷 (TP)、总氮 (TN)、高锰酸盐指数 (CODMn)和透明度 (SD)作为湖库营养状态评价指标,并参考文献 [7,11],选取重富营养临界值的2倍作为评价指标极大值 (上限值),贫营养临界值的0.5倍作为评价指标极小值(下限值),并以其上下限值作为评价对象评价指标的极点值,见表1。

表1 我国湖泊营养状态评价标准及分级标准

2.2 营养状态评价的实现

2.2.1 数据的标准化处理

表1中湖泊营养状态评价指标分为正向指标和负向指标,为了消除不同量纲对评价结果的影响,首先需对评价指标数据进行标准化处理。对湖泊营养状态评价等级起正作用的指标,如叶绿素、总磷等,其处理方法为:

对湖泊营养状态评价等级起负作用的指标,如透明度,其处理方法为:

经过标准化处理后,数据处于 [0~1]范围,有利于网络训练。

2.2.2 训练及测试样本设计

依据表1,为不失一般性,采用随机内插的方法在各分级阈值间生成30个样本,随机选取20个作为训练样本,10个作为测试样本,以此计算共随机内插得到180个样本,其中120个作为训练样本,60个作为测试样本。并用表2中的输入、输出对模型参数进行率定。

表2 湖泊营养状态评价学习及检验样本及期望输出

2.2.3 性能评价

本文选用的模型性能评价指标有:平均相对误差和最大相对误差2个统计学指标,各评价指标越小,表明模型的性能越好。各统计量的具体公式如下:

2.2.4 网络训练

本文基于MATLAB环境,创建及训练LMBP、RBF 2种模型湖泊营养状态评价。LM-BP模型,由于隐含层节点数、期望误差、训练次数、传递函数和训练函数等参数目前并没有较理想的确定和选择方法,主要是凭经验确定和选取。对于RBF模型,人为调节的参数少,只有径向基函数系数SPREAD,利用逐步增加或减小SPREAD取值的方法获得具有最佳评价效果时的SPREAD值。经反复调试,在下述参数设置条件下,LM-BP、RBF 2种模型具有较好的评价效果。

LM-BP模型:模型在结构为5—10—1,隐含层和输出层传递函数分别采用tansig和purelin,学习速率lr为0.01,设定期望误差为0.0001,最大训练轮回为1000次时模型达到了较好的评价效果。

RBF模型:RBF模型在SPREAD为0.4时具有较好的评价效果。

LM-BP与RBF模型对训练样本和检验样本评价精度比较结果见表3。

表3 LM-BP与RBF模型对训练及检验样本评价比较

从表3可以看出,LM-BP模型的训练样本和检验样本的评价 (拟合)精度明显优于RBF评价模型,因此本文采用LM-BP模型对丽江程海及泸沽湖2008~2012年的营养状态进行评价。

2.3 程海及泸沽湖富营养化程度评价及分析

利用上述训练好的LM-BP湖泊营养状态评价模型对丽江程海及泸沽湖2008年~2012年营养状态进行评价,评价结果见表4。

表4 2008~2012年程海及泸沽湖营养状态评价结果

根据表4可以得出以下结论:泸沽湖LM-BP输出值约在1~3,表明泸沽湖营养状态处于贫营养~中营养,营养化程度有下降趋势;程海LMBP输出值约在3~5,表明程海营养状态处于中营养~富营养,营养化程度同样具有下降趋势。从LM-BP输出值与期望输出值比较来看,最大相对误差为2.85%,平均相对误差为0.79%,LM-BP湖泊营养状态评价模型具有较好的泛化能力和评价精度,表明研究建立的LM-BP模型应用于湖泊营养状态的评价是合理可行的,可为湖泊营养状态的评价提供新的途径和方法。

3 结语

本文针对标准梯度BP算法在实际应用中存在着收敛速度较慢、易陷入局部极小值的不足,采用梯度下降法和牛顿法相结合的 Levenberg-Marquardt,提出LM-BP湖泊营养状态评价模型,并构建RBF模型作为对比模型。鉴于模型训练样本难以获取的缺点,利用随机内插的方法构造网络训练样本和检验样本。在经过一定次数的训练后,模型达到精度要求,训练及检验结果表明,LM-BP模型评价精度优于RBF模型。最后将训练好的LM-BP模型运用于丽江程海及泸沽湖营养状态的评价,评价结果令人满意。

[1]舒金华.我国主要湖泊富营养化程度的评价 [J].海洋与湖沼,1993,24(6):616-620.

[2]金菊良,王文圣,洪天求,等.流域水安全智能评价方法的理论基础探讨[J].水利学报,2006,37(8):918-925.

[3]邓大鹏,刘刚,李学德,等.基于神经网络简单集成的湖库富营养化综合评价模型[J].生态学报,2007,27(2):725-731.

[4]任黎,董增川,李少华.人工神经网络模型在太湖富营养化评价中的应用 [J].河海大学学报 (自然科学版),2004,32(2):147-150.

[5]楼文高.湖库富营养化人工神经网络评价模型[J].水产学报,2001,25(5):474-478.

[6]崔东文.基于BP神经网络的文山州水资源承载能力评价分析[J].长江科学院报,2012,29(5):9-15.

[7]崔东文.几种神经网络模型在湖库富营养化程度评价中的应用 [J].水资源保护,2012,28(6):1-8.

[8]张德丰.MATLAB神经网络应用设计[M].北京:机械工业出版社,2009.

[9]MATLAB中文论坛.MATLAB神经网络30个案例分析 [M].北京:北京航空航天大学出版社,2010.

[10]SL395-2007,地表水资源质量评价技术规程 [S].

[11]王贵作,任立良,王斌,等.基于投影寻踪的湖泊富营养化程度评价模型[J].水资源保护,2009,25(5):14-18.

猜你喜欢

训练样本湖泊神经网络
人工智能
神经网络抑制无线通信干扰探究
你相信吗?湖泊也可以“生死轮回”
奇异的湖泊
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定