APP下载

基于AGA-RBF神经网络模型的叶绿素a质量浓度预测研究

2024-06-23刘星宇程建牛艺晓杨春

关键词:预测模型

刘星宇 程建 牛艺晓 杨春

摘要:叶绿素a质量浓度是预测湖泊水华形成的重要影响因子,但常用的径向基(radial basis function,RBF)神经网络存在容易陷入局部极值,导致预测精度欠佳.针对这一问题,采用自适应遗传算法(adaptive genetic algorithm,AGA)对RBF神经网络进行优化,构建基于AGA-RBF神经网络预测模型,以莆田东圳水库为应用案例,对叶绿素a质量浓度进行预测,通过采集到的数据对预测模型进行仿真,对比均方根误差(RMSE)、相对误差(RE)以及平均相对误差(MRE),验证改进后的AGA-RBF模型具有更好的预测精度,以期对叶绿素a质量浓度进行长期预测.

关键词:RBF人工神经网络; 自适应遗传算法; 预测模型; 叶绿素a质量浓度

中图分类号:TP183  文献标志码:A  文章编号:1001-8395(2024)05-0670-06

doi:10.3969/j.issn.1001-8395.2024.05.012

随着社会的快速发展,人类的大规模开发和生产行为导致水体富营养化现象剧增,水华的爆发也越来越频繁,而水华的爆发使得水环境越来越差,长此以往,污染越来越严重,在诸多水质环境监测要素中,叶绿素a质量浓度能够很好地反映湖泊藻类生物数量[1],对叶绿素a质量浓度进行准确的预测能够为水体提供数据支撑,预防水体富营养化的发生.目前叶绿素a质量浓度预测主要运用的模型有多元线性回归模型[2-6]、时间序列模型[7-10]以及神经网络模型[11-18].多元线性回归预测具有计算过程简单和预测速度快等优势,但多元回归预测模型对于数据的代表性和随机性要求较高;时间序列预测模型建模相对简单,短期预测精度高,但需要长期预测的数据,模型预测精度差;神经网络作为当前最流行的预测模型,它的预测能力和非线性拟合能力都十分优越,还可以用于中长期预测.裴洪平等[12]以水温和叶绿素a质量浓度这两者作为输入变量建立的BP(back propagation)神经网络,能有效预测西湖生态系统中非线性变量叶绿素a质量浓度的变化.胡志洋等[13]建立了基于ABC-BP神经网络预测模型,结果表明,经ABC(artificial bee colony)算法优化后,BP神经网络模型预测梅梁湾叶绿素a质量浓度的平均相对误差从8.83%降低到3.31%,提高了叶绿素a质量浓度短期预测的准确性.周游等[14]使用遗传算法对BP神经网络连接权值进行优化,提高了叶绿素a质量浓度的预测精度.Hameed 等[15]构建了BP和RBF神经网络预测模型,根据预测结果比较分析模型的预测性能,预测效果虽没有太大差别,但RBF的性能优于BP的性能.RBF神经网络相较于BP神经网络,复杂度高,结构庞大,运算量也增加不少,但RBF神经网络具有对函数逼近性能更高的优势,且对于小样本数据也能有不错的效果[16].刘载文等[17]研究了RBF网络基函数中心、宽度和权值的监督学习算法,提出了基于RBF神经网络的水华预测方法,能够有效预测叶绿素a的短期变化规律,但仍存在易陷入局部极值[18]和中长期预测精度不佳等问题.为了保证模型的预测精度和中长期预测效果,本文利用自适应遗传算法优化RBF神经网络参数,提出一种基于AGA-RBF神经网络的预测模型,自适应遗传算法全局优化能力十分强大,能有效解决RBF神经网络易陷入局部最优的问题,从而提高叶绿素a质量浓度预测的精准度,为水质管理决策提供数据支撑.

1 AGA-RBF神经网络模型设计

1.1 RBF神经网络

RBF神经网络的结构如图1所示,x=[x1,x2,...,xn]T为网络的n维输入,本文选用与叶绿素a质量浓度有显著相关关系的水质影响因子作为输入,y=[y1,y2,...,ym]T为网络的m维输出,选用叶绿素a质量浓度数据作为输出,c=[c1,c2,...,cm]T为隐含层径向基函数中心构成的矩阵.由于高斯函数具有径向对称,解析性好,并存在任意阶导数等优点[19],本文使用高斯函数作为径向基函数,则RBF神经网络的输出y可表示为

y=∑mi=1Wikexp(-‖x-ci‖22σ2i),i=1,2,…,m,(1)

其中,ci是第i个基函数的中心,σi是基函数中心点的宽度,Wik是权值.

1.2 遗传算法优化RBF神经网络参数

由上述RBF神经网络的基本原理可知,RBF神经网络的参数选取十分重要.目前常用的随机选取中心法、自组织选取中心法等对样本数据需求较大,且在训练过程中易陷入局部极小值,无法得到最优的基函数中心和隐含层节点宽度[20].因此,本文将自适应遗传算法(AGA)引入到RBF神经网络的参数寻优中,建立AGA-RBF神经网络预测.遗传算法的全局搜索能力很强,但由于标准遗传算法仅仅通过适应度值的大小判断解的优劣,因此,如果算法前期个体的适应度值越大,该个体对于种群的影响就越大,导致种群中个体分布过于集中,种群失去多样性,难以寻找到全局最优值,造成算法早熟;在标准遗传算法中,选择操作选出的个体适应度值高于原个体,但交叉和变异操作并不能保证这一点,如果新个体不够优良,就会影响遗传算法的进化,减慢算法运行的速度.针对上述标准遗传算法的2点不足,自适应遗传算法从以下方面对标准遗传算法进行了改进.

刘星宇,等:基于AGA-RBF神经网络模型的叶绿素a质量浓度预测研究

1) 改变交叉和变异概率,使得交叉率和变异率根据个体的适应度值以及进化代数进行调节:

pc=pc_max-((pc_max-pc_min)tmax)t, f′>favg,pc_max, f′≤favg,(2)

pm=pm_min-((pm_max-pm_min)tmax)t, f′>favg,pm_min, f′≤favg, (3)

其中,pc表示交叉概率,pm表示变异概率,t表示进化代数,tmax表示进化最大代数,f′表示交叉个体之间较大的适应度值,f表示变异个体适应度值,favg表示种群的平均适应度值.

通过调整交叉概率和变异概率,算法在进化早期全局搜索能力较强,能够快速寻找到最优解的取值空间,随着进化代数的增加,局部搜索能力增强,更易于找到全局最优值,防止算法早熟.

2) 针对交叉和变异操作无法保证产生更优良个体这一问题,在交叉和变异操作中引入适应度函数,如果原个体经过交叉或变异后适应度值增大,就保留该个体的变化,否则保留原个体,此种改进可以保证交叉和变异操作后的个体都是优于原个体的,使算法寻到全局最优解后快速收敛,加快进化速度,缩短了算法运行时间.

2 算法流程

利用AGA对RBF神经网络的基函数中心、宽度以及连接权值进行优化,从而得到RBF神经网络的最优基函数中心、宽度和连接权值,具体流程如图2所示.

1) 数据预处理.对数据进行归一化处理,归一化处理对后续的数据处理提供便利,而且有助于模型训练结果更加精准.本文采用min-max标准化,将原始数据按照一定比例缩放到[0,1]之间,具体公式如下:

x=-xminxmax-xmin.(4)

2) 编码.本文使用二进制编码方法,将径向基函数的中心、宽度以及权值编成二进制的字符串,用字符串来表示每个个体的染色体,随机产生n个染色体,组成初始种群P.

3) 选择适应度函数.适应度函数是进行评价个体优劣的依据,本文选用均方根误差(RMSE)作为适应度函数:

f=σRMSE=1n∑ni=1(i-yi),(5)

其中,n为样本个数,i为实际值,yi为预测值.

4) 选择操作.选择算子的选取基于概率的轮盘赌法,根据个体的适应度值进行选择复制操作,形成具有N个体的临时集合C.

5) 交叉操作.交叉算子采用单点交叉,对临时集合C进行交叉操作,产生新染色体种群集合C′.

6) 变异操作.变异算子采用单点变异,对集合C′中的个体实施变异操作,产生新的个体种群集合C″.

7) 终止条件.一般情况下,达到最大迭代次数或计算结果达到最小误差时停止运算,若满足终止条件,执行下一步,不满足,令P=C″转至操作3).

8) 输出.将种群集合中最优值作为遗传算法的输出.

9) 训练RBF神经网络.将AGA的输出作为RBF神经网络参数.

3 仿真测试

为验证算法的有效性,本文使用MATLAB对基于RBF神经网络预测模型与AGA-RBF神经网络预测模型分别进行仿真测试.根据现有的莆田东圳水库2021年连续300 d的叶绿素a质量浓度数据,取前240 d数据作为训练集样本,后60 d数据作为测试集样本.在基于AGA-RBF神经网络的模型中,经反复实验,主要参数设置如下,在AGA中,初始种群规模n设为30,最大交叉概率pc_max取0.9,最小交叉概率pc_min取0.1,最大变异概率pm_max取0.4,最小变异概率pm_min取0.01,训练误差为0.01,最大迭代次数为100.在RBF中,经过相关性分析,有5个影响因子与叶绿素a质量浓度存在显著性相关关系,因此确定输入节点个数为5,分别对应5种环境因子:溶解氧、电导率、浊度、氨氮和叶绿素a质量浓度,输出节点为1,即将叶绿素a质量浓度作为输出变量,训练终止条件为总体误差小于或等于0.001.

4 实验分析

使用RBF神经网络和AGA-RBF神经网络对叶绿素a质量浓度进行预测,得出优化前后RBF神经网络叶绿素a质量浓度预测值和真实值对比,如图3所示.本文以预测结果的均方根误差(RMSE)、相对误差(RE)以及平均相对误差(MRE)作为预测模型的评价指标,其计算公式为:

σRMSE=1n∑ni=1(i-yi),(6)

σRE=i-yii,(7)

σMRE=1n∑ni=1|i-yii|.(8)

(a) 传统RBF神经网络预测值与实际值对比

(b) AGA-RBF神经网络预测值与实际值对比

图3是RBF与AGA-RBF预测结果趋势图对比,其中,星号实线在图中均代表的是叶绿素a真实质量浓度数据,圆圈虚线在图中分别代表的是RBF神经网络模型预测数据和AGA-RBF神经网络模型预测数据.从图3可以看出,使用RBF神经网络模型对叶绿素a质量浓度进行预测,可以大致预测出叶绿素a质量浓度的变化趋势,但均方根误差高达0.783,而AGA-RBF神经网络模型,均方根误差仅为0.166.表1计算了RBF与AGA-RBF预测值与实际值的相对误差,RBF预测值与实际值的平均相对误差为7.08%,其中,相对误差最大达到-12.23%,最小为-2.72%,而AGA-RBF预测值与实际值的平均相对误差为1.20%,其中相对误差最大为-3.81%,最小为-0.07%,可以看出,使用 [10]AGA-RBF神经网络模型得到的叶绿素a质量浓度值与实际值更为接近,虽然仍存在一定误差,但与RBF神经网络预测效果相较,预测精准度明显提高.

5 实验结论

针对RBF神经网络在叶绿素a质量浓度预测中易陷入局部最优解的问题,本文利用AGA算法对RBF网络的参数进行全局优化,提出了基于AGA-RBF神经网络预测模型.利用MATLAB进行仿真分析,结果表明,经过AGA算法优化过的RBF神经网络预测模型不仅解决了RBF神经网络训练时易陷入局部最优值的问题,而且具有更好的预测精度,在中长期叶绿素a质量浓度预测中也具有更强的适应能力,与传统RBF神经网络模型相比,预测均方根误差降低了0.617 7,平均相对误差降低了5.88%,有效降低了叶绿素a质量浓度的预测误差,性能明显优于传统模型,在水质预测中有着更好的实用性.

参考文献

[1] 代前程. 基于多源遥感数据的南漪湖叶绿素a浓度反演及变化研究[D]. 南京:南京信息工程大学,2022.

[2] 袁健,树锦. 改进多元回归法与神经网络应用于水质预测[J]. 水资源保护,2008,24(3):46-48.

[3] 梁勇. 基于支持向量回归的水质预测研究[D]. 武汉:武汉理工大学,2012.

[4] 刘红梅,徐英岚,张博,等. 基于最小二乘支持向量回归的水质预测[J]. 计算机与现代化,2019(9):31-34.

[5] 李修竹,苏荣国,张传松,等. 基于支持向量机的长江口及其邻近海域叶绿素a浓度预测模型[J]. 中国海洋大学学报(自然科学版),2019,49(1):69-76.

[6] 黄克勤,吴海洋,贾德庚. 基于多元线性回归模型的水质优化研究[J]. 四川有色金属,2021(4):58-60.

[7] 肖金树. 指数平滑法在水质预测中的应用[J]. 福建环境,1996(4):34-35.

[8] 王伍军,鄢贵权,丁坚平,等. 城镇地区岩溶地下水污染的水质预测[J]. 贵州工业大学学报,1997,26(2):62-66.

[9] 孙国红,沈跃,徐应明,等. 基于Box-Jenkins方法的黄河水质时间序列分析与预测[J]. 农业环境科学学报,2011,30(9):1888-1895.

[10] 任树顺,高萌,王煦雯,等. 基于3种时间序列模型的九龙江河流库区藻华预测[J]. 环境科学学报,2022,42(11):172-183.

[11] MAIER H R, DANDY G C. The use of artificial neural networks for the prediction of water quality parameters[J]. Water Resources Research,1996,32(4):1013-1022.

[12] 裴洪平,罗妮娜,蒋勇. 利用BP神经网络方法预测西湖叶绿素a的浓度[J]. 生态学报,2004,24(2):246-251.

[13] 胡志洋,李翠梅,薛天一. 基于灰色关联和ABC-BP神经网络的叶绿素a浓度预测[J]. 水电能源科学,2021,39(1):55-58.

[14] 周游,陆安江,刘璇. 基于改进遗传算法的BP神经网络的水体叶绿素a含量预测[J]. 电子测试,2022,36(15):37-42.

[15] HAMEED M, SHARQI S S, YASEEN Z M, et al. Application of artificial intelligence (AI) techniques in water quality index prediction: a case study in tropical region, Malaysia[J]. Neural Computing and Applications,2017,28(1):893-905.

[16] 刘永,张立毅. BP 和 RBF 神经网络的实现及其性能比较[J]. 电子测量技术,2007,30(4):77-80.

[17] 刘载文,崔莉凤,王小艺,等. 基于RBF神经网络的河湖水华软测量方法[C]//第二十六届中国控制会议论文集.北京:北京航空航天大学出版社,2007:3446-3449.

[18] 余可春. 基于改进RBF神经网络模型的SOFC性能预测方法[J]. 计算技术与自动化,2023,42(2):124-129.

[19] 宋朝鹏. 改进遗传算法优化RBF神经网络在短期电力负荷预测中的应用[J]. 电子世界,2021(16):164-165.

[20] 张丽娜. 基于RBF神经网络的水质预测模型研究[D]. 邯郸:河北工程大学,2019.

The Study of Chlorophyll-a Mass Concentration Prediction Based on AGA-RBF Neural Network Model

LIU Xingyu1,2, CHENG Jian2,3, NIU Yixiao1,2, YANG Chun1,2

(1. School of Mathematical Sciences, Sichuan Normal University, Chengdu 610066, Sichuan;2. Key Laboratory of the Evaluation and Monitoring of Southwest Land Resources, Chengdu 610066, Sichuan;3. Center of Network and Information, Sichuan Normal University, Chengdu 610066, Sichuan)

Keywords:Abstract:Chlorophyll-a mass concentration plays a crucial role in predicting the formation of lake blooms. However, the traditional radial basis function (RBF) neural network is susceptible to local optimal solutions, resulting in poor prediction accuracy. In this study, we employ an adaptive genetic algorithm (AGA) to optimize the neural network model, and a prediction model based on AGA-RBF neural network is constructed to predict  the concentration of  the chlorophyll a using Putian Dongshen Reservoir as an application case. Through the utilization of collected data to simulate the prediction model, we demonstrate that the improved AGA-RBF model has a good prediction accuracy, which is verified by the comparison of the root-mean-squared error (RMSE), the relative error (δ), and the average relative error (MRE). After the comparison of the root mean square error and the average relative error, it was verified that the improved AGA-RBF model has better prediction accuracy and is highly practical in the medium- and long-term prediction of the mass concentration for chlorophyll a.

radial basis function neural network; adaptive genetic algorithm; prediction model; chlorophyll-a mass concentration2020 MSC:68T07

(编辑 郑月蓉)

基金项目:国家自然科学基金(12101438)、中央引导地方科技发展项目(2022ZYD0011)和四川省自然科学基金(2022NSFSC1852)

*通信作者简介:杨 春(1970—),男,博士,教授,研究生导师,主要从事数学模型算法、应用软件开发、机器学习与人工智能的研究,E-mail:328341729@qq.com

引用格式:刘星宇,程建,牛艺晓,等.基于AGA-RBF神经网络模型的叶绿素a质量浓度预测研究[J]. 四川师范大学学报(自然科学版), 2024,47(5):670-675.

猜你喜欢

预测模型
基于矩阵理论下的高校教师人员流动趋势预测
基于支持向量回归的台湾旅游短期客流量预测模型研究
基于神经网络的北京市房价预测研究
中国石化J分公司油气开发投资分析与预测模型研究
基于IOWHA法的物流需求组合改善与预测模型构建
基于小波神经网络的GDP预测
区域环境质量全局评价预测模型及运用
组合预测法在汽车预测中的应用
H市电动汽车充电站项目建设需求规模与技术分析
基于预测模型加扰动控制的最大功率点跟踪研究