基于GRA-RBF的赤潮影响因素分析与预测方法
2021-03-22李志刚袁蕾
李志刚 袁蕾
摘要:针对赤潮灾害受多种影响因素综合作用的问题,采用灰度关联算法对所有影响因素进行关联分析。选取关联性强的50%因素作为径向基神经网络的输入,用叶绿素a作为输出,来执行赤潮预测任务。实验结果表明,该模型具有良好的赤潮预测能力。
关键词:赤潮;影响因素分析;预测;灰度关联分析; 径向基神经网络
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2021)06-0004-02
Abstract: Aiming at the problem that red tide disaster is affected by multiple factors, the gray relation analysis algorithm is used to analyze the correlation of all influence factors. Furthermore, 50% factors with strong correlation are selected as the input of radial basis neural networks, and chlorophyll a is used as the output to perform the red tide prediction task. The experimental results show that the proposed model has good red tide prediction ability.
Key words: red tide; influence factors analysis; prediction; grey relation analysis; radial basis function network
1 引言
赤潮的暴發会破坏海洋生态平衡,阻碍海洋渔业和养殖业的发展,给海洋环境,人体健康和社会经济发展带来危害[1-2]。赤潮的发生是多种海洋因素综合作用的结果[3]。这些因素使得赤潮具有季节性、空间异质性和复杂非线性等特点,给赤潮预防工作带来了巨大的挑战。因此,对海洋数据进行关联分析,进而提取并预测影响赤潮发生的主要因素对预防赤潮、保护海洋环境具有重要意义。传统的经验预测和数理统计方法难以解析多因素、不规则、不稳定的海洋数据,致使赤潮影响因素特征分析不全面,容易出现误差,不利于后期的数据挖掘与融合。灰度关联算法(Grey Relation Analysis, GRA) 弥补了上述方法的缺陷,是一种可以有效处理不精确不完整数据的相关分析方法[4]。此外,人工智能技术的发展使研究人员开始将基于数据驱动的神经网络模型应用于赤潮预测研究中[5]。径向基函数(Radial Basis Function, RBF)神经网络由于其高度的非线性映射能力、较快的收敛速度和强大的噪声修复能力,使其在时间序列预测中得到广泛的关注[6],可以用于解决多元赤潮影响因素预测问题。鉴于上述分析,本文充分结合GRA算法和RBF神经网络的优势,提出了一种GRA-RBF数据分析与预测框架,并应用于海洋环境数据赤潮影响因素分析和预测中。实验结果表明该框架可以充分分析海洋数据与赤潮之间的内在联系,实现多元赤潮影响因素预测功能。
2 多元赤潮影响因素预测模型
2.1 灰度关联分析
2.2 RBF神经网络
径向基(Radial Basis Function, RBF)神经网络是一种前馈神经网络。它包括输入层,隐藏层和输出层,层与层之间为全连接模式。在海洋环境数据预测任务中,径向基函数将每个输入映射到高维对应不同的感知域中,使低维不可分的数据转变为高维可分数据,使RBF网络可以逼近任意非线性函数,具有良好的泛化能力和较快的学习速度。一般地,常采用高斯核函数作为径向基函数,输出向量可以表示为:
其中w为隐层到输出层的权值,P为隐层神经元数量,?为高斯核函数。训练中,我们采用均方根误差(Root Mean Square Error, RMSE)来衡量预测性能。
3 实验
3.1 实验数据
本实验采用的数据为国内某海域每隔半小时采集的海洋环境数据,涵盖水文、气象、营养盐、水质四种类型,包括有效波高、1/10波浪高度、1/10波浪周期、最大波浪高度、海浪方向、平均波浪周期、气温、气压、风速、雨量、最大风速、风向、相对湿度、亚硝酸盐、磷酸盐、硝酸盐、氨氮、盐度、电导率、溶解氧、叶绿素a、浊度、蓝绿藻、总溶解性固体、溶解氧饱和度、水温、pH,标号分别为1至27。选取与赤潮关联度高的前50%的影响因素作为RBF的输入,叶绿素a作为模型的输出。将数据的60%用于模型训练,40%用于模型测试。
3.2 实验验证
本文结合GRA算法和RBF神经网络,建立了GRA-RBF数据分析与预测框架来执行多元赤潮影响因素分析与预测任务。首先,采用GRA算法对不同类型的海洋数据进行了关联度评价。图1给出了27种因素的标号按关联度降序排列。从图中可以看出,不同的海洋环境因素对于赤潮的影响程度有明显区别。因此,进行关联度评价是有意义的。从图1可以看出,叶绿素a的关联度最高,值为0.1034。而最大波浪高度则为影响最小的因素,关联度值仅为0.0049。然后,按比例选取高关联度赤潮影响因素用于预测赤潮,即叶绿素a,浊度,水温,亚硝酸盐,蓝绿藻,气温,pH值,盐度,氨氮,磷酸盐,硝酸盐,溶解氧,相对湿度。
图2给出了RBF的测试结果。从图中可以明显地看出,真实值与预测值的变化趋势大致相同,证明了模型的拟合度较高,可以用于赤潮的多因素预测。模型的预测误差RMSE为0.1008。为进一步说明模型性能,本文采用散点图进行验证。图中黑色线表示标准的叶绿素a真实值基准线。灰色散点表示每个真实值在模型输出中对应的预测值。当灰色线与黑色线越接近时,表明模型的性能越好。从图3可以看出,大部分的预测值趋近于标准线,即RBF可以在较小的误差下实现多因素赤潮预测。
4 结论
本文基于灰度关联算法和径向基神经网络提出了一种GRA-RBF数据分析与预测框架用于分析和预测多元赤潮影响因素。通过灰度关联算法提取影响赤潮程度高的因素,再用径向基神经网络进行预测,该模型可以有效地处理赤潮数据,并对赤潮数据进行准确的预测。本文采用该模型对赤潮数据进行了预测。实验结果表明,该模型可以高效地用于多种影响因素分析,并对赤潮进行预测。
参考文献:
[1] 张晓冉,庞雨宁.海水赤潮的危害及防治对策[J].河北渔业,2017(4): 59-60.
[2] Zohdi E, Abbaspour M. Harmful algal blooms (red tide): a review of causes, impacts and approaches to monitoring and prediction[J]. International Journal of Environmental Science and Technology, 2019, 16(3): 1789-1806.
[3] 齐庆华,蔡榕硕,颜秀花.气候变化与我国海洋灾害风险治理探讨[J].海洋通报,2019(4).
[4] Cornejo-Bueno L, Nieto-Borge J C, García-Díaz P, et al. Significant wave height and energy flux prediction for marine energy applications: A grouping genetic algorithm-extreme learning machine approach[J]. Renewable Energy, 2016, 97:380-389.
[5] 李海涛,刘泰麟,邵泽东,黄海广.基于决策树与二分分割算法的BP神经网络在赤潮等级预测中的应用研究[J].海洋科学,2019,43(9):34-40.
[6] 曹嘉杰, 杨猛, 徐新宇. 基于RBF神经网络的数据挖掘方法探究[J].电脑知识与技术,2016,12(7):151-153.
【通联编辑:王力】