APP下载

基于智慧全景的巢湖蓝藻水华生态大数据融合算法

2022-05-11刘运

微型电脑应用 2022年4期
关键词:蓝藻巢湖全景

刘运

(巢湖学院, 信息工程学院, 安徽, 巢湖 238024)

0 引言

蓝藻水华生态是指一种不被人们喜欢的生态现象,其呈聚生体或者丝状体在淡水体系特定条件下形成的过多生物量,并且会偶尔凝聚成片状或者块状漂浮在水面上[1]。这些蓝藻水华存在很多种类,会产生藻毒素,对人类健康造成威胁,对生态系统的持续发展造成破坏以及造成许多城市供水影响。其形成的过程分为2个部分,分别为起始和发展。当下我国98%的自来水的处理程序为絮凝→沉淀→过滤→消毒,但该处理程序无法解决蓝藻水华造成的供水安全问题。巢湖东部水源作为巢湖市唯一的供水水源,其也存在蓝藻水华而造成供水安全问题[2-3]。为了解决该问题,需对造成蓝藻水华的形成原因进行分析,并根据分析的结果制定处理方案。但是由于巢湖蓝藻水华生态大数据受到多种因素影响,可直接用于分析的数据较少,因此需融合巢湖蓝藻水华生态大数据,提升数据的利用率。文献[4]研究基于自适应ABC/FOA融合算法,该算法通过ABC算法和FOA算法的融合完成目标融合,由于其不具备分布式数据处理器,因此其融合后的误差相对较高。文献[5]研究多层概率决策的大数据协作融合算法,该算法通过多层概率决策模型完成目标融合,但是该算法的计算过程相对复杂,导致目标融合所需时间相对较长。

由于巢湖水体富营养化程度的加剧,蓝藻水华存在易暴发的情况,导致巢湖蓝藻水华生态数据量庞大,计算过程繁琐。为此提出基于智慧全景的巢湖蓝藻水华生态大数据融合算法。全景是一种新的视觉展示技术,可用于态势感知或者智能呈现。该技术能够利用智能手段或者方法、设备等完成全景数据的感知、采集等。萤火虫优化算法是通过模拟萤火虫发光的特性而设计的随机优化算法,结构简单,需要调节的参数较少,寻优搜索能力较好,为此通过智慧全景还原了巢湖蓝藻水华的真实状态,利用萤火虫优化算法优化神经网络融合过程实现了巢湖蓝藻水华生态大数据融合,并通过跨平台应用实现人机交互。

1 基于智慧全景的巢湖蓝藻水华生态大数据融合算法

1.1 基于智慧全景的生态数据感知

基于智慧全景的巢湖蓝藻水华生态数据感知过程,具备感知、采集、异构数据的快速计算、存储以及归一化格式下蓝藻水华的实时数据感知和全景复现等全方位生态数据的监测和感知功能[6],其流程如图1所示。

巢湖蓝藻水华生态数据实时感知以全链条运维为指引,将其划分为生态数据感知、数据传送、数据复现、人机交互4个步骤。数据感知通过基于正交基前向神经网络的数据融合算法对环境温度、环境湿度、水体温度、空气指数、光照指数、土壤性质等多个数据进行快速计算与存储;数据传送通过ZigBee对多节点无线互联自组网,对存储的多维生态数据实行数据包格式化处理并通过多线程传送至监测中心;数据复现步骤采取解码手段对多维生态数据包实行解码处理,并利用MapReduce分布式数据处理模型完成智慧全景的大数据控制,全景还原巢湖蓝藻水华的真实状态;人机交互步骤通过跨平台应用实现人机交互。

1.2 基于正交基前向神经网络的数据融合

1.2.1 Hermite正交基前向神经网络模型

数据的表现形式和数据的冗余度决定了BP神经网络的学习能力,并且神经网络权值的个数、神经元节点的个数决定了神经网络训练时间[7]。因为某种参数值限定了网络的训练时间与学习能力,所以需要通过Hermite正交基前向神经网络对网络的参数进行优化,该网络模型如图2所示。其中,X以及Y分别表示网络的输入值和输出值,W表示权值,φ(x)表示隐含层值。

Hermite正交基前向神经网络模型采用3层向前结构,赫尔梅特正交多项式是隐含层的选取函数,线性激励函数是输入、输出层选取的函数[8]。在伪逆的基础上,由BP算法推导权值修正迭代公式,只需一步即可直接确定权值,因为Hermite正交基前向神经网络模型具有良好的非线性逼近能力和鲁棒性预测能力,可以有效提升精确度和计算速度。

1.2.2 数据融合

Hermite正交基前向神经网络模型的巢湖蓝藻水华生态大数据融合详细步骤如图3所示。

图2 Hermite正交基前向神经网络模型

图3 数据融合的整体流程

选取需要处理的数据样本并判断其是否属于被检测对象样本,若属于则设为1,不满足则为0。然后向神经网络结构中输入初始的冗余数据,并对未知样本实行判定,该判定根据输出结果决定。决定后对其实行统计和分析,确定分类融合后的结果为对象1、对象2、…、对象n。

在巢湖蓝藻水华生态大数据融合过程中,应用Hermite正交基前向神经网络模型,将巢湖蓝藻水华生态大数据集作为模型的输入值,通过数据归一化及网络训练来处理数据样本,实现数据分类。

1.3 萤火虫算法

群体数目对萤火虫算法的优化精度和迭代速度有重要影响。当种群数目较小时,算法迭代速度较快,但最终优化精度较低;随着种群规模的增加,算法迭代速度降低,但最终的优化精度将显著提高。经过现有的实验研究,可以得出结论:萤火虫算法的种群规模一般设定在40~50,满足优化要求。为此,将萤火虫算法应用至巢湖蓝藻水华生态大数据融合之中,能够实现大数据的快速精准融合。

在萤火虫算法中,2个重要的因素是吸引度和亮度。吸引度和亮度分别表示萤火虫位置的优劣并决定其移动方向和距离,通过对吸引度和亮度的迭代更新完成目标优化。其优化机理如下所述。

吸引度公式为

I=I0×e-αrzq

(1)

式中,I0代表当处于r=0位置时的最大荧光亮度,目标函数值与该值相关,萤火虫自身亮度越高说明了目标函数值越优,通过α来表示光强吸收系数,那么rzq表示的为萤火虫z和q之间的距离。

得到新的吸引度为

β=β0×e-αrzq

(2)

式中,β0设置为(r=0)处的最大吸引度。

萤火虫被吸引后从z位置向q位置移动的更新公式[9]为

xq=xz+β×(xq-xz)+μ×(d-1/2)

(3)

式中,位于z点的萤火虫和位于q点的萤火虫所处的空间位置为xz和xq,μ表示步长因子是[0,1]上的常数,d是[0,1]上服从均匀分布的随机因子。

将萤火虫群体随机散布在空间中,萤火虫的位置差异导致了荧光亮度的不同。由式(1)可知,亮度高的萤火虫会吸引亮度低的萤火虫,并使其向亮度高的萤火虫处移动,根据式(2),吸引度的大小决定了移动的距离。为了避免过早出现局部最优状态,增加了搜索区域,将扰动项μ×(d-1/2)引入位置更新过程中,并根据式(3)得出受吸引移动后的位置。将此过程重复多次后,在亮度最高的萤火虫的位置上聚集了所有个体,至此寻优结束。根据以上算法,实现巢湖蓝藻水华生态大数据的融合。

2 实例测试

以巢湖蓝藻水华生态环境数据库中2018年4月、5月和6月的3组数据为研究对象,3组数据大小分别为100 GB、150 GB和200 GB,总共450 GB。

采用文献[4]算法和文献[5]算法,分别为基于自适应ABC/FOA融合算法和多层概率决策的大数据协作融合算法作为本文算法的对比算法,完成相关对比测试。其中:文献[4]算法采用自适应ABC/FOA融合定位算法,全局寻优能力强;文献[5]算法采用及SLAM 算法实现数据融合定位,基于期望最大化的匹配算法能够自动确定要关联的体素数量。本文算法参数设置:最大吸引度β0和光强吸收系数α均为1;步长因子μ为0.2;迭代次数maxT值为100。分别设置萤火虫数值m为35、45、55,测试3种情况下萤火虫优化算法的迭代寻优效果如图4所示。

图4 不同萤火虫数值下的函数寻优过程

分析图4可知:当萤火虫数值为35时,在迭代次数为100次时达到函数最优值,但其寻优精度较差;当萤火虫数值为55时,其寻优次数较好,但迭代次数较大,在150左右次迭代后才达到函数最优值;当萤火虫数值为45时,函数的迭代次数较低,且寻优效果较好。为此设置萤火虫数值为35。

2.1 数据融合性能测试

测试3种算法融合不同大小巢湖蓝藻水华生态环境数据的所需时间,判断3种算法的融合效率,测试结果见表1。

表1 三种算法的数据融合时间对比

根据表1可知:3种算法在数据量大小为150 GB以内时,数据融合所需的时间相差不大;当数据量大小超过150 GB后,本文算法的数据融合所需时间呈小幅度平稳上升趋势,2种对比算法的数据融合所需时间呈现大幅度增加。由于本文方法采用智慧全景技术对数据进行融合,能够集感知数据、采集数据、快速计算、存储以及归一化于一体,全方位实现蓝藻水华的实时数据感知和全景复现功能,因此本文算法的数据融合效率优于2种对比算法,可较快地完成数据融合。

2.2 寻优性能测试

采用3种算法对融合后的3组数据寻优,测试3种算法的数据寻优性能。结果如图5所示。

由图5可知,本文算法针对3组数据的寻优效果最佳,均可获取全局最优值,2种对比算法则分别在迭代过程中陷入局部最优解。文献[4]方法采用ABC算法,其全局寻优能力强,且引入了FOA算法,具有一定的局部搜索能力,但局部搜索能力较差,导致陷入局部最优解;而文献[5]方法采用多级概率框架,能快速匹配数据,实现数据融合,但当数据量较大时,该方法会由于计算量过大而陷入局部最优解。本文方法利用萤火虫优化算法优化神经网络,通过对吸引度和亮度的迭代更新实现了全局寻优,实现巢湖蓝藻水华生态大数据的高效融合,因此本文算法具备较好的数据寻优性能,可获取巢湖蓝藻水华生态大数据融合的全局最优解。

2.3 应用性测试

为测试本文算法的应用性,测试本文算法使用前后研究对象3组数据的使用率和管理生态环境管理效果提升程度,结果如图6、图7所示。

(a) 4月数据的寻优结果

(b) 5月数据的寻优结果

(c) 6月数据的寻优结果

图6 应用前后数据的使用率

分析图6、图7可知,本文算法应用后可较大程度提高巢湖蓝藻水华生态数据的使用率和管理程度。本文方法应用智慧全景技术,实现了巢湖蓝藻水华生态大数据的高效融合,利用萤火虫优化算法对神经网络进行优化,提升了数据融合的准确性。

图7 应用前后生态环境管理效果提升程度

3 总结

本文研究基于智慧全景的巢湖蓝藻水华生态大数据融合算法,经实验表明:

(1)本文算法具备较高的数据融合效率,完成450 GB的巢湖蓝藻水华生态数据融合只需3.3 ms;

(2)本文算法的数据融合误差较小,在服务器延时的情况下依旧可保持数据融合的精准度;

(3)本文算法具备较好的寻优性能,可得到巢湖蓝藻水华生态大数据融合结果的全局最优解;

(4)本文算法具备较好的应用性,应用后可提高巢湖蓝藻水华生态大数据的使用率和管理程度。

猜你喜欢

蓝藻巢湖全景
有“青苔”,请慢行
巢湖流域2020年洪水分析
定制化全景声耳机系统 JVC EXOFIELD XP-EXT1正在热销中
巢湖 外一首
戴上耳机,享受全景声 JVC EXOFIELD XP-EXT1
巢湖,我的母亲
巢湖,我的母亲
全景敞视主义与侦探小说中的“看”
全景搜索
地球上最早出现的藻类——蓝藻