基于数据融合的工业互联网运行异常监控系统
2023-03-10肖楠阮大智宋凯华
肖楠,阮大智,宋凯华
(工业互联网创新中心(上海)有限公司,上海 200232)
工业互联网数据中心可将来自不同传感器的信息整合成统一的数据包,并将多种不同类型数据信息参量汇总,以供网络主机的直接调取与利用。在工业互联网中,上述处理流程被称为“数据融合”。在网络主机作用下,已被挑选的数据信息参量可与知识库中存储的文件自行匹配,一方面辅助故障诊断模块确定用户端主机是否连接,另一方面也可将信息反馈至既定数据库主机中[1-2]。由于数据融合算法的出现,工业互联网主机中的存储信息能够自发向下级客户端传输,且信息与信息之间的连接映射关系也不会受到任何协议文件的影响。
随着工业互联网运行时间的不断延长,一部分信息参量会表现出异常传输行为,从而导致信息参量之间的相对偏差值水平不断增大。为避免上述情况的发生,需要准确分辨互联网主机所接收到的数据,再借助AOP 程序提取与监控数据传输行为[3]。然而,此系统对于异常信息参量的监控准确性并不能达到标准,导致工业互联网运行数据之间的相对偏差值水平高于理想化数值。为解决此问题,引入数据融合技术,并以此为基础,设计一种新的工业互联网运行异常监控系统。
1 监控系统硬件设计
工业互联网运行异常监控系统的硬件由异常识别模块、多节点负载均衡模块、数据存储模块三部分组成。
1.1 异常识别模块
异常识别模块存在于工业互联网核心监控主机与数据库存储主机之间,在分析数据监控任务可行性的同时,将既定指令文件反馈至相关应用元件中,一方面能够将各类型异常行为进行区分,另一方面可实现数据信息融合行为的识别[4-5]。异常识别模块结构如图1 所示。
图1 异常识别模块结构示意图
通常情况下,异常识别模块的主体应用结构能够同时对数据信息融合行为、工业互联网运行行为、异常行为指标进行识别,且随着模块连接时间的增加,数据库主机中存储的监控信息量也会不断增多。
1.2 多节点负载均衡模块
在工业互联网运行异常监控系统中,多节点负载均衡模块能够直接执行数据融合指令,并可根据信息参量指标存储量的不同,确定系统主机所处的运行阶段,从而避免运行数据偏差值不断增大[6-7]。整个模块以monit 元件作为核心结构,向下则分别连接task 任务主机与load 结构。
由于工业互联网运行异常行为的表现状态有所不同,因此在每一个load 结构下端附属两个work 监控设备。其中一个监控设备负责记录数据融合指令的运行状态,另一个监控设备能感知互联网运行信息的传输形式[8]。多节点负载均衡模块结构如图2所示。
图2 多节点负载均衡模块示意图
图2 中,task 任务主机直接与融合数据寄存器设备相连,可对工业互联网运行异常数据进行初步采集,并将满足传输要求的信息参量反馈至下级应用元件中。
1.3 数据存储模块
数据存储模块与工业互联网运行异常监控系统的数据库存储主机直接相连,可根据数据融合指令的运行状态,将已存储的信息参量整合成多个结构主体,便于核心监控主机的直接调取与利用[9-10]。一般来说,能够由模块主机直接存储的数据信息主要包含EsAggregateData、EsProcessData、EsMethodData三种命名形式,每种数据信息的具体字段长度及所属类型如表1 所示。
表1 数据存储模块的信息命名机制
为使工业互联网运行异常数据得到准确监控,存储模块中所有信息参量字段长度需要保持一致。
2 系统软件设计
在系统硬件支持下,按照SEP 路由协议连接、异常信息剔除、相似度矩阵加权值计算流程,实现系统软件设计,完成基于数据融合的工业互联网运行异常监控系统设计。
2.1 SEP路由协议
SEP 路由协议是执行数据融合指令时遵循的唯一信息编码条件。在工业互联网运行异常监控系统中,该协议定义模式越完善,系统主机对数据的编码能力越强。在不考虑其他干扰条件下,SEP 路由协议编码指令的命名行为同时受到数据信息传输系数、工业互联网运行异常行为特征的直接影响[11-12]。
数据信息传输系数长表示为λ,该项物理指标的取值区间存在一定局限,其起始值必须大于自然数“1”,而终止值则必须小于自然数“e”。
工业互联网运行异常行为特征存在最大值rmax和最小值rmin,由其值决定单位时间内数据信息的平均融合能力。联立上述物理量,可将SEP 路由协议的编码条件表示为:
式中,y表示工业互联网运行异常数据的常规融合权限,表示待融合数据的检测特征值,d表示特定的融合数据标记系数。
在数据融合约束下,所有待剔除的异常信息需要满足SEP 路由协议的编码的要求。
2.2 异常信息剔除
异常信息剔除是执行数据融合算法的执行环节,可在已知数据参量传输目的的前提下,确定监控主机与核心融合信息之间的传输距离,避免不必要传输指令的出现,从根本上控制数据融合算法的执行时长[13-14]。在数据融合指令单位执行时间ΔT内,工业互联网运行权限指征χ的取值结果越小,则表示待剔除的异常信息数据越多,反之则越少。
设a表示互联网异常运行指令的执行系数,在实际应用过程中,该项指标的最小取值为1。在上述物理量的支持下,联立式(1),可将监控系统主机所遵循的异常信息剔除原则表示为:
式中,w、c表示两个不同的数据信息融合深度指标,I表示与工业互联网运行异常行为相关的监控指令执行系数项。对于工业互联网运行异常监控系统而言,数据库主机中存储的所有信息参量需要满足异常信息剔除的要求。
2.3 相似度矩阵加权值
相似度矩阵加权值计算是工业互联网运行异常监控系统构建中的重要环节,可在数据融合算法支持下,分辨两个监控信息参量之间的相似性,不仅满足数据库主机对于传输数据参量的实时需求,也可避免异常运行数据对系统监控指令传输中出现的问题[15-16]。
设X1、X2表示两个不同的相似度量指标,若考虑数据融合算法的作用能力,则X1≠X2的不等式条件恒成立。ϕ表示数据融合矩阵中已知信息参量的相似度量系数,在选取作为加权标准值的情况下,可将工业互联网运行异常监控系统中的相似度矩阵加权值计算结果表示为:
式中,c表示互联网运行异常信息在数据融合矩阵中的偏移系数项。
3 实例分析
为验证工业互联网运行主机对异常数据信息的提取与监控能力,设计如下对比实验。具体实验步骤如下:
步骤一:以配置数据融合算法的互联网运行主机作为实验组研究对象,以配置多源异构应用系统的互联网运行主机作为对照组研究对象;
步骤二:同时闭合实验组、对照组的互联网主机元件,通过人工干预方式,令运行数据实时传输速率保持一致;
步骤三:确定互联网运行数据偏差指标的理想数值变化情况;
步骤四:分别对比实验组、对照组偏差指标数值与理想数值。
互联网运行数据偏差指标的理想数值变化情况如表2 所示。随着实验时间的变化,互联网运行数据偏差值均呈现不断增大的数值变化趋势。就数据信息横向传输行为而言,其偏差值指标的上升幅度相对较大,实验初始值与最终取值之间的物理数值差为0.15%;就数据信息纵向传输行为而言,其偏差值指标的数值水平在40~60 min 的实验时间内,始终保持相对稳定的状态,实验最终取值与初始值之间的物理数值差为0.07%。
表2 互联网运行数据偏差的理想数值
在横向传输情况下,实验组、对照组运行数据偏差指标的实验数值变化结果如图3 所示。
图3 运行数据偏差的实验数值(横向传输)
分析图3 可知,在数据信息保持横向传输行为的情况下,实验组运行数据偏差指标在整个实验过程中始终保持来回波动,当时间取值为30 min 时,其数据偏差指标达到最大值0.36%,与理想最大值0.50%相比,下降0.14%。除时间取值为40 min 的时间节点外,对照组运行数据偏差指标始终呈现不断上升趋势,当时间取值为80 min 时,其数据偏差指标达到最大值0.56%,与理想最大值0.50%相比上升了0.06%,远高于实验组的极大值。
纵向传输情况中,实验组、对照组运行数据偏差指标的实验数值结果如图4 所示。
分析图4 可知,在数据信息保持纵向传输行为的情况下,当时间取值处于0~50 min 的区间内时,实验组运行数据偏差呈现来回波动的变化态势,而当时间取值处于50~80 min 的区间之内时,实验组运行数据偏差则始终保持连续上升变化状态,其全局最大值为0.35%,与理想极大值0.34%相比上升了0.01%。对照组运行数据偏差在整个实验过程中则始终保持连续波动的数值变化状态,当时间取值为80 min 时,其全局最大值为0.40%,与理想极大值0.34%相比上升了0.06%,整体均值水平高于实验组。
图4 运行数据偏差的实验数值(纵向传输)
在数据融合算法作用下,互联网运行数据偏差的数值水平在信息横向传输、纵向传输情况下,均能得到较好控制,其平均值始终低于理想数值水平,这在实现对异常信息参量的准确提取与监控方面,能够起到较好的作用。
4 结束语
与多源异构型应用系统相比,新型工业互联网运行异常监控系统以数据融合算法作为切入点,在异常识别模块、多节点负载均衡模块等多个硬件设备支持下,通过构建SEP 路由协议的方式,对异常信息参量进行剔除,实现对相似度矩阵加权值的准确计算。实验结果显示,工业互联网运行数据之间的相对偏差值水平得到有效控制,符合准确提取并监控互联网运行异常的实际需求。