基于数据特征融合的管网信息物理异常诊断方法
2019-02-15马大中胡旭光孙秋野郑君王睿
马大中 胡旭光 孙秋野 郑君 王睿
随着信息和通信技术的不断进步与发展,工业系统依靠智能化的检测执行设备、可靠的网络通信以及高度集成的决策分析信息促使工业系统物理设备及信息空间的联系更加紧密.异构空间融合发展的过程衍生出灵活高效的信息物理系统(Cyberphysical systems,CPS)[1-3].由于系统具有实时、高效、高性能的特点,同时能够有效地实现工业过程稳定有效的监测与控制,信息物理系统成为未来工业4.0计划的核心基础.
作为工业信息物理系统的典型应用,输油管网系统已经从管道自动化网络发展成融合管道设备、通信体系以及信息网络的复杂智能化网络体系.由于输油管网在保障能源供应、维护能源安全方面具有重要价值,因此在日常生产调度中需要实时监测管网物理空间异常情况[4].文献[5]采用泵状态、阀门开度以及管道设计参数等变量建立管道模糊分类模型,从而完成对管道运行状态的判断分类.文献[6-7]从单条管道压力时间序列出发对泄漏异常情况进行诊断和定位,文献[6]采用结构相似度准则判断泄漏情况并且确定泄漏位置,同时文献[7]通过马尔科夫链提取管道压力数据特征进行异常检测并且采用相似性和连续小波定位方法找出泄漏源位置.文献[8]将小波提取的管道压力拐点时间作为特征对双支持向量机进行训练完成对管道泄漏点的定位.随着管网信息物理系统进一步发展,系统内部产生与累积了海量过程数据,机器学习方法由于其强大的数据挖掘能力,迅速的分析速度以及良好的泛化性能[9-11],尤其是卷积神经网络(Convolutional neural network,CNN)自主挖掘图像深度特征的能力,因而广泛用于管道系统中,为管网系统的异常检测、分析和运行等提供了直接或辅助的决策.文献[12]提出一种融合一维卷积神经网络和支持向量机的方法检测管网泄漏情况.文献[13]通过卷积神经网络对管道漏磁图像进行训练,进而识别出管道的缺陷区域和非缺陷区域.通过对卷积神经网络增加视觉转化层,文献[14]可以准确地辨识不同形状和大小的缺陷特征.除了对缺陷进行识别以外,文献[15]使用卷积神经网络对管道焊缝法兰组件进行识别,并且结果表明卷积神经网络对漏磁图像具有良好的位移和畸变鲁棒性.
此外随着管网系统物理空间和信息网络深度融合和实时交互,信息网络的功能不断升级改造使得管网系统的可观测性不断增强,管网系统的功能和作用范围得到极大扩展.但是与此同时,信息网络也增加了管网系统的复杂性和不确定性,给管网系统带来新的安全问题.信息网络的异常会导致管网系统设备失去控制造成甩泵、阀门关断等紧急运行情况,如果处置不当甚至会诱发连锁故障使得管网全线停输[16-17].文献[18]对管道SCADA系统信息传输中断的原因及保护措施进行了全面的分析.由上述文献可知,对信息传输中断或者数据传输错误异常进行快速检测具有重要意义,及早发现信息异常能够避免重大安全事故的发生.
综上所述,为了能够区分管网不同空间异常变化情况,本文以管网系统信息数据为基础,提出一种数据特征融合的管网信息物理异常诊断方法.通过对站场信息数据构建信息增维协方差矩阵实现数据特征的融合.在利用矩阵特征值分布情况实现信息异常判断的同时,将矩阵最大特征向量转换成的图像作为输入,通过卷积神经网络完成不同物理异常的分析.本文创新点在于:
1)提出一种基于数据特征融合的管网信息物理异常诊断方法.首先通过信息增维协方差矩阵最大特征值对管网不同异常类型情况进行检测和分析,进而在此基础上通过矩阵最大特征向量映射的图像完成对物理异常的分析.
2)针对管网系统的海量信息数据,采用随机矩阵谱理论实现数据特征的构建.通过管网各个站场信息数据构建信息增维协方差矩阵数据特征,从而能够在有效地降低数据输入量的基础上对管网进行实时分析.
3)采用集中–分布协同检测形式完成对管网异常情况的检测.通过信息增维协方差矩阵最大特征值完成管网异常情况的判断,然后通过选取的管网全部站场的矩阵最大特征向量完成物理异常诊断,从而实现站场异常诊断与信息物理异常分类的有机结合,提高了异常诊断响应能力.
本文其余内容安排如下:第1节根据管网特性对站场数据进行梳理,建立起管网的信息物理系统模型;第2节介绍基于信息增维协方差矩阵的管网信息物理异常诊断方法;第3节通过仿真实例验证本文所提出方法的有效性;最后,给出了本文的结论.
1 管网信息物理模型
1.1 管网图论
输油管网模型是信息物理异常诊断的基础,所建立的模型结构既要从全局上描述整个系统,又要兼顾各个站场在系统中的功能和地位.输油管网具有网络状拓扑结构并且管道内油品具有方向性,因此本文采用有向拓扑图理论进行研究分析.假设管网系统表示为有向图,其中(n为节点数目),(m为边连接数目).在管网信息物理系统中,节点表示站场物理及信息节点,并且不同节点通过连接边完成能量及信息流传递,最终实现管网系统的平稳运行和完成额定输油计划.
1.2 管网结构
管网图论模型是设备硬件等物理组元和管道数据等信息组元的综合反映,同时也是系统集成的基础.因为管网信息物理系统是一个融合物理实体设备与信息数据网络的海量异构系统,所以从物理信息融合交互角度对管网的数据结构进行划分,具体结构如图1所示.
在物理网络中,节点表示实际存在的数据站场并且通过长距离密闭输油管道实现油品的输送.在实际输油管网系统中,通常采用管道两端压力和流量评价和分析管网运行情况,因此本文定义用于管网系统异常分析的信息数据为压力、流量.定义t时刻站场k的信息数据zk(t)为
其中,h(x)为非线性测量函数,为站场k的测量向量,α为测量噪声,站场编号k=1,2,···,n.
图1 管网信息物理系统结构Fig.1 CPS structure of pipeline network
因为信息节点矩阵Dk(Dk∈Rnk×ts)每一行表示为信息数据的时间序列,因此为了能够突显信息数据的变化以及保持数据变化的连续性,对矩阵Dk(Dk∈Rnk×ts)行向量依次增维次,构成如式(4)所示的增维矩阵.
2 基于数据特征的信息物理异常诊断
为提高采集的数据可靠性,管网会安装多个设备采集同一信息数据,所以同一采样时刻信息数据可以描述为向量zk(t)
其中,j为采集同一信息数据量的设备个数.
多元信息网络是由实际物理设备采集到的实时信息数据构成的,用于判断和分析管道的运行状态.因为管网系统为有向图结构,为了能够实时反映站场数据流情况,定义nk维的站场信息节点向量为
其中,z(t)in为站场k的进站信息数据向量,为站场k的出站信息数据向量.p和f分别表示为站场压力和流量,上标in和out分别表明数据的采集点为进站位置和出站位置.
假设管网系统信息节点向量dk(t)通过ts次采样后构成行为信息数据,列为时间长度的矩阵Dk(Dk∈Rnk×ts).为进一步通过管网信息数据情况判断出管网异常情况,本文将站场信息节点向量dk(t)进行增维实现突出信息数据变化情况的目的.由于管网中各个站场的压力变送器、流量计设备类型及数量各不相同,所以设置增维变量,根据实际管网站场情况对信息节点矩阵实现不同程度地增维.
为了阐述本文提出的异常诊断方法,本节以站场k的信息物理异常诊断为例进行说明,并且定义物理异常为工况调整和泄漏,信息异常为信息传输中断和信息传输错误.在第1节建立管网信息物理系统增维矩阵的基础上,依据随机矩阵理论[19]构建信息增维协方差矩阵.接着通过站场信息增维协方差矩阵最大特征值的变化区别出物理异常和信息传输错误异常,最后通过矩阵最大特征向量融合映射成的图像完成不同物理异常的区分.
其中,tb为系统允许的最大数据中断时间.
在确保站场k数据可靠性的基础上,将随机噪声引入矩阵保证信息数据间的独立性,减少由于增维过程带来的数据高度一致性,从而完成构建信息增维协方差矩阵的第一步.构建的信息增维矩阵如下所示.
其中,Ak为增加的随机噪声幅值,G为标准高斯噪声矩阵.
其中,i=1,2,···,,t=1,2,···,ts,分别为矩阵第i行的均值和标准差.
根据随机矩阵MP律可知,当管网系统处于平稳运行状态时,信息数据不会出现明显地变化,矩阵特征值的分布满足[19]
因此为了检测站场k的信息传输异常和物理异常情况,本文采用矩阵最大特征值分析判断站场k的信息数据变化情况,当站场最大特征值满足下式时,表明ts时刻站场k发生异常情况.
其中,γ为设定的异常阈值,λset为预先定义的增维协方差矩阵的最大理论特征值.
根据输油管网特性可知,当站场k的信息增维矩阵最大特征值满足式(10)时,需要进一步综合管网其余站场信息数据进行物理信息异常的分析.为了能够区分信息异常和物理异常,首先定义最大站场数据传输时间tg为
其中,tthr为数据传输延迟时间,站场数据传输时间为
图2 管网卷积神经网络模型Fig.2 CNN structure of pipeline network
其中,Lkg为站场k和g间的管道长度,vkg为站场间负压波速.
当相邻站场g的信息增维协方差矩阵经过长度为tg的采样时间后未满足式(10),则表明ts时刻站场k的信息数据改变是由信息传输错误异常引起的.
在信息增维协方差矩阵特征值实现信息异常判断的基础上,为了对物理异常进行分析,本文采用卷积神经网络进行物理异常类型的识别.首先从管网站场的信息增维协方差矩阵最大特征向量中选取维的最大特征向量,然后将选取的最大特征向量按照管网站场输油顺序进行排列,将tn秒数据构成维度为的矩阵;接着根据矩阵内的数值情况将矩阵内元素映射为0~255范围内的数字,从而得到维的灰度图;最后通过伪彩色变换实现灰度图向RGB图像的转换.在得到输入图像后,通过卷积神经网络的卷积核和池化窗进行特征自主提取,使最大特征向量包含的信息经过非线性模型转化为更抽象的特征,最终完成物理异常的识别[20-21].
针对管网系统物理异常分类问题构建的卷积神经网络如图2所示,由4个卷积层、4个批正则化层、4个池化层、1个全连接层以及1个Softmax回归层组成.
图2中的卷积层包含卷积运算和非线性运算两种计算结构,卷积层图像的特征向量是由卷积核的尺寸决定的,将上一层的输出与当前层32个大小为5×5的卷积核进行卷积运算,然后通过激活函数对卷积结果进行非线性运算,也就是说通过非线性函数和加入偏置项得到最终当前层的输出特征映射Xc+1.
为了能够提升卷积神经网络的模型拟合能力,在图2卷积神经网络结构中加入批正则化层,对卷积层输出特征进行正则化处理,使得图像数据特征的分布更加均匀.
接着池化层的每个神经元对局部接收区域进行池化操作,起到二次特征提取及实现非线性降采样运算的作用,进而得到池化层输出图像的特征向量.本文中池化层的池化窗大小为2×2,步长为2,并且神经元表达式为
其中,down(·)为最大值池化函数.Φ 和b分别为权重系数向量和偏置系数向量.
在经过12层网络的图像特征提取之后,将特征图输入到具有1024个神经元的全连接层,通过全连接将提取的特征图连接成一个一维向量.进而将其输入到Softmax回归层进行物理异常的分类.
基于上述分析可知:当站场k信息数据发生改变时,根据信息增维协方差矩阵最大特征值和最大特征向量的变化可以诊断出管网信息物理异常,并且基于数据特征的管网异常诊断方法的流程图如图3所示.
3 仿真结果与分析
为了验证所提方法的有效性,本文采用Matlab完成对不同算例数据的仿真及分析.并且每个算例中均包含不同类型的异常样本及诊断过程的描述.所有测试结果均在一台配备Intel Core i7-6700CPU、8GB内存的计算机上实现.并且仿真数据选取某输油管网近5年的工况调整数据、放油测试以及调试时产生的信息异常数据.为了能够满足卷积神经网络对于样本的要求,本文通过对现有物理异常数据的泛化实现样本数量的增加.所以最后训练和测试卷积神经网络的数据集共包含26500个数据样本,其中物理异常工况调整样本为14000个,不同程度地泄漏样本为12500个.在管网输送油品到各个站场时,管网调控中心及相应站场会对站内阀门、主输泵等设备进行操作,由于此类操作有时会使管网信息数据产生类似泄漏情况的变化,并且可能会传播到管网沿线其他站场,所以在本文中定义由正常操作引起的数据改变为工况调整样本;泄漏样本定义为管网放油测试以及程序调试时通过阀室及站内调节阀模拟产生的管网泄漏数据.训练样本和测试样本分别为总样本数量的80%和20%.为了模拟实际现场情况,检验模型的泛化能力,在测试过程中,将部分工况调整及泄漏样本作为未知样本进行测试,其比例占全部测试样本的20%.仿真参数为:管网站场增维矩阵的维度为30×60,站场信息增维协方差矩阵的最大特征向量的维度为30×30,,tn=300,因此卷积神经网络的输入图像维度是60×300,最大允许数据中断时间tb为10s以及最大传输延迟长度tthr为3s.异常阈值γ为1.2,管网信息增维协方差矩阵最大理论特征值λset为0.1.卷积神经网络训练参数为初始化学习率为10-4,损失函数为交叉熵函数,最大迭代次数为20次,卷积层权重系数向量参数由卷积神经网络训练获得,其余参数如图2所示.
3.1 算例一
为了说明本文提出的检测方法对信息传输中断异常的有效性,以图4所示的管网某管道调试时的压力曲线为例进行说明.管道上、下游站场分别为管网中的第2个和第3个分输站场.管道下游站场通过式(5)进行分析计算,当采样时刻达到326s时,计算第317s至第326s的增维矩阵的数据可靠性,发现下游站场数据满足式(5),因此判断下游站场发生信息传输中断异常.
此外,选取如图5所示的管网站场2和站场3的异常压力曲线对信息传输错误异常进行说明.从图5中得知:采样时间为324s时,下游站场压力由1.748MPa下降至1.746MPa,超过了平时压力波动范围.
基于数据特征融合的异常诊断方法首先通过式(5)验证增维矩阵满足数据可靠性,进而采用式(6)~(8)构建信息增维协方差矩阵和.通过图6(a)可知,在采样时间ts=325s时,站场3的信息增维协方差矩阵最大值为0.1294,超过了式(10)所设定的阈值0.12.因此,判断下游站场(站场3)发生异常情况.为进一步确定异常类型,对上游站场(站场2)的压力进行分析.当上游站场采样时间超过最大站场数据传输时间tg=61s时,通过图6(a)可知上游站场信息增维协方差矩阵的最大值在此时间段内并未超过阈值.因此根据图3流程图可知,下游站场(站场3)发生信息传输错误异常.
3.2 算例二
选取如图7所示的管网工况调整曲线对工况调整的物理异常进行检测.
按照第2节所示诊断流程,首先分别对管网6个站场进行数据预分析,然后再构建站场信息增维协方差矩阵.接着通过式(10)得到管网6个站场的信息增维协方差矩阵的最大特征值.管网站场最大特征值计算结果如图8所示.通过图8可知,站场4的最大特征值在800s时超过设置的阈值.然后根据图3所示流程图判断其他站场的最大特征值曲线,通过图8其余站场最大特征值曲线发现相邻站场均在不同时间发生最大特征值改变,因此判断站场4发生物理异常.
图3 管网信息物理异常诊断流程图Fig.3 Flowchart of pipeline network for cyber-physical abnormity diagnosis
然后选取管网站场信息增维协方差矩阵最大特征向量组成60×300维的矩阵.如图9所示,为了判断物理异常类型,首先将最大特征向量构成的矩阵通过灰度图映射为彩色图,接着将其作为卷积神经网络的输入,通过之前训练好的网络得到站场4发生的物理异常为工况调整.卷积神经网络对于图7所示的异常压力曲线的分析结果与实际工况调整相符(站场4进行输油调压).
图4 管道信息中断压力曲线Fig.4 Pipeline cyber interrupt pressure
图5 管道信息错误压力曲线Fig.5 Pipeline cyber error pressure
信息物理异常诊断方法除了需要对工况调整作出准确地识别以外,还需要对管网站场发生的泄漏情况进行分析.因此本算例通过站场2放油测试产生的压力曲线(图10)进行泄漏异常诊断.
通过图10可知,站场2压力曲线从380s附近开始下降,并且从图11可以看出站场2的最大特征值从382s开始超过了设定的阈值.并且在430s时站场3的最大特征值呈现出上升趋势.两个站场在最大站场数据传输时间内相继出现最大特征值上升的情况,表明管网发生物理异常.
图6 管道压力最大特征值曲线Fig.6 Max eigenvalue curves of pipeline pressure
为了进一步判别该异常的类型,在经过251s的采样后,将管网站场信息增维协方差矩阵的最大特征向量转化为如图12所示的RGB图像.利用训练好的卷积神经网络对该图像进行图像特征提取,卷积层1和卷积层4得到的图像特征向量如图12所示.在完成特征提取后,将一维特征向量输入到Softmax回归层,最终得到站场2的物理异常类型为泄漏.
图7 管网工况调整压力曲线Fig.7 Pipeline network operation adjustment pressure
图8 管网压力最大特征值曲线Fig.8 Max eigenvalue curves of pipeline network pressure
图9 卷积神经网络输出特征图Fig.9 Output feature of CNN
图10 管道泄漏压力曲线Fig.10 Pipeline leakage pressure
在管网物理泄漏异常诊断当中,异常诊断方法需要识别出站场出现的缓慢泄漏情况.因此,选取如图13所示的站场3和站场4的压力变化曲线进行阐述.该变化曲线是由阀室开阀放油测试产生的.
图11 管道压力最大特征值曲线Fig.11 Max eigenvalue curves of pipeline network pressure
图12 卷积神经网络输出特征图Fig.12 Output feature of CNN
如图13所示,在采样时刻ts=450s附近,上、下游站场压力开始缓慢下降并且压力下降值小于0.01MPa.对管网6个站场的信息节点矩阵通过增维变量进行增维,经过式(5)~(10)分析得到如图14所示的站场3和站场4的最大特征值曲线:在480s附近,上、下游站场最大特征值均超过最大特征值异常阈值1.2,表明站场4发生物理异常情况.接着将管网6个站场的信息增维协方差矩阵最大特征向量转化为图15所示的输入层图像.然后通过图2所示的卷积层提取图像特征,接着将提取到的一维特征向量输入到图2所示的Softmax回归层中进行判别,最后得到站场4的物理异常是由泄漏引起的.
图13 管道泄漏压力曲线Fig.13 Pipeline leakage pressure
图14 管道压力最大特征值曲线Fig.14 Max eigenvalue curve of pipeline network pressure
图15 卷积神经网络输出特征图Fig.15 Output feature of CNN
综合算例二的结果可知,通过数据特征融合的信息物理异常诊断方法能够有效地判断出不同的物理异常类型.为了检验卷积神经网络对工况调整及泄漏异常的识别能力,对测试样本进行50次实验,在50次统计测试实验中,全部测试样本中工况调整样本数量为2800个,泄漏样本的个数为2500.并且统计结果如表1所示.
表1 物理异常统计结果Table 1 The statistical result of physical abnormity
从表1可以看出工况调整样本的错误分类数为104个,并且泄漏测试样本的错误分类数为145个.两种物理异常的判断结果均在95%附近,表明卷积神经网络对于不同物理异常样本的识别有着较好的分类效果.如果在训练过程中包含全部物理异常类型的样本,那么测试精度会达到99%以上.
3.3 算例三
为了进一步表明文中提出方法在实际应用中的优势,将本文提出的方法和参考文献[7]、反向传播神经网络(Back propagation neural network,BPNN)、支持向量机 (Support vector machine,SVM)的方法进行了对比.
在仿真对比中,参考文献[7]采用发生物理异常的管道两端压力进行分析,并且采用相同的样本对BPNN、SVM 进行训练,其中BPNN是由三层神经网络组成,隐含层神经元的个数为6,并且隐含层的传递函数为tan-sigmoid;SVM的核函数为径向基函数,并且通过网格搜索算法来优选SVM参数.不同方法间的精度对比结果如表2所示.
表2 不同方法物理异常精度对比Table 2 Comparison of accuracy among different methods
从表2中可以看出,本文所提的方法在两种物理异常的识别中均优于其他三种方法.由于成品油是在密闭管道内输送,压力会随着距离不断衰减,参考文献[7]主要针对单条管道进行异常检测,所以该方法无法对管网沿线的操作进行有效地识别,从而导致误报警出现.因此,该方法对于工况调整和泄漏的识别精度较低.BPNN和SVM方法采用管网数据进行识别,所以方法灵敏度、特异度以及准确率都比参考文献[7]要高.虽然三种不同的方法均能够得到较好的效果,但是灵敏度、特异度以及准确率均低于本文所提的方法.出现该现象的原因在于卷积神经网络的输入为管网信息增维协方差均值的最大特征向量图像,而非手工提取的特征,信息更加全面,能够挖掘出隐藏在图像背后的深层特征.
此外,为了对比不同方法间的计算量,测试时间定义为方法得到一次样本结果所需的平均计算时间.不同方法的训练时间及测试时间结果如表3所示.
表3 不同方法物理异常计算时间对比Table 3 Comparison of computing time among different methods
从表3中可以看到,本文所提方法的训练时间比另外三种方法的时间要长.其原因在于本文所提的方法需要将信息增维协方差矩阵的最大特征向量转化成图像,进而使用卷积神经网络进行训练和测试,并且卷积神经网络的参数及结构较为复杂,所以训练时间较长.因为网络训练是离线进行的,所以不同的训练时间对于在线实时检测来说是一样的.虽然本文提出的方法是采用管网数据进行测试,测试时间较长,但是仍然没有超过1s.
因此,本文提出的方法能够兼顾管网异常诊断精度以及实时性,能够在较短的时间内准确地判断出运行情况,从而确保管道的安全.
4 结论
针对管网不同类型的信息物理异常,本文提出一种基于数据特征融合的管网信息物理异常诊断方法.从信息网络角度将站场压力、流量作为信息数据进行分析,通过对信息数据增维的方式突出信息数据的变化情况.接着通过构建的信息增维协方差矩阵预分析以及矩阵最大特征值的变化情况得到不同信息异常类型的分析结果.当多个站场最大特征值发生改变时,将协方差矩阵最大特征向量映射的二维图像作为卷积神经网络的输入,最终实现对站场工况调整和泄漏两种不同物理异常的分析.通过大量实际数据样本的仿真研究表明,本文提出的方法能够有效地检测管网信息物理异常情况.
此外为了能够提高测试精度,可以采用增加训练样本以及多次多折交叉验证进行卷积神经网络的训练.虽然本文提出的方法能够诊断出管网信息物理异常,但是需要进一步确定泄漏源位置.因此下一步的研究方向为继续研究深度学习机理,进一步探索泄漏源位置定位方法.