基于大数据挖掘技术的发电机故障诊断与预测性维护
2020-10-29倪先锋中海石油中国有限公司天津分公司天津300452
倪先锋(中海石油(中国)有限公司天津分公司,天津 300452)
0 引言
发电机组的安全与稳定运行是电网能否稳定运行的先决条件,对发电机组进行实时状态监测与故障诊断可及时发现电网的隐患,且对保证发电机组的稳定运行具有重大意义[1]。发电机一般由定子、转子、端盖、机座以及轴承等零部件组成,而每个单独的零部件又由很多的零部件构成。由于发电机的组成元件过于复杂,因此如何有效设计发电机组的监测点、有效提取到发电机组的状态信息就尤为困难。因此,有效地对发电机进行状态监测与故障诊断具有很高的工程应用价值与实际意义。其中,文献[1]提出对发电机的主要零部件进行振动监测,然后对关键零部件进行故障诊断,该论文取得了一定的成果,但是没有对发电机的整体状态进行评估;文献[2]对发电机组的运行状态进行了状态监测,但是没有做故障诊断。
目前对海上电网发电机组故障诊断难点在于以下几点:
(1)发电机的组成零部件太复杂,造成干扰源太多,很难提取到发电机有效故障特征信息;
(2)对海上电网发电机的故障诊断研究资料甚少;
(3)一般的传统故障诊断技术不能直接适用于发电机。
鉴于综上几点,本文提出一种基于大数据挖掘技术的发电机故障诊断与预测性维护方法[3-5]。本方法采用大数据挖掘技术与人工智能技术相互结合,进一步在实现对海上电网发电机组的状态监测的基础之上,更进一步的实现了对发电机组的故障诊断,然后基于故障诊断的信息提出预测性维护的意见。有效的打破了传统方法对发电机的故障监测的局限性,并且为后续发电机组的寿命预测提供了基础保证,该方法具有很高的工程应用价值与实际意义。
1 传统的发电机故障诊断技术
目前对于电网系统中发电机的故障诊断在实际过程中主要还是依赖于专家系统[6-8],其故障诊断流程图如图1所示。其主要技术方法的关键点在于如何构建基于发电机组的各种状态检测量来推算发电机的缺陷、以及发电机的故障发生概率(典型的有故障树)的物理模型或者是数学模型。
图1 传统的发电机故障诊断流程图
用于发电机故障诊断的状态监测量有很多,并且实际运用过程中每个状态特征量代的作用也不一致,通常需要给每个特征状态量给予不同权重。目前给予不同特征状态量权重的方法主要有主观权重法与客观权重法两种方式,主观权重法的主要依据就是根据专家的意见进行特征监测量权重的分配,因此该方法的结果很容易受到专家主观性的影响,客观权重法是根据各特征状态量之间的客观规律,然后依靠数学方法来确定其权重。通过数学方法确定客观权重的方法主要包括模糊理论、可拓理论、灰色理论、证据理论等。
2 基于大数据分析的发电机故障诊断技术
2.1 基于大数据技术故障诊断原理简述
大数据技术的兴起,为海上电网发电机组的故障诊断提供了新的技术,并且对发电机的状态监测提出了更高要求。大数据挖掘技术引入了更高深的数理统计、模式识别等方面的理论技术与工具。在海量数据的前提下,重点挖掘出不确定模型与监测状态量、以及故障状态之间的内在联系。基于大数据挖掘技术的发电机故障诊断技术主要是依靠历史数据,然后根据历史数据的特征预测未来的发展趋势,进一步实现故障诊断监测[9,10]。
2.2 基于大数据技术发电机故障诊断
2.2.1 聚类算法
基于大数据挖掘技术的设备故障诊断方法是通过故障异常状态参量的聚类分析来挖掘设备异常的故障模式。在本文中主要通过DBSCAN[12,13](Density-Based Spatial Clustering of Applications with Noise),基于密度的聚类算法)。DBSCAN 是一种常见的聚类算法,其用于聚类的基本思想可以简述如下:
(1) DBSCAN 通过检查数据集中每个点的δ 邻域(该邻域的大小由算法给定)来搜索簇,如果任意一点的δ 邻域包含多于给定点数,则创建一个以该点为核心对象的簇;
(2)接步骤(1),如果簇内的每一个点均满足聚类条件则对簇进行拓展,否则计该点为噪声点;
(3)重复步骤(2),当没有新点添加到任何簇时,迭代过程结束。最终可以得出聚类的类别与数目。
2.2.2 异常检测
大数据挖掘技术主要通过异常检测的方式来实现对故障的监测。异常检测的方法有很多,例如隔离森林、局部异常因子监测、自组织映射神经网络(self-organized maps,SOM)[11]等。其中本文采用的基于SOM 异常检测方法,SOM 的学习过程不同一般的神经网络,其可以不用提前给定任何目标输出。其基本思想上可以简述为:当输入矢量输入到网络后,网络利用随机选取的权值进行计算,寻找到最优的神经元,然后调整权值,用收缩邻域与学习因子(随时间而收缩)的办法,最终使取值形成一组能映射输入的数据,当网络自组织形成时,训练即结束。
一般而言SOM 的神经元是一个二维规则的单元格(一般有六边形、矩形),其中每一个神经元均可以由一组向量表达邻近神经元,且神经元之间是根据一定的拓扑关系进行关联。
其中SOM 的实现步骤可以简述为,将输入特征向量进行归一化后,反复训练SOM。每训练一步,计算SOM 权值与特征向量之间的“欧式距离”,最终选取最短距离的神经元为最佳匹配单元(Best matching unit, BMU),BMU 的本质就是权值矢量与输入向量之间最为接近的单元。当BMU 确定后,更新权值矢量与拓扑关系。其更新权值公式(1)为:
式中:Wi为权值矢量;h(·)为邻域函数;a(t)为学习率,在(0,1)区间内递减;X为输入特征矢量。
在工业现场中,故障数据往往很难被采集到,然而设备正常数据可以轻易的获取,因此可以利用偏离正常状态的特征空间来探测设备健康状态。因此可以结合SOM 中的BMU 与输入特征向量之间的距离来衡量设备是否偏离了正常运行状态,即运用最小量化误差MQE(Minimum Quadratuer Error)值来衡量设备的健康状态。
定义最小量化误差MQE 如下:
式中:MMQE为MQE 值;X为输入特征矢量;BMU 为BMU对应的权值矢量。
通过MQE 值即可实现对设备的故障监测与预测性维护。基于大数据挖掘技术的发电机的故障诊断流程图如图2所示。
图2 基于大数据挖掘技术的发电机的故障诊断流程图
(1)状态监测。利用传感器获取发电机的测量值,其中有发电机的电参数(电压、电流、有功功率等)、设备参数(关键设备的压力、温度、转速、加速度、位移、速度)等。
(2)数据清洗。在步骤(1)的过程中,采集到的数据由于采集硬件设备的原因或者是网络通讯的原因,会导致一些数据存在丢失。因此要将数据进行去重、去空及对缺失值进行补全等操作。
(3) DBSCAN。接步骤(2),对原始监测数据进行降维、归一化,然后运用密度聚类方法对其进行聚类,划分原始数据的类别。
(4) SOM-MQE。再步骤(3)的基础上,对聚类后的数据进行异常检测,判断输入的点是否为异常点,即此时发电机的状态是否出现了异常。
(5)状态评估。根据步骤(4)的MQE 值来判断设备的健康状态,如果设备正常,MQE 值会在一定范围内波动;如果MQE值突然变化很大,则说明设备出现异常。
3 实例验证
为了验证本文所提方法的有效性,选取一个海上电网发电机组的实际数据进行试验验证。选取22个特征指标对发电机组进行状态评估。由于采集的特征参数的具体数值不在同一量级上,因此对其进行归一化处理,然后进行特征降维分析。其中算法的相关设置参数如下:DBSCAN 中,邻域半径的大小设为0.35,最小采样点数为10;SOM 算法的参数设置如下:构建二维平面为5×5的六边形结构拼接而成,领域半径为0.5,学习率0.1,近邻函数选用高斯函数。最终基于SOM-MQE 方法发电机的故障诊断结果如图3所示。
图3 基于SOM-MQE的发电机故障诊断
在正常情况下,发电机的MQE 值处于一个正常的波动状态,当发电机出现异常时,其MQE 值波动范围较大,如图3中红色圆圈中的点。根据此时发电机的状态,最终反查至发电机此时的监测值,进行故障的根因分析,有利于进一步提高发电机的故障诊断。进一步,根据发电机的MQE 值作为发电机状态的特征指标,然后对发电机进行预测性维护。
4 结语
文章所提的基于大数据挖掘技术的发电机故障诊断与预测性维护技术,在一定程度实现了发电机的故障诊断。在此基础之上实现了对发电机的预测性维护,该方法避免了传统状态监测与故障诊断方法的不足,进一步提高了发电机的状态监测与故障诊断效率。进一步提升了海上电网的安全性能,提高了实际工程应用价值。