多元状态估计的记忆矩阵选取及风机故障预警方法
2019-01-30潘凤萍廖宏楷
李 锋 ,潘凤萍 ,廖宏楷 ,吕 游 ,黄 鑫
(1.广东电网有限责任公司电力科学研究院,广东 广州 510800;2.华北电力大学控制与计算机工程学院,北京 102206)
0 引言
提高电站设备运行的安全性和可靠性、降低设备的维护成本、延长设备的检修周期,对提高发电企业的经济效益和社会效益都具有重要的意义。随着电站设备故障检测技术的发展,人们不仅希望在故障出现时提供维修,还要求在设备发生故障前实现预警,从而有足够的时间采取措施来防止故障的发生和造成的停机,避免不必要的损失[1]。
引风机是大型火力发电厂主要的辅机设备之一,其运行状态直接影响电力生产的安全性和经济性。电站引风机故障会造成机组负荷降低或者非计划停机,减少机组发电量,影响发电企业的经济效益,甚至引发潜在安全事故。由于引风机设备结构复杂、故障类型繁多,而且在运行过程中会受到许多外界因素的影响,很难及时发现故障和准确判断故障产生的原因。因此,在设备出现异常或故障之前进行准确的预警,提前将潜在的故障预警送达相关人员,以采取正确措施避免故障发生或降低故障损失,对企业的安全生产和效益提高都具有重要的意义。
多元状态估计技术(multiple state estimation technology,MSET)利用涵盖正常运行状态的数据进行过程相似性建模,可以实现对设备运行状态的辨识及故障预警[2-3]。孙建平等[4]将MSET应用于电站风机的状态监测及故障预警中;刘涛等[5]提出利用MSET和偏离度实现电站引风机设备的故障预警。此外,MSET还应用于风机齿轮箱[6-7]以及内燃机[8]等设备的状态监测和预警中,并得到了较好的效果。
在利用MSET进行故障预警时,需要选取正常工况下的历史运行数据构建记忆矩阵,实现对运行状态的估计。而构建的记忆矩阵中工况特性的好坏,直接影响模型的预测精度[9-12]。如何选取合适的运行数据样本来构造信息量完备的记忆矩阵,是建立引风机故障预警模型时需要解决的一个重要问题。
本文提出一种记忆矩阵的构建方法。考虑样本的样本分布的空间大小、样本分布的均匀程度以及样本的冗余程度,构造记忆矩阵的评价指标;从历史运行数据中选取记忆矩阵时,应使评价指标l尽可能大,从而使得到的记忆矩阵涵盖更多的工况特性,以保证模型预测的精度。基于选取的记忆矩阵,构建MSET预测模型,从而实现电站引风机的故障预警。
1 引风机结构及监测参数
本文以燃煤电站中配备的静叶可调轴流式引风机为研究对象。电站厂级监控信息系统(supervision information system,SIS)中实时记录了引风机运行的状态参数,涵盖了电流、温度以及振动位移等参数。这些参数反映风机设备的运行状态变化特性。基于这些参数信息,可以实现对设备的状态监测和故障预警。引风机测点分布如图1所示。
图1 引风机测点分布图
图1中:I为电机电流;t1为电机后轴承温度;t2为电机前轴承温度;t3为引风机前轴承温度;t4为引风机后轴承温度;l1为引风机前轴承垂直位移;l2为引风机前轴承水平位移;l3为引风机后轴承垂直位移;l4为引风机后轴承水平位移。
从SIS系统中采集引风机运行状态相关的9维参数变量,具体包括:引风机电机电流、电机前轴承温度、电机后轴承温度、引风机前轴承温度、引风机后轴承温度、引风机前轴承垂直位移、引风机前轴承水平位移、引风机后轴承垂直位移和引风机后轴承水平位移。
2 多元状态估计技术
多元状态估计技术是一种非参数建模方法,通过运行参数之间的相似性来实现对设备状态的监测和故障预警[2- 3]。MSET的主要思想是利用设备正常工况下的历史运行数据,建立关于各参数之间关系,并根据新采样的数据判断设备的当前运行工况。在正常工况的历史运行数据中选取样本构建记忆矩阵D,在历史运行数据中,记tj时刻p个变量的数据样本为:X(tj)=[x1(tj),x2(tj),…,xp(tj)]T,j=1,2,…,n。其中:xi(tj)表示样本的变量i在tj时刻的测量值。选取n个数据样本,构建记忆矩阵D∈ip×p:
Dp×n=[X(t1),X(t2),…,X(tn)]=
(1)
式中:Dij=xi(tj)。
记忆矩阵中的每一列观测向量代表设备的一个正常运行状态,经过合理选择的记忆矩阵中的n个数据样本所形成的子空间,能够代表设备正常运行的过程特性。因此,记忆矩阵的构造实质就是对设备正常运行特性的描述和存储。
(2)
式中:权值向量w为该样本与记忆矩阵中各状态的相似性测度,并可通过最小化预测误差e得到。
新样本和估计值之间的误差定义为:
(3)
通过使误差最小化,可求得权值向量w:
w=(DT⊗D)-1×(DT⊗xo)
(4)
式中:⊗为非线性运算符,用来代替普通矩阵乘积运算。
通常,采用欧式距离运算,即:
(5)
式中:xi=X(ti);yj=Y(tj)。
通过欧式距离反映样本之间的相似程度。若新样本与记忆矩阵中样本的相似程度越大,则所对应的权值越大;反之越小。将式(4)代入式(2),可得到样本的估计向值。
3 记忆矩阵构建方法
记忆矩阵存储了设备正常运行的工况特性。当新样本处于记忆矩阵空间之内时,表明设备当前的运行特性与存储的正常工况特性一致,同时样本的估计误差较小,设备处于正常运行状态;若新样本处于记忆矩阵空间之外,表明当前的运行特性与存储的正常工况特性不一致,同时估计误差较大,设备可能发生故障。由此可以看出,记忆矩阵所包含的工况特性是否完备,直接决定了MSET的预测精度和预警的正确性。如何构建一个覆盖较大工况特性的记忆矩阵,对实现故障的精确预警具有重要的意义。本文同时考虑样本的空间大小、样本分布的均匀程度和样本的冗余程度,从历史运行数据中寻找涵盖最大工况的数据样本构建记忆矩阵。
在从历史运行数据中选取样本构建记忆矩阵时,考虑三个重要的因素:样本分布的空间大小、样本分布的均匀程度以及样本的冗余程度。样本分布的空间大小直接决定了记忆矩阵的覆盖范围,样本分布的均匀程度决定了记忆矩阵是无偏的,样本的冗余程度决定了信息的重复和冗余特性。
历史运行数据中任意一个样本到其邻近样本的平均距离为:
(6)
式中:n为所选的样本数;mi为与xi邻近的周边样本数;dij为任意两个样本xi和xj之间的欧式距离,并可以通过公式计算得到;r越大,表征样本分布的空间范围越大。
同时,为了保证每个样本与周边样本的距离都相近,即样本在整个空间内均匀分布,要求所有的距离近似一致,即具有较小的方差:
(7)
除了以上两个因素之外,还要考虑样本之间的冗余程度,使记忆矩阵中包含较少的冗余信息,即其中的每个数据记录都具有一定的工况代表性。这里利用Pearson相关系数的平均值来表征数据样本的冗余度:
(8)
ρij可以通过下式计算:
(9)
基于以上分析,最终定义评价记忆矩阵的指标如下:
λ=ρ(r-σ)
(10)
在进行选取记忆矩阵样本时,应使评价指标l的值尽可能大,从而使得到的记忆矩阵涵盖更大的工况特性,以保证预测的精度。在选取记忆矩阵样本时,可以采用Kennard-Stone (KS)搜索方法[11]、遗传算法以及粒子群算法等方法[12]。
4 基于MSET的风机故障预警
4.1 故障预警准则
定义当前样本与设备正常特性下预测值的相似度s来表征设备当前的健康状况:
(11)
式中:ε为相似度归一化参数,其值由设备正常运行样本的变化方差所决定。若s较大,表明当前样本和其预测值一致,即当前设备的运行状况也是正常的;若s较小,表明当前样本和其预测值不一致,即当前设备的运行状况与正常特性不同,设备有可能出现了故障。
定义相似度阈值δ作为故障阈值,来表征设备是否发生故障。若s≥δ,则设备运行状态正常;若s<δ,则设备发生故障。
4.2 故障预警变量选取及标准化
为了建立电站引风机的故障预警模型,需要选择表征引风机运行特性的变量来作为预警变量。基于风机常见故障,选择引风机电机电流、电机前轴承温度、电机后轴承温度、引风机前轴承温度、引风机后轴承温度、引风机前轴承垂直位移、引风机前轴承水平位移、引风机后轴承垂直位移和引风机后轴承水平位移作为预警变量。同时,为了统一个各个变量的量纲,将所选变量按照式(12)进行标准化:
(12)
式中:x为观测向量中的变量;x′为对应的标准化后的变量;μ为变量的样本均值;σ为变量的样本标准差。
4.3 风机预警仿真分析
选择引风机电机电流、电机前轴承温度、电机后轴承温度、引风机前轴承温度、引风机后轴承温度、引风机前轴承垂直位移、引风机前轴承水平位移、引风机后轴承垂直位移和引风机后轴承水平位移测点作为预警模型的观测变量,采集故障前连续2周左右的运行数据,采样间隔为2 min,共得到约10 000组数据样本。其中,引风机设备在9 500点开始发生引风机前轴承超温。采集的引风机前轴承温度数据如图2所示。
图2 引风机前轴承温度数据
从引风机正常运行的历史数据中,按照本文提出的使记忆矩阵评价指标最大化方法来选择100组数据样本作为记忆矩阵。利用MSET对新样本进行状态估计,然后计算样本与估计值的偏离度,建立故障预警模型(记为M1)。为了验证提出的记忆矩阵选取方法的有效性,按照时间顺序选取前100组数据样本构建记忆矩阵和建立故障预警模型(记为M2),对样本进行状态监测和故障预警。故障预警阈值δ设置为0.7。
利用故障预警模型M1得到的状态监测结果如图3所示。由图3可以看出,从第9 200个样本开始,样本的相似度逐渐降低,在第9 400个样本点开始低于故障阈值0.7。这说明引风机开始进入早期故障阶段,直至第9 500个样本点出现超温故障,相似度迅速降低,并在第9 800个样本点时降至0左右。由此可见,利用本文提出的最大化评价指标选择记忆矩阵建立的MSET模型可以实现故障的早期预警。以第9 500个样本点发生早期故障来计算,预警时间比故障发生时间提前了3 h。
图3 基于M1模型的预测相似度
利用故障预警模型M2得到的状态监测结果如图4所示。由图4可以看出,模型的相似度在第3 400个样本点处下降,并低于故障阈值,但是在第3 600个样本点处又开始上升。这说明模型在此处发生了故障误报。同时,模型在第6 900个样本点处也发生了故障误报。此外,模型在第9 700个样本点处仍能给出故障的预警信息,但比模型M1滞后了10 h左右。
图4 基于M2模型的预测相似度
为了进一步探究模型误报的原因,对模型的预测精度进行分析。图5和图6分别给出了模型M1和M2对引风机运行特性预测的误差序列。
图5 基于M1模型的预测误差
由图5可以看出,在设备正常运行的工况下,模型M1的预测误差较低,当发生故障时,模型的预测误差开始增加,这说明故障工况偏离了正常工况特性。
图6 基于M2模型的预测误差
由图6可以看出,模型M2在某些正常工况点也存在较大的误差,从而误认为这段运行工况偏离了正常状态,发生了故障的误报。这说明记忆矩阵样本的选取对MSET模型的预测精度有着较大的影响。
预警模型M1和M2中记忆矩阵样本的引风机电机电流分布频度如图7所示。
图7 风机电流分布频度
由图7(a)可以看出,模型M1中样本分布覆盖了较大的工况范围,标准化电机电流值的范围达到[-3.8,3.8]。这是由于M1中样本经过精心的筛选,使样本评价指标达到了最大化。而M2中记忆矩阵的样本则是按时间顺序进行选取,最大范围只达到[-2.1,1.6],小于M1模型的记忆矩阵样本的工况范围。通过对比图7(a)和图7(b)可以发现,模型M1中记忆矩阵的电机电流的分布频度较为均匀,而模型M2中记忆矩阵只选取了前100组数据样本,无法保证分布频度的均匀性。由此可见,本文提出的记忆矩阵样本选取方法,能够有效地选择具有较大工况特性的样本,并能保证样本分布的均匀性,从而使MSET建模具有很高的精度,并能实现对引风机故障的精确预警。
5 结束语
本文分析了电站引风机机结构和监测参数,在此基础上,对MSET技术在引风机的故障进行预警中的应用进行了研究。提出了记忆矩阵样本的评价准则和选取方法,对不同记忆矩阵样本选取方法下模型的预测精度进及预警效果行了对比验证。验证结果表明,本文提出的记忆矩阵样本选取方法,能够有效地选择具有较大工况特性的样本,从而使MSET建模具有很高的精度,并能实现对引风机故障的精确预警。