基于EEMD-GA-BP的水电机组状态趋势预测
2021-09-02肖志怀
陆 丹,肖志怀,刘 东,胡 晓,邓 涛
(1.武汉大学水力机械过渡过程教育部重点实验室,武汉430072;2.武汉大学水资源与水电工程科学国家重点实验室,武汉430072;3.武汉大学后勤保障部水电中心,武汉430072)
0 引 言
水电机组的安全可靠运行关系到电厂、电网的安全性与经济性。传统的故障诊断方法都是事后决策方式,只有在机组出现异常或故障后,才能进行相应的分析。水电机组的故障多是渐变发生的,可以通过预测机组的状态趋势来确定一段时间内机组的运行状态,提升机组运行的可靠性。通过对机组状态进行预测,可以提早发现机组的故障征兆,及时排查以免发生重大事故[1]。
水电机组的状态信息蕴藏于振动信号中,通过分析振动信号可以提取机组的故障征兆[2]。小波变换、Hilbert-Huang 变换、经验模态分解(Empirical Mode Decomposition,EMD)等时频分析方法常用来处理此类信号[3-5]。在实际应用中,小波变换的效果与选取的小波基函数和分解层数有关,泛用性较差;EMD分解存在模态混叠现象。Wu 和Huang 发现在原始信号中添加高斯白噪声组成新信号再进行分解的集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)方法[6]可以提高信号的抗混叠能力。
机组状态趋势预测是根据采集到的机组历史运行数据建立预测模型,用当前的机组运行参数预测一段时间内的运行趋势。常用来建立预测模型的方法有:自回归[7]、自回归滑动平均[8]、支持向量机[9]、神经网络[10]等。自回归和自回归滑动平均方法主要用于解决线性问题;支持向量机初始速度快、泛化能力强,但难以对大规模训练样本实施;神经网络是为了适应工程需要而发展的一门交叉学科,其中反向传播(Back Propaga⁃tion,BP)神经网络在水电领域应用广泛,其基于经验风险最小化原则进行建模,理论上可以拟合任意函数。为提高预测精度,避免非线性非平稳信号对预测结果的影响,一些学者将信号的时频分析方法和数学预测模型相结合。付文龙等基于聚合EEMD 和支持向量机理论建立的水电机组状态趋势预测模型,能够有效预测机组状态[11];杨晓红等结合小波变换和支持向量机提出了一种预测模型,实现了振动信号的短期预测[12];戈英杰提出了一种EEMD-SA-BP的新型混合风速预测模型,能够准确的进行风速预测[13]。
本文提出的EEMD-GA-BP 水电机组状态趋势预测模型,通过对振动数据进行EEMD 分解克服其非平稳非线性的特点,选择遗传算法(GeneticAlgorithm,GA)优化BP 神经网络的权值阈值,利用GA-BP 模型预测各IMF 分量的状态趋势,最后的预测信号通过累加各分量预测结果得到。实验表明,所提出的EEMD-GA-BP 水电机组状态趋势预测模型能够有效预测水电机组的状态趋势,与其他方法对比有更高的精度。
1 EEMD基本原理
EEMD 方法通过在原始信号中填充高斯白噪声组成新信号,再对新信号进行多次EMD 分解,由于高斯白噪声频率分布均匀的特性,最后总体平均处理各次分解得到的IMF 可滤去添加的噪声成分,获得最终的IMF 分量。EEMD 方法抑制了信号在分解过程中出现的短时间内局部极值频繁跳动的现象,降低IMF分量的混叠程度[14]。
对给定信号进行EEMD分解,其具体步骤如下:
步骤1:设定外加噪声次数N,高斯白噪声强度α;
步骤:2:将服从高斯分布[0,(αδ)2]的白噪声ni(t)添加到原始信号x(t)中构成新信号,新信号的标准差为δ=std[x(t)];
式中:ni(t)为第i次添加的白噪声;xi(t)是第i次添加白噪声后构成的新信号,i=1,2,…,N。
步骤3:用EMD方法分解新信号xi(t),获得一组IMF分量;
式中:K为本征模态分量的个数;ri,s(t)为残差;ci,k(t)是采用标准EMD对xi(t)进行分解得到的第k个模态分量,k=1,2,…,K,i=1,2,…,N重复步骤2与步骤3共N次,得到以下模态集合:
步骤4:总体平均处理各次分解得到到IMF 分量,得到最终的模态分量:
式中:k=1,2,…,K。
当存在异常或故障时,水电机组的振动信号会产生相应的突变。利用EEMD 分解将非线性非平稳信号平稳化处理的优势,避免由于直接预测而产生的误差,提高机组状态趋势预测的精度。
2 GA-BP神经网络
2.1 GA-BP神经网络介绍
人工神经网络是模拟人脑结构建立的数学模型。BP 神经网络是信号向前传递,误差反向传递的前馈型神经网络,虽然应用广泛,但存在易陷入局部极小值、收敛速度慢等缺点。通过遗传算法寻找BP 神经网络权值阈值的最优初始值,二次训练神经网络,实现全局最优[15,16]。
GA-BP算法流程如图1所示。
2.2 相空间重构
研究表明,在具体数据模型未知的情况下,对振动信号进行相空间重构可以得到高维相空间中的轨迹矩阵,并从中找出动力系统的响应规律[17,18]。依据此方法构造GA-BP 预测模型的输入输出样本。
对状态序列x(1),x(2),…,x(len),len为序列总长度,可构造相空间输入矩阵如下:
延迟时间参数取1,K=len-m+1,m为嵌入维度。Xk为相空间输入矩阵X的第k个相量。
对应的预测输出矩阵O为:
式中:Ok为在相空间中建立预测模型时与第k个输入向量对应的输出。
预测模型的输入输出样本由X与O组合构成。
3 基于EEMD 与GA-BP 神经网络的水电机组状态趋势预测
由上可知,结合EEMD 对非线性非平稳信号平稳化处理的能力和GA-BP 状态趋势预测的能力,本文提出了EEMD-GABP 的水电机组状态趋势预测模型。通过EEMD 方法将原始信号分解成不同本征模态分量,对每个本征模态分量重构相空间构建起神经网络的输入输出样本,通过GA-BP模型对各本征模态分量进行单步预测,最终的预测信号由各分量预测结果求和得到。
基于EEMD-GA-BP 预测模型的水电机组状态趋势预测具体内容如下:
步骤1:对水电机组振动信号进行EEMD 分解,得到本征模态分量IMFs;
步骤2:对各IMF分量重构相空间,构造GA-BP神经网络的输入输出样本;
步骤3:使用GA-BP 预测模型对每一个本征模态分量IMF进行预测;
步骤4:将所有IMF 分量的预测结果相加,得到最终的预测值。
EEMD-GA-BP模型状态趋势预测流程如图2所示。
4 实例验证
将本文提出的方法应用于国内某电站的机组状态趋势预测中。该电站3 号机组额定功率为200 MW,机组转速为107.1 r/min。该机组在2015年8月运行时表现出强烈的振动,经专业人员检测后诊断为由水力不平衡因素引发的转轮室里衬掉落故障。
4.1 数据获取
相关研究表明,波形的标准差或峰峰值可以较好的反应机组的状态[19,20],因此本实验中使用波形的标准差作为实验数据。本实验以该机组的轴向振动A 波形的标准差作为研究对象,波形的平均时间间隔为20 min。
将导叶开度和水头变化在3%以内的工况点视为处于同一工况,在同一工况下采集得到234个样本,经过小波阈值降噪后的信号如图3所示。从图3中可知,原始振动信号的标准差在第200点处发生突变,询问专业人员后得知,在该时间点附近机组上机架出现明显异常声音,声音在机组负荷200 MW 时更加剧烈,后经深入检查发现出现了转轮室里衬掉落故障。为符合工程实际,在进行神经网络训练时选择第200 点前的数据作为训练集,第200点后的数据作为测试集。
4.2 参数选取
在实验进行过程中发现对预测结果影响较大的参数有两个:一是EEMD 的分解参数,二是输入数据的长度。为确定最优参数,研究预测结果随这两个参数的变化。采用均方根误差(RMSE)与平均绝对百分误差(MAPE)比较不同参数的预测结果。数学公式描述如下:
式中:N为测试样本数;Yi与分别为实际检测值与预测值。
(1)EEMD 分解参数。集合次数和噪声强度影响EEMD 分解的性能。通常设定外加辅助白噪声强度是信号标准差的0.01~0.2 倍[21,22]。在不同集合次数和噪声强度下进行对比实验,EEMD 分解参数及实验结果如表1所示,其中,预设相空间重构嵌入维度m=6,即预测模型输入长度为6,EEMD 分解IMF分量个数为8。
表1 不同EEMD分解参数效果对比Tab.1 Comparison of the effect of different EEMD decomposition parameters
由于集合次数取100 噪声强度取0.4 与集合次数取200 噪声强度取0.4 时评价指标相差不大,对比在这两组参数下预测结果如图4所示。
对比可知,最佳的EEMD 分解参数为集合次数200,噪声强度0.4。
(2)输入数据的长度。进行重构相空间时的嵌入维度即是预测模型的输入数据长度,输入数据过短会导致模型提取到的特征缺失,影响预测结果;输入数据过长会造成数据冗余,加长神经网络训练的训练时间,输入更多的噪声,导致预测精度下降。在输入数据长度为5,6,7,8,9,10,15,20时进行对比实验,预测结果如图5所示。
通过上述实验,选择输入数据长度6 作为本实验的输入数据长度,即进行相空间重构时嵌入维度m=6。
4.3 预测结果及分析
图3在第200 点时出现突然上升,为证明预测模型的有效性,应选择200 点前的数据作为训练样本,结合在4.2 中确定的神经网络输入数据长度为6,因此在本实验中选取前186 个点作为训练集,后48个点作为测试集。为验证所提出的状态趋势预测方法的优越性,选取GA-BP、EMD-GA-BP 两种模型作为对比。
由4.2 可以确定本实验参数。EEMD 分解IMF分量个数为8,集合次数为200,噪声强度为0.4;GA-BP 神经网络为一个6输入1 输出的神经网络,隐层神经元个数为10。原信号经过EEMD分解得到结果如图6所示。
对EEMD 分解得到的各模态分量进行GA-BP 预测结果如图7所示。
对比各分量的预测结果,IMF1 的波动频率较高,导致预测效果较差,而IMF3、IMF4 由于相对平缓,因此得到了较好的预测效果。
在对比分析中,两种模型的样本选取方法与EEMD-GABP 模型相同,其中GA-BP 不对信号进行分解,最终预测结果由模型对原始信号直接预测得到;EMD-GA-BP 对信号进行EMD处理,再对各分量进行预测,最终的预测信号是将各分量预测结果相加得到的。预测信号与原信号对比如图8所示,预测性能指标如表2所示。
由图8和表2可知,EEMD-GA-BP 方法的预测曲线最逼近原信号,预测精度更高。这是由于非平稳信号经过EEMD 分解实现了平稳化,提高了预测精度,同时EEMD 因为添加了辅助噪声而避免了在EMD 分析中由于出现的模态混叠而导致的误差。
表2 各预测方法指标对比Tab.2 Comparison of indicators of various forecasting methods
4.4 补充验证
为进一步证明所提出的方法具有普适性,将本文所提方法应用到国内某抽蓄电站的机组状态趋势预测实验中。该电站一号机组在2019年6月20日至2019年7月6日期间出现水导摆度突然增大的现象。在本实验中选择2019年6月底机组正常运行至2019年7月初发生故障的1号机组的水导摆度的波形峰峰值为研究对象,波形的平均时间间隔为30 min。
将导叶开度和水头变化在3%以内的工况点视为处于同一工况,在同一工况下采集得到1 000 个样本点,原始信号如图9所示,原始振动信号的峰峰值在第900点处出现突变,询问工作人员后得知机组在该时间点附近出现的水导摆度的突然上升是由于水导瓦磨损严重引起的。
在本实验中,对原信号进行EEMD 分解时辅助噪声强度为0.4,集合数为200。EEMD 分解IMF分量数为8,EEMD 分解结果如图10。
对各IMF分量进行相空间重构,嵌入维数取6,序列相空间重构延时参数取1,构建一个6 输入1 输出,隐含层神经元数为10的BP神经网络。在本实验中,选取数据中前886个点作为训练集,后114个点作为测试集。
对各本征模特分量进行GA-BP预测结果如图11所示。
最终预测结果通过累加各分量预测结果得到,采用GA-BP和EMD-GA-BP 预测模型作为EEMD-GA-BP 模型的对比。各方法神经网络输出的预测信号与原信号对比如图12所示,各方法预测性能指标如表3所示。
从图12可以看出,所提模型预测结果在第40 样本点所处的时间附近机组水导摆度峰峰值会出现突然上升,与图9中实际监测数据所反映的情况基本吻合。由图12、表3可知,进行EEMD分解可以避免对非平稳信号直接预测时带来的误差和由模态混叠引起的误差,也因此所提方法与其他预测方法相比具有更高的精度,该预测模型能够对数据的突变时刻进行预测,补充验证进一步证明所提EEMD-GA-BP 模型具有普适性与优越性。
表3 各预测方法指标对比Tab.3 Comparison of indicators of various forecasting methods
5 结 论
趋势预测是事前决策的核心环节,通过预测机组的运行状态,尽早发现机组故障征兆,及时安排检修、排查故障,避免事故的发生,确保电厂运行的安全性。本文以水电机组振动信号作为研究对象,以BP 神经网络的预测能力为基础,结合EEMD对振动数据进行平稳化处理,利用遗传算法对BP 神经网络进行参数优化,提出了一种EEMD-GA-BP 的水电机组状态预测模型,并结合工程实际,应用到国内某两电站的机组振动状态趋势预测中。并设计对比实验与其他方法进行对比,结果表明,经过EEMD 处理后的机组振动数据,在预测精度上有一定的提高,能实现机组状态的有效预测。□