基于数据挖掘的水电机组振动区精细划分方法
2020-09-30张长伟李德红王卫玉陈启卷
张长伟,李德红,席 慧,王卫玉,陈启卷
(1.国网浙江省电力有限公司紧水滩水力发电厂,浙江 丽水 323000;2.水力机械过渡过程教育部重点实验室(武汉大学),武汉 430072)
0 引言
水电机组结构复杂,引起机组振动的因素包括机械、电气、水力等,不同振动因素的相互耦合导致机组运行状态发生变化,严重威胁电站安全运行,因此对机组运行区域进行准确划分对指导其安全稳定运行具有重要意义[1-3]。
经典的振动区划分方法主要基于机组特征水头的变负荷试验,专家和学者基于该方法对机组振动区的划分取得了一系列研究成果。马云勇[4]通过带负荷试验确定机组振动区分布,为机组AGC(自动发电控制)负荷分配提供指导。郭智俊等[5]对滩坑水电站1 号机组通过典型水头下的变负荷试验,将机组的运行区域划分为小负荷区、涡带工况区和大负荷区。钟堰辉[6]通过机组在较低水头下的变负荷试验确定机组振动区,与运转特性曲线比对,验证了试验结果的准确性。吴祖平[7]通过研究龙滩水电站700 MW 水轮发电机组在不同水头下的稳定性试验数据,得出了机组的稳定运行区域。乔亮亮等[8]通过对某250 MW 混流式机组开展不同水头下的变负荷实验,将机组运行区进行划分,提出多项AGC 避振策略,保障机组安全运行。虽然经典的振动区划分方法对国内水电站振动区划分的研究取得了较多成果,但是该方法难以覆盖机组运行全水头,得到的分区结果范围较为粗糙,机组在线状态监测系统数据得不到全部应用,没有体现出监测数据应有的价值。
近几年,随着大数据概念的迅速形成,利用机组海量在线监测数据为振动区划分提供依据成为现实。潘罗平[9]基于三峡集团公司远程状态监测与故障诊断中心数据,分析机组运行水头和负荷对监测参数特征量的影响,根据分区健康样本,确定机组运行全工况监测参数特征量的基准值和报警值,实现了机组运行分区。娄强等[10]提出一种基于机组在线监测数据、辅以稳定性试验分析的运行区精细划分方法,对比常规的运行区划分方法,该方法在获取涡带区边界、识别涡带区范围、实现全水头划分等方面具有优势。严耀亮等[11]提出采用MATLAB 对机组运行数据进行处理,分析机组振动原因,对机组运行区间提出建议。这些研究表明,虽然机组在线监测数据已经应用于振动区划分,但数据应用成本高,需要花费大量时间精力进行数据的筛选和整合。
本文针对水电机组振动区划分中在线监测数据尚未被高效利用、数据处理成本高等问题,搭建工况样本数据库,充分挖掘在线状态监测系统数据中的信息,研究基于数据挖掘的水电机组振动区精细划分方法。
1 基于数据挖掘的振动区划分模型
基于数据挖掘的振动区划分模型包括工况样本数据库构建和振动区精细划分方法两部分,工况样本数据库对在线监测系统数据分工况区间存储,振动区精细划分方法是一种通过健康样本确定相对阈值,识别全工况区间振动区的方法。
1.1 工况样本数据库构建
为实现在线监测数据在机组振动区划分中的高效率利用,专门搭建了工况样本数据库,将在线监测数据中工况数据和稳定性参数按照运行水头和负荷进行分类存储,以数据文件结合数据表的方式,通过Delphi XE3 编程结合SQL Server 数据库软件实现,数据库框架如图1 所示。通过数据文件和数据表可以同步快速地从在线监测系统中提取机组运行全工况区间稳定运行过程工况数据和稳定性参数测点峰峰值数据,同时根据机组运行时间提取健康样本数据和分区数据,节省大量的人力和物力,为快速实现振动区精细划分提供海量数据基础。
图1 数据库框架
数据文件负责存储机组稳定负荷运行时在线监测的所有数据,主要包括机组运行工况数据、各稳定性参数测点的波形数据和特征值,分类存储在机组运行工况对应的水头和负荷文件夹下。水头文件夹以机组运行水头H(四舍五入)命名,将H±0.5 m 的范围作为一个水头区间,形成机组运行全水头文件夹,用于存储该水头区间的实际负荷。负荷文件夹以机组稳定运行负荷P(四舍五入)命名,将P±0.5 MW 的范围作为一个负荷区间,形成机组运行全水头下的全负荷数据文件。
数据表存储机组稳定运行时的工况数据和稳定性参数测点峰峰值数据,主要包括分区记录表和样本记录表。分区记录表存储机组稳定运行时的有功功率、水头、上游水位、下游水位、转速、励磁电流、无功功率和导叶开度等工况数据。样本记录表存储机组稳定运行时振动、摆度和压力脉动等21 个稳定性参数测点峰峰值。
1.2 振动区精细划分方法
经典的振动区划分中数据来自于机组变水头变负荷试验,覆盖水头范围有限,难以反映机组运行全工况振动区。机组在线监测系统数据不仅包括稳定性试验数据,还包括机组日常发电运行数据,将这些数据应用到振动区划分,覆盖水头范围更广,工况区间范围更加精细。
振动区划分方法中阈值标准主要有绝对阈值标准、相对阈值标准和类比阈值标准。本文采用相对阈值标准,充分考虑机组在不同工况区间自身运行状态变化,基于已有的大量健康样本数据,采用3σ 准则上限值作为各稳定性测点峰峰值相对阈值。
具体算法如下:
对于同一工况区间内样本X1,X2,…,Xn,相互独立且同分布,则存在数学期望E(Xn)=μ 和方差D(Xn)=σ2,其样本平均值X 和样本方差S2按以下公式计算。
根据文献[12],可得出总体期望和方差S2的无偏估计量μ 和σ2。
在理想情况下,机组在某一工况区间内运行时稳定性参数测点峰峰值为定值,然而由于随机误差的存在,数值在[μ-3σ,μ+3σ]范围内波动,该范围能够覆盖99.74%的统计数据,若机组运行时稳定性参数测点峰峰值超出上限值μ+3σ,则表明机组运行稳定性状态较差,出现异常的概率为99.73%,应该避免在此工况区间运行。因此,在机组不同工况区间内,采用3σ 准则确定各稳定性参数测点越限区相对阈值,符合在振动区划分中对各稳定性参数测点峰峰值阈值设定的要求,可以满足工程实际需要[13-15]。
选取机组大修后在2 年以内稳定负荷运行过程中稳定性参数及工况参数等数据作为健康样本,针对健康样本中各稳定性参数测点峰峰值,选定3σ 准则中上限值μ+3σ 作为其阈值。将机组大修后除健康样本外累积稳定运行的数据作为分区数据,确定各测点峰峰值越限工况区。综合考虑各测点越限工况区,取交集部分作为强烈振动区(即禁止运行区),其他越限工况区作为过渡运行区(即限制运行区),非越限区作为稳定运行区,如图2 所示。
图2 振动区精细划分流程
2 振动区全水头划分案例
以某水电站3 号机组为研究对象,该机组2017 年7 月完成增容改造,单机容量为55 MW,设计水头为69.0 m,最大水头为85 m,最小水头为60.5 m。工况样本数据库于2018 年12 月投入使用,考虑数据库开始存储数据时间及机组运行水头变化规律,选取机组2018 年12 月—2019 年1 月稳定运行数据作为健康样本数据,2019 年2—10 月运行数据作为振动区划分数据,综合不同测点峰峰值越限区,对机组运行区进行划分。
2.1 数据库运行结果
本文搭建的工况样本数据库,实现了包括稳定性试验数据在内的在线状态监测数据中运行水头、有功功率等工况参数和振动、摆度、压力脉动等21 个稳定性参数峰峰值分类存储,数据覆盖机组运行工况区间如图3 所示。由目前数据库存储的机组稳定运行工况和运行时间可知,2018年12 月—2019 年1 月水头从低水头到高水头变化,2019 年2—10 月水头在高水头到低水头之间多次变化,其变化范围为63~82 m,且主要运行水头范围为68~80 m,在该水头区间内运行负荷为0~52 MW,80 m 以上水头区间内运行负荷为50~56 MW,67 m 以下水头区间内机组运行数据较少。数据库已累计存储该机组稳定运行数据共1 450 798 条,不同水头下机组运行数据累积数目如图4 所示。
图3 机组运行工况点
图4 全水头数据累积数目
2.2 基于数据挖掘的振动区划分
基于数据挖掘的振动区划分,首先对每一个工况区间内根据运行时间选取健康样本数据,在各工况区间内,根据准则确定各稳定性参数测点阈值;然后与除健康样本外的峰峰值比较,得到越限工况区域;最后对各工况区间内越限测点数进行统计,实现机组运行区划分,并对比传统的变负荷试验得到的振动区,研究基于数据挖掘的振动区划分模型的工程实用性。
基于目前工况样本数据,采用前述阈值划分原则,可得到21 个测点全工况区间相对阈值。综合考虑测点峰峰值反映机组稳定性状态和传感器的数据有效性,选择下导Y 向摆度、水导Y 向摆度、顶盖垂直向振动和蜗壳进口压力脉动4 个测点来表征机组运行状态,其中顶盖垂直向振动峰峰值相对阈值如图5 所示。图中每一种点代表了一个水头区间内各负荷区间越限区相对阈值分布情况,同一水头区间下在0~10 MW 和25~55 MW区间内阈值较小,在10~25 MW 区间内阈值较大;不同水头区间下各负荷区间内相对阈值变化规律类似。
图5 顶盖垂直向振动峰峰值相对阈值
将工况样本数据库中2019 年2—10 月存储的各稳定性参数测点峰峰值数据作为振动区划分依据,与全工况区间内各测点峰峰值相对阈值比较,若测点峰峰值大于其相对阈值,则此工况区间为越限区域。按此规则划分,顶盖垂直向振动峰峰值越限区如图6 所示,图中3 区域分别为越限工况区、机组稳定运行区及机组目前还未运行的工况区。
通过对以上4 个测点峰峰值越限工况区域取交集,若某一工况区间有2 个以上测点峰峰值都在越限区,则此区域显示为强烈振动区(即禁止运行区);若某一工况区间有1 个测点峰峰值处于越限区,则此区域显示为过渡运行区(即限制运行区);若某一工况区间没有测点峰峰值处于越限区,则此区域显示为非越限区,即为稳定运行区,机组没有历经的运行工况区域显示白色,划分结果如图7 所示。
图6 顶盖垂直向振动峰峰值越限区
图7 基于数据挖掘的机组运行分区结果
2017 年3 号机组增容改造后,在68.95 m,76.23 m,70.74 m 3 个水头下进行了变负荷试验,根据国家和行业标准中规定的稳定运行过程中振动、摆度、压力脉动峰峰值限值作为运行区域划分标准,对该机组3 个水头下的稳定运行区进行常规划分,如图8 所示。从图8 中可知,试验数据只能反映机组在该水头下的运行情况,水头覆盖范围有限,并且试验结果只能对机组运行区提供粗略的参考范围,不能对机组全工况运行区进行准确详细划分。
图8 基于变负荷实验的机组运行分区结果
基于数据挖掘的水电机组振动区精细划分方法所搭建的工况样本数据库能自动识别机组运行工况区间,对不同工况区间中稳定运行数据分类存储,与传统振动区划分方法相比,覆盖工况区间更广,弥补了变负荷试验难以涉及的区域,减少了试验成本,能方便快捷实时地根据实际运行情况确定振动区。由基于数据挖掘的运行区划分与基于变负荷试验的运行区划分结果图对比可知,基于数据挖掘的运行区划分可以精细到每一水头区间下的不同负荷区间,达到了机组运行区间精细划分的效果,验证了模型的工程实用性。
3 结语
通过搭建工况样本数据库,有针对性地将机组在线监测系统数据分工况区间进行存储,对机组运行工况和各测点峰峰值单独存储,大大减少了运行数据查看、调用和筛选所用时间,节省了大量人力物力,为振动区划分提供大数据基础。基于数据挖掘的振动区划分方法水头覆盖范围更广,根据准则确定各测点峰峰值振动区划分相对阈值充分考虑了机组实际运行情况,较绝对阈值更加合理,机组运行区域划分更加细致,可为机组的安全稳定运行提供准确指导。
除此以外,从基于数据挖掘的机组振动区划分结果图可以看出,机组目前已运行的工况区间还不能覆盖所有可能运行的工况区,将来可以进一步通过变负荷数据累积来补充完善机组全工况运行区。