APP下载

基于SCADA 大数据的风电机组故障预警分析与研究*

2023-05-16张照彦

科技与创新 2023年9期
关键词:主轴风电预警

庄 勇,张照彦

(1.国能思达科技有限公司,北京 100000;2.河北大学电子信息工程学院,河北 保定 071002)

风能作为一种可再生能源,近些年处于蓬勃发展阶段[1-3]。根据世界风能协会初步统计,2018 年全球新增53.9 GW 的风电装机,中国以新增25.9 GW 继续大幅度领跑[4-5]。风电机组长期运行在恶劣的自然环境中,各部件的故障率显著增加[6],采用合理高效的监测手段和准确的故障诊断方法对提高风电机组可靠性具有重要意义[7]。

风电机组运行数据来源丰富,其中机组本身所配备的数据采集与监视控制系统每天会产生大量的运行数据,合理利用这些信息丰富的SCADA 数据可以实现对风电机组故障的预警,提高机组可靠性和电能质量[8-9]。基于SCADA 大数据的风电机组预警系统容易实现且可靠性高,它具有以下优点:不需要额外的投资,风电机组本身配备有实时监测系统,可得到准确可靠的SCADA 数据,方便采取大量的实验数据,实验数据越丰富,对于实验的科学性就更有保障,避免了偶然性,更有利于进行风电机组运行状态的分析与预测;历史储存的数据量很大,可以利用大量的健康数据进行试验,建立健康模型,由于故障发生之前的数据保留得较为完整,也就可以利用健康模型以及异常工作之前的各项参数进行分析比较,确定正常工作状态与异常工作状态之间的关系;现场实施方便,无需另配备专门运维人员,无后续维护费用,大大减少了工作量以及维修维护成本,对于风电场的运营有极大的好处,既减少了投入成本又提高了安全保障,所以风电机组故障预警策略有很大的应用空间。

风电机组故障预警是基于采集机组状态数据,通过尝试使用多种算法或算法的组合,在风电机组设备衰退出现“缺陷”的时候,尽早检测到潜在故障,为机组维修决策提供充裕时间与决策信息。本文依托现场的真实风电机组数据,经数据预处理,建立了NSET模型,并通过固定预警阈值验证了模型的可行性与预警策略的可实施性。

1 算法原理

使用机组正常工况下采集到的SCADA 数据建立NSET 模型,将该模型用于风机参数预测,依据残差实现对风电机组故障的预警。建模涉及的参数主要如下:总体观测矩阵Pnхb、记忆矩阵D、观测矩阵Xоbs和估计矩阵Xеst。

总体观测矩阵Pnхb如式(1)所示:

式(1)中:n为每个时间的观测变量数;b为时间标签。

从总体观测矩阵Pnхb中选取一段时间的参数记为训练矩阵K,代表各个观测参数的健康状态, 设训练矩阵中共k个观测向量,训练矩阵K如式(2)所示:

从训练矩阵K中抽取部分数据组成记忆矩阵D,被选取出的数据能覆盖系统正常工况,记忆矩阵D如式(3)所示:

将观测向量Xоbs输入NEST 模型,得到状态估计矩阵Xеst,对任意一个观测向量Xоbs,NSET 模型都将产生一个与Xоbs同维的权值向量W,使:

式(4)中:W=[w1,w2,…,wm]。

设残差为ε,对它做最小化处理:

若使ε最小,则需要求ε2的极小值,令,则:

由式(5)可看出,DTD可逆是权值向量W存在的先决条件,为增强NSET 模型可用性,将点乘运算代替为非线性运算符,本文选择DT和D间的Euсlidеn(欧氏)距离,即:

权值向量W可改为:

则系统的当前状态估计矩阵可写为:

基于上述推导,NSET 模型完成建立,由此模型可预测出输入数据,最终得到潜在的故障预警信息。

2 算例分析

以某风场A12 号风电机组现场获取的大量SCADA 数据为基础,开展基于非线性状态评估的风电机组故障预警分析和研究。数据源的时间跨度为2021-09-26—2022-01-26。

2.1 数据剖析

SCADA 系统故障记录显示,2021-12-26T06:00,A12 号机组发出类型为“主轴止推轴承温度高”的故障报警。温度属于渐变信号,在故障产生和发展的过程中是逐渐上升的,与振动等冲击型信号相比,温度信号中蕴含着更为丰富的潜在故障信息,对潜在信息进行充分挖掘对于风电机组故障预警的分析和研究具有极高的工程应用价值。本文使用的数据源中,共包含70 类17 713 条采样频率为10 min 的风电机组相关参数,其中齿轮箱相关参数共5 个、主轴相关参数共2个。主轴相关参数趋势如图1 所示。

图1 主轴相关温度变量趋势图

图1 中在菱形标识时刻故障报警,但温度却继续上升;继续匀速采样,风机并未停止。由此推断,可能存在2 种情况:发出故障报警后风电机组立刻停机,在设备温度下降之后再次启动并网;故障发生后风电机组并未立刻停机检修,而是带故障持续运行。

从图1 可知,情况2 更符合实际情况,为此,分别画出故障预警时刻后的风速与风功率趋势图,如图2所示。从图中可以看出,故障报警后,风电机组继续运行25.5 h 后才停机,停机时长达到51 h。

图2 风速与功率对照趋势图

2.2 数据关联变量分析

将SCADA 数据导入MATLAB 中,以相关系数r有针对性分析主轴相关2 个变量与其他变量之间的关联关系,以期发现对建模过程有建设性贡献的变量。需要说明的是,相关系数r只是众多变量关联关系分析指标的一种,并不具备直接决定全部建模相关变量的能力;最终的变量需要结合相关系数r与工程经验,决定具体的建模变量。

相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。

为研究2 个主轴相关变量与其他参数之间的线性相关程度,以确定非线性状态评估模型的建模变量,本文以相关系数为相关程度统计指标。相关系数r的计算方法如下所示:

相关系数是研究变量间关联程度的统计指标,以2个参数和各自平均值的离差为基础,通过2 个离差相乘来表示2 参数间的密切程度。r的绝对值越接近1,2 个变量关联程度越大;r的绝对值越接近0,2 个变量关联程度越小。针对本例中的“主轴止推轴承温度高”,可首先确定主轴直接关联的变量“主轴齿轮箱侧温度”“主轴风轮侧温度”,两者是所提供数据中直接与故障相关的数据。并且将两者的上一时刻数值作为2 个新变量。以这2 个变量为基础,进行相关系数r分析,可得到如图3 所示的相关数幅值图。

图3 相关系数幅值图

从图3 中可分析出,2 个变量的相关系数分布与数值十分相似;2 个变量无强负相关变量,正相关强变量较多。通过导出的数据分析可知,在图3①号线以上(幅值0.6)的变量有:主轴齿轮箱侧温度、主轴叶轮侧侧温度、机舱空气温度、机舱Y轴振动值、发电机转速、变桨轴1 轴箱温度、变桨轴2 轴箱温度、变桨轴3 轴箱温度、变桨轴1 电容温度、变桨轴2 电容温度、变桨轴3 电容电压、变桨轴2 伺服温度、变桨轴3 充电电流、变桨轴1 轮毂温度、变桨轴2 轮毂温度。

实际上,上述变量不需要全部使用,因为很明显可以看出绝大部分都是温度信号。而温度信号一般是输出类型的变量,如果全部变量都选择输出类信号,模型拟合固然很好,但实际应用效果会不理想。从变量物理空间与机械结构构造角度考量,选择主轴齿箱侧温度、主轴叶轮侧温度、机舱空气温度、机舱Y轴振动值、发电机转速、风轮转速、风速作为NSET 建模变量。

2.3 建立模型数据

由上述分析可知,有建模意义的数据共13 142 条,时间区间为2021-09-26T00:10—2021-12-26T06:00,将它分为训练集、验证集和试验集3 份。训练集的时间跨度为2021-09-26T00:10—2021-11-19T18:00;用于训练模型,以得到预警故障的NSET 模型。训练数据的风速与功率趋势对照图如图4 所示,从图中可知,训练数据有3 127 个数据条目异常。

图4 训练数据的风速与功率趋势对照图

验证集的时间跨度为2021-11-19T18:10—2021-11-28T21:00,数据条目1 315 个,用于验证所生成的故障模型。此区间的数据如果包含全部工况,则更能说明所建立模型的全工况动态验证下的鲁棒性。验证数据的风速与功率趋势对照图如图5 所示。

图5 验证数据的风速与功率趋势对照图

试验集的时间跨度为2021-11-28T21:10—2021-12-26T06:00,数据条目3 944 个;用于生成预测序列,将所形成的时间序列残差用于预警策略。试验数据的风速与功率趋势对照图如图6 所示。

图6 试验数据的风速与功率趋势对照图

利用等步长选择策略,共得到3 026 条NSET 建模有效数据条目,过程记忆矩阵三维图如图7 所示。

图7 记忆矩阵三维图

2.4 故障预警

利用建立的NSET 模型,预测试验集主轴齿轮箱侧温度,试验集预测结果如图8 所示。

从图8 可看出,主轴齿轮箱侧温度的实际值与其预测值产生较大偏离,在试验集的第1 000 点之后预测偏差尤为明显。这是由设备状态衰退所引起的原始NSET 模型与当前设备运行状态失配,进而导致实际值与预测值偏差较大,依此可检测出设备的潜在故障。

为清楚示意预警流程,此处使用固定阈值作为范例,将图8 中的原始数据与预测数据两者相减形成残差统计图,计算验证集残差的均值与均方根误差,可得到图9,图中2 条横线为预警线,是以均值为中心,上下3 倍均方根误差而得。

图8 试验集数据预测图

图9 验证集数据残差图

图9 中超出2 条预警线的点十分稀少,残差数据集中且残差的波动有一定规律,说明所建模型能够对验证集时间范围的机组状态进行较好的描述。通过逐点分析,发现超出预警线的时刻最多连续了2 次,说明此警戒线具有统计意义。

使用试验集参数形成上述残差图,使用验证集的2条预警线可得试验集的预警图,具体如图10 所示。

图10 试验集预警图

从图10 可明显看出,试验集齿轮箱侧温度残差在1 000 点左侧首次超出阈值,经逐点分析,900~1 000点之间共有17 个温度残差数据越过阈值下限。之后频繁超出阈值,并在2 500 点以后反向越过阈值上限。综上分析,在试验集第1 000 点(2021-12-05)应对风电机组登舱检查,此时距离SCADA 系统报警(2021-12-26)、停机(2021-12-27)尚有充裕检修时间,并且期间也有多次预警。

3 结论

本文依托现场的真实风电机组数据,经数据预处理,建立了NSET 模型,并通过固定预警阈值验证了模型的可行性与预警策略的可实施性。由于数据样本较少,残差序列整体幅值较大,后续可通过增大数据训练样本的方法降低残差幅值。同时,由于数据覆盖范围仅有4 个月,风电机组运行参数中的长周期特性并未得到体现,且风力资源并不充沛,高风速数据缺失严重,此问题依然可以通过提高数据采样频率、数据覆盖时间范围等措施加以克服。这些问题的存在也正是数据驱动建模的弱点,只有经大量数据训练,才能得到泛化效果好、预警准确率高的故障预警模型。

猜你喜欢

主轴风电预警
法国发布高温预警 严阵以待备战“史上最热周”
海上风电跃进隐忧
分散式风电破“局”
园林有害生物预警与可持续控制
风电:弃风限电明显改善 海上风电如火如荼
双主轴双排刀复合机床的研制
基于FANUC-31i外部一转信号在三档主轴定向中的应用
重齿风电
机载预警雷达对IFF 的干扰分析
应对最大360mm×360mm的加工物研发了双主轴·半自动切割机※1「DAD3660」