基于维度融合与SSA-LSTM的机翼结冰检测*
2022-06-28聂福印黄秋凤黄玲琳
聂福印, 李 强, 黄秋凤, 黄玲琳
(西南科技大学 信息工程学院,四川 绵阳 621010)
0 引 言
在我国冬季,在环境温度和地域特性的双重影响下,正常作业的风电机机翼叶片容易产生覆冰现象[1]。一方面,机翼结冰会加重风机作业负荷,降低产能效率,缩短使用寿命;另一方面,高空覆冰滑落给地面设备和工作人员带来严重安全隐患[2]。
目前针对风电机组叶片的研究主要包括机翼除冰系统设计和机翼结冰检测两方面。其中针对机翼结冰检测研究相对较少,目前结冰检测的主要手段大部分是通过比较风机的实际功率与理论功率间的偏差值,当功率偏差达到一定阈值后触发报警传感器[3]。然而真实运行情况下,传感器触发报警时叶片往往产生大范围覆冰现象。如何有效判断叶片结冰的早期时刻,适时启动除冰系统成为时下面临的一项严峻挑战。文献[4]基于图像边缘梯度和灰度值分割算法实现结冰检测;文献[5]基于光学摄像头实时图像传导实现对叶片工况的监控;文献[6]通过对加速度传感器获取的信号进行矢量分解判断风机叶片的工况状态;文献[7]使用基于随机森林的特征消减和支持向量机融合模型方法训练结冰检测模型;文献[8]基于遗传算法和支持向量机构建结冰检测模型。
为了挖掘数据的时序关联性、降低特征冗余,本文提出一种基于维度融合优化与长短期记忆(long short-term memory,LSTM)网络的机翼结冰检测策略。针对网络模型输入层权值和隐含层偏差值需要人工经验调优的缺陷,引入改进的麻雀搜索算法(sparrow search algorithm,SSA)优化检测模型。实验证明本文建立的机翼结冰检测模型具有较高的预测精度和良好的泛化性能,能够准确实现结冰检测。
1 理论与方法
1.1 递归特征消除
递归特征消除(recursive feature elimination,RFE)是通过递归循环搜索最优解的贪心算法,在训练基本模型的过程中实现不同特征组合的多次学习[9]。单轮模型训练结束后会根据系数权重选择特征,并将部分低权重特征移出特征集合,多次迭代训练,直到对所有特征实现遍历筛选。
1.2 主成分分析
本文模型输入参数间存在一定的相关性导致输入信息冗余,冗余信息会增加计算复杂度并影响判决准确率。本文选择主成分分析(principal component analysis,PCA)消除输入参数间的冗余信息[10]。
PCA的思想是通过特征变换求取相关系数矩阵,实现变量维度转换,使用互不相关的新输入参数代替原始输入参数,在保留原有参数的全部信息前提下,实现原始输入参数的降维。
1.3 LSTM网络
LSTM网络是深度学习中的经典网络结构。LSTM通过权重参数传导,将不同时间步下隐含层的权重矩阵以系数加权的方式向后传递,为后续时刻的模型学习做出贡献[11]。借助记忆单元累加隐含层权重状态,通过输入门、遗忘门和输出门的协同工作,实现重要信息累加和冗余信息的遗弃。通过记忆单元和门限结构的协同工作控制梯度变换范围,有效避免梯度过快消失的问题[12],从而实现长期记忆。
1.4 SSA及其改进
SSA是一类模拟麻雀觅食并躲避捕食者行为的启发式优化算法。在SSA中,种群被划分为发现者和追随者,发现者负责在种群空间搜索食物,追随者跟随发现者对搜索空间展开搜索[13]。
SSA在迭代过程中容易陷入局部最优,为解决此问题本文提出一种改进的麻雀搜索算法(improved sparrow search algorithm,ISSA),ISSA的主要改进部分如下:
1)借用逻辑混沌算法优化种群初始化,利用混沌伪随机性、遍历性的特点,更优良地实现初期全局搜索。本文借助逻辑映射产生伪随机序列,该策略数学表述如下
Z︰an+1=uan(1-an)
(1)
式中Z为一个混沌变量,u为控制参量,当给混沌变量赋一个初值a0时,通过逻辑方程迭代,借助线性映射,可以获得一组混沌性的初始变量,线性映射方案如下
Z→X︰X=a+(b-a)Z
(2)
2)为更好实现迭代初期全局寻优,后期局部收敛,本文提出一种自适应警戒值策略,该策略描述如下
(3)
当前迭代次数k较小时,w接近于wmin保证智能算法的全局搜索能力,随着迭代次数增加,w以非线性方式递增,保证迭代后期更好地实现局部搜索收敛,从而使算法能够灵活地调整全局搜索与局部搜索能力。
3)借鉴遗传算法的变异思想,引入自适应变异因子。每次迭代完成后,种群有一定几率发生变异,该策略数学表述如下
(4)
式中p为变异因子,随着迭代代数增加种群变异概率不断减小。
4)标准SSA在侦查时,当发生警戒时,原始移动方式是陷入局部最优的主要原因。本文选择一种新的麻雀变更方式,数学表述如下
(5)
当种群产生预警行为,最优麻雀会逃离到最优位置和最差位置间的随机位置,其余麻雀会逃离到自己和最差位置间的随机位置。
2 建模方法
2.1 结冰机理分析
当风机处于正常工作状态时,输出功率保持平稳,并与风速保持良好的曲线对应关系。对数据进行分布拟合,风速与网侧有功功率拟合情况如图1所示,机舱温度与环境温度拟合情况如图2所示。
图1 风速与网测有功功率分布
图2 环境—机舱温度数据分布
其中,图1中的曲线是大样本拟合后的风速—功率拟合曲线。分析图1和图2发现风机处于正常工作状态时,输出功率保持平稳,并与风速有良好的对应关系。当风速处于-2~2 ℃时,网侧有功功率处于-1.0~2.1 kW,存在结冰数据。当机舱温度处于-2.5~1.7 ℃时且环境温度小于2 ℃,存在结冰数据,其余数据分布段均为正常数据。
2.2 数据预处理
为防止丢失低数量级特征,本文使用归一化策略对原始特征进行数据预处理,将原始数据特征集合归一化到0~1的数据段内,归一化数学表述如下
(6)
式中xmax为样本特征中的最大值,xmin为样本特征中的最小差。
2.3 特征选取
选择风速、有功功率等4个重要特征,通过特征交叉扩充原始特征集。基于递归特征消减算法选择风速/环境温度等19个权值评分高的特征作为建模特征维度。
2.4 模型训练
选取70 %数据训练模型,30 %验证模型。使用PCA处理输入数据实现数据降维,并通过滑动窗口处理数据的输入格式,训练LSTM结冰检测模型。
2.5 智能算法优化及其改进
SSA 相较于其他群体智能优化算法搜索精度高,收敛速度快,稳定性好,鲁棒性强。但SSA搜索接近全局最优时,会出现种群多样性减少,陷入局部最优的缺陷。本文对SSA进行改进并提出ISSA算法。根据风机数据建模需求,设置搜索维度为三维,种群大小为20,迭代次数为1 000次,选择不同的测试函数进行测试,结果如表1所示。
表1 基准测试函数结果
从表1可以发现,ISSA在基准测试函数中表现较好,寻优效果更为明显。设置种群数量为10,迭代次数为10,最大、最小预警阈值分别为0.8和0.1,选择验证集判决错误率作为种群适应度并使用ISSA算法对网络学习率、隐含层神经元个数进行寻优,经过ISSA算法寻优后模型超参数为:网络学习率为0.008 14,第一隐含层神经元数量为160,第二隐含层神经元数量为174。
3 结果分析
设置滑窗宽度为10,优化器学习率为0.001,隐含层神经元个数50,步长参数为64,模型训练200次,选择Adam优化器优化模型。当训练样本为20 000条时,LSTM模型训练损失如图3所示。
图3 LSTM模型训练损失
图3中,虚线代表模型验证集的损失变化,实线表示训练集的损失变化。分析图中曲线发现,LSTM模型迭代到105次左右时训练损失已经收敛在0.13附近。选取特征融合处理后的样本作为训练数据构建ISSA-LSTM模型,并与其他群智能优化算法的优化模型进行比较,验证ISSA,SSA,PSO,GWO对检测模型的优化情况,模型验证集精确率如表2所示。
表2 群智能算法模型精确率 %
采用来源于信息检索中对相关性的评价Precision-Recall曲线反映结冰模型的故障判决准确程度,即召回率和精度
(7)
(8)
(9)
式中recall代表召回率,precision代表精度,F1分数表示精确率和召回率的调和平均数。取20 000条训练样本,其余参数保持一致进行实验,群智能算法优化模型各参数如表3所示。
表3 优化参数结果对比
结合表2、表3可以看出:相比SSA,PSO,GWO等群智能优化算法,ISSA的各项参数皆优于其他群智能算法,当训练样本数据为20 000时可以达到99.85 %的判决准确率,充分证明ISSA-LSTM模型的有效性及可靠性。
4 结束语
为检测结冰阶段,提前开启除冰设备,本文提出一种基于维度融合优化的LSTM网络机翼结冰检测策略。将递归特征消减算法与主成分分析技术结合起来实现输入特征优化,并引入ISSA优化LSTM网络结冰检测模型。多次实验验证,该策略能有效地实现风机数据的结冰判决。模型准确率优良,具备泛化性,可理解性好。为风机结冰检测难题提供新的解决思路,为风机除冰决策提供辅助性依据。