基于麻雀搜索算法优化支持向量机的海缆振动信号识别方法
2023-11-06郭家兴钱君霞马鸿娟
郭家兴,钱君霞,柳 瑞,马鸿娟
(1. 中国能源建设集团江苏省电力设计院有限公司,江苏 南京 210000;2. 华北电力大学(保定),河北 保定 071003)
0 引言
为了适应中国近海岛礁发展以及近海风电、跨海通信等重大工程项目的施工需求,光纤复合海底电缆(简称“海缆”)的使用愈加频繁。在跨海输电和通信传输中,海缆发挥着重要作用[1-2]。复杂的海洋地质构造和施工作业环境,都是引起海缆不同程度机械或电学故障的因素[3]。因此,对海缆各类工况进行信号识别,有助于海缆故障的早期预警。
支持向量机 (support vector machine,SVM)算法被广泛地用作振动信号的识别。SVM具有样本需求量小、泛化能力强和判别精确度高的优势[4]。在实际应用中,其核函数的选取以及参数的设定直接影响分析效率。目前径向基函数(radial basis function,RBF)的核函数已被证实对非线性问题的解决效果良好[5-7]。因此,如何更好选择惩罚因子C和核函数参数g很重要。常用的参数优化方法包括网格搜索(grid search, GS)、遗传算法(genetic algorithm,GA)和粒子群优化(particle swarm optimization, PSO)等。文献[8]采用GS 算法对SVM 的惩罚因子C和核函数参数g进行寻优,以此建立分类器用于识别故障类型,并达到了不错的效果。文献[9]针对SVM 参数选择困难问题,采用GA-SVM 算法,确定参数最优值识别3种故障类型,模型故障诊断平均准确率比SVM 有了较大的提升。文献[10]采用GA-SVM 算法,有效地提高了SVM 的分类性能,但是由于GA的操作较为复杂,从而导致寻优速度较慢。文献[11]提出用PSO-SVM 算法,虽收敛速度得到提升,但却很容易陷入局部最优解。文献[12]将构建的多维特征向量送入PSO-SVM 模式自动识别分类模型,与SVM 相比,该方法具有更好的识别准确率。文献[13]用人工蜂群( artificial bee colony,ABC) 算法来优化SVM,这种方法可以很好地克服局部最优解,但无法利用全局最优信息迭代更新。文献[14]利用麻雀搜索算法(sparrow search algorithm, SSA)优化SVM 对刀具磨损状态进行识别,其识别准确率达到了98.246%。文献[15]利用SSA-SVM 对滚动轴承进行识别,诊断模型的测试正确率为96.67% ,比传统的GA-SVM 和PSO-SVM诊断模型分别提高了3.34和1.67个百分点,且收敛速度更快,可有效应用于故障诊断。文献[16]利用 SSA 对SVM 参数进行调节,以实现对瓶盖装配的检测,优化后的SVM模型测试准确率达到98.33%,基于SSA-SVM 的瓶盖装配检测模型识别精度高、调参速度快、泛化能力强。
目前,典型的振动分析算法——集合经验模态分解(ensemble empirical mode decomposition, EEMD)算法被广泛用于故障诊断[17],其可对信号进行分解以提取特征。SSA是一种新颖的群体优化算法,现有研究通过19个标准测试函数进行验证,结果显示SSA 在搜索精度、收敛速度、稳定性和避免局部最优值方面均表现优异[18]。因此,本文提出了一种基于SSA-SVM优化的EEMD-SSA-SVM 混合海缆振动信号识别模型。其首先采用EEMD 对3 种海缆振动信号进行分解,并求解其模态分类的峭度和能量熵,以构成特征向量用于后续识别;为提高分类准确率,采用SSA 优化SVM 的惩罚因子和核函数参数,形成SSA-SVM 识别模型;并将本文方法与PSO-SVM、SVM算法进行了对比分析。
1 SSA-SVM算法原理
SSA-SVM算法的主角为麻雀,每只麻雀个体只有一项属性,即位置,其可表示麻雀所寻觅到的食物所在方位。对于每只麻雀个体,其可能有3 种状态的改变:1) 充当发现者,带领种群寻觅食物;2) 作为追随者,追随发现者觅食;3) 具备警戒机制,发现危险则放弃觅食。麻雀算法的优化参数为SVM中惩罚因子C和核函数参数g,适应度函数为SVM对测试集的预测正确率。
1.1 SSA
SSA 是薛建凯在2020 年提出的一种新的群体智能优化算法,其灵感来自麻雀的觅食和反捕食行为。SSA 不受目标函数可微性、可推导性和连续性的限制,具有全局搜索能力强、稳定性好、收敛速度快等优点。SSA是一种新颖、组织良好的元启发式算法,可用于解决各个领域的优化问题[19]。
假设在D维搜索空间中有M只麻雀,由M只麻雀组成的种群具体如下:
式中:xid——维度D中的第i只麻雀。
这里,采用海缆故障的准确率作为适应度函数,以不断更新最优值来达到最佳的识别率。所有麻雀的适应度值FX可表示为
在SSA中,适应度值FX表示能量储备,f表示适应度函数。在搜寻过程中,能源储备量较高的生产者将优先获得食物。一般而言,占种群10%~20%的生产者负责寻找食物,其觅食搜索范围比掠食者的大;同时,生产者应通过式(3)更新:
式中:t——当前迭代次数;Xid,t—— 第i只麻雀在d维中经t次迭代后所在的位置;T—— 最大迭代次数;α ——均匀随机数,α∈ (0,1];Q—— 服从正态分布的随机数;L——大小为1×d的矩阵,其所有元素均为1;R2——警告值,R2∈ [0,1];ST——安全值,ST∈ [0.5, 1]。
当R2<ST时,觅食区周围没有捕食者,生产者可以执行广泛的搜索操作。当R2≥ST时,群中的侦察麻雀已经识别出一个捕食者,并立即向其他麻雀发出警报,然后,群中的麻雀开始进行反捕食者行为,调整搜索策略并迅速向安全区域移动。
在觅食过程中,除了生产者之外,所有麻雀都充当寻找最佳觅食区域的搜寻者。搜寻者根据式(4)更新其位置。当时,第i个搜寻者得不到任何食物,处于饥饿状态,适应性较低,这种麻雀很有可能飞到另一个地方觅食并获得更高的能量。当i≤时,第i个搜寻者在当前最佳位置xb附近找到一个随机位置进行觅食。
式中:xwd,t——在第t次迭代中麻雀在第d维的最差位置;xbd,t+1——在第(t+1)次迭代中麻雀在第d维的最佳位置;A——大小为1×d的矩阵,其每个元素被随机分配到1或-1,使得A+=AT。
当检测到危险时,种群边缘的麻雀将迅速移动到一个安全的区域以获得更好的位置,而种群中间的麻雀会随机走动以接近其他麻雀。移动的数学表达式如下:
式中:xbd,t——第t次迭代时预警麻雀的最佳全局位置;β——步长控制参数,为正态分布随机数,均值为0,方差为1;K——表示麻雀移动方向的随机数,也是步长控制参数,且K∈[-1,1];ε是一个小常数,以避免分母为0 的情况;fi——第i只麻雀的适应度值;fb——当前麻雀群的最佳适应度值;fw——当前麻雀群的最差适应度值。
当fi≠fb时,麻雀处于种群的边缘,容易受到捕食者的攻击;当fi=fb时,麻雀就在种群中间。一旦麻雀意识到来自捕食者的威胁,它就会靠近其他麻雀并调整搜索策略以避免受到攻击。
1.2 SSA-SVM算法
SVM惩罚因子C和核函数参数g的选择对分类结果有很大影响。同时,SSA算法具有较强的全局搜索能力,适合用于优化SVM的C和g,以获得更好的参数组合。通过使用一定数量的麻雀进行全局优化,可以得到最优的参数组合。然后,利用SSA优化算法得到的最优C和g来建立SVM 识别模型,并得到诊断结果。使用SSA算法优化SVM的过程如图1所示,具体步骤如下:
图1 SSA-SVM 算法流程图Fig.1 Flow chart of SSA-SVM algorithm
1) 首先确定故障诊断模型的输入、输出。提取故障特征作为诊断模型输入,确定目标输出值。建立训练、测试样本集。
2) 初始化麻雀搜索算法相关参数,包括种群数量M、最大迭代次数T、C和g。
3) 通过交叉验证,对训练样本进行分类,以交叉验证的准确率作为麻雀个体的适应度。保留最优的适应度值及位置信息。
4) 根据式(3)~式(5)更新位置。
5) 计算麻雀个体新位置的适应度值,将更新后的适应度值与原来的最优值进行比较,并更新全局最优信息。
6)判断迭代次数是否满足终止条件,如不满足,则重复步骤3);反之则停止,输出最优参数,将测试集样本输入到最优的 SVM 模型,输出诊断结果。
2 振动信号获取及特征提取
2.1 仿真信号获取
华北电力大学尚秋峰团队通过有限元仿真得到了海缆的锚砸、摩擦及冲刷振动信号。设定船锚重151 kg,其下落的速率为6.95 m/s,锚砸持续时间定为0.05 s,海缆长度500 cm,重力加速度g=9.8 m/s2,通过ANSYS 软件仿真,提取光单元的振动数据,进而得到对应的锚砸故障信号[20]。通过有限元分析法中的瞬态动力学分析方法仿真构建了岩石与海缆发生摩擦时的二维模型,设摩擦的时间为0.5 s,起始速度是0.25 m/s,滑动方向沿x轴的正方向,同时在y方向施加了约束,使海缆摩擦运动方向只能沿x轴正向,提取光单元的振动数据,得到对应的摩擦故障信号[21]。在波浪高度为100 cm、速度为2 m/s、周期为1 s的匀速海浪条件下,构建了在波浪冲刷条件下裸露的悬跨海缆的有限元模型,模型中规定水流沿y轴方向流动,通过有限元仿真得到了海缆冲刷故障信号[22]。
2.2 实验系统
图2 所示的实验系统为布里渊光时域分析(Brillouin optical time-domain analysis,BOTDA)和偏振态检测相结合的温度/应变/振动多参量传感系统[23-25],其可以实现对温度、应变和偏振态的同时检测。BOTDA系统中,窄线宽激光器输出的光信号经耦合器分为两路,并由掺铒光纤放大器(erbium doped fiber amplifier, EDFA)放大。其中一路光信号由声光调制器(acousto-optic modulator,AOM)调制成脉冲光,经EDFA2 放大并由光栅滤除EDFA2 所产生的自发辐射噪声,最后进入传感光纤。耦合器的另一路光信号由电光调制器(electro-optic modulator,EOM)调制产生约11 GHz 频移的光信号。本系统采用损耗型BOTDA 技术,连续光频率高于脉冲光频率。利用光滤波器选取EOM 输出的已调制信号的上边带,此信号作为探测光进入传感光纤。当光纤中相向传输的两路光的频率差与光纤的布里渊频移一致时,受激布里渊散射(stimulated Brillouin scattering,SBS)作用最强。携带SBS 信息的探测光通过环形器、保偏耦合器和光电探测器,分别由高速数据采集设备(A/D 转换器)和偏振分析仪(POD)进行数据采集,采用Matlab 进行数据处理和分析。
图2 BOTDA 实验框图Fig.2 Block diagram of the BOTDA experiment
从POD获取振动信号并完成本文算法分析的模拟实验过程为:分别将仿真获得的摩擦、冲刷和锚砸3种故障振动信号输入到任意波形信号发生器中,开启功率放大驱动振动台,使振动段光纤产生摩擦、冲刷和锚砸3种故障形态对应的偏振态变化。本实验中,振动信号特征的提取和识别采用的数据源为POD输出的斯托克斯矢量S1信号,其对应海缆内置的单模光纤中连续探测光偏振态的变化,为输入到POD的光功率(P)经过水平/垂直线偏振器后所输出光功率之差。摩擦、冲刷和锚砸这3种故障形态对应的S1信号如图3 所示,采用本文提出的EEMD-SSA-SVM算法对S1进行处理,即可识别海缆故障。振动信号探测的性能将受到POD采集速率的影响。依据所分析振动信号的频域分布不同,采用的POD采集速率分别如下:冲刷信号0.25 kHz、摩擦信号50 kHz和锚砸信号200 kHz。
图3 海缆振动信号光功率Fig.3 Optical power of vibration signal of submarine cable
2.3 特征提取
EEMD 方法,也就是在原始信号中加入白噪声,改变故障信号的极值点,以保证信号在不同尺度上的连续性,可有效抑制由于异常扰动引起的模态混叠和端点效应[26-28]。EEMD分解过程如下:
1) 在原始海缆故障信号中多次加入等长度的高斯白噪声ni(t),得到新的信号为
式中:xi(t)——在原信号x(t)中第i次加入噪声后的信号。
所加入的白噪声应符合的规律为
式中:ε——输入信号的标准差;k——加入噪声的强度;N——加入噪声的次数。
2) 通过拟合信号的上下包络线求解均值m(t)。
3) 在加入噪声的信号中去除均值序列m(t),得到检测信号,并判断检测信号是否满足固有模态分量(intrinsic mode functions,IMF)的条件。如不满足,继续重复步骤2),直到检测信号满足IMF条件为止。
4) 利用xi(t)和固有模态函数计算剩余信号,即
式中:Ai(t)——剩余信号;IMFi(t)——第i次加入高斯白噪声的固有模态分量总和。
5) 对剩余信号重复步骤2)和步骤3),依次获得IMF分量。
6) 重新在原始信号中加入白噪声,并重复以上步骤。
7) 为了避免所加入的白噪声对特征提取的影响,对分解得到的同阶IMF 分量进行集总平均,则EEMD的分解结果为
式中:IMFi j(t)——第i次加入高斯白噪声的第j个固有模态函数。
对经过POD 后的含噪声振动信号进行EEMD 分解。其中,原始信号中添加的白噪声均值为0、标准差为0.2,EEMD分解层数设置为6。经过EEMD分解后的各振动信号模态分量波形如图4所示。
图4 3 类海缆振动信号EEMD 分解Fig.4 EEMD decomposition of the three-class signals
每类信号各有500 组,依次求解每组分解后各个模态分量的峭度值及能量熵,每一组特征向量中包含有6个模态分量,对应的特征值共计12个。对冲刷、摩擦及锚砸信号对应的特征向量分别给定标签1、2和3。其中,根据3 类振动信号的第一组数据提取的特征值如表1所示,共计提取1 500组特征向量。
表1 3 类海缆振动信号特征值Tab.1 Characteristic values of three-types of signals
3 分类结果与分析
以每类信号各个模态分量的峭度及能量熵组合作为输入特征向量进行分类训练。冲刷振动信号,指定输出标签为1;摩擦振动信号,指定输出标签为2;锚砸振动信号,指定输出标签为3。每类信号各500组数据,即共计提取了1 500组特征向量作为数据集用于训练。其中,又将数据集的80%作为训练集、20%作为测试集,由此得到1 200个样本的训练集和300个样本的测试集。
为了更好地观察在测试集上每类算法对3类故障的识别情况,EEMD-PSO-SVM、SVM算法及本文提出的算法的混淆矩阵如图5所示。图中,混淆矩阵的横坐标轴代表海缆故障预测的状态类别标签,纵坐标轴代表海缆故障实际类别标签。每类故障有100个测试样本,即测试集中共有300个测试样本。混淆矩阵左对角线上的值表示模型为每种类型的海缆故障状态正确预测的样本数,该值越大,算法对海缆故障分类越有效。可以看出,本文所提算法不仅对海缆振动信号的识别效果优于EEMDPSO-SVM、SVM算法的,而且对各类故障识别精度高。
图5 3 类算法分类结果Fig.5 Classification results of three algorithms
为了进一步说明模型的性能,以识别准确率作为适应度函数,将EEMD-SSA-SVM与EEMD-PSO-SVM模型进行了最佳适应度值的比较,如图6所示,EEMDSSA-SVM 模型经过约5 次迭代后可以快速识别出最优值。EEMD-PSO-SVM 模型在经过大约15 次迭代时达到最优值,SSA 算法在优化SV M 参数后优化速度快、适应度好、识别率高。
图6 各类算法的最佳适应度曲线Fig.6 Optimum fitness curves of the algorithms
经过150 次迭代,EEMD-SSA-SVM、EEMD-PSOSVM 及SVM 的识别率及运行时间及F1分数如表2 所示。由表2可知,本文提出的模型在准确率、时间、F1分数这3 个评价指标上表现良好,说明本文提出的模型具有较强的故障诊断能力和良好的综合性能,其能够更好地诊断海缆故障类型,实现对海缆的故障预警与保护。
表2 3 种算法性能对比Tab.2 Performance comparison among the three algorithms
为了进一步验证算法的诊断性能,改变数据中训练样本和测试样本所占的比例,将训练样本的比例分别设置为70%、50%和30%,结果如表3 所示。可以看出,在不同训练样本下,EEMD-SSA-SVM 算法在准确率上均优于其他算法,在测试时间上仅次于SVM 算法,但是SVM 算法识别效果不佳,综合而言,EEMDSSA-SVM具有良好的综合诊断性能。
表3 不同训练集比例下3 种算法性能对比Tab.3 Performance comparison among the three algorithms under the different proportions of training sets
4 结束语
通过对海缆各类工况信号进行识别,可以实现海缆故障的早期预警。为更快、更精确地实现海缆故障早期预警,本文提出一种基于SSA-SVM 算法的海缆振动信号识别方法。其首先采用EEMD来分解海缆振动信号,并提取模态分量的特征进行分类;为了提高算法识别准确性,采用SSA算法来优化惩罚因子C和核函数参数g,并构建EEMD-SSA-SVM 海缆振动信号识别模型。在测试中,运用EEMD 算法分解提取各分量峭度值作为特征向量进行识别。对EEMD-SSA-SVM、EEMD-PSO-SVM 和SVM 算法进行仿真比较,结果显示,EEMD-SSA-SVM 算法在测试集上的分类识别率最高,达到了95%;EEMD-SSA-SVM 运行时间虽次于SVM的,但SVM算法识别率最低。
本文所提出的EEMD-SSA-SVM 模型准确率高、优化能力强,能对海缆振动信号进行较为准确的区分,但其未考虑信号中噪声的影响。后续将对信号降噪进行研究,以提升算法性能,进一步提高信号识别精度。