基于TCN-LSTM神经网络的线缆性能衰退预测方法
2024-01-02王发麟俞威
王发麟, 俞威
(南昌航空大学航空制造工程学院, 南昌 330063)
线缆作为复杂机电产品各电气设备间的连接枢纽,对整个产品设备进行传递信息、电信号时的作用很重要。当线缆的性能受到严重影响导致的例如线缆的绝缘层破裂、电磁兼容过大等问题从而造成线缆无法正常传输信号、能量时,会给设备造成安全隐患。这类绝缘层破裂等问题则是由于复杂机电产品的工作环境多样性的原因,线缆会受到不确定因素的影响,导致线缆的物理、电气等方面的性能产生衰退。因此在针对线缆性能衰退方面的问题上需要得到研究重视。目前国内外对于复杂机电产品的线缆性能衰退问题的研究还较少,研究的方向大致都是针对设备上的性能的研究[1-3],而线缆作为复杂机电产品中的组成部分,相对于设备中其他部分来说,存在着电磁影响等特殊的性质。因此大多预测方法在处理线缆衰退预测上因设备通性存在虽存在一定的可行性,但仍需依据线缆的衰退性质进行修改,提高方法适用性。
目前存在的对设备状态预测方面的研究,大致都是依据研究对象的特点,通过构建特定的神经网络将采集分析的已有数据输入神经网络模块后,进行学习、训练,最后得到预测结果。例如:Wu等[4]针对矿井电缆寿命的预测问题,构建了径向基函数神经网络预测模型进行预测,并对寿命预测值进行了验证。ngel等[5]依据地下电缆的网络配置、参数和电涌放电器数据等指标,构建电缆故障风险预测的人工神经网络的方法。Olga等[6]提出了一种基于多指神经元的多层前馈神经网络的方法,利用实际数据预测劣化程度的案例研究,验证预测的良好性能。李亚平等[7]依据滚动轴承作为旋转机械的关键零件为出发点,采用时序卷积神经网络对滚动轴承的振动趋势做预测,并最终证实了时间卷积网络(temporal convolutional network,TCN)可以用于滚动轴承的振动趋势及剩余寿命预测。赵星宇等[8]将自适应噪声完备集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)方法和TCN、长短期记忆网络(long short-term memory network,LSTM)神经网络结合共同处理电力负荷这一时间序列的问题,并通过实力验证表明了方法的精确性及可靠性。王欣等[9]以航空发动机为研究对象,将注意力机制引入神经网络中提高模型预测精度,并通过实验对比验证了方法可靠性。
综合以上国内外的研究来看,对设备本身的状态或者其他零部件进行状态的预测除了传统统计模型方法以外,目前各研究所学习使用的方法为基于数据驱动的方法。在通过可靠的指标数据的基础上,进行良好的预测,但是以上研究中大多部分的网络模型未考虑到数据存在着不同性质的问题,在代入数据时尚未考虑到数据的时序性、数据维度等差异。而在预测线缆的性能衰退状态时,运用到的数据部分存在着时间关联性以及数据特征不同等问题,因此在构建线缆的性能衰退预测模型的时候,需要考虑这一部分时序特征特性。
现通过对线缆性能衰退原因进行分析,选取能有效反映线缆性能状态的参数,并选取记录的其他相关影响因素,如工作环境温度、湿度等数据进行融合代入所构建的时序卷积-长短期记忆神经网络模型中学习、训练以及预测。同时在训练过程中确定其他线缆性能影响因素对结果的影响程度。最后将预测结果与单体神经网络得出的预测结果进行对比分析,寻求相对最优的网络模型。
1 问题描述及线缆性能衰退分析
线缆的机械、电气性能在长时间的使用下,会受到环境、人为等各种因素的影响,不再具备稳定工作的性能条件以及使用寿命。现缺少一种详细有效的预测方法对线缆的衰退程度做到一个预警,往往都是出现事故后才开始弥补。因此需要构建一种预测模型以及预测方法,对线缆的性能衰退状态进行预测,并在此之后将预测的线缆状态结果反馈给检修人员及使用人员,从而提供修检维护的参考与决策,起到一个预防线缆失效的功能。本文通过对线缆衰退原因进行分析,依据分析结果按指标进行数据集选取,构建TCN结合LSTM的网络模型。最后得出预测结果并进行比较分析,为线缆性能衰退状态的预测提供方案,具体过程如图1所示。
对于线缆而言,线缆会由于其结构在组成材料部分的化学性能上发生不可逆的变化而导致线缆的性能衰退是不可逆的(如有机物腐蚀、电解腐蚀等),线缆本身最薄弱的环节通常是绝缘材料部分,绝缘材料的性能会随时间而发生劣化或老化等问题,这也是导致线缆性能退化的主要原因。而导致绝缘材料发生故障的原因有多种,如表1所示。
图1 线缆性能衰退预测流程图Fig.1 Cable performance degradation prediction flow chart
表1 绝缘材料故障原因Table 1 Insulation material failure causes
除了以上导致绝缘材料上的劣化的原因,线缆性能还存在着其他材料上的老化、损坏导致线缆发生水树、腐蚀等现象,而这些现象最终都基本反映在线缆绝缘电阻等的变化上,因此在构建预测模型选取相关参数上应选择能够良好反映线缆的绝缘状态的数据。而线缆中的介质损耗角正切值、直流电流、线缆绝缘电阻值等都与线缆的绝缘状态有关,所以本文选取此参数作为主要的预测输入对象。
2 基于融合相关性分析的预测模型
对于线缆性能衰退的预测而言,考虑到时序卷积网络[10]、循环神经网络[11]等单体神经网络在不同性质序列数据下训练的结果以及效果会有差异。通过构建TCN与LSTM的结合网络模型,将通过采集仪器所得到的各线缆信息时间序列数据,与通过相关性分析后确定的其他影响线缆性能的情况,如温度、湿度等非时间序列数据输入模型中进行训练,并在训练构建的结合网络中进行预测后,将预测出的结果与在各单体神经网络训练后所预测出的结果、效果进行比较分析。
2.1 基于TCN-LSTM的预测模型结构
TCN模型依据其因果卷积对数据进行提取,保证时序性,对线缆性能衰退预测问题中所确定的各数据的特征提取后代入神经网络中特定的结构中进行学习分析。标准LSTM模型在处理长期问题的情况下,因长时间、多种类数据优化存储能力不足会导致预测精度下降、预测反馈延迟问题[12]的产生。而TCN网络中含扩张卷积操作以及残差连接,可优化网络的处理速度与预测精度,因此在文中将两种模型融合构建了TCN-LSTM模型,如图2所示。
模型结构主要包括输入层(输入1、输入2)、TCN网络层、LSTM网络层以及输出层,每一层的相连以及运作最终构成预测模型。输入层的输入1部分为通过分析所确定的可以良好反应线缆性能的参数数据,TCN网络层内设置为2层的残差单元,残差单元简单来说就是将输入添加到单元中进行计算后输出为下一层的输入,公式为
图2 TCN-LSTM模型结构图Fig.2 TCN-LSTM model structure diagram
(1)
式(1)中:Xn为第n层卷积层所包含的信息;K为扩张卷积操作,也就是所说的包含的直接映射部分;Ki为第i个卷积核的数量;F为不同层之间进行残差映射操作。
本模型构造的卷积层为多卷积,以进行深层特征提取,卷积单元的激活函数为ReLU函数,对卷积核的权重进行归一化,并在后加入dropout层进行正则化减轻过拟合的发生。具体计算过程为
yi=Conv(WiFj+bi)
(2)
{Y0,Y1,…,Yi}=Hi-norm({y0,y1,…,yi})
(3)
{T0,T1,…,Ti}=ReLU({Y0,Y1,…,Yi})
(4)
式中:yi是i时刻卷积计算的状态值;Wi为i时刻卷积计算的时间序列矩阵;j为层数,bi为偏置矩阵;{T0,T1,…,Ti}为最后通过所有计算得到的序列特征。输入2为各类影响线缆性能的非时序数据,例如温度、湿度等因素,并且在选取非时序数据时,为了进一步的提高训练以及预测的准确性,在选取非时序数据时先经过皮尔逊相关分析进行原始数据的降维以及优选。LSTM网络层设置三层单元,并将输入1的输出与输入2作为网络层的输入。整体模型预测流程如图3所示。其中TCN内处理过程为扩张卷积及残差连接的引入,一是在极大效率的过滤长时数据中包含的无用信息的同时,保证能保留原有影响线缆状态的多因素信息之间的关联性,减少后续处理的数据量。二是解决网络太深而造成的退化问题,为模型的建立以及预测做好基础。
图3 预测方案流程图Fig.3 Flow chart of prediction scheme
2.2 相关性分析
输入2的非时序数据在选取过程中,对通过分析确定的影响线缆性能的各因素进行相关性分析,通过比对不同数据集进行学习训练后预测的结果,来确定最终进行模型对比的数据,已验证构造的方法的有效性。在考虑到影响线缆性能的因素及线缆性能本身的情况,可将他们看为两个变量来两两进行分析,采用皮尔逊相关系数来分析两个变量(X,Y),即影响线缆性能的因素和线缆性能之间的相关程度。皮尔逊相关性系数r计算公式为
(5)
式(5)中:r的绝对值的大小与相关性强度的关系为绝对值越接近1,两个变量之间的相关性越高,详细关系如表2所示。
通过经皮尔逊系数计算线缆性能变化与温度、湿度等因素之间的相关程度得到结果后,确定在影响线缆性能衰退的非时序数据中,哪些数据对线缆性能衰退的影响最大,从而选择适宜的数据进行输入、预测。
表2 相关性强度表Table 2 Correlation strength table
2.3 评估准则
在经过输入、学习、预测等一系列操作后,用对预测结果得到的数据值进行选取平均绝对百分误差(mean absolute percentage error,MAPE)以及决定系数R2作为模型的衡量指标与评估标准。R2作为表示预测模型拟合程度的指标,其中差越小,决定系数的值越接近1,表明模型的拟合效果越好。各公式为
(6)
(7)
3 实例分析
文中进行搭建神经网络的服务器配置为WIN10系统,16 G运行内存,显卡为NVIDIA 1050ti,编程环境为pycharm2020.2,神经网络模型为Keras框架。
3.1 数据准备及处理
选取某系列机电设备中所检测反映线缆性能状态的数据,将其中的绝缘阻值IR、介质损耗正切角tanδ、内部电流I、电容电流IC的参数数据作为输入1。再依据线缆性能会受到例如温度、湿度、设备使用时长等情况的影响,将记录的日志数据作为输入2,具体为温度、湿度、设备单位时间使用时长、季度以及设备清洁次数。
按照式(5)~式(7)可知在相关性系数在0.7以上的有温度、湿度、使用时长这三个影响因素,而清洁次数与线缆性能变化的相关性系数为0.65。因此为比较是否选择清洁次数这一因素对预测线缆性能衰退状态的影响程度,本文中采取对比非时序数据取(温度、湿度、使用时长)以及(温度、湿度、使用时长、清洁次数)两种情况进行分析。以构建预测效果最优的网络模型。
3.2 网络模型设置
TCN网络层内设置为2层的残差单元,其中每层残差单元包含两个卷积单元,扩张系数以2的倍数叠加。LSTM层经实验发现,模型训练初期,预测精度随LSTM神经网络层数的增加而提高,而网络层数超过3层时预测精度变低,因此选择LSTM网络层数为3层,各层神经元数量为256。
其中TCN网络设置为四个输入端,以及四个输出端,每个输入端都是以三维张量的形式以进行输入;LSTM网络在依据影响数的选择分别建立为7与8次的输入端进行训练,最后以四个输出口为目标进行设置。
3.3 预测分析
3.3.1 非时序数据影响对比
现将能良好反映线缆性能状态的四种参数数据以及通过皮尔逊相关性分析确定的两种情况的非时序数据进行输入,时序数据通过输入1中的输入端口,在pycharm2020.2环境中编写的py程序中读取时序文件,在构建的TCN网络中进行模型训练,进行时序特征提取,再同非时序数据一同输入LSTM网络中进行模型训练。为比较清洁次数这一因素在线缆性能衰退中造成的效果以及对预测的影响,在非时序数据中进行对其添加与否的分析比较,图4和图5所示分别为不包含清洁次数与包含清洁次数这一情况预测后的图形。
其中,图4、图5为反映线缆性能状态的各参数数据预测图,纵轴的值为介电损耗正切角、电流、绝缘阻值的数值。当线缆开始老化时,正切角、内部电流以及电容电流的值会变大,绝缘电阻值会因老化而变小,因此依此来评判线缆的衰退状态。预测图中蓝色部分前一段为设定的训练部分,后一部分为与预测比较的实际值部分,橙色部分为通过构建的神经网络训练得到预测值。从最后的预测部分的结果图中可以看出包含了清洁次数的预测情况与实际值拟合程度比较高。为了严谨的比较出两种情况的最优结果,现通过2.3节中的评估准则来计算误差等值来衡量预测程度,如表3所示。
图4 未包含清洁次数预测的结果Fig.4 Results without cleaning count prediction
图5 包含清洁次数预测的结果Fig.5 Results with cleaning count prediction
表3 预测误差比较Table 3 Comparison of prediction errors
根据评估准则计算出的误差值可知非时序数据在选择包含清洁次数的情况时计算的误差值比不包含清洁次数的情况所预测的值要小,预测误差在3.4%~4.1%,预测精度在95.9%~96.6%,相较而言非时序数据选择了包含清洁次数的情况在构造的网络中预测的程度更好。
3.3.2 网络对比验证
验证不同数据的预测影响后,为比较验证构造的网络模型在预测性上的性能,先通过构建各类网络模型将TCN-LSTM模型与TCN-GRU模型、TCN模型、LSTM模型、GRU模型进行对比训练,模型网络层数统一设置为三层,通过学习、训练后得到的预测效果如表4所示。
表4 模型对比Table 4 Model comparison
根据表4可得,构建的TCN-LSTM模型的平均MAPE值为3.65%,与其他网络模型相比,有更好的预测精度,并且可知加入了TCN网络来处理含时序数据的准确度比单体网络模型更加的高,因此在图6中对比了TCN分别与LSTM和GRU构成的模型生成的预测效果。
依据图6中曲线结果可以看出TCN与两种变体RNN结合的网络在预测上拟合程度差不多,但通过计算得到的平均绝对百分误差可以确定TCN-LSTM模型要优于其他模型,与实际拟合的效果更佳。因此在预测数据上存在着不同类型的情况下,可以通过构建混合型网络处理不同的数据集,通过调节参数以及网络结构来构造预测效果好、符合预测内容的模型。
图6 多模型结果对比Fig.6 Comparison of multi-model results
4 结论
(1)通过对线缆性能衰退进行分析可以确定介质损耗正切值、电流值、绝缘电阻值的变化可以良好的反映线缆的绝缘状态从而确定线缆性能的状态。
(2)构造的TCN-LSTM网络模型进行学习、训练预测后的结果与实际比较贴合,预测效果比较好,并且相较于单体的网络预测结果更贴合实际,因此在预测多类型数据样本时,可考虑构造结合网络。
(3)在非时序数据的选择上来说,加入记录的清洁次数这一影响因素对整个预测有一个较好的提升,说明清洁次数影响线缆性能的程度需要考虑,从侧面反映清洁对于机电设备来说很重要,防止线缆设备腐蚀而造成的性能变化。
(4)对线缆的衰退状态预测在一定程度提供一个准确的预测结果,并且可以该结果依据评估对线缆进行相应的防护措施,起到一个提供决策的应对准则,在面对线缆的安全问题时防患于未然。