APP下载

基于域自适应的复合材料结构损伤识别方法

2022-08-01王育鹏吕帅帅杨宇李嘉欣王叶子

航空学报 2022年6期
关键词:样本深度分类

王育鹏,吕帅帅,杨宇,李嘉欣,王叶子

1. 西北工业大学 航空学院,西安 710072 2. 中国飞机强度研究所,西安 710065

近年来,碳纤维增强复合材料(Carbon Fibre Reinforced Plastics, CFRP)由于具有比强度/比刚度高、性能可设计和易于整体成型等优点,被广泛应用于飞机主承力部件。但是,CFRP对外来物冲击敏感,跑道碎片、维护工具、保障车辆的撞击,都可能造成表面目视基本不可见、内部大面积分层的损伤,使得结构压缩强度有时下降40%以上,给飞行安全带来隐患。目前,为了保障复合材料结构的使用安全,需要将设计许用值设定低于结构含表面勉强目视可见损伤(Barely Visible Inspected Damage, BVID)的剩余强度值,但是不利于发挥CFRP结构减重的优势。

能够实时监测结构状态的结构健康监测(Structural Health Monitoring, SHM)技术为解决上述问题提供了一条潜在的解决途径。导波(Guided Wave)能够在结构中传播较长距离,并且对分层、脱粘和裂纹等损伤敏感,已经被开发成为一种结构损伤监测方法。然而,其在航空工程领域的表现一直无法令人满意。这是由于导波对结构构型、损伤形式、使用环境等因素非常敏感,损伤诊断的准确性和可靠性很大程度取决于专家水平以及专家对监测对象的先验知识。

研究人员利用深度学习开展了基于导波的结构损伤识别、定位和定量研究。Shen等利用深度学习技术开展了加筋壁板的脱粘识别研究,对有限元仿真得到的导波信号进行小波变换预处理后以灰度图的形式输入卷积神经网络(Convolutional Neural Network, CNN)进行识别,其准确率接近99%。Cui等将深度学习技术应用于加筋复合材料测试板关键区域的损伤成像,其设计的一维CNN算法在蒙皮、纵梁翼缘和纵梁帽区域展现出较好的损伤诊断能力。Khan等提出了一种基于结构振动的、用于复合材料层合板分层损伤评价的深度学习框架,对模拟损伤位置、大小的预测准确率达到94.5%. Zhang等利用迁移学习技术,开发了一个可在损伤定位和损伤定量间进行知识迁移的深度学习框架,效果明显优于对两类任务进行直接训练。

研究结果表明深度学习方法能够有效处理材料、结构、环境等因素变化引起的不确定性,减轻对专家经验和先验知识的依赖。但是,有效的深度学习方法是以大量的损伤数据样本为基础的。航空结构试验昂贵,无法满足海量损伤数据的需求。虚拟损伤(通过数值模型或者在结构表面粘贴质量块来模拟损伤)虽然能够产生大量数据,但与真实损伤存在一定的差别,不能直接替代。因此,建立从虚拟损伤到真实损伤的迁移识别能力,对实现基于导波的结构损伤监测具有重要的工程意义。

本文提出一种基于域自适应的深度学习导波损伤诊断方法。该方法以典型航空复合材料结构为研究对象,通过提取物理模拟损伤和真实损伤的共有信号特征,在无需对真实损伤信号进行标注的情况下,即可实现对损伤的准确监测。

1 基于域自适应的深度学习模型

首先,在被监测结构上通过粘贴质量块的方式模拟结构损伤,并收集大量的导波监测数据作为源域,设计并训练深度学习损伤识别模型;然后,通过多次落锤冲击试验在被监测结构上引入一定数量的物理损伤,获取相应的导波监测数据,作为目标域;接着,设计域自适应模块,对深度学习模型的参数进行微调,使源域(模拟损伤)和目标域(真实损伤)的数据样本在特征空间内满足相同的分布规律,进而提高深度学习模型对真实损伤的识别准确率;最后,通过在结构服役过程中持续获取损伤监测数据,使深度学习模型的可靠性不断得到提升。

应用该方法,能够实现在待检测结构上直接收集模拟损伤信号又不对结构本身产生性能干扰,训练得到的模型通过参数在线更新,可直接用于真实损伤的监测,无需等待真实损伤积累至一定数量再将模型投入使用,具有较好的经济性和工程应用价值。

1.1 整体架构

采用的深度学习模型(以下简称模型)主要包含特征提取和目标分类。在结构上布置的监测网络中,2个传感器构成1条监测路径。模型首先对每条监测路径上的导波信号提取特征,再将所有监测路径的信号进行特征拼接,最后利用域自适应网络进行目标分类,输出损伤识别及定位结果,其数据处理流程如图1所示。

图1 损伤识别模型框架Fig.1 Framework of damage identification model

1.1.1 特征提取

由于导波监测信号具有较强的时序特征,因此采用处理时序文本的长短期记忆网络(Long Short-Term Memory, LSTM)作为特征提取网络的主体结构。导波信号的特征提取分为信号拆分、信号编码、时序特征提取3个步骤。信号拆分是将包含4 000个采样点的导波信号拆分为 10个 400个采样点的信号单元;信号编码是将每个信号单元按照一定的规则编写为有利于时序分析的语义信号;时序特征提取则是利用LSTM挖掘10个信号单元间的时序关联特征。

使用一个3层卷积神经网络对信号单元进行编码,并与LSTM构成了混合神经网络模型,更有利于深层损伤特征的提取。编码网络的结构如图2所示,其中卷积层参数(lx, ly, lz)中的lx、ly表示卷积核尺寸,lz表示卷积核数量;池化层参数(cx, cy)表示池化窗口尺寸。

图2 编码网络架构Fig.2 Architecture of coding network

编码后的每个信号单元均转换为一个120维向量,10个信号单元的向量按照导波信号采样的时间顺序依次进入LSTM网络,以提取时序特征。LSTM网络的结构如图3所示,其中表示一条导波信号中第个信号单元的120维向量,为模型从前个信号单元中提取的时序特征向量,()为LSTM模型处理完第个信号单元后的模型状态,虚线表示LSTM模型的时间更迭,时刻的模型输出、模型状态作为下一时刻的历史数值重新输入。

图3 LSTM网络架构Fig.3 Network architecture of LSTM

LSTM模型的输入包括-1(-1),主体结构包括遗忘门、输入门和输出门。其中遗忘门的功能是从上一时刻的模型状态中过滤掉需要丢弃的信息,它包含一个维隐层神经网络。

-1经过遗忘门后输出一个维向量,具体可以表述为

=(+-1)

(1)

式中:为sigmoid函数;分别为-1与隐层神经网络的连接权值。

中的元素处于[0,1]内,0表示(-1)中的对应元素需要完全遗忘,1表示完全保留。通过遗忘门可以剔除掉LSTM状态中与损伤特征无关的时序信息。

输入门的功能则是从新输入的信号单元中提取出有效的损伤信息,并利用该信息更新模型状态。输入门包括2个单层维神经网络,其作用分别为创建一个新的候选向量和训练出该向量的权值,具体可表示为

=tanh(+-1)

(2)

=(+-1)

(3)

式中:tanh为正切函数;、分别为与2个神经网络的连接权值;、分别为-1与2个神经网络的连接权值。

遗忘门的和输入门的共同决定了LSTM在时刻的状态:

()=(-1)+

(4)

输出门的作用是基于模型状态()输出前序信号单元的时序特征,它包含一个单层维神经网络,具体可表示为

=(+-1)

(5)

=tanh(()

(6)

式中:、分别为-1与输出门神经网络的连接权值。

将LSTM隐层神经网络的维度设置为28,一条导波信号经过10次迭代得到一个28维时序特征向量

1.1.2 目标分类

24条导波路径的特征向量拼接后形成一个24×28维的向量,模型通过单层全连接神经网络将其映射至一个128维特征空间(见图1)。如果源域和目标域的数据在128维空间内符合相同的分布规律,那么以源域数据精准分类为目标优化得到的深度学习模型,将能够同时适用于无标签的目标域数据。为达到这一目标,在分类网络中设计了域自适应模块。

1.2 域自适应模块

域自适应模块的输入数据包括大量的、对(模拟)损伤有无进行了标记的源域数据和少量的、未对(真实)损伤进行标记的目标域数据,其作用是提高两类数据在特征空间内的分布相似性。使用最大均值差异(Maximum Mean Discrepancy, MMD)来衡量源域和目标域数据特征分布的相似性,它能够度量在再生希尔伯特空间(Reproducing Kernel Hilbert Space, RKHS)中两个分布的距离,具体表达式为

(7)

式中:分别表示源域、目标域数据的特征向量;、分别表示源域和目标域的样本个数;(·)表示映射函数,用于把原变量映射至RKHS, MMD的实质是求两类数据在RKHS中的均值距离。

域自适应模块的添加主要更改了模型的损失函数,在原有的分类损失的基础上增加MMD损失。通过最小化MMD,减小源域和目标域数据分布的差异;同时最小化源域数据的分类损失,使目标域数据通过分类网络后能够准确预测损伤。该模型的损失函数为

=(,)+MMD(,)

(8)

式中:表示分类损失;、分别表示的真值和预测值;表示两类损失的权重参数,为超参数。

模型在训练过程中对MMD和分类误差进行同步优化,最终达到两类数据同分布和源域数据的高准确率分类。

2 实验设计与模型训练

2.1 实验设计

使用导波监测网络开展复合材料加筋壁板的分层损伤识别和定位研究。加筋壁板采用CCF300/BA9916碳纤维增强复合材料,其结构如图4(a)所示,长700 mm,宽450 mm,包含3条长桁,中心区域长桁间距150 mm。在加筋板的中心区域,布置①~⑨共9个压电传感器,形成含24条监测路径的网络,覆盖蒙皮与长桁,并划分为A、B、C和D共4个区域,如图4(b)所示。根据监测信号与基线信号的差异识别损伤,样本为一个24×4 000 的矩阵,其中24表示24条路径,4 000表示每条路径上导波信号的采样点个数。使用在试验件表面粘贴专用质量块的方法来模拟损伤,获取源域数据,如图5(a)所示;通过冲击试验制造真实损伤,获取目标域数据,如图5(b)所示。

图4 试验件Fig.4 Test piece

图5 模拟和冲击试验示意图Fig.5 Schematic diagram of simulation and impact test

深度学习模型在目标域表现良好的基础是其对源域数据具有较好的识别准确率和召回率。因此,使用4件(A1~A4)相同的复合材料加筋壁板获取大量的模拟损伤数据,包含不同试验件之间材料、结构的差异性,使获取的数据能够表征源域数据的分布规律。质量块的粘贴面积在8 mm×8 mm~13 mm×13 mm范围内随机变化。每个试验件的数据采集间隔2天时间,以引入环境变化(温度、传感器状态等)对监测信号的影响,丰富样本的多样性。模拟损伤数据的具体采集方法为:

1) 在试验件的区域A内粘贴质量块,采集监测信号并将其作为损伤信号,后随机更改粘贴位置和质量块尺寸,并重复以上操作;每采集10条损伤信号后采集一次无损伤(即不粘贴质量块)的基线信号。

2) 针对区域B、C、D重复操作。

3) 针对每一个试验件,分别随机抽取一条损伤信号和一条基线信号,两者相减得到的散射信号即为一个损伤样本,并根据其所在区域,标记为A、B、C或D。

4) 针对每一个试验件,随机抽取两条基线信号,两者相减得到的即为无损伤样本,标记为0。

A1~A4上共收集损伤信号1 710条,基线信号170条,每条路径的采样频率均为120 Hz,采样点个数为4 500个,其中0~500为电磁串扰,不参与数据分析。数据收集过程历时15天,最大温度变化为4 ℃。通过随机匹配、相减的方法生成源域样本4 100个,其中标签为0、A、B、C和D的样本分别有900、1 070、520、1 120和390个。

为验证模型是否受材料分散性影响,添加另外2块相同的试验件(A5和A6)进行冲击试验,能量分为5 J、10 J和15 J,共冲击233次,通过无损检测确定产生冲击损伤183处。每次冲击后采集2次导波数据,其间间隔10分钟。若冲击产生损伤,则使用冲击前、后的数据生成一个损伤样本,使用2次冲击后数据产生一个无损伤样本;若冲击未发生损伤,则使用冲击前、后数据生成一个无损伤样本。冲击损伤的数量、标签统计如表1所示,其中标签为B、D的样本数量明显少于标签为A、C的样本。造成该现象的原因是区域B、D处为长桁,且压电传感器粘贴于试验件内表面,由于导波在结构表面传播,因此只有当冲击损伤使长桁产生脱粘时,导波信号才会发生明显变化,若只有试验件外表面发生损伤,压电传感器则难以监测到结构变化。标签为0、A、B、C和D的样本分别有78、46、18、38和3个。

2.2 模型训练及结果分析

域自适应深度学习模型的损失函数分为分类损失和域自适应损失两部分,训练过程不易收敛。因此,使用迁移的思想对模型进行训练,即首先训练一个针对源域数据的分类网络,再以该网络的最优参数作为初始值,对域自适应深度学习模型进行训练。针对源域数据进行训练时,训练集、验证集和测试集的样本数量分别为3 100、500、500个,经过72次迭代模型收敛;训练域自适应模型时,源域数据的分配保持不变,目标域的183条未标记样本均作为训练集,经过45次迭代模型收敛。应用该模型分别对源域测试集和目标域数据集进行分类,两类数据的精确率分别为86.2%和85.7%,召回率分别为89.6%和87.9%,目标域数据达到了和源域数据相近的识别结果,其中目标域数据的混淆矩阵如表1所示。此外,使用的处理器为Nvidia GTX 1050,每秒钟可以完成25个数据样本的分类任务。

如表1可知,103个有损伤样本中,有10个被预测为无损伤、2个位置预测错误,损伤检出概率为88.3%;在109个预测为有损伤的样本中,14个为无损伤、2个位置错误,虚警率为14.6%。 此外,为研究域自适应技术对损伤识别准确率的影响,使用基于源域(模拟损伤)数据训练的深度学习模型直接对目标域(冲击损伤)数据进行检测,其混淆矩阵如表2所示,模型的识别精确率、召回率、损伤检出概率和虚警率分别为76.9%、83%、78.6%和30.2%. 相比之下,域自适应模型的各向指标分别提升了8.8%、4.9%、9.7%和15.6%,说明域自适应技术可以在数据未标记的状态下,根据实时采集数据自动修正模型参数,进而提升新采集数据的损伤识别准确率。

为进一步说明域自适应模块对真实损伤的特征分布和分类准确率的影响,首先计算了添加域自适应模块前、后,真实损伤与模拟损伤在128维特征空间内的MMD,其值分别为4.12和0.89,说明域自适应模块减小了两类数据特征分布的差异;然后使用主成分分析法将128维的特征向量降至2维并显示,如图6所示。其中图6(a)和图6(b)分别为添加域自适应模块前后,模拟和真实损伤数据的特征分布,小圆、大圆分别表示源域和目标域数据,红、蓝、绿、黑、黄分别表示样本无损伤、损伤位于A、B、C、D区域。由图6可知,域自适应模块添加前后,模拟损伤的5类数据均能较好的分离、界限明显;在添加域自适应模型块前,真实损伤5个类别的数据均分布于模拟损伤对应类别的附近,但处于模拟损伤数据簇的外侧,各类别间存在数据叠加;而在添加域自适应模块后,模拟损伤和真实损伤的数据明显更加集中,两者集合为同一个簇,进而模拟损伤的类别界限同样可以适用于真实损伤。例如:针对红色(无损伤)和绿色(损伤位于区域B)数据,在应用域自适应技术前,两者的分类线可能位于直线、间任一位置,进而将红色小圆和绿色小圆(即模拟损伤)完全分开,但是若直接用该分类线对红色大圆和绿色大圆(即真实损伤)分类,则会有多个红色大圆被归类到绿色类别;添加域自适应模块后,通过小圆分类优化得到的分类线位于直线′、′间,而′、′间只有2个绿色大圆、没有红色大圆,因此,分类错误个数会明显减少,进而表现为在无标签的情况下,模型对真实损伤的预测准确率明显提升。该结论可通过表1和表2间的数据对比得到证实。在表2中,无损伤样本有6个被误判为损伤位于区域B,而在表1中,没有无损伤样本被误判为损伤位于区域B。

表1 基于域自适应模块对冲击损伤识别的混淆矩阵Table 1 Confusion matrix for shock damage identification based on domain adaptive module

表2 未使用自适应模块对冲击损伤识别的混淆矩阵Table 2 Confusion matrix for shock damage identification without domain adaptive module

图6 数据特征分布Fig.6 Distribution of data features

3 结 论

1) 提出一种基于域自适应的深度学习导波损伤诊断方法,利用物理模拟损伤产生大量与真实损伤相近的导波监测数据,并设计、训练深度学习损伤识别模型;再通过域自适应技术将该模型迁移至少量、无标签的冲击损伤监测数据,使其对真实损伤也具备与模拟损伤相近的识别准确率。

2) 使用该方法,能够在待检测结构上直接收集模拟损伤数据又不对结构本身产生性能干扰,物理模拟损伤和域自适应技术可以较好的解决工程实际中无法事先采集监测对象的损伤信号、制定损伤判据的问题。

3) 域自适应深度学习模型在导波损伤诊断中表现良好的一个重要因素是物理模拟损伤和真实损伤的数据分布规律近似,然后通过域自适应模块调整模型参数,使模拟损伤与真实损伤符合同一种分类规则。

在全机疲劳试验等复杂应用场景下,多类干扰因素耦合、信号机理分析困难,域自适应深度学习模型为其损伤监测提供了一条新的思路,面向工程实际的域自适应技术应用是本文的后续研究方向。

猜你喜欢

样本深度分类
四增四减 深度推进
深度思考之不等式
简约教学 深度学习
按需分类
教你一招:数的分类
说说分类那些事
直击高考中的用样本估计总体
随机微分方程的样本Lyapunov二次型估计
给塑料分分类吧
基于支持向量机的测厚仪CS值电压漂移故障判定及处理