APP下载

考虑残差学习的深层卷积神经网络在结构损伤识别中的应用研究*

2022-10-27李书进熊书琪范沛然

工业建筑 2022年7期
关键词:深层残差准确率

李书进 熊书琪 范沛然 王 罡

(1.武汉理工大学土木工程与建筑学院, 武汉 430070; 2.中冶建筑研究总院(深圳)有限公司, 广东深圳 518054)

结构的损伤诊断是指通过一定的手段和方法来获取既存结构当前使用性能并对其进行评价的过程,其工作目标主要有以下三个层次:1)使用中的结构是否受到损伤;2)存在损伤时的结构损伤定位;3)结构损伤程度的标定和评价。相较第一层次的结构是否受到损伤,结构损伤的定位和损伤程度评判由于工况多、数据量大,处理起来要困难许多,特别是损伤位置的判断,目前可用方法并不多。

近年来,基于机器学习,特别是卷积神经网络(Convolutional Neural Network, CNN)的损伤诊断因其在大数据处理和解决复杂问题等方面的强大能力而受到研究人员的关注,不少研究者对其展开了研究,并提出了相关算法[1-6]。与其他基于人工智能的损伤诊断方法相比,卷积神经网络善于学习样本数据中内在规律和表示层次,特征抽象层次更高、表达能力更强、内容更丰富,尤其是该网络能通过局部连接、权值共享及子采样等操作有效地减少训练参数,非常适合于大规模数据的处理,对于复杂的土木工程结构具有极大的优势,应用前景广阔[7-10]。

卷积神经网络是一种层次结构,其中的卷积层可以通过多个的叠加抽象成更为高级的深层卷积神经网络(Deep CNN)。一般来讲,相对于浅层卷积神经网络,深层卷积神经网络能更好地提取样本中的全局特征,对特征的表达能力更强[11]。但研究表明,对于一些复杂问题,实践中深层卷积神经网络并没有表现出预期的效果,有时甚至不及浅层网络[6],主要原因是随着层数的增加网络模型会出现梯度爆炸、弥散和退化等问题[12-13]。针对上述问题,不少研究者进行了深入研究并提出了解决建议,比如可以通过引入标准初始化和中间层正规化等方法来控制梯度弥散、爆炸问题导致的模型训练收敛困难,以及引入残差学习来缓解深层卷积神经网络的退化等[14]。

本文将对考虑残差学习的深层卷积神经网络在结构损伤识别中的应用展开研究,其主要思想是通过残差学习逼近恒等映射,增加信息传递路径的方式和数量,从而在尽可能保留原始信息的前提下减少网络参数。残差学习的引入在很大程度上避免了随着网络层数加深而产生的网络退化,使得网络的深度可以由几层持续推进到极深的层数,让极深网络的训练成为可能。研究将以难度较大的损伤位置判断问题为目标,并采用更为复杂的框架结构为对象,探讨引入残差学习后深层卷积神经网络在处理复杂问题上的收敛性能和识别能力。另外,考虑目前的研究多为仿真数据,本文将通过模型试验获取的数据作为训练和验证样本,检验该方法对实测数据的识别情况和抗噪能力。

1 考虑残差学习的深层卷积神经网络

1.1 卷积神经网络

卷积神经网络是一种前馈神经网络,其基本结构如图1所示,是一种层次结构[15],在语音识别、人脸识别、图像处理、人工智能等众多领域均有广泛的应用,是当前的的研究热点。

图中的卷积层是卷积神经网络的核心部分,其运算见式(1):

yout=fi[bi,j+conv(yin,wi,j)]

(1)

式中:yin,yout分别为卷积层的输入和输出;wi,j为第i层的第j个卷积核;bi,j为第i层的第j个偏置项;fi为第i层的激活函数。

卷积神经网络采用反向传播算法(BP算法)进行有监督地训练,通过损失函数评估模型得到的预测值与真实值的差距大小,然后通过反向传播算法将误差由最后一层向前逐层反馈,以此来更新模型中的参数。更新参数后网络再次进行前向运算,并再次反馈更新,如此反复,直到误差在许可范围内,完成对模型的训练。常见的损失函数有均方误差函数、交叉熵代价函数、负对数似然函数等[16]。

1.2 考虑残差学习的深层卷积神经网络

理论上讲,深层卷积神经网络比浅层具有更复杂的网络结构,因而也会获得更强的学习能力。但实际应用中,随着卷积神经网络层数的加深,这种常规网络的堆叠往往无法达到预期的效果,甚至由于网络退化和梯度爆炸、弥散等因素的影响,其表现比浅层网络还低。

大多数神经网络是基于梯度的BP算法来优化,对前馈神经网络而言,一般需要前向传播输入信号,然后反向传播误差并使用梯度方法更新参数,误差梯度在更新中积累,从而产生深层卷积神经网络中的梯度爆炸、弥散问题。网络退化则是在神经网络可以收敛的前提下,随着网络深度增加,网络的表现先是逐渐增加至饱和然后迅速下降的现象。

为了解决网络退化问题,残差学习这一概念被提出。残差学习是一种逼近恒等映射的学习方式,即让网络去学习一个更容易的残差函数,从而解决网络直接学习恒等映射比较困难的问题。残差学习通过前馈神经网络的“快捷连接”来实现,其结构如图2所示。研究表明,残差学习可以增强网络的泛化能力,有效解决深层卷积神经网络的退化问题[17]。残差函数的表达式如下:

F(x)=H(x)-x

(2)

式中:H(x)是残差单元要学习的目标映射,由线性映射x→x和非线性映射F(x)两部分构成。特别地,当非线性映射F(x)=0时,上式即为恒等映射。

在计划经济时期,政府是主角,负责毕业生的统筹分配;而当下,政府的主要职责是:宏观调控毕业生流向,指导毕业生到基层、老少边穷地区就业;规范就业市场的运营机制;制定吸引人才的优惠政策,包括户籍制度、人才培养制度和社会保险制度等;提供各种创业优惠政策,鼓励毕业生投入创业浪潮中。因而,政府的角色发生了根本性的转变,由“主角”变成了“配角”,实现了由行政导向功能向服务功能的转化[3]。

2 基于深层卷积神经网络的结构损伤诊断

一般地,结构的损伤会导致结构动力特性发生变化,对提取到的结构动力反应利用一定手段和方法进行分析和评判是目前结构损伤诊断最常用的方法。结构损伤诊断中的损伤位置判断由于工况多、情形复杂而较难处理,特别是复杂一点的结构,相关研究也不多,只有为数极少的针对简单梁式杆件的报道[18-19]。

利用深层卷积神经网络强大的数据处理能力,本文将对其在结构损伤位置判断方面进行探讨,处理过程中将引入残差学习方式来减轻层数增加后网络退化带来的影响,研究对象也上升到更为复杂的多层框架结构,并通过试验得到的实测数据研究分析该方法的可行性和有效性。分析过程中相关函数的取用如下:

1)卷积层的激活函数采用Relu函数[10],权重和偏置项的初始化采用He等的方法[20];

2)输出层设定为Softmax回归[21],见式(3),输出结果为各类别的准确率。

(3)

式中:y为输出结果;x为输出层神经元变量;n为输出个数。

3)损失函数采用交叉熵代价函数,见式(4)。

(4)

式中:di为真实值;yi为预测值;l为真实值向量和预测值向量的维度。

3 试验概况和样本获取

3.1 结构模型与装置

试验用模型为一单榀单跨四层钢框架结构,尺寸见图3。其柱用高1 200 mm、宽100 mm、厚1.2 mm的不锈钢板模拟,楼板采用15 mm厚、300 mm长、100 mm宽的铝合金制作,通过螺栓与柱相接。

加载采用加拿大Quanser公司生产的小型振动台进行,将制作好的结构固接在振动台台面,并布置激光位移计测量结构楼面的位移响应,完成后的试验现场图片见图4。经实测,结构模型第一阶频率为1.429 Hz,与有限元仿真计算所得第一阶频率1.433 Hz基本相符。

3.2 试验工况与样本准备

水平荷载作用下框架结构的节点处荷载效应最大,最易发生损伤,属结构关键部位,因此本次研究将以节点损伤为对象,对其位置进行判断。对于工程结构,节点损伤工况复杂,理论上所有节点都存在损伤的可能,再考虑同时损伤情况其组合数将达到2n(含无损伤,n为结构的节点数量),如果全数考虑对于复杂结构计算量将会非常巨大,无法进行有效诊断,需要合理减量。根据对结构进行的地震作用下力学性能仿真分析,选取了图3所示的6个最易损伤节点作为本次试验的分析对象,采用放松节点螺栓的方式模拟节点损伤(将板与柱3个连接螺栓中的中间螺栓放松),定义了包括无损在内的12种工况,见表1。

表1 损伤工况Table 1 Damage conditions

采用简谐波作为外部激励依次在振动台上进行模型结构各损伤工况下的动力试验,为使试验有较为明显的位移响应,同时避开共振以防结构反应过大,本次激励采用频率为1.2 Hz、振幅为0.4 cm的简谐波。由于深度学习需要尽可能多的样本数,试验中每个损伤工况共持续3 100 s,并取其后3 000 s的稳态响应作为研究样本。数据的采样频率设为100 Hz,每个传感器共获得300 000个数据点。图5为工况12下试验所测得的结构第3层层间位移无损和有损部分时程对比,可以看出有损工况下结构层间位移峰值明显增大。

有关节点损伤的判断处理方式有多种,本文按某单节点是否有损伤进行归类,即将所有试验工况中含有某个节点损伤的工况归成一类(如把含有节点1损伤的2、8、11、12四个工况归为一类,其余同),并建立神经网络模型对其进行判断,样本的选取也以需判断的目标节点所在层的层间相对位移作为网络模型的训练和测试样本。处理时将每个工况3 000 s的响应按6 s时长平均分段共得到500个样本,这样12个工况共生成6 000个样本,其中每个样本含有600个数据点。

3.3 识别结果分析

用试验所得6 000个样本作为输入信号对某节点是否有损伤进行卷积神经网络训练和测试,其中随机抽取600个左右的样本作为测试集,用于对训练好后的网络进行验证,余下样本作为训练集对网络进行训练。

根据上述试验所得样本,分别采用浅层卷积神经网络、深层卷积神经网络和考虑残差学习的深层卷积神经网络三种方式对试验模型的节点损伤情况进行诊断,其中建立的浅层神经网络为3层(不包含池化层),含2个卷积层、2个池化层和1个全连接层;深层神经网络为45层(不包含池化层),含44个卷积层、1个池化层、1个全连接层,详细参数如表2所示。与图像处理不同,本文所使用的样本均为一维数据,因此所建神经网络均为一维卷积神经网络。

表2 一维深层卷积神经网络参数Table 2 Parameters of one-dimensional deep CNNs

在用试验数据分析前先对该方法进行了数值模拟分析,除训练和测试样本是由有限元计算得到外,其他处理方式均同上,识别结果如图6所示。图7则为利用试验实测数据为样本得到的识别结果。

可以看出,相较于仿真数据,实测数据的收敛速度要慢一些,反映了实测数据中噪声对识别过程的影响,但无论是仿真数据还是实测数据,在节点损伤识别准确率上浅层神经网络和考虑残差学习后的深层神经网络均有上佳的表现,准确率高且收敛速度快,基本上经过十代训练就可收敛,后续虽有一定的波动但均能维持很高的准确率。同时,相较而言传统深层神经网络的诊断准确率明显不高,一直在50%上下波动且收敛缓慢甚至不收敛,整体表现不如浅层神经网络,主要原因是随着网络层数的加深,其工作性能受到网络退化和梯度爆炸、弥散等因素的影响加剧而导致。而引入残差学习后,深层卷积神经网络的识别能力得到大幅提升,收敛快且稳定,对于实测数据的抗噪能力更强,表明了本文方法的稳定性和有效性。也说明所提方法可以很好地解决网络深化带来的诸多问题,使得在工程结构应用过程中建立更深、更复杂的网络成为可能。

4 关于本方法的几个探讨

4.1 样本获取

本文所提方法需要尽可能多的样本数来学习框架节点响应时程信号中的节点损伤信息,且其准确率会随着样本数量的增多而提高。在本文的研究中采用了常用的将时程按时长平均分段的方式来获取样本,这种方式简单、方便但存有在分割处会损失一部分有效信息的问题,因此,本文提出了一种改进的数据分割方式来减轻该问题的影响,并对其进行对比分析。

这里提出的改进的样本获取方法可称为数据移位截断法,其工作方式是在按常规的平均分段法得到一组样本后将分割起始点向后平移一定时段(小于平均分段时长)再次进行分割,舍去不足样本后得到另一组样本。由于平移时段小于平均分段时长,该组样本将跨过前一组样本的分割处将其信息包含在内;同理,再将分割起始点向后平移一定时段可获得第三组样本,该组样本又能将前一组样本的分割处信息含盖;依此类推,根据需要,通过调整平移时长可得到足够多的样本数,并且后一组始终能将前一组分割处的信息含盖,从而减轻数据截断对识别的影响。

以本文研究的试验数据为例,每一个工况是按6 s时长平均分段,得到了500个样本,每个样本含有600个数据。按上述原则将分割起始点以1 s时距向后依次平移5次,即从第1、101、201、301、401、501个数据点开始分割,每个样本同样是600个数据,舍去数据不足600的样本即可得到六组样本。六组样本中除第一种情况有500个样本外其他均为499个样本,则每个工况共计可获得2 995个样本,样本量提高了近6倍。

将新处理获得的2 995个样本分别作为本文所建浅层和深层卷积神经网络的输入信号进行训练,部分识别结果如图8所示。可以看出,无论是浅层还是深层网络,使用数据移位截断法的处理方式后,识别准确率和收敛速度都有了明显的提高。特别是对浅层网络的改进更加明显,这是因为浅层网络处理复杂问题在样本量不足时难以给出准确判断,大样本量能极大提高其学习能力,从而得到理想的结果。而应用到本文提出的考虑残差学习的深层神经网络,不仅收敛速度提高,准确率也接近100%。

为了更直观地分析数据移位截断法对卷积神经网络损伤识别的影响,表3给出了在不同方法下的平均准确率和方差。可以看出,无论是浅层还是考虑残差学习的深层神经网络,使用本文提出的数据移位截断法后损伤准确率都有了不同程度的提高,方差也有明显的改善,其中对浅层网络的提高效果更明显,与图8分析的结果相符。

表3 不同样本处理方式的准确率比较Table 3 Comparisons of accuracy of different sample processing methods

4.2 复杂结构的分步识别法

在3.2节的节点损伤判断处理中本文采取的是按单个节点是否出现损伤进行的判断,对于节点数过多的复杂结构则可以采用分步识别的方式逐步进行判断。即先按区或者类型将待识别节点进行粗分归类,对一组节点中是否含有受损节点利用本文所建方法进行第一次判断,如判断含有受损节点则再对该组节点进行细化处理直至找到损伤节点,具体步数可根据结构复杂程度确定。

5 结 论

提出了一种考虑残差学习的深层卷积神经网络损伤识别方法,对其进行了试验研究,得到的结论如下:

1)训练次数相同时,考虑残差学习的深层卷积神经网络对所有节点损伤识别的准确率均高于常规浅层神经网络和深层神经网络,且收敛速度更快更稳定,有极高的准确率和稳定性。

2)考虑残差学习的深层卷积神经网络损伤识别方法可以很好地解决网络深化带来的网络退化或梯度爆炸、弥散导致的收敛困难和识别准确率差等问题,使更深层、更复杂网络的搭建成为了可能。

3)本文提出的数据移位截断处理方法在不改变环境和不过多增加工作量的前提下能充分保留样本中的有效信息,显著增加用于卷积神经网络训练的样本量,提高了卷积神经网络的诊断能力,在不易获得足够多数据的试验研究和工程实际中有一定的应用前景。

4)与传统的基于人工智能损伤诊断方法相比,卷积神经网络具有更强大的数据处理和特征提取能力,在解决结构损伤诊断中的复杂问题上具有很大优势。

猜你喜欢

深层残差准确率
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
深层承压水污染途径及防治研究
中深层套管式地埋管换热器换热性能模拟研究
深层搅拌桩在水利工程地基处理中的应用分析
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
基于残差学习的自适应无人机目标跟踪算法