基于Unet++网络结构建筑物抗震能力评价研究
2024-12-06秦玉来
摘 要:为了快速评价建筑物的抗震能力,本文基于Unet++网络结构,建立了抗震能力评价模型,主要功能包括特征图的跳跃连接、深度监督机制、信息输入与输出。完成理论建模后,将某城市的一个下辖区作为评价对象,收集谷歌影像信息,同时进行现场实测,经过预处理后形成2000组样本集,对模型进行训练。在考虑不同抗震因素的情况下,检测模型的评价效果,结果显示该模型的准确率和精确性均达到了较高的水平。建筑物的抗震能力分为3个级别,传统模式下通过现场实测评价其抗震能力,因此效率低。在人工智能时代,可将建筑物的影像信息、抗震特性作为主要的评价因素,利用神经网络和机器学习进行自动化评价,Unet++网络在该问题中有较大的应用潜力。
关键词:Unet++网络结构;建筑物抗震能力;评价模型
中图分类号:TU 352" " " 文献标志码:A
1 基于Unet++的建筑物抗震能力评价模型
1.1 Unet++网络概述
Unet是一种卷积神经网络,最早应用于医学图像的自动化分割中。2018 年,在 Unet 的基础上开发了Unet++神经网络模型。Unet神经网络在具体应用过程中有一定的局限性,主要问题是该模型的跳跃连接方式较为单一,导致精度较低。Unet++对该问题进行了改进,优化了跳跃连接的方式,使算法性能得到明显提高。
1.1.1 Unet++的跳跃连接方式
Unet++中设计有嵌套网络,以整体的网络编码结构为基础,嵌套了部分子网络,从而优化了连接跳跃的模式,这一改进措施提高了该网络模型的监督效果。Unet和Unet++的区别为前者直接接收编码器特征图,后者通过密集卷积块实现这一功能。
在Unet++网络中,将节点X的特征图堆栈表示为Xi,j,其数学描述如公式(1)所示。
(1)
式中:H()为激活函数;将上一个采样层记为u();[]为连接层。j等于0的节点的获取输入信息途径只有一个,即编码器的上一层。当节点的参数j=1时,该节点可从同一卷积层的两个子网络获得输入。当节点的参数jgt;1时,其信息输入的渠道升至j+1个,由同一跳跃路径中的前j个节点进行信息输入[1]。
1.1.2 深度监督机制
Unet++网络结构能够产生全分辨率特征图,该特征图可表示为{X0,j,j∈(1,2,3,4)},其深度监督机制依赖这些特征图,监督模式分为两种。第一种为精确监督模式,其特点是神经网络的整体输出等于各分支输出的平均值。第二种为快速监督模式,其特点是网络输出结果为被选中分支的输出。深度监督机制带来了一系列优势,包括减少解码器运算、模型剪枝、减少计算开销、降低模型复杂度等[2]。
1.2 网络输入与输出
1.2.1 网络输入
作为一种图像分割模型,理论上讲,无论图像的尺寸有多大,均可输入Unet++网络模型中。为了便于卷积核处理该图像,通常将输入图像的尺寸处理成2的幂次方,例如256×256。在网络前向传播过程中,如果数值变化幅度较大,就会增加计算的难度。因此在网络输入阶段,采取归一化方法处理每个像素的通道值。
当利用Unet++网络评价建筑物的抗震性能时,需要根据遥感影像信息和建筑抗震影响因素,合理设置输入通道数,具体可按照表1确定抗震影响因素和通道数的关系。
1.2.2 网络输出
Unet++网络的输出结果是针对影像中像素信息的分割或者分类,输出图像的几何尺寸与原图保持一致,呈现形式为张量。假设原图像具有3个维度的张量,分别为高度H0、宽度W0以及通道数C0。如果将Unet++网络对图像的分类数量记为K,那么经过其处理的图像输出形状可表示为(H',W',K)。图像中的每个位置都可表示为(H',W',I)的形式,表示该位置像素属于类别I的概率,I∈K。模型的概率输出不能直接作为预测结果,需要经过特定的处理,才能将其作为最终的预测结果,以下为处理步骤。1)设置决策阈值。Unet++网络在图像处理中,需要对影像信息进行分类,其分类方式包括二分类和多分类。在二分类任务中,将影像信息划分成正类和负类,正类可表示为(H',W',1),负类可表示为(H',W',-1),在正类和负类的判断中,可设定一个阈值,当概率大于阈值时,分类结果为正类,否则为负类。在多分类任务中,该分类算法的输出形状可表示为(H',W',K)的形式,表示像素属于每个类别的概率,对比该像素点属于每个类别的概率数值,将概率最高的类别作为预测分类的结果。2)图像后处理措施。应该对模型的输出结果进行特定的后处理操作,包括去除图像噪声、提高清晰度、改善对比度等。根据处理措施的技术原理,可分为边缘检测、膨胀运算、形态学操作等。在研究过程中,运用膨胀运算的方法进行图像后处理,其特点是增强图像的前景区域、填充图像中的小空洞、连接断开的区域,从而提高图像的质量,原理如下。
假设存在集合A、B,可将A被B的膨胀表示为A⊕B,符号⊕为膨胀算子,膨胀运算的数学描述方法如公式(2)所示。
A⊕B={x|Bx∩A≠Φ} (2)
式中:A为整个图像区域;B为卷积核;Φ为空集;x为待处理的图像元素。
1.3 损失函数
模型在评价过程中,会存在一定的误差,可通过损失函数来评价模型的精确度。损失函数具有多种类型,在此次建立的评价模型中,将交叉熵损失和Dice损失相结合,形成综合性的损失评价方法。
Dice系数是产生Dice损失的基础,该系数本质上是一种相似度函数,用于判断两个样本的相似度,计算结果在[0,1],越接近1,说明两个样本的相似度越高。Dice损失=1-Dice系数,显然,Dice损失越小,Dice系数越大。假设类别数量为C,将第i类的预测结果记为Pi,其对应的真实标签为Ti,i属于[0,C-1]。第i类的Dice损失计算方法为Li=1-2×(Pi∩Ti+τ)/(Pi+Ti+τ)。符号“∩”为向量的点乘,τ是一个非常小的正数,其作用是避免分母为0。经过Unet++分类后,形成了C个类别,总损失的计算方法如公式(3)所示。
(3)
式中:L为Dice损失的总损失,当各类别对总损失的影响存在差异时,可设置权重,以提高计算时的精确性。交叉熵损失的数学描述方法如公式(4)所示。
(4)
式中:L'为交叉熵的总损失;yi为真实标签经过独热编码后的结果;Pi为模型对应类别的预测概率。在实际应用中,log(Pi)的计算具有一定的难度,在这种情况下,可引入Softmax函数,形成Softmax交叉熵损失计算模型。
2 评价数据收集和预处理
2.1 原始数据采集
A市M区南北长度为64km,东西长度为33km,占地面积为1068km2,该地区的地震设防烈度为Ⅶ度。在抗震评价过程中,利用谷歌影像收集M区的遥感数据,其最高分辨率为0.30m,最低分辨率为1.0m,由多种卫星数据融合而成。除了卫星遥感数据,还需要获取大量的现场数据,包括建筑物类别、层高、建造时间等,表2为部分现场调查的数据。
2.2 建筑抗震等级划分
《建筑抗震设计规范》(GB 50011—2010)中对抗震等级做出了规定,将建筑物的抗震等级分为3个级别,包括估计抗震能力达标、疑似抗震能力不足、疑似抗震能力严重不足。通过实地调查,对M区内的建筑抗震等级进行评价,3种抗震等级的建筑占比分别为38.19%、44.84%、16.99%,对应建筑物的数量分别为3093、3631、1376。
2.3 确定建筑物抗震影响因子
抗震影响因子是决定通道数量的关键因素,在此次研究过程中,选取4个关键性的抗震影响因子,包括建筑物的结构形式、建造时间、用途以及层数。在数据预处理阶段,需要明确抗震影响因子的具体内容。经过对比,在建筑用途方面,将影响因子确定为住宅用房、商业用房、教育系统用房、公共服务用房、卫生系统用房、政府机关用房以及其他;在结构类型方面,将建筑物划分为砖木结构、砖混结构、钢结构、框架结构以及其他[3]。建造时间和建筑层高按照表2中的类别进行划分。
2.4 构建样本集
在深度学习中,需要通过样本集训练评价模型,通常将样本集划分为标签集和特征集,前者用于样本分类,后者用于描述样本的特征。根据抗震影响因子,将样本转化为语义图片[4]。再利用语义图片和M区的遥感影像资料建立特征集,用抗震影响因子描述样本的特征,标签集的构建方法类似于特征集。样本输入模型前,应该对样本进行裁剪,将像素控制为512×512dpi,部分样本在裁剪后存在建筑物占比过少的问题,因此剔除掉这部分样本,最终获得有效样本2000个。
3 基于Unet++的建筑物抗震能力评价
运用建立的评价模型对建筑物抗震能力进行评价,实施流程如下。
3.1 特征选择
建筑物存在多种特征,为了提高评价模型的可读性和准确性,在模型训练前,将不同的属性特征和遥感影像组合在一起,作为模型的输入信息,并且为每一种组合设置代号,共形成25组输入信息,部分输入信息见表3。
3.2 设置模型训练参数
模型训练需要搭建运行环境,研究过程在Windows环境下搭建了Python的机器学习库,硬件方面配置了英伟达的GeForce RTX 3070显卡。图像尺寸均为512×512,将单批次样本数量、初始学习效率、权重衰减分别设置为10个、0.001、0.001。
3.3 建立评价指标
模型评价指标包括5个,分别为准确率(A)、精确率(P)、召回率(R)、均交并比(MIoU)以及F1。各指标的计算方法与正确的正例(True Positive,TP)、错误的反例( Negative,FN)、错误的正例( Positive,FP)、正确的反例(True Negative,TN)相关[5]。以MIoU为例,该指标的计算方法如公式(5)所示。
(5)
式中:K为类别。准确率A的计算方法为A=(TP+TN)/(TP+FP+TN+FN);精确率P的计算方法为P=TP/(TP+FP);召回率R的计算方法为R=TP/(TP+FN);F1的计算方法为F1=2(P×R)/(P+R)。
3.4 结果分析
3.4.1 模型训练结果
模型训练的目的是提高评价模型的效果,具体体现于损失函数的值,该数值越小,说明评价模型的效果越好。在训练的初期阶段,模型损失与经过实测的损失存在较大偏差。在80次训练后,I、ID、IS、IA、IDS等各输入信息对应的模型损失趋于稳定,与实测损失值的偏差缩小至可接受的范围,继续巩固训练效果,将模型训练次数升至100次,并将其作为测试模型。
3.4.2 评价模型总体精度
根据测试数据统计不同输入信息对应的评价指标,得到表4的数据。综合全部的评定结果,此次建立的评价模型在准确率和精确率上达到了较高的水平,25组输入信息对应的准确率在88.6%~95.9%;精确率在75.3%~85.8%;25组输入信息对应的召回率、F1值和MIoU值分别在48.7%~57.3%、0.583~0.687、0.541~0.691。可见,准确率和精确率较好,其他性能指标还需进一步提升。
3.4.3 不同模型的预测效果对比
在模型I中将遥感影像信息作为分类预测的依据,其准确率为88.6%,精确率为75.3%,召回率为48.7%。在遥感影像的基础上引入抗震影响因素,预测效果得到明显提升。在表4所列举的模型中,增加抗震影响因素之后,准确率的提升幅度在7.4%~12.4%,精确率的提升幅度在10.81%~14.95%,召回率的提升幅度在15.2%~38.79%。对比各模型的数据,抗震能力评价模型对代号为IDS的输入信息具有良好的预测性,其准确率、精确率、召回率以及MIoU都最大,说明建筑物高度和建筑物的结构特征对抗震性能具有突出的影响力。对比IDS和IDU的数据,前者对应的5个评价指标全面优于后者,说明在抗震评价中,建筑结构的影响力强于建筑物的建造年代。采用同样的方法,可判断各抗震影响因素在抗震性能评价中的影响程度,结果为建筑高度gt;建筑结构gt;建造年代gt;建筑用途。
4 结语
建筑物的抗震能力分为3个级别,研究过程利用Unet++网络建立了建筑物抗震性能评价模型,将谷歌影像信息和现场实测信息作为评价依据,利用该模型对遥感影像和抗震影响因素进行识别,从而自动化地判断建筑物的抗震级别。经过实测,其准确率和精确率均达到了较高的水平,召回率、精确度等性能指标还需进一步提升。
参考文献
[1]刘志文,王进强,王广鑫.基于UNet++的地震P波初至拾取研究[J].太原理工大学学报,2023,54(1):65-72.
[2]沈旭东,吴湘莲,雷英栋.一种改进的Unet建筑物变化检测方法[J].电子制作,2020(1):30-31,15.
[3]姜柳,史健勇,付功义,等.基于BIM和深度学习的建筑平面凹凸不规则识别[J].图学学报,2022,43(3):522-529.
[4]贾婧,王凌霄,窦圣宇,等.面向海岛民居抗震性能评估的信息提取方法研究[J].世界地震工程,2021,37(4):148-156.
[5]贾佳.基于深度学习的地震动持时预测[D].哈尔滨:中国地震局工程力学研究所,2022.