APP下载

基于改进蚁群算法与无人机影像的震害识别方法及其在漾濞地震中的应用

2021-09-27杜浩国林旭川张建国杜浩标张方浩杜竹泉卢永坤代博洋

地震地质 2021年4期
关键词:蚁群训练样本蚂蚁

杜浩国 林旭川 张建国 杜浩标 张方浩 杜竹泉 卢永坤 代博洋

1)云南省地震局,昆明 650224 2)中国地震局工程力学研究所,哈尔滨 150080 3)中国人民解放军31663部队,昆明 650224 4)迪庆州藏文中学,迪庆 674400 5)中国地震应急搜救中心,北京 100049

0 引言

政府和社会对地震灾情获取的时效性要求越来越高,而遥感作为地震灾情获取的重要手段之一,在地震应急救援、 地震灾害损失评估工作中发挥着越来越重要的作用(Linetal.,2015)。 无人机遥感技术的发展,使得快速获取较大范围内的建筑物信息成为可能,避免了人力资源需求大、 数据采集格式不一、 自动化识别程度低和信息更新不及时等问题(张景发等,2017; 杜浩国等,2019)。 本文结合人工智能蚁群算法提出一种基于改进蚁群算法的遥感影像震害识别新方法,该方法属于半监督式识别方法,能在震后对大面积损坏的建筑物进行快速震害识别,为地震灾害损失评估工作提供高效精确的数据支持(Lietal.,2009)。

近年来,学者们提出了一系列基于遥感高分辨率影像的建筑物震害识别方法,可分为监督式、 非监督式和半监督式3种。 采用监督式识别方法识别建筑物震害信息往往需要预先构建训练样本及提供先验知识。 Guo等(2011)利用多光谱遥感数据提取了2011年3月11日日本福岛东部海域7.3级地震中岩手县、 宫城县和福岛县等严重受灾地区的建筑和农场的矢量数据,通过叠加地震烈度和建筑物的分布评估建筑物的损坏程度; 宋平等(2016)提出基于现场调查的地震灾害损失预评估,以现场调查的建筑物类型和比例为修正依据,与实际历史地震造成的地震灾害损失对比进行震害损失评估; 郭建兴等(2020)提出了一种利用遥感影像与居民地建筑数据评估地震烈度的方法,通过构建居民地房屋倒塌率与地震烈度之间的关系模型,利用高分辨率遥感影像解译居民地房屋的倒塌率。 非监督式震害识别方法主要有3种。 第1种为基于纹理特征的震害提取方法。 Hu等(2019)提出了基于CHRIS高光谱图像的滨海湿地分类的全连通8层特征深度学习分类方法,将光谱特征与多空间纹理特征信息相结合应用于黄河河口滨海湿地。 李强等(2018)针对震后强度图像变化复杂无规律、 纹理特征参数繁多且难优选的问题,提出了基于纹理特征主成分变换的相关性变化检测方法,对不同震害程度建筑物的分布进行检测。 张景发等(2018)选取了2i495个建筑区样本点,基于图像纹理信息熵的相关性分析对重点村镇目标进行变化检测处理,获得了各村镇建筑物的破坏程度及其趋势。 第2种为基于几何特征的震害提取方法。 游永发等(2019)在综合考虑影像光谱、 几何与上下文特征的基础上,提出了一种基于面向对象与形态学的高分辨率遥感影像建筑物信息分级提取方法。 刘莹等(2017)充分利用高分辨率遥感影像提供的细节信息,提出了一种图割框架下融合形状、 边缘、 角点等多种类型特征的损毁建筑物检测方法。 第3种为基于辅助特征的震害提取方法,其中辅助特征包括LiDAR建筑物点云、 建筑物DSM和DEM、 阴影信息等。 Guo等(2021)通过天空视因子(SVF)分析机载激光雷达DEM衍生品,以评估激光雷达技术在中国西南山区地质灾害识别中的性能。 此外,基于天空视因子(SVF)生成的精准三维地形图,使准确解释地质灾害特征成为可能。 邓飞等(2018)利用从机载激光雷达点云中提取出的建筑物点云,实现了灾区建筑物的震害识别。 范熙伟等(2017)利用基于摄影测量原理获得了研究区的数字表面模型(Digital Surface Model,DSM)、 数字高程模型(Digital Elevation Model,DEM)和数字正射影像数据,提出基于摄影测量技术的房屋提取方法。 半监督识别方法是监督识别与非监督识别相结合的一种提取方法。 半监督式震害识别方法中,Wang等(2020)针对高光谱图像(HSI)数据获取困难、 不同HSI特征分布不一致的问题,提出了一种半监督异构域自适应CycleGan(UHDAC)算法,该算法可以在缺乏相似数据的情况下捕获可转移特征。 张凌等(2019)提出基于马尔科夫随机场的单时相震害影像的受损建筑物识别方法。 何曼芸等(2017)融合LiDAR和航空影像2种数据源,提出了改进顶帽变换及局部二进制模式(LBP)高程纹理分析的建筑物提取算法。 井然等(2020)提出一种基于多尺度SLIC-GMRF和FCNSVM的建筑物识别方法,提高了高分辨率遥感影像建筑物提取能力。 半监督学习在使用标记数据的同时,也使用了大量的未标记数据,既可减少人工投入,又能够保证较高的准确性,因此日益受到人们的重视。

综上所述,当前主要灾害评估手段可分为3种: 1)人工目视解译调查,该方法通过人工对影像中的建筑物进行震害等级划分,避免了人工实地调查带来的风险,但人为进行影像震害识别将花费大量时间,且需要人工短时间内处理大量建筑物震害信息,可能导致建筑物震害判别标准不统一。 2)基于卫星遥感影像震害识别,此类方法以震后卫星遥感影像为基础,根据影像中严重倒塌建筑物的纹理、 亮度等特征进行震害识别,但由于卫星影像的偏移、 分辨率低、 时效性差等问题,导致很难识别建筑物屋顶轻微梭瓦和开裂现象。 3)基于机器学习的无人机高分辨率影像震害识别。 近年来,无人机遥感技术的发展,使得快速获取大范围建筑物信息成为可能,将无人机获取的高分辨率影像与机器学习算法相结合,既可以减少人工的投入,又能够保证较高的准确率,因此日益受到人们的重视。 本文在遥感影像半监督识别方法的基础上,结合机器学习算法,提出基于改进蚁群算法与无人机影像的震害识别方法,并在2021年5月21日漾濞6.4级地震的地震应急与损失评估中进行应用,对方法的有效性进行验证。

1 蚁群算法的基本原理

蚁群优化算法是基于蚂蚁觅食的原理设计出的一种群集智能算法。 蚂蚁在觅食过程中能够在其经过的路程上留下一种被称为信息素的物质,并在觅食过程中感知这种物质的强度,指导行动方向。 蚂蚁总是朝着该物质强度高的方向移动,因此大量蚂蚁组成的集体觅食就表现为一种对信息素的正反馈现象(杜浩国等,2021; Zhangetal.,2021)。 当某一震害特征被选中时,选取此特征的蚂蚁就会越来越多,其信息素遗留也就越多,信息素的浓度也就越高,蚂蚁选择这一震害特征的几率就越高,由此构成正反馈过程,从而逐渐逼近最优的震害提取规则。

在初始时刻,将m只蚂蚁随机放置于影像中,影像上的每栋建筑物震害信息素初始值相等,设τij(0)=τ0为信息素初始值,其中τ0=m/Lm,Lm是由最邻近启发式方法构造的震害等级。 其次,蚂蚁k=(k=1,2,…,m) 按照随机比例规则选择下一步要选择的震害识别规则,其选择概率公式为

(1)

其中,τij为区域(i,j)上的信息素,ηij=1/dij为从区间i转移到区间j的启发式因子,allowedk为蚂蚁k下一步被允许访问的震害识别规则集合。

当蚂蚁完成1次循环后,清空禁忌表,对识别规则再进行重新选择,准备下次周游。 信息素的更新公式为

(2)

(3)

2 数据预处理与改进的蚁群算法

2.1 数据预处理

本文将蚁群算法引入遥感影像建筑物震害识别中,基于改进蚁群算法的高分辨率影像震害识别流程如图 1 所示。 将蚁群算法应用于遥感影像震害识别可分为3个步骤: 1)蚂蚁随机选择1条路径,并在路径上重复选择属性节点,构造1条完整的路径,即某一地物的1条识别规则; 2)优化识别规则,移去多余不相关的属性节点,避免识别规则对样本的过度拟合; 3)更新所有节点的信息素数据,对比每条路径上的信息素浓度,选出最优识别规则。

图1 基于改进蚁群算法的高分辨率影像震害识别流程图Fig. 1 The flowchart of earthquake damage identification based on improved ant colony algorithm.

定义蚁群搜索路径为属性节点和类节点的连线,其中属性节点最多只出现一次且必须有类节点,属性节点对应遥感影像识别的特征值,如图 2 所示,每条路径对应1条完整的识别规则。

图2 识别规则对应的路径Fig. 2 Route corresponding to classification rule.

建筑物震害识别规则代码为

Ifthen

代码中,termi为条件项,条件项用<波段,操作符,波段的值>表示,规则结论(then部分)则定义了建筑物样本震害识别等级。 在对遥感影像中的建筑物进行震害识别时,需要对数据进行离散化处理; 然后从一条空路径开始重复选择路径节点,直到搜索到一条完整路径,即规则构造,之后对搜索的规则进行优化和删减,最后得到一条最优的建筑物震害识别路径规则,并作为下一只蚂蚁搜索震害规则的对比条件。

2.2 优化算子改进

为了较快获取识别规则,提高蚂蚁搜索震害识别规则的质量和效率,将优化算子引入到蚁群算法中。 优化算子在算法中对规则进行比较以及修剪,不断提高规则质量,优化算子算法描述如下:

∥初始化信息浓度

double choose=((double)rand())/(RAND MAX)∥蚂蚁随机选择属性节点∥

RuleA; (term(ij)and term(ij)or term(ij)); ∥随机选择一条完整的震害识别规则A∥

RuleB; (term(ij)and term(ij)or term(ij)); ∥随机选择一条完整的震害识别规则B∥

RuleB=RuleAterm(ij)-term(ik),其中j≠k; ∥确保选择的规则不相同∥

if(QA>QB)return RuleA; ∥如果规则A的质量高于规则B的质量,则选择规则A∥

Else return RuleB; ∥否则选择规则B∥

程序中,RuleB=RuleAterm(ij)-term(ik)表示RuleB是由用term(ik)代替RuleA中的term(ij)而得到的;QA为RuleA的有效性,QB为RuleB的有效性。

2.3 信息素浓度改进

尽管信息素浓度过快增长有利于最优震害提取规则快速收敛,但也会遗漏一些潜在的规则,导致最终的结果不是全局最优解,而是局部最优解。 为了防止信息素浓度增长过快,对信息素浓度增加项进行优化。 式(4)为蚁群算法信息素增长数学模型,式(5)为信息素浓度增长抑制参数的数学模型,式(6)为改进信息素浓度增长速度的蚁群算法,经改进的信息素更新浓度加快了算法的收敛,能进行大范围震害规则的提取。

τij(t+1)=(1-ρ)τij(t)+Qτij(t)

(4)

(5)

τij(t+1)=(1-ρ)τij(t)+pτij(t)

(6)

式中,Δτij(t)为条件属性节点的信息素浓度,当蚁群优化算法开始运行时,初始化所有节点的信息素浓度,并取相同值;P为信息素浓度增长抑制参数;Q为震害识别规则的有效性;ρ信息素挥发因子,一般取0<ρ<1。

将被蚂蚁选中的节点加入到路径规则中,直到得到一条震害识别规则,式(7)为震害识别规则有效性计算方法:

(7)

式中,TurePos为满足规则条件且和规则预测类型相同的样本数;TruePos为满足规则条件且和规则预测类型不同的样本数;FalseNeg为不满足规则条件且和规则预测类型相同的样本数;TrueNeg为不满足规则条件且和规则预测类型不同的样本数。

以下为信息素改进的更新算法: 首先,以多尺度分割后的像元为属性节点,对训练样本进行最优规则的搜寻; 然后,根据找出的最优震害识别规则路径更新信息素,质量高的规则信息素不断增加,质量差的规则信息素不断减少; 最后,将最优规则搜寻算法循环10次,选取最优震害识别规则。 以下为最优核心代码:

If(mone==1)∥蚂蚁经过的属性节点是否被选中,选中为1,未选中为0∥

{mone[ij]=(1-ρ)*mone[ij]+p*mone[ij]; mone[ij]=(mone[ij]>0.9)?0.9: mone[ij];}

∥未被选中,信息素减少,蚂蚁下一次循环搜索时,该规则将不会被选中; *为乘号∥

{mone[ij]=(1-ρ)*mone[ij]; mone[ij]=(mone[ij]<0.1)?0.1:mone[ij];}

∥mone为信息素,ρ为信息素挥发系数,p为信息素增长抑制参数∥

3 区域震害提取试验

3.1 漾濞地震概况及遥感影像

根据中国地震台网测定,5月21日21时48分34秒在云南省漾濞县发生6.4级地震,震源深度8km,试验的数据是2021年5月22日10时获取的漾濞县城的无人机高分辨率影像,选择波段为1—4波段,图3a为1—4波段合成的影像图。 辅助参考数据为该研究区域的DSM(数字表面模型),如图3b所示。 表1 为多光谱影像采集设备参数。

图3 a 漾濞县城无人机影像图; b 漾濞县城数字表面模型Fig. 3 The UAV image(a) and the DSM(b) of Yangbi county seat.

表1 多光谱影像采集设备参数

训练样本的选择是蚁群算法的关键,直接关系到建筑物震害识别规则的质量。 通过实地调查,采用分层随机采样的方法获取训练样本和验证数据集。 如表2 所示,漾濞6.4级地震中确定的建筑物震害为严重破坏、 中等破坏、 轻微破坏、 无破坏4个等级,训练数据集的样本数为1i680,验证数据集的样本数2i048。 图 4 为部分训练样本的实地调研影像。

表2 训练样本和验证样本

图4 部分训练样本的实地调研影像Fig. 4 The field survey images of some training samples.

3.2 震害识别规则挖掘与试验结果

改进的蚁群算法在搜寻震害识别规则时,将离散化后的各波段值作为蚂蚁路径上的属性节点,将识别的震害等级作为蚂蚁路径最终的类节点,属性节点与类节点构成一条完整的震害识别规则。 图 5 为部分训练样本震害规则提取,图 6 为1i680个训练样本的平均灰度值与建筑物数量统计。 试验首先采用基于遥感影像边缘检测的多尺度分割方法,对建筑物屋顶破坏进行边缘检测,如图5a所示,受损的建筑物屋顶具备不规则形状以及多形状聚集的特征(Xieetal.,2018; Heetal.,2020),然后利用改进的蚁群算法搜索建筑物震害识别规则。 本文中蚁群算法规则挖掘算法是在Visual Studio 2008环境中用C#语言编程实现的,此次试验利用改进的蚁群优化算法搜索到20条震害识别规则,利用蚁群算法搜索到36条震害识别规则,具体如表3 所示。 将所搜索的规则应用于试验区进行震害识别,得到识别结果,如图7a和7d所示。 同时,采用相同的训练样本利用最大似然法对试验区进行震害识别,结果如图7c所示。 图7d为后期对试验区影像进行目视解译与实地调研结果,图 8 为漾濞县云龙桥区域结果的局部放大图。

图5 a 建筑物轮廓检测结果; b 建筑物灰度化结果; c 建筑物损坏识别结果; d 建筑物震害等级识别结果Fig. 5 Building contour test results(a),building grayscale results(b),building damage identification results(c),and identification result of building earthquake damage grade(d).

图6 训练样本的平均灰度值与建筑物数量统计Fig. 6 The average grayscale value of training samples and building number statistics.

表3 改进的蚁群算法和蚁群算法挖掘的部分识别规则

图7 a 改进的蚁群算法震害识别结果图; b 蚁群算法震害识别结果图; c 最大似然法震害识别结果图; d 目视解译结果Fig. 7 Seismic damage identification results of improved ant colony algorithm(a),seismic damage identification results of ant colony algorithm(b),seismic damage identification results of maximum likelihood method(c),and visual interpretation results(d).

图 8 a 改进的蚁群算法震害识别局部放大; b 蚁群算法震害识别局部放大; c 最大似然法震害识别局部放大; d 目视解译局部放大Fig. 8 An improved ant colony algorithm for local amplification of seismic damage identification(a),ant colony algorithm for seismic damage identification local amplification(b),local amplification of earthquake damage identification by maximum likelihood method(c),and local magnification of visual interpretation(d).

3.3 震害识别精度分析

本文采用实地调研与影像目视解译的方法,分别对基于改进蚁群算法、 蚁群算法和最大似然法的结果进行精度评价,得到如表4—6所示的混淆矩阵。 从表4—6和图 8 中可以看出,基于改进的蚁群算法所得到的结果的总体识别精度与Kappa系数最高,分别为89.64%和0.855,该方法对建筑物震害的识别效果最好。 对比表4 与表5 可发现,改进的蚁群算法对建筑物震害识别的总体精度与Kappa系数高于蚁群算法,但2种方法对严重破坏、 轻微破坏和无破坏建筑物的识别结果相差很小,对中等破坏建筑物识别的结果相差较大,分别为384栋和370栋。 对比表5 和表6 可发现,蚁群算法震害识别的总体精度与Kappa系数高于最大似然法,说明蚁群算法在建筑物震害识别方面较常用的最大似然法具有一定优势。 可见,本文提出的信息素浓度更新策略以及加入的优化算子是可行的。

表4 漾濞县城区基于改进的蚁群优化算法震害识别精度评价结果

表5 漾濞县城区基于蚁群算法震害识别精度评价结果Table5 Evaluation results of earthquake damage identification of Yangbi county seat based on ant colony algorithm

表6 漾濞县城区基于最大似然法震害识别精度评价结果Table6 Accuracy evaluation results of earthquake damage identification of Yangbi county seat based on maximum likelihood method

综上所述: 1)漾濞县城云龙桥区域(图 7)的最底端为茶马古道遗址(图 8),该区域砖木与土木结构建筑物居多且建造时间久远,这2类建筑物的抗震性能低于框架和砖混结构,因此出现顶部破裂、 倒塌的建筑物占比较高,其破坏程度较为严重; 无破坏与轻微破坏建筑物主要为新建的框架和砖混结构房屋,主要用砖块建造,该类房屋建筑整体结构完整,外部轮廓清晰,没有出现明显的破损和倒塌现象,受到的地震损害较小,部分建筑外墙有轻微破损,震害等级为基本完好。 严重破坏建筑物主要以老旧的土木和砖木结构建筑物为主,承重的载体为木头,墙面多以泥土砌成,结构简单且建造时间久远,建筑物屋顶呈现墨黑色。 该建筑物受到的地震损坏较大,有大面积的屋顶和墙面倒塌,可以看到倒塌后的木结构框架以及一些泥土、 瓦片等堆积物。 2)从表4 和表5 中可以看出,改进的蚁群算法与普通的蚁群算法对中等破坏建筑物的识别效果显著,而对于其他破坏类型建筑物识别效果不显著。 究其原因,是由于各破坏等级建筑物的验证样本数量差别不大(除无破坏建筑物),而训练样本里中等破坏建筑物的训练样本数远高于其他样本数,表明训练样本数越多,改进的蚁群算法优势更明显。

4 结论

(1)本文提出了基于改进蚁群算法的高分辨率影像震害提取方法,并将其应用于2021年5月21日漾濞6.4级地震的区域建筑震害识别工作,获取了震后县城无人机遥感影像。 将本文所提出的方法与基于蚁群算法、 最大似然方法的震害识别效果进行了对比分析,本文方法的总体精度可达89.64%、 Kappa系数可达0.855,可有效提高建筑物震害识别的精度。

(2)蚁群算法具有较好的鲁棒性,在建筑物震害识别方面的精度比最大似然法更高。 但蚁群算法容易收敛于局部最优解,遗漏隐藏的全局最优震害规则。 针对该问题,本文提出信息素浓度更新策略并加入优化算子,建立基于改进蚁群算法搜索震害规则,相对于简单的蚁群优化算法能够更好地搜索简短有效的震害规则集,进一步提高建筑物震害识别精度。

(3)本文提出的基于改进蚁群算法的高分辨率影像震害提取方法尚处于起步阶段。 在未来的工作中,将进一步推进高分辨率影像获取、 波段数据离散化以及震害规则搜寻和建筑物震害识别的智能化、 自动化,为震后灾情调查提供更加高效、 精准的数据支撑。

猜你喜欢

蚁群训练样本蚂蚁
游戏社会:狼、猞猁和蚁群
人工智能
基于自适应蚁群的FCM聚类优化算法研究
基于奇异值差分谱分析和蚁群算法的小波阈值降噪
我们会“隐身”让蚂蚁来保护自己
蚂蚁
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
蚂蚁找吃的等