乡镇级农居建筑物目标判定方法及应用
——以辽宁康平张强镇为例
2023-08-19李雨佳张欣然田雨佳王姝婷
李雨佳,张欣然,于 浩,田雨佳,王姝婷
(辽宁省地震局,沈阳 110006)
0 引言
辽宁地处华北断块区北部,由辽东断块隆起带、下辽河-辽东湾断块凹陷带及辽西断块隆起带组成,郯城-庐江断裂带北延带纵向贯穿辽宁全省。从概率上来说,辽宁省农村地区发生地震的概率极高,而大多数农居建筑抗震设防等级未达标或未进行抗震设防,在地震中极易遭到破坏。农居建筑物是农村地区主要的地物类型之一,利用遥感影像准确获取其空间分布并将其用于震后灾害损失评估、重点救援区域判定及震前应急备灾准备中具有极其重要的意义[1]。
随着遥感技术的发展,高空间分辨率遥感数据的应用变得越来越普及,从图像中提取建筑物目标已经成为遥感领域的一项工作任务。但从图像中人工解译建筑物耗时耗力,无法做到全方位实时检测,故应用深度学习算法从高空间分辨率遥感图像中自动、准确地提取建筑物信息成为遥感影像目标识别中的重要研究内容。近年来,计算机硬件水平不断提升,训练样本规模持续增加,以卷积神经网络(Convolutional Neural Network,CNN)为代表的深度学习方法在计算机视觉和遥感任务中展现出巨大的潜力[2]。CNN具有自动学习并生成高度复杂非线性特征的能力,能够改善人工设计特征带来的不足,在建筑物检测任务中得到了越来越广泛的应用。AlexNet、VGGNet[3]等传统的卷积神经网络模型只为一个图像输出单个类别标签,即离散标签分类。2015 年,全卷积网络(Fully ConvolutionalNetwork,FCN)得到迅猛发展并广泛应用于语义分割领域。FCN使用卷积层替换CNN中的全连接层,结合反卷积或上采样操作生成最终的特征图[4]。但是FCN及其一些扩展网络(如SegNet[5]、DeconvNet[6]、UNet[7]等)仅利用部分网络层生成最终特征图,导致边缘精度较低,限制了对微小尺寸或大型建筑物的检测能力。基于FCN框架提出了金字塔场景解析网络(pyramid scene parsing network,PSPNet)及金字塔池化模块,聚合基于不同子区域获取图像的全局上下文信息,适用于复杂场景下的图像分割[8]。过去的研究多采用航空数据,此类数据空间分辨率高,场景简单,而迁移至高分辨率遥感影像数据集时存在提取结果不完整、提取结果精度低等问题,建筑物提取结果在实际生产工作中实用性较差。
1 研究区概况及数据预处理
张强镇位于辽宁省沈阳市康平县西北部,镇域面积288 km2,辖14个行政村83个居民组204个自然 屯,截至2017年底总人口达到24 264人。2022年9月29日,辽宁康平发生了M3.0级地震(塌陷),12月13日发生了M2.1级矿震。两次地震均发生在康平县张强镇内,因近期张强镇地震活动较频繁,以快鸟卫星获取2023年2月张强镇0.6 m分辨率的遥感影像。
针对遥感影像覆盖区域范围大、地物聚集分布的特点,采用ArcGIS Pro,制作遥感影像深度学习样本数据集。选取张强镇周边地区,包括典型农居建筑物的遥感影像作为样本数据。由于PSPNet完成语义分割建筑物目标是一种对图像进行逐像素的分类行为,故需对样本图像中的全部像元进行类别标注,不应出现未进行分类的样本。对样本影像进行二分类处理,农居建筑物标注为正样本类别,其他像素标注为负样本类别,标注结果如图1所示。对样本区域进行尺寸为256×256、叠置步长为128×128的矩形切片,如图2所示。
图1 样本标注结果Fig.1 Result of sample labeling
图2 样本切片示例Fig.2 Sample slice example
2 原理及研究方法
2.1 PSPNet网络结构
PSPNet网络结构如图3所示。通过改进经典的FCN网络,设置了4层的金字塔结构,引入更多的上下文信息进行运算,带入更多的全局信息,降低误分割概率。选用算法稳定的PSPNet网络作为农居建筑物目标判定的基础网络结构。
图3 PSPNet网络结构Fig.3 PSPNet grid structure
2.2 结合形态学运算的农居建筑物判定方法
形态学运算的实质是利用数学中的非线性滤波对二值图像进行非线性滤波处理,对图像逐像素进行先腐蚀再膨胀操作,定义为:
A°X=(AΘB)⊕B
即利用B腐蚀X,再进行膨胀,修复小斑块、毛刺及细小桥接,分离细微黏连的物体,平滑大物体轮廓,效果如图4所示。
在这份报告里,课题组建议保持草案提出的每月5000元的基本减除费用标准不变,建立与基本消费品物价指数挂钩的自动调整机制,同时,慎重审议专项附加扣除,明确其与基本减除费用的关系,并考虑使用定额抵免方式,建议降低最高边际税率,增加劳务报酬所得费用扣除,鼓励创新。此外,对于个人纳税信息申报和税收法定等也提出了意见和建议。
图4 形态学开运算效果Fig.4 Morphological open operation effect
形态学闭运算对图像逐像素进行先膨胀再腐蚀操作,定义为:
A•X=(A⊕B)ΘB
即利用B膨胀A,再进行腐蚀,可使像素块轮廓平滑且面积不明显变化,消除狭窄的间断及小空洞,填补裂缝,效果如图5所示。
图5 形态学闭运算效果Fig.5 Morphological closed operation effect
利用上述二值图像领域运算,对通过PSPNet网络运算后的初级结果图像进行形态开、闭运算,形成结合形态学运算的农居建筑物判定方法,流程如图6所示。
图6 结合形态学运算的农居建筑物判定方法流程Fig.6 Determination method flow of farm buildings combined with morphological operation
在遥感影像经过PSPNet网络结构进行卷积及空间金字塔结构运算后,通过合理地叠加形态学开闭操作结果,依据影像空间分辨率设定模板阈值,去除碎片并填补孔洞,规则化建筑物对象形状,增强正样本结构表达,从而更准确地对遥感图像中的建筑物空间信息进行提取分析。
3 实验与分析
3.1 网络模型训练
实验平台采用英特尔酷睿i5-6500k处理器,8 GB内存,显卡NVIDIA GeForce GT 730,显存4 GB。软件环境方面,操作系统为Windows 10,编程语言采用Python,深度学习框架选择PyTorch。基础学习率为0.0001,每次以 0.9倍速率衰减,衰减因子为0.0001。由图7可知,在训练次数迭代2000次后,损失值在0.1~0.2震荡,认为已经完成深度网络模型训练。
图7 损失值迭代Fig.7 Loss-value iteration
3.2 实验结果及精度评价
利用结合形态学运算的农居建筑物判定方法对张强镇进行农居建筑物目标判定实验,局部地区农居建筑物遥感影像及目标判定结果如图8所示。
图8 农居建筑物遥感影像及目标判定结果Fig.8 Results of remote sensing images of farm buildings and target determination
由图8可知,实验结果能够覆盖区域内彩钢顶、混凝土平顶及小青瓦斜顶农居建筑物房屋,建筑物能够被完整地识别出来,但也存在极少量的不完全提取现象。
为了对所提网络模型的整体性能进行定量评价,选用深度学习领域通用的混淆矩阵进行真值及实际预测值比较。实验中,真值为影像底图数字化成果,混淆矩阵如表1所示。
表1 混淆矩阵
其中,TP为农居建筑物被正确识别的像素数量,TN为其他地物被正确识别的像素数量,FP为其他地物被误识别为农居建筑物的像素数量,FN为农居建筑物被误识别为其他地物的像素数量。
利用图像识别通用的比率指标,即准确率、查准率及召回率进行精度分析,公式如下所示:
Accuracy=(TP+TN)/(TP+TN+FP+FN)
Precision=TP/(TP+FP)
Recall=TP/(TP+FN)
准确率(Accuracy)用于评估本方法的全局准确程度,查准率(Precision)用于表示所有判定为农居建筑物的像素中实际为农居建筑物的比例,召回率(Recall)用于表示所有实际为农居建筑物的像素中被正确判定的比例。
实验结果的精度比率指标如表2 所示。
表2 精度指标表
由表2可知,结合形态学运算的农居建筑物判定方法查准率为80.65%,表明此方法对负样本的区分能力很强,召回率为50.00%,对正样本的识别能力完整,准确率为92.03%。从全局来看,本方法对农居建筑物及其他地物都能准确识别,具有良好的鲁棒性、稳健性,实用性较强,能够满足实际应用要求。
4 乡镇级农居建筑物判定结果的应用
以张强镇为例进行乡镇级的农居建筑物目标判定结果的应用研究,利用农居建筑物识别结果生成建筑物公里网格,能够很好地展示出乡镇内农居建筑物分布密度情况。张强镇农居建筑物目标判定结果如图9所示。
图9 张强镇农居建筑物目标判定结果Fig.9 Result of target determination of rural residential buildings in Zhangqiang Town
由图9可知,张强镇内有大小不等的农居聚集地39处。对张强镇全域按照公里网格划分,共分为342个公里网格,建筑物公里网格如图10 所示。
图10 张强镇建筑物公里网格Fig.10 Buildings kilometer grid of Zhangqiang Town
其中,108个网格无建筑物存在,有6个网格内建筑物占地面积超50 000 m2,叠加遥感影像如图11所示。
从生成的建筑物网格图中可以看出,张强镇建筑物密集区域主要为镇政府所在地、官宝窝堡村及东一棵树村。结合影像内地物信息判读及实地调查,建筑物判定应用成果符合张强镇实际情况,镇政府及周边地区为当地建筑物最为密集区域,东一棵树村内设大型厂矿,存在大量单层厂矿建筑聚集现象,官宝窝堡村内设大型牧业公司,存在大量单层建筑。
建筑物的分布可以在一定程度上代表人口密度分布。依照目前的研究结果可以判定张强镇内人口密集区域为镇政府所在地、官宝窝堡村及东一棵树村,在地震等自然灾害发生时可考虑救援设备及救援力量的调配。
5 结束语
结合形态学运算的农居建筑物判定方法能够完成单体农居建筑物的识别任务,通过建筑物公里网格,分析了张强镇全域农居建筑物分布情况,可应用于地震灾害预评估实地调研地选取、破坏性地震后现场调查点选择、人口埋压地点预判及计算地震直接损失经济损失等方面。利用遥感影像信息量大、更新频率高、获取数据快速的特点,可对辽宁省的建筑物网格更新生产,掌握农居建筑物分布情况。科学、合理地应用遥感影像识别方法是减轻地物目标判定工作量、增加可信度的有效途径。