基于高分遥感影像的多尺度纹理特征变化检测技术*
2022-03-10刘自增张德政姚建华严瑾黄涛
刘自增 张德政 姚建华 严瑾 黄涛
1. 宁夏回族自治区遥感调查院 宁夏 银川 750000;2. 北京科技大学 北京 100083
1 网络和方法
基于预处理后合成好的高分影像,对目标像素进行地物分类所用的网络结构如图1所示。将目标像素的邻域尺寸设定为24×24并输入卷积神经网络,先后经过两次卷积、池化对输入图像提取特征后,传入全连接层和Sigmoid分类器,得到目标像素的地物类别。该方法先利用卷积神经网络进行逐像素地物分类,再对比两时相影像的地物分类结果,得到地貌变化区域,属于分类后变化检测。
图1 逐像素地物分类的网络结构示意图
传统邻域矩阵特征存在噪点多、伪检多的不足,分析原因是邻域特征尺度单一导致的,由此对特征构造方法做出改进,本章提出基于图像金字塔的多尺度变化检测方法。图像金字塔可对同一影像进行多尺度描述,它的本质是利用高斯模糊平滑数据后,下采样浓缩数据,所以金字塔上层影像不仅在一定程度上保留原始影像的概貌,并且尺度更高,同一像素的多尺度信息可基于此提取[1-2]。
图2展示融合多尺度信息的邻域矩阵特征的构造流程。为简化表示,将邻域矩阵展平得到的一维向量用三个像素表示,代表RGB三通道特征。
图2 融合多尺度特征的邻域矩阵特征构造示意图
相较传统邻域特征构造方式,本章提出的融合多尺度信息的特征构造方式具有如下优点:
第一,整合目标像素在高斯金字塔不同层上的观测结果,将其汇总为一个向量,则特征向量中整合了目标像素的多尺度信息;
第二,多尺度信息的融合降低了邻域矩阵尺寸选取的困难,相当于一个特征向量上整合了不同尺寸邻域的信息,则不用过度受困于邻域尺寸的选取问题;
第三,单时相影像提取的多尺度邻域特征包含9个通道、3个尺度的邻域信息,更充分利用原始影像的多尺度特征;
第四,多尺度信息帮助模型从低、中、高不同视角观测目标区域,改善了目标像素属于不同尺度地类或目标像素为噪点时,单一尺度邻域特征难以帮助模型有效变化检测的问题,从多尺度观测该像素,可对该像素所属地貌或是否为噪点由更全面、详尽的把握,可以有效避免伪变化检测问题。
在变化检测中,易分类样本通常有两种情况:一是前后地貌一致,并且外界成像因素对该地貌影响不大的未变化地域;二是前后地貌差异明显,所构建特征向量十分不同的变化区域。模型应重点学习难分类样本,即预测概率接近0.5的样本,这类样本的预测结果会因训练集、模型甚至参数的改变而产生明显差异,是体现算法和模型性能的关键[3]。
为改善变化检测数据集固有的正负样本不均衡问题,并帮助模型重点学习难分类样本,以提升变化检测效果。本章提出将Focal loss作为SDAE模型的损失函数,有三点好处:
第一,从模型层面而非特征层面改善对变化地貌学习的质量;
第二,模型注重少量变化样本的学习,将帮助其提高变化发现能力,提升样本的召回率;
第三,模型注重难分类样本的学习,样本的分类精准率应有所提升,使得精准率和召回率之间的效益背反影响尽可能小,以提升SDAE变化检测的综合性能。
2 实验结果
本节进行两组实验,第一组实验以多尺度纹理变化检测为基础方法,以原始影像和三类标签构成训练集,利用本章提出的三类标签配套训练方法,对模型训练并预测,将其检测结果与利用常规标签训练模型并检测的结果对比,评估二者在各项指标和主观视觉上的差异。第二组实验分别利用交叉熵与Focal loss作为损失函数训练模型,对比二者变化检测效果的差异。
本实验将标签修改为三类标签,训练方法修改为本章提出的三类标签配套训练方法,对融合多尺度光谱和纹理特征的SDAE进行训练,邻域尺寸设定为3×3|5×5、5×5|7×7、7×7|9×9三种尺寸对,分别训练、预测后,对各项检测指标取平均,以表征算法的综合效果,将其与常规标签训练模型检测的各项指标对比,结果如表1:
表1 常规标签与三类标签训练模型的效果对比
利用三类标签训练模型后,模型变化检测的精准率提升,作者分析原因是:三类标签构造法有益于提高标签的准确率,检测影像上的噪点显著减少,精准率提升,房屋和道路的轮廓更加清晰,变化区域的整体性更强,对伪检的鲁棒性提升,检测结果图更加纯净,势必会提升模型变化检测的能力。但是利用三类标签训练模型会让召回率小幅下降,作者分析原因是:由三类标签构造的样本会损失部分地貌,导致用于模型训练的地类不如常规标签丰富,召回率降低。综合而言,利用三类标签进行训练,提升了模型的变化检测精度,F1 score有所上升。
本实验以融合多尺度光谱和纹理特征的SDAE变化检测为基础模型,利用三类标签法训练模型,对比常规损失函数与Focal loss损失函数对模型检测效果的影响。实验结果如表2所示:
表2 交叉熵与Focal loss作为模型损失函数的效果对比
将损失函数改进为Focal loss后,召回率明显提升,因为Focal loss用于解决两类问题:第一,正负样本不均衡问题,它给予少量样本更大的权重,当模型对少量样本分类错误时,将受到更大的惩罚,所以不得不注重对少量样本的学习;第二,难分类样本学习不足的问题,Focal loss根据模型对样本预测的类别概率,判断样本的难易分类程度,认为概率趋于0.5的是难分类样本,给予这类样本更大的损失权重,迫使模型注重难分类样本的学习。变化检测中,变化样本是少量样本,地貌变化复杂、仅靠基础特征难以判断变化与否的样本是难分类样本。将损失函数改进为Focal loss后,模型对变化样本的发现能力提升,召回率提升。召回率和精准率之间存在效益背反,引入新的特征辅助模型判决,保证二者均有提升,正因Focal loss注重难分类样本的学习,益于模型精准分类,才使精准率没有大幅下降。F1 score有所提升,说明模型综合检测能力增强,损失函数的改进是有效的。
作者将损失函数改进为Focal loss后,模型更注重难分类样本的学习,在训练时若该类样本被频繁预测错误,预测概率趋近0.5,模型将给予其很大的样本权重,以重视对该类变化的学习,而抵消样本量少产生的影响。由检测结果可知,修改损失函数后,模型检测的变化区域更完整、连通,召回率得以提升。
3 结束语
本文结合图像金字塔算法,提出一种融合多尺度特征的变化检测算法。将同一像素在不同尺度上的邻域特征相融合,构成一个包含低、中、高多尺度特征的向量,辅助模型进行变化检测。融合高尺度特征后,模型具有更大的视野,由于视野局部而产生的噪点得以减少,检测影像的视觉效果更加纯净。由此,降低模型对邻域尺寸选取的依赖,适用于同一邻域尺寸不同地物类型的变化检测。本研究具有一定的通用性,研究的技术不仅可以用于土地利用变化的检测,也可用于土地调查、城市规划、农业测量、地表水域及和自然环境监测等领域,具有非常重要的意义。