遥感信息处理技术在工程中的应用
2023-09-20鄂鑫雨
鄂鑫雨
(河钢集团矿业公司 河北 唐山 063000)
0 引言
地质灾害是野外工程必须要重视的问题,这对地质环境保护是一个非常重要的环节,在开采工程中应用较多的是高分遥感影像,为矿区的环境监测和地质环境监测提供了科学的指导,并积累了一些原始数据资料[1-2]。高分辨率遥感影像识别技术在开采中的应用方式有两种,一种是面向对象的分类,另一种是对像素的监督进行分类[3]。面向对象的分类技术研究方面,SONG W等[4]将开采信息在Spot-5遥感影像上呈现出来;还有张文博等[5]将面向对象的多个尺度进行改进,使遥感影像能够清晰地呈现工程地区的地物情况,使之更加遥感图像更加清晰;颜小霞[6]研究了无人机遥感技术,并与面向对象的方法进行融合,得到了工程地区平面的数据资料;王战卫等[7]将攀枝花地区作为范本,将土壤调节大气耐抗设备指数与监督分类进行融合,从而提取了开采区域的相关遥感信息;张松浩等[8]在工程地区进行分类时使用了支持向量机算法,效果显著。上述识别方法并没有多大的难度,因此显示影像仅限于纹理、波段、结构等简单的资料,很少能够显示开采工程的高级别数据资料。
多层网络结构高级别数据资料特征的显示方法常为卷积神经网络,卷积神经网络也常常被应用于土地分类或车辆识别中。基础的卷积神经网络(convolutional neural networks,CNN)训练方法对带标签样本的数量有一定的要求,但是在实际的野外工程中,这种带标签的样本并不多,由此导致CNN训练方法并没有足够高的精确度。因此,本文主要阐述CNN中的迁移学习方法在遥感信息处理中的应用,该方法对数据量没有过高的要求,所以能够很好识别野外工程的相关信息。
1 数据集
1.1 研究区概况
本文研究区域由低山、平原和丘陵共同组成,所处地区的总面积约为2 182 km2,它的气候特征以半干旱大陆气候为主,降水量平均每年约为654.2 mm。开采对地形地貌造成了一定的破坏,出现了山体的崩塌与滑坡,研究区影像的波段来自高分二号(GF-2)遥感数据,是多光谱与全色相融的结果。空间分辨率1 m 研究区坐落在114°9′E,35°41′N,该地区聚集了诸多的开采区,这就导致了伴随着开采而来的废料和玻璃层产生的土石对地貌地形造成了严重的破坏。
1.2 实验数据集
数据是经过加工处理后的GF-2遥感数据,加工处理的方式有几何融合与几何校正两种方式,它们的分辨率大概为1 m。测试集、训练集和验证数据共同组成了实验数据集。测试集及训练集的常见场景主要有七类,分别是开采区域、梯田、农田、建筑、道路、河流和森林,在CNN的迁移学习中常用的是训练集,80幅/类;测试集中有16幅/类的算法验证。采用数据为GF-2预处理数据可用来评估评价算法的精确度。
2 模型与方法
2.1 CNN-F 模型
该模型是由Ken设计的,它的网络架构是CNN-F,共包括8层,由卷积层和全连接层组成,比例为5∶3,图像的规格是224×224像素。CNN-F网络结构如图1 所示。卷积层/全连接层的结构为5/2。卷积层的表示方法如下:Size—卷积核尺寸;stride、pool 和pad 分别表示卷积步长、降采样池化和空间填充。全连接层fc6和fc7的神经元数均为4 096,fc8是softmax 分类器,也是神经网络的最后一层。
图1 CNN-F网络结构示意图
深度残差网络ResNet-50是以传统卷积网格为基础。该学习框架可以减轻网络训练负担,可以进行跨层连接,从而形成残差块,能够有效地解决网络层数多引起的梯度下降现象。该模型优化了反向传播的网格数据,使网络能够更好地提取数据信息。ResNet-50的网络结构如图2所示,残差块与卷积层的比例为16∶1,softmax分类器与平均池化层共同组成了全连接层,该图像的尺寸为224×224像素。
图2 ResNet-50 网络结构示意图
训练CNN必须有足够数据的支撑,如果数据过度匮乏会导致拟合现象经常发生。解决该问题的有效方法是迁移学习,也就是将CNN的数据进行训练得出预训练模型,并调取特征层重复使用,从而有效解决新任务缺乏数据的问题,该方法即迁移学习。
在场景分类中应用最广泛的是CNN模型的全连接层,它的神经元数量等同于图像分类器。本文的模型数据来自ImageNet数据集,该数据与mageNet不属于同一类别,即通过替换该模型的最后一层数据,才能够进行迁移学习,从而得到合理的实验数据。如图3所示为预训练模型调整流程,用该模型的预训练数据替代分离器,N用于表示不同的训练数据影响类别。
图3 预训练模型调整流程示意图
参数微调和特征提取是迁移学习的主要方法,前者是将预训练模型的全部或部分数据用目标数据集进行训练,这样就可以调整网络各层的数据信息,使其更符合实际要求;后者并不会全部舍弃预训练模型的数据信息,而是在新的案例数据仍有所保留,可将其视为特征提取的原始能力。
3 实验与结果分析
3.1 迁移学习对比实验
CNN-F是本实验的基础,第一步是处理最后一层网格,让它的分类器与实验数据集更吻合。训练方法有三种,即An、Bn、Cn,训练的场所是训练集,An是训练前需冻结预模型的n层数据,该方法只是需要初始化7—n层数据,而不需要调整参数,Bn方法不会破坏预训练模型的数据信息,但是需要对7—n层数据进行初始化;Cn是要冻结预训练模型的n层数据,同时不删除余下7—n层数据,即n={1,2,…,7}。
当n=1时,该层保留模型的参数用阴影部分表示,初始化部分用白色来表示,该层冻结的数据用有锁符号来表示。因此,预训练模型位于第一层,初始化模块则位于剩下的7层,这7层主要用于初始化训练。B1表示除不初始化第一层外,对其他层数据进行初始化,从而达到对整个网络训练的目的。C1表示将预训练模型的第一层数据进行冻结后,对其他层的参数进行局部调整。
如图4所示,是在实验中得到的An,Bn,Cn 三种迁移学习方法的训练模型,并进行一系列测试的输出结果。
图4 An、Bn、Cn 分类精度对比
由图4可知,红色菱形点An 的 1—3层,精度会随着冻结层数的增加而提升,精度的最高点是A3。但是如果冻结层数持续增加,精度并不会一直调高,而是呈现出下降趋势。由此可见,可以通过调整预训练模型的前3层参数,获取实验测试集的整体特性。实验数据集与ImageNet数据集存在显著差别,因此预训练模型4—7层不能够很好地呈现出遥感数据的本质特征。通过微调层数,可以得到精准度更高的黄色三角点Bn,精准度最高点是B7。由此可见,如果ImageNet数据集与实验数据集存在着明显差异,可以通过对其他的层次进行微调获取精准度更高的遥感影像信息。
由实验可知,C1与C2可以通过微调高层或底层参数进行冻结,由此可以保留预训练模型的提取能力。在实际应用中只需要对高层参数进行调整,就可以完成对新遥感图像的甄别。为了了解C1与 C2训练效果的差别,笔者将生产者精度与用户精度同时进行考量,C1训练方法的生产者精度和用户精度分别为93.75%和100%,C2的生产者精度和用户精度分别为100%和94.12%。
3.2 最佳训练方式的适用性实验
通过以上的实验可以看出,最佳的训练方法是将高层参数进行微调同时对底层预训练模型参数进行冻结。对此我们也在CNN模型上进行了实验,具体的实验方法如下。
在ResNet-M中,M是指ResNet-50 预训练模型被冻结的是M层以前的参数(含M层),未被冻结的数据则可以在训练集上进行调整。
图5为ResNet-conv1识别的最高精确度。识别的精确度会随着冻结层数的增加和残差块的产生而下降,所以说ResNet-50 模型最适合将高层数据进行调整并对底层数据进行冻结。
图5 ResNet-M 分类精度
实验通过对比可知,ResNet-50 预训练模型的精准度虽然会在调整高层数据并对底层数据进行冻结时得到改善,但是可发现生产者精度与总精度并不能满足CNN-F 预训练模型的需求。虽然在ImageNet 数据集上显示了ResNet-50 模型的优越性,但是笔者认为,本文所阐述的迁移学习方法最适合CNN-F 模型,这也就说明了残差网络的跨层连接可以帮助优化网络数据,所以就迁移学习在ResNet-50 模型中的效果不显著。
3.3 遥感信息识别
应用C1在对开采工程进行识别的过程中,采用CNN-F对最佳迁移学习方式进行验证。结果如下:该算法得出的工程区域的用户精度和生产者精度分别为87.5%和100%。如图6所示为研究区域解译图(a)与本文识别方法图(b)对比结果,只有A处工程区域没有被本文的算法识别。本文方法识别出了多种地貌、地物特征,并得到了良好的数据分析资料。因此,充分证明了CNN模型的最佳迁移学习方式在开采工程遥感信息处理的效果显著。
图6 遥感信息识别结果对比
4 结语
综上所述,开采工程遥感识别精度不高主要与训练数据量不足有关系。本文通过不同的对比实验可知,如果通过微调高层数据并同时对底层CNN预训练模型的数据进行冻结的迁移学习方法,能够有效地提高CNN模型的识别精度。迁移学习方法对CNN模型的结构没有具体的要求,实验证明这种方法能够同时提高用户精度和生产者精度。因此,通过该种方法训练的CNN模型能够有效识别开采工程区域的高分遥感影像信息,可以在开采工程中广泛使用。