APP下载

基于残差网络的怒江泥石流沟谷分类及其预测

2022-08-29刘存熙王保云

现代信息科技 2022年12期
关键词:残差卷积正确率

刘存熙,王保云,2

(1.云南师范大学 数学学院,云南 昆明 650500;2.云南省高校复杂系统建模及应用重点实验室,云南 昆明 650500)

0 引 言

泥石流是山区常见的自然灾害,具有突发性、群发性、伴生性、时段性、破坏性等显著特点。泥石流主要受地形地貌、降水量、植被覆盖、气候条件等自然因素和人类活动等因素的影响。灾害发生区域分布不均,类别众多。近年来,我国泥石流灾害频繁,云南怒江流域更是高发地区,泥石流一旦发生常常造成巨大损失,甚至人员伤亡。若能正确预测泥石流发生沟谷,提前做好防范,便能减少损失。

深度学习是学习样本数据的内在规律和表示层次,是一个复杂的机器学习的算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习是一类模式分析方法的统称,其中卷积神经网络(CNN)就属于深度学习的范畴。随着信息技术的发展,将卷积神经网络应用于泥石流沟谷的图像分类及预测已经成为主流的方法之一。实验中经常用到的神经网络模型主要有LeNet网络、AlexNet网络、VGG网络、GooleNet网络、ResNet 网络等。当卷积网络变得越来越深时,一个新的研究问题出现了:随着输入信息或者梯度信息穿越很多层网络后,它可能会消失。其中ResNet 网络可以更好地提取图片特征,能够加深网络结构来提高准确率,防止过网络退化。

怒江傈僳族自治州是云南省泥石流典型的高发地区,频发的泥石流灾害给当地居民的生活带来了严重的影响。区别于实地考察、对沟谷特征进行调查的方法,本文通过深度学习的方法,结合数字高程模型(DEM)图与残差网络,通过神经网络卷积运算对图像进行特征提取,对怒江流域的泥石流沟谷进行了分类以及预测,取得了良好的效果并节约了大量的人力资源。

1 研究数据

1.1 研究区域

如图1所示,怒江傈僳族自治州位于云南省西北部,该地区跌宕起伏,北高南低,属典型的高山峡谷深切割地貌。由于区域内条状高山与纵谷并列的地形特点、线状褶皱断裂与岩带伴生的地质特点以及干湿季分明且湿季明显长于干季的气候特点,使其成为云南省泥石流灾害高发区。

图1 研究区域

1.2 数据处理

数字高程模型(DEM)是以数字形式按一定结构组织在一起,表示实际地形特征空间分布的数字模型,也是地表和地形起伏的数字描述。本文的数据来源是通过查阅《云南减灾年鉴》以及查找有关怒江流域泥石流的新闻,按记载信息结合地图,确定具体发生的村和沟谷。通过收集处理数据,共得到50 条确定发生过泥石流的沟谷作为正样本,同样的,查找50 条没有任何发生泥石流记录且人员密集居住的沟谷作为负样本,然后我们使用ArcGIS 软件从DEM图中将这些沟谷提取出来。根据沟谷的面积大小,分别将正负样本各分为三类,如表1所示,并将沟谷图像分成了六类。我们将六类数据集放入PyCharm 中通过代码编程,将六类数据集分别打上标签,图2是从六类样本中分别抽出的一张沟谷图像。

表1 图像分类

图2 部分沟谷DEM 图

2 研究方法

残差神经网络(ResNet)是由微软研究院的何恺明、张祥雨、任少卿、孙剑等人提出的,作者对残差网络命名的解释是:网络一层通常可以看作=(),而残差网络的一个残差块可以表示为()=()+,也就是()=()-,在单位映射中,=便是观测值,而()是预测值,所以()便对应着残差,因此叫残差网络。残差网络通过引入恒等路径使权重参数有效传递与更新,解决了卷积神经网络层数加深导致的过拟合、权重衰减、梯度消失等问题,性能表现优异。在进入网络前先通过Python 将DEM 图统一放缩为224×224 的大小,为了减少参数大小,我们将全连接层设置一层,本文的残差网络结构框架如图3所示。

图3 网络结构图

根据VGG 网络模型得到启发,我们以一个卷积核全为3的Conv7 网络结构为基础,在该网络结构上添加了三层残差模块,通过最大池化层缩小图片大小,最后经过一层全连接层。

残差块的结构图如图4所示。

图4 网络结构图

在神经网络训练过程中,网络中的参数也随着梯度下降在不断地更新。这样可能会造成上层网络需要不断调整来适应输入数据分布的变化,导致网络学习速度的降低,以及网络的训练过程容易陷入梯度饱和区,减缓网络收敛速度等问题。因此我们在残差块中引入了批归一化(Batch Normalization, BN)处理,这样可以加快模型的收敛速度,并且能够解决深层网络中存在的梯度消失的情况,让模型变得更加稳定。

激活函数我们选择了Relu 函数,Relu 函数的优势主要有:没有饱和区,不存在梯度消失的问题,可以防止梯度弥散;其次Relu 函数没有复杂的指数运算,计算简单,效率很高,实际的收敛速度较快。池化层我们选择使用最大池化层,有效地降低了特征图的大小,减少了参数量,去除了冗余信息,简化了我们的网络复杂度。损失函数的学习率我们设置为0.001,学习率如果过大可能会使损失函数直接越过全局最优点,此时loss 会变得过大,如果学习率过小,就会使损失函数的变化速度变得缓慢,会大大增加网络的收敛复杂度,并且很容易被困在局部最小值或者鞍点,经过我们多次实验对比,得出当学习率为0.001 使时取得的效果较为理想。momentum 动量我们设置为0.9,在对网络进行训练时,最开始会对网络进行权值初始化,但这个初始化不可能是最合适的;因此可能就会出现损失函数在训练的过程中出现局部最小值的情况,而没有到达全局最优的状态。momentum的出现可以在一定程度上解决这个问题。当momentum 越大时,就有可能摆脱局部凹区域,从而进入全局凹区域,Momentum 主要用于权值优化。

对该模型的进行训练和测试的过程为:每次实验从100张图片中随机选取20 张,并且保证每类图片至少拥有3 张作为测试集,其余的80 张图片作为训练集,实验流程如图5所示。

图5 实验流程图

3 实验结果与分析

本文基于怒江流域的沟谷数字高程模型(DEM)图,使用残差网络来对沟谷图像进行训练,实现分类及预测。我们设置了两组神经网络模型作为对照试验,模型一是Conv7网络,模型二则是在Conv7 的结构上添加了三层残差模块的残差网络,通过结果的预测正确率,训练函数,损失函数来判断模型的优劣。我们共进行了5 次实验,实验结果较为稳定,因此选取5 次实验的平均正确率作为实验结果。重要的参数有:lr:0.001,epochs:200,batch_size:8。优化方法为随机梯度下降法(SGD),损失函数为交叉熵损失(Cross Entropy Loss),交叉熵能够衡量同一个随机变量中的两个不同概率分布的差异程度,在机器学习中就表示为真实概率分布与预测概率分布之间的差异。交叉熵的值越小,模型预测效果就越好。每轮训练后使用测试集进行测试,保存最好的测试结果。实验结果如图6、图7所示。

从图6和图7可以看出,两个模型损失函数尽管有波动,但总体呈下降趋势,并最终都能达到收敛。两个模型在训练集上的准确率总体呈上升趋势,最后的训练正确率都收敛到100%。模型一在测试集上的准确率开始呈上升趋势,随后在52.381%和57.143%之间波动,没有收敛;模型二在测试集上的准确率与在训练集上的准确率变化趋势基本一致,并最终收敛到60%。结果表明,在卷积神经网络基础上添加残差块,可以提取更多的图像特征,取得更高的测试正确率,并有助于实现测试正确率的收敛。本文采用残差网络对怒江流域的沟谷数字高程模型(DEM)图进行训练能够实现较好的分类以及预测,为怒江流域泥石流预警及防治工作提供理论参考,尤其是在雨季来临时,做好防范准备。

图6 模型一的损失值与正确率变化曲线

图7 模型二的损失值与正确率变化曲线

4 结 论

泥石流的形成受多种因素的影响。通过对卷积神经网络添加残差模块能更好地提取泥石流沟谷图像的特征,防止过拟合现象,提高模型预测的正确率。利用残差网络对怒江流域的沟谷数字高程模型(DEM)图进行分类和预测是一种便捷有效的方法,但该方法仍存在很多不足之处,如DEM图只能体现沟 谷本身的特征,无法反映沟谷上的植被覆盖情况,而植被的覆盖情况和泥石流的发生有着密切的关系。其次,样本数量较少,容易出现偶然性,精度较差。最后本文的残差神经网络仍有很多改进的地方,卷积神经网络需要优化结构设计,寻找更高效的神经元和结构单元。

猜你喜欢

残差卷积正确率
基于全卷积神经网络的猪背膘厚快速准确测定
多级计分测验中基于残差统计量的被试拟合研究*
个性化护理干预对提高住院患者留取痰标本正确率的影响
基于图像处理与卷积神经网络的零件识别
用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*
课程设置对大学生近视认知的影响
基于深度卷积网络与空洞卷积融合的人群计数
卷积神经网络概述
生意
生意