APP下载

基于改进DeepLab网络的道路场景识别

2022-11-22吴佳丽毕春跃

物联网技术 2022年11期
关键词:解码器特征提取语义

吴佳丽,毕春跃,王 剑,赵 涵

(浙江万里学院 大数据与软件工程学院,浙江 宁波 315000)

0 引 言

近年来,随着社会生活水平的提高,汽车的数量呈现不断增长的趋势,极大地方便了人们的出行,但是也间接导致了大量交通事故的发生。为了保障车辆驾驶人员的安全和减少交通事故的发生,许多研究人员对自动驾驶技术展开了研究。自动驾驶技术主要包括三个部分:环境感知、决策、控制,其中环境感知的结果直接影响到后续模块,所以环境感知是整个自动驾驶技术的核心模块[1]。自动驾驶的环境感知一般在不断变化的道路场景下进行,为了保障自动驾驶的安全,要求尽可能地获取精准的环境信息。图像语义分割通过对道路场景的分割获取车辆前方道路、车辆等信息,是提高自动驾驶安全性的重要技术手段[2-3]。

传统的图像语义分割过程繁琐,很难适应多目标的分割任务[4-7];随着深度技术的发展,基于深度学习的图像语义分割开始出现,FCN使用端到端的图像分割[8],卷积神经网络在图像分割任务中的优势开始显现;SegNet池化层能保留记录信息空间位置[9],进一步提高分割的精度;U-Net在网络中使用跳跃连接优化了图像上采样的信息补充[10]。随后,一些基于卷积神经网络的改进图像语义分割方法不断涌现[11-14]。DeepLab是由谷歌提出的较成熟的图像语义分割系列[15-18],DeepLab V1通过结合空洞卷积增加网络的感受野[15],但分割目标边界模糊;DeepLab V2引入了空洞卷积金字塔模块(Atrous Spatial Pyramid Pooling, ASPP)实现了多尺度的特征提取[16];DeepLab V3提出了串行卷积和并行两种卷积的网络结构[17];DeepLab V3+采用了编码-解码的网络结构[18],其语义分割效果更优于DeepLab V3。但是直接将DeepLab V3+用于道路场景识别仍存在因细节信息丢失而导致分割目标区域模糊的问题。

本文以DeepLab V3+为基本结构网络,通过在编码器中进一步优化注意力机制,加强底层特征图与高层特征图的融合,弥补解码器模块大幅上采样带来的细节信息缺失,增强网络对目标区域边缘的提取能力,实现网络对道路场景识别的精细化分割。

1 面向道路场景识别的网络构建

本文基于DeepLab V3+构建了面向道路场景识别的改进网络,改进网络由编码器模块和解码器模块两部分组成,网络结构如图1所示。

图1 网络结构

改进网络编码器模块的主体为Xception骨干特征提取网络和ASPP两部分。Xception网络是Inception和深度可分离卷积融合后的演化网络,它先对输入图像做特征提取工作,特征提取包括四个步长为2的卷积模块和一个步长为1的模块,改进网络保留对Xception的前两个卷积Conv1、Conv2提取后的特征图,并作为解码器端的底层特征图;随后将Xception的输出作为ASPP模块的输入,ASPP模块并行了一个1×1的卷积、三个空洞速率分别为6、12、18的空洞卷积和一个图像池化模块,图像经过并行特征提取后相加融合,使用1×1卷积减少通道数后输出。

改进网络解码器模块的作用是将特征图逐步恢复成原输入图像大小,将编码器的输出经过四倍上采样操作与Conv2输出的底层特征图融合,随后经过两倍上采样后再与Conv1输出的底层特征图融合,经过3×3卷积后使用两倍上采样恢复到网络输入图尺寸,得到最后的图像语义分割图。

2 实 验

2.1 数据集

实验使用的数据是Cityscapes道路场景数据集,数据集一共设定了八个大类别标签:天空、车辆、行人、马路面、自然、建筑、物体和其他。Cityscapes数据集是道路场景中较为权威的数据,标注图像的范围广泛,有利于研究算法网络的泛化能力。

2.2 实验环境

实验采用TensorFlow1.14深度学习框架和Python语言作为开发环境,处理器为E5-2683,显卡为NVIDIA Tesla P-100,RAM为128 GB,初始学习率设置为0.000 5,batch size为32,训练步数为10 000次。

2.3 实验结果

将Cityscapes数据集输入原网络和改进网络进行训练,训练完成后得到模型,将测试集图片输入训练好的模型得到道路场景语义分割图片。为了验证改进网络的有效性,实验评价指标采用平均交并比(Mean Intersection Over Union,MIOU),计算公式如下:

表1 实验结果评价数据

实验结果对比如图2所示。由图可知,在道路场景提取时原网络的目标区域边缘粗糙;而在加强了底层特征和高层特征融合之后,使用改进算法改善了目标区域的提取边缘粗糙的问题,网络的道路场景语义分割性能得到了进一步提升。

图2 实验结果对比

3 结 语

考虑到DeepLab网络的解码器模块使用了大幅上采样,造成了特征图的细节缺失,本文提出了一种加强底层特征图和高层特征融合的改进网络,使得网络可以保留图像的更多细节特征信息,从而改善了道路场景语义分割的边缘粗糙问题,进一步提高了网络的分割性能。

猜你喜欢

解码器特征提取语义
科学解码器(一)
科学解码器(二)
科学解码器(三)
语言与语义
线圣AudioQuest 发布第三代Dragonfly Cobalt蓝蜻蜓解码器
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
“上”与“下”语义的不对称性及其认知阐释
认知范畴模糊与语义模糊
基于MED和循环域解调的多故障特征提取