APP下载

基于SegNet模型的高原鼠兔的图像分割

2021-01-04陈海燕陈刚琦张华清

关键词:解码器海燕编码器

陈海燕,陈刚琦,张华清

基于SegNet模型的高原鼠兔的图像分割

陈海燕,陈刚琦,张华清

(兰州理工大学计算机与通信学院,甘肃 兰州 730050)

针对高原鼠兔图像目标尺寸小、背景复杂、特征不显著、基于活动轮廓的图像分割模型无法有效分割的问题,采用基于卷积神经网络的SegNet语义模型对高原鼠兔图像进行分割:首先将采集的高原鼠兔图像进行预处理,尺度归一化后制作成与Pascal VOC数据集格式一致的数据集;然后将数据集分为训练集与测试集,采用训练集对SegNet模型训练,测试集对模型进行分割测试。对高原鼠兔图像分割的试验结果表明:与基于活动轮廓的Chan_Vese模型相比,基于卷积神经网络的SegNet模型对高原鼠兔图像分割时的交并比、平均像素精度、Dice相似性指数和Jaccard指数分别提高了68.33%、9.35%、30.61%和47.98%,过分割率和欠分割率分别降低了87.20%、16.52%。

高原鼠兔;卷积神经网络;图像分割;SegNet;语义分割

高原鼠兔是青藏高原的优势鼠种之一[1],对维持高原草地的生态多样性和生态平衡起着重要作用。但当高原鼠兔过度增加时,又会对草地生态的平衡造成破坏[2-3]。对高原鼠兔进行长期监测,掌握鼠兔种群的动态变化规律,可以有效地对鼠兔进行掌控,对高原草地生态环境的保护具有重要意义。

传统的高原鼠兔监测是通过建立野外观测站、人工观测记录来统计高原鼠兔种群信息,不仅耗费大量人力、物力,而且不能对鼠兔进行长期连续的监测,采集到的数据还会受到人为因素的干扰[1,4]。智能监控则不仅节省人力、物力,而且可实现对高原鼠兔长期、连续的监测。

自然场景下高原鼠兔图像目标尺寸小,特征不显著,背景复杂,同时由于图像在拍摄和传输过程中产生的大量噪声,使得高原鼠兔图像分割十分困难。对高原鼠兔种群进行智能监测的关键是对高原鼠兔图像进行分割[5]。张爱华等[5]采用一种改进的Chan-Vese(CV)模型对高原鼠兔进行图像分割,与CHAN等[6]的CV模型相比,改进的模型采用了全局灰度信息引导曲线向目标边缘逼近,对前景灰度不均的图像具有更强的分割适应性,但该模型基于抽象程度较低的图像低层梯度特征,没有抽象出更高层的语义特征并用于图像分割,因此,在目标尺寸小、背景复杂、特征不显著的情况下,图像分割效果仍然欠佳。

相比较基于活动轮廓模型的图像分割方法,基于卷积神经网络的图像分割方法是利用卷积神经网络提取目标的语义特征,在获得高度抽象的语义特征的基础上,在原图像尺寸空间上对图像进行像素分类,进而获得图像分割结果[7],其中卷积神经网络提取的目标语义特征对于前景目标的辨识以及分割有着重要作用[8-9]。因此,笔者利用基于卷积神经网络的SegNet语义模型对高原鼠兔图像进行分割。

1 数据来源

使用佳能EOS70D单反相机,采用固定角度、固定高度拍摄的方法采集青藏高原东北部(东经101°35′36″~102°58′15″,北纬33°58′21″~34°48′48″)甘南草原的高原鼠兔图像。

对采集的高原鼠兔图像进行尺度统一处理,并制作与Pascal VOC数据集格式一致的数据集。数据集中共有1 100张高原鼠兔图像,其中800张图像作为训练集及验证集,300张图像作为测试集。

2 基于SegNet的图像分割模型的建立

用于高原鼠兔图像分割的SegNet模型共有4个编码器和4个解码器。每个编码器由1个卷积层、1个正则化层和1个下采样层构成;每个解码器由1个上采样层、1个卷积层、1个正则化层构成。每个编码器中使用下采样窗口尺寸为2、步长为2的最大池化进行下采样,解码器中采样参数与编码器中的采样参数相同;编码器以及解码器中的卷积核尺寸为7、步长为1、填充为3。每层的初始化参数来自经过预训练的VGG16网络。解码器以及编码器中的模型所用的损失函数为交叉熵损失。

模型训练过程(图1):首先将图像输入网络中,图像进入编码器中,经过若干编码单元下采样以及提取特征之后获得编码后的语义特征,然后将该结果送入解码器中进行特征恢复,每个解码器都将进行上采样以恢复尺寸,最后输出的最终语义特征图的尺寸空间与原图像一致。在该特征的基础上进行像素分类,即可获得最终的分割结果。在计算出损失之后,采用反向传播进行参数调整,直到损失降低到一定程度,即网络收敛。

图1 高原鼠兔图像分割的SegNet模型的训练过程

3 高原鼠兔图像的分割

为了综合评估所建立的SegNet图像分割模型的分割效果,与文献[5]中方法的分割性能进行对比。试验在搭载NVIDIA Titan V 显卡的工作站上进行,该工作站内存64G,操作系统为Ubuntu desktop LTS 16.04,实现模型所用的计算框架为Chainer[10]。采用定性和定量的方法评价模型的分割性能,定量指标为交并比(IOU)、平均像素精度(PA)、相似性指数(DSC)、过分割率(FPVF)、欠分割率(FNVF)和Jaccard指数。

模型训练完毕后,将训练集中的图像分别送入SegNet模型和文献[5]中的模型中进行分割。随机选取8张不同季节的高原鼠兔图像,分割结果如图2所示。可以看出,SegNet模型分割效果要优于文献[5]中模型的分割性能。

1~8 为SegNet模型分割结果;9 ~16 为文献[5]模型分割结果;17 ~24 人工手动标记轮廓。

在测试集上采用6个评价指标对2个模型的分割性能进行对比,结果列于表1。可以看出,SegNet模型的并交比比改进CV模型的提高了68.33%;平均像素精度提高了9.35%;相似性指数提高了30.61%,且相似性指数大于0.7;SegNet模型的Jaccard指数提高了47.98%;过分割率与欠分割率分别减小了87.20%与16.52%。SegNet模型性能均优于改进CV模型方法,且可对目标进行精准分割。这是因为基于SegNet的模型利用深度卷积神经网络提取了各个层次的语义特征,而语义特征的提取对前景目标的辨识以及分割有着重要作用。由于卷积神经网络多层次抽象的语义特征对背景变化鲁棒性强于低层特征,因此SegNet模型对背景复杂、目标特征不显著的高原鼠兔图像能取得更好的分割效果。

表1 定量的SegNet模型分割结果

4 结论

高原鼠兔的图像分割是对高原鼠兔进行数量统计和形态学研究的基础。针对传统基于低层特征的活动轮廓模型难以有效对背景复杂、目标特征不显著的高原鼠兔图像进行精确分割的问题,采用基于深度神经网络的SegNet模型提取不同层次的语义特征,在此基础上对高原鼠兔的图像进行分割,结果表明,所采用SegNet模型在对高原鼠兔的图像分割时,分割精度要优于以改进CV模型为代表的活动轮廓模型的图像分割方法。

[1] 张爱华,王帆,陈海燕.基于时空域联合信息的高原鼠兔运动目标检测[J].农业工程学报,2018,34(9):197-203.ZHANG A H,WANG F,CHEN H Y.Moving object detection ofbased on spatio- temporal imformation[J].Transactions of the Chinese Society of Agricultural Engineering,2018,34(9):197-203.

[2] 雷声.中国西部草原生态环境问题及其控制措施[J]. 中国资源综合利用,2019,37(9):140-142.LEI S.Grassland eco-environmental problems and control measures in western China[J].China Resources Comprehensive Utilization,2019,37(9):140-142.

[3] 曾鹂,赵燕兰,彭云煦,等.高原鼠兔扰动作用下高寒沙化草地土壤特性变化特征[J].草原与草业,2018,30(1):50-53. ZENG L,ZHAO Y L,PENG Y X,et al.Soil properties variety of alpine sandy grassland under perturbation of[J].Grassland and Prataculture,2018,30(1):50-53.

[4] 李苗,马玉寿,李世雄,等.控制高原鼠兔对不同退化高寒草甸植物群落特征的影响[J].青海大学学报(自然科学版),2016,34(3):41-47. LI M,MA Y S,LI S X,et al.Effect of controlling theon plants community characteristics in different degraded alpine meadow[J].Journal of Qinghai University(Natural Science),2016,34(3):41-47.

[5] 张爱华,王帆,陈海燕.基于改进CV模型的高原鼠兔图像分割[J].华中科技大学学报(自然科学版),2017,45(8):32-37. ZHANG A H,WANG F,CHEN H Y.image segmentation based on the improved CV model[J].Journal of Huazhong University of Science and Technology(Nature Science Edition),2017,45(8):32-37.

[6] CHAN T F,VESE L A.Active contours without edges[J]. IEEE Transactions on Image Processing,2001,10(2):266-277.

[7] 熊炜,童磊,金靖熠,等.基于卷积神经网络的语义分割算法研究[J].计算机应用研究,2019,38(3):1-5.XIONG W,TONG L,JIN J Y,et al.Research on semantic segmentation algorithm based on convolutional neural network[J].Application Research of Computers,2019,38(3):1-5.

[8] ZOU Z,SHI Z,GUO Y,et al Object detection in 20 years:a survey[J/OL].ar Xiv preprint(2019-05-13) [2019-09-15].https://arxiv.org/abs/1905.05241.

[9] 魏晗,李弼程,张瑞杰,等.图像语义提取方法研究[J].现代电子技术,2011,34(24):103-106.WEI H,LI B C,ZHANG R J,et al.Research on image semantic extraction[J].Modern Electronics Technique,2011,34(24):103-106.

[10] TOKUI S,OONO K,HIDO S,et al.Chainer:a next- generation open source framework for deep learning[C]// Proceedings of workshop on machine learning systems (LearningSys) in the twenty-ninth annual conference on neural information processing systems(NIPS),2015:1-6.

Image segmentation ofbased on SegNet model

CHEN Haiyan, CHEN Gangqi, ZHANG Huaqing

(Department of Computer and Communication, Lanzhou University of Technology, Lanzhou, Gansu 730050, China)

To solving the problem that the image segmentation algorithm based on active contour cannot effectively segment the images ofwith small target, complex background and insignificant features,the SegNet semantic model based on convolution neural network was used to segment the images of. Firstly, the images ofwere preprocessed to make data set consistent with Pascal VOC data set format after scale normalization. Then, the data set was divided into training set and testing set. The training set was used to train the SegNet model, and the testing set was used to estimate the performance of SegNet model. The experimental results of images segmentation forshow that compared with the CV model based on active contour, the intersection over union, mean average precision, similarity index, and jaccard index of the SegNet semantic model based on convolution neural network improved 68.33%, 9.35%, 30.61% and 47.98%, respectively. The false positive volume function and false negative volume function of the SegNet semantic model based on convolution neural network decreased 87.20% and 16.52%, respectively.

; convolutional neural network; image segmentation; SegNet; semantic segmentation

TP391

A

1007-1032(2020)06-0749-04

陈海燕,陈刚琦,张华清.基于SegNet模型的高原鼠兔的图像分割[J].湖南农业大学学报(自然科学版),2020,46(6):749-752.

CHEN H Y, CHEN G Q, ZHANG H Q. Image segmentation ofbased on SegNet model[J]. Journal of Hunan Agricultural University(Natural Sciences), 2020, 46(6): 749-752.

http://xb.hunau.edu.cn

2019-11-06

2020-01-10

国家自然科学基金项目(61362034、62061024)

陈海燕(1978—),女,甘肃陇西人,博士,副教授,主要从事图像处理研究,chenhaiyan@sina.com

10.13331/j.cnki.jhau.2020.06.017

责任编辑:罗慧敏

英文编辑:吴志立

猜你喜欢

解码器海燕编码器
融合CNN和Transformer编码器的变声语音鉴别与还原
科学解码器(一)
转炉系统常用编码器选型及调试
科学解码器(二)
科学解码器(三)
舞台机械技术与设备系列谈(二)
——编码器
线圣AudioQuest 发布第三代Dragonfly Cobalt蓝蜻蜓解码器
Friendship
赏春
赏春