APP下载

基于深度卷积网络的地理图像分类研究

2021-02-26张宝燕

电脑与电信 2021年11期
关键词:细粒度降维纹理

张宝燕

(晋中学院,山西 晋中 030600)

1 引言

得益于卫星技术、无人机技术、遥感技术和摄影技术的发展,大范围采集地理图像成为可能,这给我们对地理空间信息进行分析提供了基础。但是地理图像数据由于体量庞大,又对研究者进行深入分析提出了挑战。此外,将地理图像分为不同的类型也是一个十分困难的问题,与常规的图像分类不同,地理分类需要极其细微的特征,而地理图像中特征差别可能在视觉感官上差别不大,因此分类难度较大。如图1所示,其中可以看出,河流和道路在视觉感知上极为相似。

图1 不同类型的地理图像(左河流右道路)

深度学习技术的发展,为细粒度的地理图像分类奠定了基础,本文针对地理图像信息研究的图像分类部分进行深入研究,通过深度卷积神经网络对大规模地理信息图片进行监督学习,自动化地对大规模地理图像进行分类。本文提出的方法能够通过深度卷积神经网络提取出地理信息图像中的细粒度特征,采用多维融合的方式将特征进行融合,同时针对地理图像特征差异度小的问题,将模式识别与分类相结合,提高分类的准确率。

本文的主要贡献如下:(1)提出了一个有效针对地理图像分类的深度卷积网络;(2)将先验性知识加入模型中,进一步提高分类性能。

2 相关研究

本文主要针对地理信息图像的分类工作进行研究,关于图像分类的研究可以溯源到Haralick[1]于1973年提出的图像纹理分类一文,但是受到时代的限制,其方法有着极大的局限性。随着技术的进步,基于纹理的分类逐渐无法满足高精度的地理信息图像分类要求,随着机器学习算法的出现,图像分类逐渐进入到一个新的领域。

二十一世纪,随着计算机硬件设备的发展,基于深度学习网络的图像分类方法逐渐成为主流。He K[2]在2016年提出的ResNet 通过将残差连接用于特征重用和防止梯度消失方面,极大提高了图像分类的准确度。Huang[3]将原本相加的特征结合方式改为通道级别的相连,极大提高了特征重用效率。2017年Jie[4]将注意力机制引入到图像分类之中,与ResNet相比,其在不提高复杂度的基础上有效提高了分类的性能。Radosavovic[5]从设计网络空间并参数化网络整体的角度出发,提出了RegNet 网络,再一次提高了图像分类的性能。Zhang[6]结合注意力机制和特征加权聚合方法,高效地捕捉到同道关系模块,并将其置入到网络中进行训练,在分类、检测和分割的任务中都有显著提升。

针对地理图像分类的研究较少,Yang[7]提出了基于协方差的迭代优化框架来针对高分辨率航拍机图像进行分类,这是一种粗粒度的分类方式,能够在一定程度上解决地理图像分类的问题,但是对于仅存在细微差别的细粒度地理图像,其分类效果不佳。Aodha[8]将拍摄地点和时间信息作为外部输入信息加入到地理图像分类任务中,其提出的分类方法结合了时间先验性和空间先验性,极大提高了细粒度图像的分类效率,但是由于其分类准确率极大依赖于先验性信息,因此本文思考是否在不加入额外信息的前提下提高分类性能。此外,Dornik[9]针对土壤类型进行分类研究,Haw ryo[10]通过植被或土地覆盖面积进行分类等,都从不同的视角对地理图像分类进行了研究。

3 论文方法与实验数据

3.1 论文方法

为了提高细粒度层面的地理图像分类的准确度,我们参考了Aodha[8]的方法,引入外部标记信息,但是与其不同的是,本文提出的是一种改进的基于深度卷积网络的细粒度地理图像分类方法,该方法的主要框架如图2所示。

图2 本文的算法框架

本文主要使用了8层卷积神经网络,将标记好的地理信息图像输入到该网络中进行训练,具体步骤如下:

(1)收集地理图像数据集GImage=[GImage1,GImage2,…,GImagen],并 将其进行标记Label=[Label1,Label2,…,Labeln],本文共标记地理图像类别6 类,分别是森林、河流、水域、戈壁(荒漠)、城市和丘陵(山峰)。GImagei(i=1,2,…,n)意为第i类地理图像的集合,Labeli 表示第i类地理图像的标签集合。

(2)将地理信息数据集随机分为训练集和测试集,其中80%的数据作为训练集,20%的数据作为测试集。

(3)搭建模型,其中输入层为256*256*3 的地理信息图片,第1层至第6层为卷积层,每一层包含卷积层conv和池化层pool,池化层使用MAX 方法,除第1 层卷积层步长为4之外,其余卷积层的步长均为1。第7层和第8层为全连接层。

(4)使用训练集中的地理信息图像和对应标签进行训练,假设第i层为卷积层,那么当前层的第j个特征图的计算如公式(1):

池化层的特征计算如公式(2)所示:

全连接层的特征计算如公式(3)所示:

其中yi-1是第i-1层中所有特征图的加权结果。

3.2 实验数据

本文使用百度卫星地图作为数据源,我们随机采集了地图尺度为12-18 的图像20000 张,每张图片尺寸为256*256。数据集主要分为6类,具体如图3所示。

图3 地理图像分类(分别为森林、河流、水域、隔壁、城市和丘陵)

本文分别对上述内容进行人工标记,并将其中的16000张地理图像作为训练集训练分类模型,4000张地理图像作为测试集测试模型的准确率。

4 深度卷积网络分类算法

4.1 地理图像特征提取

本文根据3.1 节设计的卷积神经网络提取地理图像的特征,主要包括底层特征、底层组合特征、基本纹理特征、复合纹理特征、区域性特征以及具有类别性的分类特征。这些特征分别对应第1 到第6 卷积层,而网络最终输出结果是当前图像的所有特征图。其中各层特征具体如下:

第1层卷积核,主要提取地理信息图像的底层特征,包括边、线、角、弧等,其为组成地理信息图像的最基本单元。

第2层卷积核,主要提取由底层特征组合而成的图像特征,包括多边形、圆、椭圆等,第2层特征可以简单对应到地理信息图像中的湖泊轮廓、山脉轮廓等简单特征中。

第3层卷积核,主要提取地理信息图像的基本纹理特征,包括纹理的稠密程度和粗细程度,根据第3层特征可以对应到地理信息图像中繁茂程度不同的丛林,密集程度不同的水路网等。

第4层卷积核,主要提取地理信息图像的复合纹理特征,主要是基础纹理特征的组合,能够更加详细地对应到地理信息图中的组成成分。

第5层卷积核,主要提取地理信息图像中的区别性特征,即代表水域图像的大面积不规则仿圆多边形,代表森林的高密集数目等,该层特征已经能够在一定程度上体现出地理信息图像不同种类之间的差别。

第6层卷积核,主要提取地理信息图像中的完整的辨别性特征,该层特征能够很好地区分细粒度层面上的图像差别,例如河流和道路在周边环境中存在差别等,这些完整的辨别性特征能使我们的网络很好地对地理信息图像进行分类。

最后全连接层将全部特征进行计算,得出不同地理信息图像的高层特征。

4.2 深度特征降维与融合

全连接层将卷积层的不同级别特征进行融合,首先需要对特征进行降维,我们使用线性判别分类(Linear Discrim inant Analysis)进行降维。LDA是线性降维算法,其主要目的是使得降维后的数据特征更加容易被区分。

本文输入的地理信息图像为256*256,那么每个像素为一个特征,会有65536个特征,而对应的标签类别值有多种。这么多的特征不仅仅训练复杂,而且存在很多不必要的特征,因此必须要进行特征降维。我们给定特征为d维度的n个样例,其中n1个样例归为类别w1,n2个样例归则为类别w2。

本文的目标是尽可能地将原始特征进行降维,同时保证类别能够保持准确度的情况下映射到低维数据中,即当前降维之后的维度能够决定每种地理图像的类别。本文将最佳维度向量标记为w,那么样例x映射到w中的投影计算方式如下:

其中y表示的是x投影到直线上的点到原点的距离,其样本均值如下:

即投影后的高维信息均值就是地理信息图像维度中心点的投影。特征融合主要是全连接层对多维特征的融合,融合计算公式如下:

Y为整个网络训练之后的特征向量。

4.3 先验性知识

为了能够进一步提高图像分类性能,我们在训练开始之前引入了先验性知识。本文的先验性知识是除去基本标记之外的图像信息内容,例如在图1左中,本文除了标记该图像为河流图像外,还进行了更加细致的标记,具体为[河流,城市,丘陵],即将更加细节的标签信息进行标记。

由于地理信息图像的复杂性,在同一张图像中可能存在多种明显的地理特征,因此在分类中存在同一张图片的具有多种类别的情况,我们根据最高概率为主的方式,即分类器预测该图像为何种类别,则将该图像标位该类别。

5 实验结果及分析

本文在测试集中的分类结果具有较高的准确率,部分识别结果如图4所示。

图4 测试集分类结果

由图中可以看出,本文的深度学习网络对于城市、水域、戈壁、河流的分类结果较好,而对于丘陵和森林的分类结果相对较差,本文认为这是由于丘陵和森林在细粒度层面上的特征依旧较为相似所致,同时还由于丘陵往往由森林覆盖,因此在分类过程中较难明确当前地理信息图像是属于丘陵还是属于森林。

我们与Zhang[11],Wan[12]的方法进行对比,具体准确率如表1所示。

表1 三种算法的对比

6 结论

本文针对地理信息图像分类困难的问题,设计并提出了深度卷积网络框架,通过监督学习的方法有效地对地理信息图像进行分类。

此外,针对地理信息图像特征复杂的问题,本文使用LDA降维算法对高维地理信息图像进行降维,同时将先验性知识加入到网络训练之中。同时本文将地理信息图像的特征分为6个维度,分别为底层特征、底层组合特征、基本纹理特征、复合纹理特征、区域性特征以及类别特征。

本文与已有方法进行对比测试,根据结果显示,本文的方法的训练时间较长,但是准确率和平均误差有所提升。但是本文的方法依旧存在一些不足,例如对于森林图像和丘陵图像难以区分等,本文认为这是由于丘陵往往密布森林所致。除此之外,本文的算法效率依旧有较大的提升空间。

猜你喜欢

细粒度降维纹理
融合判别性与细粒度特征的抗遮挡红外目标跟踪算法
混动成为降维打击的实力 东风风神皓极
基于SVM多分类的超分辨图像细粒度分类方法
基于BM3D的复杂纹理区域图像去噪
降维打击
使用纹理叠加添加艺术画特效
基于web粒度可配的编辑锁设计
TEXTURE ON TEXTURE质地上的纹理
支持细粒度权限控制且可搜索的PHR云服务系统
消除凹凸纹理有妙招!