基于快速去噪和深度信念网络的高光谱图像分类方法
2016-12-29欧阳宁
高 鑫,欧阳宁,袁 华
(桂林电子科技大学 信息与通信学院,广西 桂林 541004)
基于快速去噪和深度信念网络的高光谱图像分类方法
高 鑫,欧阳宁,袁 华
(桂林电子科技大学 信息与通信学院,广西 桂林 541004)
为了改善传统分类方法在高光谱遥感图像去噪和特征提取方面的不足,提出了一种基于快速去噪和深度信念网络的高光谱图像分类方法。该方法利用图像的二阶偏导数和梯度共同控制扩散速度,采用改进的自适应扩散系数对不同区域进行扩散,并利用深度信念网络对去噪后的图像进行地物分类。实验结果表明,与传统的分类方法相比,该方法提高了高光谱图像地物分类的精度。
去噪;高光谱;深度信念网络;图像分类
遥感技术[1]是一种利用安装在卫星等航空飞行器上的成像设备对地面物体进行光谱信息收集的一门技术。在遥感技术蓬勃发展的今天,通过卫星上的遥感仪器,人们可以对地球表面诸如森林、草地、农作物、动物、土壤、水和矿物等资源实施监控[2]。
目前,主要使用人工神经网络ANN[3]、支持向量机SVM[4-5]等方法进行高光谱图像的分类工作。2006年,Hinton等[6]提出深度信念网络DBN,使深度学习作为机器学习的一个新兴研究方向。虽然DBN网络模型在高光谱图像的分类上取得了不错的效果,但该方法对高光谱数据的去噪处理还停留在简单去除噪声波段[7],未对去除噪声波段后的数据进一步去噪。针对这一问题,对传统的扩散平滑算法进行了改进,提出一种自适应扩散系数和联合边缘检测的算法,对高光谱图像进行去噪处理,再利用深度信念网络对图像进行分类。
1 基于改进的扩散平滑和限制玻尔兹曼机的特征提取及分类
利用图像的二阶偏导数和梯度作为边缘检测,共同控制扩散速度;引入自适应扩散系数,对不同梯度区域利用对应的扩散系数进行不同程度的平滑处理,在去除噪声的同时最大程度保留图像的细节和边缘信息。
将经过扩散平滑处理得到的数据进行重组和分批操作,输入到多层限制玻尔兹曼机网络进行训练,输出的权值向量作为BP神经网络的输入,最后实现地物分类。系统框图如图1所示。
图1 系统框图Fig.1 System diagram
2 基于改进的自适应扩散系数和联合边缘检测的图像去噪方法
高光谱遥感图像在获取和传输过程中容易受传感器、外界环境等因素的影响,存在很多噪声。为了减小噪声对特征提取的影响,除了剔除噪声波段和吸水波段,还需要对数据进一步去噪。
对经典的各向异性扩散模型[7]进行改进,将图像的二阶偏导数和梯度相结合作为新的边缘检测,并结合自适应扩散系数,对高光谱遥感图像进行快速去噪。
2.1 PM模型
PM模型利用梯度算子判断图像的梯度变化是由噪声引起的还是由边缘引起的,然后利用邻域加权平均的方法,将由噪声造成的梯度变化消除,将由边缘信息造成的梯度突变保留,如此重复迭代,直到将噪声都消除为止。
热传导微分方程:
(1)
其中:||表示幅度;k为阈值,用来控制扩散的尺度。
2.2 改进的模型
虽然PM模型在平滑消除噪声的同时尽量保留了特征,但实际应用中仍存在诸多问题:首先,对于小范围内的噪声和梯度变化很大的区域去噪效果不理想;其次,在强噪声干扰情况下的去噪效果很差;另外,控制扩散平滑的阈值k因为没有一个统一的标准和理论公式计算,所以很难选取。针对PM模型的不足,提出2点改进方法:
1)引入图像的二阶偏导数,利用二阶导数和梯度共同控制扩散速度。
2)针对梯度的阈值参数,设计了3个不同的扩散系数,利用新的边缘检测选择对应的扩散系数,对不同的区域进行不同程度的扩散平滑,使得模型在整个图片区域的扩散效果都比较理想。
改进后的扩散系数为:
其中:*表示卷积;α、β为连贯系数,满足α+β=1,保证扩散函数的连续性。
微分方程为:
2.3 实验结果及分析
为了验证模型改进后的实际效果,从高光谱遥感图像中选取一个波段的图片,对其加入不同强度的随机噪声进行实验。改进后的模型去噪效果如图2所示。
图2 改进后模型的去噪效果Fig.2 Denoising effect of the improved model
在主观视觉上,从图2(b)可看出,PM模型能够滤除大部分的噪声,特别在梯度值相近的区域,效果明显。但是在一些边缘信息并不明显的区域,平滑的程度开始变得不稳定,有些平滑效果太弱,使得去噪效果不明显;另外,在一些地方出现了平滑幅度过大的情况,造成边缘轮廓模糊的现象。从图2(c)可看出,改进模型利用自适应扩散系数,结合新的边缘检测,使得模型能够很好地将噪声和边缘区分开,在最大限度地滤除噪声的同时,尽可能多地保留边缘信息。可见,改进模型是可行的。
3 基于深度信念网络的高光谱图像分类
深度信念网络(deep belief networks,简称DBN)结合了监督学习和非监督学习的优点,使用多层限制玻尔兹曼机(restricted Boltzmann machine,简称RBM)训练样本,利用BP算法实现对网络的微调,在挖掘抽象特征方面具有很强的能力,对于构建逐层抽象网络系统具有很大的优势。图3所示为RBM的网络结构。
图3 RBM网络结构Fig.3 RBM network structure
图3中,n为可见层神经元的个数,m为隐藏层神经元的个数,v=(v1,v2,…,vn)为可见层的状态向量,h=(h1,h2,…,hm)为隐藏层的状态向量,a=(a1,a2,…,an)为可见层的偏置向量,b=(b1,b2,…,bm)为隐藏层的偏置向量。
3.1 深度信念网络
为了提取样本抽象的特征规律,采用多层RBM构建网络。将RBM按层堆叠,下面的隐藏层作为上一层网络的输入端,以此类推,构建DBN网络模型。
图4为三层RBM构建的DBN网络结构。其中,最底层RBM的可见层作为输入端接收样本,每一层RBM的隐藏层同时也是下一层的可见层,最顶层RBM的输出会连接一个逻辑回归层,作为分类器的输入。
图4 三层RBM构建的DBN网络结构Fig.4 DBN constructed by three layers of RBM
整个DBN网络模型的训练过程有2个阶段:无监督训练和有监督训练。无监督训练要先初始化网络的权值等参数,将无标签的样本输入到可见层的各个节点,然后用CD算法逐层训练,直到所有的RBM层都训练完毕。接着,在有监督训练部分,底部的逻辑回归层接收上一层输出的数据,并结合有标签的训练集,利用误差反向传播算法,有监督地训练实体关系分类器。误差反向传播系统优化了网络的输出权值,并改善了BP网络因初始权值设置不合理易陷入局部最优解的情况,提高了网络的性能。
3.2 数据重组及分批
为了得到更好的分类效果并提高系统效率,将去噪后的数据进行重组和分批:先将a幅m×m的图片拉伸为a列m2×1的矩阵存储,再将每一列平均分为c份,每份含有b个元素,这样处理的数据便于批量训练和制作标签。数据重组和分批过程如图5所示。
图5 数据重组和分批Fig.5 Data reorganization and partial
3.3 方法流程
1)将经过几何校正和大气校正的高光谱数据中的噪声波段和吸水波段剔除,采用改进的去噪模型进行去噪。
2)将数据进行重组并分批。
3)按批次将数据输入第一层RBM,输出的权值和偏置作为第二层RBM的输入,以此类推,经过N层训练,得到权值向量以及隐藏层和可见层的偏置向量。
4)将最后一层RBM网络输出的权值向量作为BP神经网络的输入,最后进行分类。
改进的高光谱遥感图像特征提取和分类方法流程如图6所示。
图6 特征提取和分类方法流程图Fig.6 Flow chart of feature extraction and classification method
4 实验仿真及结果分析
4.1 实验数据和评估指标
实验环境:在CPU为Intel至强E3-1230 V3,内存为DDR3 8 GB ,显卡为GTX660 2GB的PC机上,利用Matlab R2012a进行实验仿真。
实验采用的数据是美国国家航空航天局喷气推进实验室用AVIRIS系统在1992年拍摄的印第安纳州西北部松树场景高光谱遥感图像。该数据光谱分辨率为10 nm,空间分辨率为20 m×20 m,包含224个波段的光谱信息,每个波段图像的分辨率为144像素×144像素。图7为某一单波段的地物场景。图8为对应的地物标识。
图7 单波段地物场景Fig.7 Single band scene
该高光谱数据对应的地物有16种,分别为Corn-Notill、Grass/Pasture、Grass/Trees、Hay-Windrowed、Soybeans-Notill、Soybeans-Mintill、Soybeans-Clean、 Woods、 Alfalfa、 Corn-Mintill、Corn、
图8 地物标识Fig.8 Object identification
Grass/Pasture-moved、Oats、Wheat、Bldng-Trass-Trees、Stone-Steel-Tower。表1所示为16种地物的样本数目。
表1 16种地物的样本数目
选取16种地物中的Corn-Notill、Grass/Pasture、Grass/Trees、Hay-Windrowed、Soybeans-Notill、Soybeans-Mintill、Soybeans-Clean和Woods这8类地物,共计8511个样本进行分类实验。图9为重新制作的8类地物标识。
图9 八类地物标识Fig.9 Object identification of eight kinds of objects
利用混淆矩阵来反映分类结果与地物真实情况的相关信息,通过分析混淆矩阵,采用总体分类精度、平均分类精度和Kappa系数作为实验的参考参数判断算法的性能。混淆矩阵通过将每个实测像元的位置和分类与分类图像中的相应位置和分类相比较计算。
对于混淆矩阵A,假设矩阵大小为m×m,样本种类即为m。设aii为正确分类到第i类的样本数目,aij为错分的样本数目,测试样本总数为:
;
(8)
第i行元素之和为:
;
(9)
第i列元素之和为:
(10)
Kappa系数使用一种多元离散分析技术表示分类效果与标识数据间的吻合程度。Kappa系数为
;
(11)
总体分类精度为
;
(12)
平均分类精度为
(13)
4.2 参数设置实验
通过查阅相关文献[9]并经过多次试验,将RBM的参数设置为:权重学习率为0.1,可见层偏置学习率为0.1,隐藏层偏置学习率为0.1,权重为0.000 2,初始动量为0.5,最终动量为0.9。
4.2.1 迭代次数实验
通过反复试验发现,迭代的次数对分类结果有很大影响。若迭代次数过小,则数据不能很好地描述较抽象的特征;若迭代次数过大,则实验花费在训练样本上的时间将大大增加。
为了让模型能够充分提取高光谱图像数据的特征,同时考虑到训练时间,设置不同的迭代次数,对最后一层RBM结构的权值进行观察。图10为不同迭代次数下第三层RBM的权值。从图10可看出,当迭代次数较小时,显示的特征杂乱无章。随着迭代次数的增加,权值的特征趋于稳定,在迭代次数达到80次以上,权值趋于稳定。为了进一步确认,在比较不同迭代次数下系统最终的分类精度后,同样证实当迭代次数达到80次以上,分类效果最佳,此时继续增加迭代次数分类效果提升也不明显。
图10 不同迭代次数下第三层RBM的权值Fig10 The weights of the third layer RBM with different iteration times
4.2.2 网络模型深度实验
LE ROUX等[10]指出深层的网络结构对特征提取很有益,增加RBM的层数可提高网络的特征提取能力,使得网络能够更深入地挖掘抽象特征。为此,将网络设置为20层,发现效果并不理想。在查阅文献[11]后发现,实验采用的数据与手写字体库以及人脸识别库相比数据量偏小,使得网络在训练样本时出现了过拟合的现象,降低了网络的泛化性能。图11为不同网络深度下的输出权值。经过反复实验发现,使用3层RBM进行特征提取效果最佳。
图11 不同网络深度下的输出权值Fig11 Output weights in different network depth
4.3 实验结果分析
实验采用改进的扩散平滑算法对高光谱图像进行去噪,然后利用DBN网络实现对高光谱遥感图像的分类。将该方法与SVM方法、RBM+SP方法以及未改进的DBN方法进行对比,几种方法的分类效果如图12所示,评估分类结果的参数如表2所示。
从图12(a)可看出,SVM方法对Corn-Notill的分类效果很差,大部分都被错分为Soybeans-Mintill;Soybeans-Clean也有一部分被错分为Soybeans-Mintill。表2的实验数据反映该方法对地物Corn-Notill的分类精度只有58.67%。
图12(b)和图12(c)使用的2种方法均采用了多层RBM训练网络对数据进行处理,对比图中标注的区域可看出,这3种方法在一定程度上改善了漏分、误分的现象,特别是采用DBN网络的方法,由于BP神经网络的误差反向传播特性,能够对系统进行微调,使得图12(c)和图12(d)使用方法的分类效果比图12(b)使用的方法更好。
图12 4种方法的分类效果图Fig.12 The classification effect of four methods
图13为经去噪处理的图像和未经去噪处理的图像在DBN网络下的分类结果对比。从图13可看出,使用图12(d)改进的扩散平滑算法进行去噪处理后,
分类效果有一定提升。表2中的数据也显示新方法对Corn-Notill、Grass/Trees、Grass/Pasture、Hay-Windrowed、Soybeans-Notill和Soybeans-Mintill这几类地物的分类效果比未经过改进的DBN方法均有所提升。
图13 去噪前后DBN分类结果对比Fig.13 Comparison of DBN classification results before and after denoising
实验表明,新方法在主观视觉效果和客观评价参数都优于比较的几种算法,改善了DBN系统在去噪方面的不足,对高光谱遥感图像有很好的分类效果。
表2 各方法分类结果
5 结束语
针对DBN网络在去噪方面的不足,提出了一种基于改进的扩散平滑和深度信念网络的高光谱图像分类方法。该方法利用图像的二阶偏导数和梯度共同控制扩散速度,并针对不同区域使用自适应扩散系数对高光谱图像进行去噪,利用DBN网络实现对高光谱遥感图像的分类。实验结果表明,提出的算法在各类地物分类效果以及总体分类精度上相比其他算法都有所提高。新方法在去噪方面仍有改进的空间,可以结合深度学习在数据挖掘方面的优势进行更好的去噪处理。该方法优化后将在城市规划、农业生产和森林植被调查等领域有很好的应用前景。
[1] KWON H,HU Xiaofei,THEILER J,et al.Algorithms for multispectral and hyperspectral image analysis[J].Journal of Electrical and Computer Engineering,2013(2):1-16.
[2] AHMAD M,LEE S,HAQ I U,et al.Hyperspectral remote sensing:dimensional reduction and end member extraction[J].International Journal of Soft Computing and Engineering,2012,2(2):256-271.
[3] 都业军,周肃,方吉宙.人工神经网络在遥感影像分类中的应用与对比研究[J].测绘科学,2015(增刊1):53-123.
[4] 谭琨,杜培军.基于支持向量机的高光谱遥感图像分类[J].红外与毫米波学报,2008,27(2):123-128.
[5] NIU X,BAN Y F.A novel contextual classification algorithm for multitemporal polarimetric SAR data[J].IEEE Geoscience and Remote Sensing Letters,2014,11(3):681-685.
[6] HINTON G E,SALAKHUTDINOV R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313:504-507.
[7] 张芳,崔学英,张权,等.基于变指数各向异性扩散和非局部的最大似然期望最大低剂量CT重建算法[J].计算机应用,2014,34(12):3605-3608.
[8] 张春霞,姬楠楠,王冠伟.受限波尔兹曼机[J].工程数学学报,2015,32(2):159-173.
[9] LUO X,ZHAO C,PAN J,et al.Remote sensing image Intelligent classification and its application[J].Publishing House of Electronics Industry,2011,8(2):19-27.
[10] LE ROUX N,BENGIO Y.Representational power of restricted Boltzmann machines and deep belief networks[J].Neural Computation,2008,20(6):1631-1649.
[11] LAROCHELLE H,BENGIO Y,LOURADOUR J,et al.Exploring strategies for training deep neural networks[J].Journal of Machine Learning Research,2009,10(10):1-40.
编辑:翁史振
A hyperspectral image classification method based on fast denoising and deep belief network
GAO Xin, OUYANG Ning, YUAN Hua
(School of Information and Communication Engineering, Guilin University of Electronic Technology, Guilin 541004, China)
In order to improve the shortcomings of the traditional classification methods in hyperspectral remote sensing image denoising and feature extraction, a hyperspectral image classification method based on fast denoising and deep belief network is proposed. The method uses the second partial derivative of the image and the gradient to control the diffusion velocity, and uses an improved adaptive diffusion coefficient of diffusion in different regions. Finally the depth of belief network is used for denoising images to classify these terrain features. The experimental results show that compared with the traditional classification methods, the proposed method obviously improves the classification accuracy of the remote sensing image.
denoising; hyperspectral; deep belief network; image classification
2016-03-05
国家自然科学基金(61362021);广西自然科学基金(2013GXNSFDA019030,2013GXNSFAA019331,2014GXNSFDA118035);广西科学研究与技术开发计划(桂科攻1348020-6,桂科能1298025-7);桂林电子科技大学研究生教学创新计划(YJCXS201531)
欧阳宁(1972-),男,湖南远宁人,教授,研究方向为智能图像处理、智能信息处理、数据融合、计算机应用等。E-mail:2930530@qq.com
高鑫,欧阳宁,袁华.基于快速去噪和深度信念网络的高光谱图像分类方法[J].桂林电子科技大学学报,2016,36(6):469-476.
TN751.1
A
1673-808X(2016)06-0469-08