APP下载

多特征联合的高光谱图像分类方法研究

2021-12-20侯建国

黑龙江工程学院学报 2021年6期
关键词:光谱精度分类

侯建国, 刘 江,王 强

(黑龙江工程学院 测绘工程学院,哈尔滨 150050)

高光谱成像(HSI)研究光与被观测物质如何相互作用,从而测量从某一物体或目标发射、反射或透射的光量。HSI传感器通常工作在0.4~2.5 μm光谱区域,从被观测物质中捕捉可见和太阳反射的红外光谱,即近红外NIR以及短波红外SWIR[1]。高光谱图像就是在电磁波谱可见光到红外区域获取数百个精细狭窄的连续光谱波段的图像。高光谱图像中每个像元可以用向量来表示,向量的维度就是高光谱图像的波段数。由于向量的每个成分都对应特定的测量值,因此,每个像元含有丰富的光谱信息,这些光谱信息可以反映感兴趣对象的物理结构和化学组成。相比传统的成像系统,丰富的光谱信息有助于更好地识别地物和目标[2]。高光谱图像不仅用于军事目标探测、城市土地规划和植被覆盖分析,还用于医学和健康、植被病虫害分析等领域[3]。如何在高光谱图像中充分地利用这些信息,并从中提取出感兴趣的信息成为研究的热点和难点,在这种情况下高光谱遥感图像分类成为一个比较重要的研究方向。

高光谱图像计算机分类就是利用计算机对高光谱图像中丰富的地物光谱信息和空间信息进行分析和处理,将图像中像元按照某种机制划分不同的类别,从而实现高光谱图像的分类。一般来说,高光谱图像分类方法分为非监督分类、半监督分类和监督分类[4]三类。高光谱图像非监督分类利用像元向量的相似性进行自动分类,这种分类方法不需要类别的先验知识和引入较小的人为误差,但仍需要后续处理和分析,才能获得可靠的分类结果。例如当某类地物光谱不同时就增加了分类难度。半监督分类是监督分类与非监督分类相结合的一种学习方法。半监督分类使用小样本类别先验知识进行模式识别工作,这种方法通常需要一定理论假设且具备较差的抗干扰能力。与非监督分类和半监督分类方法不同,监督分类方法中类别先验知识得到了充分利用,且监督分类抗干扰能力强于半监督分类法,并能避免非监督分类中的光谱聚类重分类。当下垫面的类型看起来类似时,传统的基于像元分类方法导致对高光谱图像进行处理和分析时产生较大误差,原因有:第一,大多数情况下像元的光谱由多种地物光谱综合而成;第二,下垫面的不同部分处于不同的条件下,它们中的一些被太阳光直接辐射,而另一些则处于阴影中只被反射光或散射光辐射;此外,相对于辐射源和传感器,下垫面具有不同的朝向并且环境湿度不同,由于层层之间的二向反射(如水、土壤、植被等),导致辐射明显失真[5]。

光谱和空间特征提取经过几十年的研究已经成为高光谱遥感中充满活力的领域,并取得较大的进展。典型的光谱特征提取方法包括主成分分析法(PCA)[6]、独立主成分分析法(ICA)[7]、线性判别分析法(LDA)[8]、最小噪声分离变换法(NNFT)[9]、植被指数法[10]、水体指数法[11]等,这些方法只是利用高光谱图像的光谱特征,并没有充分利用其空间特征,然而,高光谱图像包含光谱和空间两种信息。研究表明,同时利用像元特征、该像元临近像元特征等特征,即光谱特征、空间特征等,则有助于提高高光谱图像分类结果的可靠性。常见的图像空间特征有纹理特征、形态学特征、空间坐标特征等[12],常用的空间特征提取方法有离散小波变换(DWT)[13]、Gabor滤波[14]、局部二进制模式(LBP)[15]、图像分割法等。FAUVEL等[16]验证了光谱特征和空间特征结合分类的有效性,提取空谱特征联合分类并划分为同步处理和后处理两种策略。HUANG[17]从灰度共生矩阵提取空间特征,对特征进行主成分分析,选择主成分作为最大似然分类器的输入特征,对高光谱数据进行分类。HE等[18]将多尺度超像素局部保持映射应用于提高高光谱图像分类精度。RANJAN等[19]利用独立成分分析提取光谱独立成分,然后采用边缘保持滤波产生空间特征,最后使用随机森林的方法对这些特征进行分类。为了提高高光谱图像分类精度,研究人员付出大量的努力,建立各种分类器,如随机森林、神经网络、支持向量机(SVM)和深度学习、强化学习以及广泛的学习系统[20]。虽然国内外对高光谱遥感图像分类展开了广泛的研究,但是很多高光谱遥感图像分类采用欧美的标准数据集进行研究,一方面这些数据较小,通常为几十上百兆;另一方面也是因为缺乏丰富的植物类型数据,因此,为了研究较大数据量高光谱图像植物精细分类性能,文中利用雄安新区马蹄湾村航空高光谱图像(3.76 G),研究一种多特征联合的高光谱图像分类方法。首先对高光谱图像进行最小噪声分离变换(NNF),同时提取对应纹理特征;然后计算高光谱图像归一化植被指数(NDVI)和归一化水体指数(NDWI);最后联合上述3类特征,采用最大似然法、支持向量机(SVM)和随机森林法分别进行地物精细分类,并对分类后结果进行分析和评价,研究不同特征组合方式、分类方法在植被类型丰富区域航空高光谱图像数据大时对不同植被区分能力的差异,为地物精细分类提供理论和实践支撑。

1 材料与方法

1.1 数据源

实验所用数据为中国科学院遥感与数字地球研究所发布的雄安新区马蹄湾村航空高光谱遥感数据集,如图1所示,该数据集包含航空高光谱图像和地物类别标注图。航空高光谱遥感影像如图1(a)所示,其光谱范围为400~1 000 nm,波段250个,影像大小为3 750×1 580像元,空间分辨率0.5 m。通过开展与航空飞行同步地物类别实地调研,最终获取该区域20种典型地类(水稻茬、草地、榆树、白蜡、国槐、菜地、杨树、大豆、刺槐、水稻、水体、柳树、复叶槭、栾树、桃树、玉米、梨树、建筑、裸地和稀疏林)的 ROI 及示意图,如图1(b)所示,主要以经济作物为主[21]。航空高光谱图像已完成辐射定标、大气校正和几何纠正等相关预处理,其中,利用FLASSH进行快速大气校正,得到影像反射率数据,并乘以1 000保存,该数据集具有光谱分辨率高、空间分辨率高、地物类别多等特点,可为高光谱精细分类研究提供良好的数据支持,其存储为.img和.tif格式,数据量为3.78 GB。下载方式为http://www.hrs-cas.com/a/share/shujuchanpin/2019/0501/1049.html。

图1 雄安新区马蹄湾村航空高光谱遥感数据

1.2 最小噪声分离变换

由于航空高光谱图像在经过预处理后仍含有大量的噪声,影响图像分类的精度,同时由于高光谱图像波段数过多,也容易引发分类的hough现象,因此,将最小噪声分离变换(NNF)引入高光谱图像噪声压制的研究中,变换后选择信噪比高的NNF成分进行后续处理,也能达到图像降维的目的,从而提高图像分类的精度和速度。假设高光谱图像为n个像元、m个波段的数据集,组成n行m列的矩阵X,最小噪声分离变换就是通过一组正交变换将原始高光谱图像转化为一组新变量,有

Yi=aiX,i=1,2,…,m.

(1)

高光谱图像数据经过最小噪声分离变换后各NNF成分各自独立,NNF成分按噪声分数从小到大排列,噪声分数为各NNF成分噪声方差与整体方差之比,即

(2)

式中:CN为高光谱图像噪声协方差矩阵;CX为高光谱图像协方差矩阵。这一问题可以通过求解广义瑞丽熵得以解决。

1.3 NDVI和NDWI计算

NDVI是反映土地覆盖植被状况的一种遥感指标,定义为近红外波段与可见光波段反射率之差与之和的商,对于文中高光谱图像数据,其计算公式为

(3)

式中:ρ670,ρ800为中心波长为670 nm、800 nm处波段的反射率数据。

NDWI是凸显遥感图像中水体信息的一种遥感指标,定义为绿波段与近红外波段反射率之差与之和的商,对于文中高光谱图像数据,其计算公式为

(4)

式中:ρ560,ρ860为中心波长在560 nm、860 nm处波段的反射率数据。

1.4 SVM分类法

SVM本质上是综合结构风险最小化理论、优化理论和核函数的线性分类器。它涉及到两个方面即线性可分和线性不可分。考虑线性不可分情况,此时的优化函数为

(5)

1.5 Softmax分类法

p(l(I)|xI;Θ)=yp(xI;Θ)=

(6)

1.6 随机森林分类法

随机森林是一种用于分类(和回归)的集成学习方法,通过构建大量决策树{h(x,Θk)}对样本进行训练并预测,最终分类结果由众多决策树分类器投票决定,这里{Θk}是独立且相同分布的随机变量。为了构造K棵决策树,随机森林首先产生k个彼此独立且分布相同的随机向量(Θ1,Θ2,…,Θk);然后基于给定的训练样本和随机向量构建随机森林分类器h(x,Θi),i∈[1,k],其中,x是输入变量(或者说被分类变量)。在进行分类任务时,新的被分类变量进入,就让森林中的每一棵决策树分别进行判断和分类,每个决策树会得到一个自己的分类结果,然后组合所有决策树的分类结果,按多棵树分类器投票的方式决定最终分类结果,投票模型为

(7)

式中:HR(X)为组合分类模型;I(h(X,Θi)为第i棵决策树分类结果。

1.7 多特征联合的机载高光谱遥感图像分类方法

文中联合高光谱图像光谱特征、空间特征和指数特征,研究机载高光谱遥感图像地物类别精细分类方法,具体流程如图2所示。首先,分别对高光谱遥感图像进行最小噪声分离变换,提取NNF特征图像,选择SNR高的NNF特征图像,对其进行纹理分析,提取纹理特征图像,同时对高光谱遥感图像计算植被指数和水体指数,获取NDVI特征图像和NDWI特征图像;然后联合NNF特征、纹理特征、NDVI特征和NDWI特征,利用训练样本进行监督分类,采用的分类方法有最大似然法、支持向量机(SVM)法、Softmax法和随机森林法;最后检查样本并评定各种分类结果,研究基于多特征联合的高光谱图像分类方法的可靠性。

图2 基于多特征联合的高光谱图像分类方法技术流程

2 实验及分析

实验所使用数据分别为雄安新区马蹄湾村航空高光谱图像,训练样本和检查样本分别从对应的地物标注图中选取。对航空高光谱遥感影像进行NNF变换,提取影像信噪比高的主成分;然后基于图像灰度共生阵提取每个主成分对应的8种空间纹理特征,包括均值、方差、均质性、对比度、异质性、熵、二阶矩和相关性;同时计算对植被和水体敏感的NDVI 和NDWI;联合光谱特征、纹理特征和指数特征,利用最大似然法、SVM、Softmax法和随机森林法分别对研究区遥感图像进行分类,最后利用检查样本评定上述分类方法,分析不同特征融合对后续信息提取的影响,以及选择合适的特征组合方式和分类方法用于地物精细分类。从特征联合的角度出发,实验采用两种方案:方案一联合NNF前5个特征、对应空间纹理特征、NDVI和NDWI,总计47个特征;方案二联合NNF前11个特征、对应空间纹理特征、NDVI和NDWI,总计101个特征。两种方案分类训练样本和检查样本选择分层抽样方式获得。

图3是方案一分类结果,其中,图3(c)、(d)和(e)的分类方法都是SVM,对应的核函数分别是线性函数、多项式函数和径向基函数。图4是基于混淆矩阵计算的方案一分类结果的总体精度和Kappa系数。从图4可以看出,在方案一中,相同训练样本和检查样本的条件下,随机森林分类精度最高,其总体精度为79.64%,Kappa系数为0.766 2;SVM 3种方法的分类精度相差不大,最大似然法分类精度最低。与图1中的地物类型标注图比较,图3中随机森林分类效果明显要好于其他分类结果。

图3 实验方案一分类结果

图4 实验方案一分类精度评定

图5是基于混淆矩阵计算的方案二分类结果的总体精度和Kappa系数。从图5可以看出,在方案二中,相同训练样本和检查样本的条件下,随机森林分类精度最高,其总体精度达到90.79%,Kappa系数为0.895 1;SVM 3种方法的分类精度相差也不大,最大似然法分类精度最低。图6是方案二分类结果,跟图1中的地物类型标注图比较,图6中随机森林分类效果明显要好于其他分类结果。

图5 实验方案二分类精度评定

通过对比分析两种方案的对应方法的分类精度和分类结果,发现方案二中无论哪种方法的分类结果和精度都要远远高于方案一,说明对文中机载高光谱图像进行地物精细分类时,选择方案二的特征组合方式要好于方案一;通过分析两组方案的分类结果,发现无论采用方案一还是方案二的特征组合方法,随机森林法的分类精度在各自方案实验中,分类效果最好,分类可靠性最高。

3 结束语

文中研究不同NNF特征、纹理特征和指数特征组合情况下机载高光谱图像地物精细分类方法,实验结果表明,基于8个NNF特征联合分类效果要明显好于基于5个NNF特征联合分类效果,说明不同特征组合对高光谱图像地物精细分类影响较大,这就要求在以后的高光谱图像精细分类中,应该进一步深入研究特征提取和不同特征如何组合的问题;实验中随机森林分类方法在不同的特征联合分类中分类效果最好,尤其是在基于8个NNF特征联合分类中,分类精度很高,这也说明合适的特征组合情况下随机森林分类法用于高光谱图像分类具有很高的可靠性。本研究成果可以为高光谱图像地物精细分类选择合适的多特征组合和分类方法提供一定的理论和实践支撑。

猜你喜欢

光谱精度分类
基于三维Saab变换的高光谱图像压缩方法
热连轧机组粗轧机精度控制
分类算一算
高光谱遥感成像技术的发展与展望
超高精度计时器——原子钟
分析误差提精度
分类讨论求坐标
基于DSPIC33F微处理器的采集精度的提高
教你一招:数的分类
说说分类那些事