基于扩展线性模型的多端元高光谱图像分组寻优解混方法
2022-08-30曹文杰
房 森,曹文杰,完 诚
(中国船舶集团有限公司第八研究院,江苏 扬州 225101)
0 引 言
高光谱遥感技术是在遥感技术的基础上发展并成长起来的一种新型的对地观测技术,是20世纪80年代开始兴起的一种新的遥感技术,其主要的特点是能够提供较多的地物光谱波段,以较高的光谱分辨率解决大多在全色和多光谱遥感中无法解决的问题。高光谱图像有效地综合了代表地物辐射特性的光谱信息和反映空间几何关系的图像信息,有效实现了“图谱合一”。高光谱图像在光谱分辨率方面拥有其他图像无可比拟的优势,但是其空间分辨率相对较低,因此在图像中很容易出现混合像元现象。混合像元指的是高光谱图像中某些像元对应的地面区域中包含多种不同的地物,它是遥感成像空间尺度有限性和自然界地物复杂程度的无限性之间矛盾的体现。混合像元成为影响高光谱图像处理精度进一步提升的重要因素,限制了遥感图像处理的进一步发展。因此,如何有效解决高光谱图像中存在的混合像元问题以提高遥感图像处理精度是一个重要的研究方向。
线性光谱混合模型和非线性光谱混合模型是高光谱图像处理中较为常用的2种模型。线性光谱混合模型比较简单,该模型假设高光谱图像中混合像元的端元组成是以线性比例完成的,即到达成像光谱仪的光子在传播过程中只与成像区域中的一种地物发生作用,而不考虑光子在多种地物之间的多重散射作用。当光子在地物之间发生多重散射作用时,就需要考虑使用非线性光谱混合模型对像元进行建模。非线性光谱混合模型更符合实际的高光谱图像成像原理,但是与线性光谱混合模型相比,非线性光谱混合模型使用起来较为麻烦,因此在大多数高光谱图像混合像元解混文章中均使用线性光谱混合模型对混合像元进行建模。
使用线性光谱混合模型对混合像元进行建模主要分为2个步骤:第一首先建立针对特定研究区域的高光谱图像端元集,然后使用特定的混合像元解混算法对高光谱图像中的所有像元进行解混,得到所在区域每种地物在每一个像元中所占的比例,即丰度。端元集中的端元可以从已有的光谱库中提取或经过野外实地测量得到,还可以利用N-FINDR、PPI、IEA等端元提取算法从指定的高光谱图像中提取。端元提取的精度对后续的高光谱图像解混有着重要的影响。在传统的线性光谱混合模型中,每种地物类别均采用一个端元来表示,并没有考虑到端元光谱的变异现象以及由该现象引起的端元个数的变化。由于高光谱图像的空间幅度较广,导致每种地物端元内部光谱变化一般很大,在这种情况下很难用一个单一固定的端元准确地表示一个地物类别。在需要准确知道各个端元在混合像元中所占比例的应用中,传统的固定端元的线性光谱混合模型会引起较大的解混误差。针对这个不足,Roberts等人提出了一种新型的高光谱图像混合像元解混算法,即多端元光谱混合分析(MESMA)。MESMA考虑到端元光谱曲线可能出现的变异情况,迭代地调整像元中端元的种类和数量。然而,对于高光谱图像中的每一个像元,MESMA需要使用光谱库中所有的端元组合来对混合像元进行解混,然后根据最小重构误差准则为每个像元建立一系列的候选端元集,最后将重构误差最小的端元集作为该像元最佳的端元组合,所得的丰度向量就是该端元集中的每一个端元在该混合像元中所占的比例。MESMA能够克服端元变异现象,得到的解混精度较高,但是该方法所需要的计算量较大。为此,文献[3]提出一种基于分组寻优的多端元高光谱解混算法,该方法最终所得的计算精度与MESMA相当,但是该算法所需的计算量相对较小。
由于大部分高光谱图像所覆盖的实际地理范围较广,所以在高光谱图像中存在大量由于光照和地形因素引起的地物端元变异现象,这会严重影响高光谱图像的解混精度。为此本文在基于分组寻优的多端元高光谱解混算法的基础上提出一种基于扩展线性模型的多端元高光谱图像解混算法。扩展线性模型能够有效应对地物端元变异现象,提高高光谱图像的解混精度。
1 光谱解混模型和丰度反演
解决高光谱图像中存在的混合像元问题需要建立一定的模型,目前主要存在2种光谱混合模型:线性光谱混合模型和非线性光谱混合模型。
线性光谱混合模型是假设太阳光子只与一种地物发生相互作用,并将其光谱信号叠加到像元光谱中,地物之间没有相互作用。相反地,非线性光谱混合模型由于同一场景内多种地物之间反射光的相互作用,可以认为是一个迭代乘积过程,是非线性的。非线性混合模型的建立和求解都相对比较困难,因此基于非线性混合模型的光谱解混研究较少。相比之下,线性混合模型因其物理意义明确而容易建立模型,因此,对其研究的相对较多。本文正是基于线性光谱混合模型对高光谱图像进行研究。
光谱解混技术作为混合像元处理的最主要技术,要求得各个端元在其中所占的比例,是一种更为精确的分类技术。
1.1 扩展线性光谱混合模型
传统的线性光谱混合模型假设太阳光子在到达成像光谱仪之前只与一种地物发生作用,而没有与其它地物发生作用。如果1幅高光谱图像中包含有个地物端元,且每个地物端元有个波段,假设这幅高光谱图像具有个像元,那么其中的每一个像元均是由这个地物端元以不同的比例组合而成的,这种组合过程即线性光谱混合模型:
(1)
式中:是地物端元在某一像元中所占的比例,也被称之为丰度,通常被理解为端元在像元对应地面区域中的面积比例;为误差项,反映了由环境引起以及成像系统产生的随机误差。
式(1)表示的是单个像元的线性组合过程,将所有像元的线性组合过程写在一起可以得到线性光谱混合模型的矩阵形式:
=+
(2)
式中:表示的整个高光谱图像矩阵,矩阵中的每一列代表一个像元;表示该图像中包含的所有地物端元的矩阵,其中每一列代表一个地物端元;表示丰度矩阵,它的每一行表示不同地物端元在不同像元中所占的比例;表示误差矩阵。
传统的线性光谱混合模型的优点是它的建立和求解比较简单,但是该模型并不能考虑到某种地物在高光谱图像中所有的变异情况。本文在线性光谱混合模型的基础上使用了一种被称为扩展的线性光谱混合模型,该模型可以将地物端元所有的变异情况表示出来,具体表示如下:
(3)
式中:是一个以某地物端元为参数的函数,然后对进行变换,变换的结果相当于端元发生了变异。
令()=,则式(3)可以写成:
(4)
式中:是一个元素值非负的×维对角矩阵;表示端元矩阵中的所有端元在像元中的变异情况。
同样也可以得到式(4)的矩阵形式:
=(∘)+
(5)
式中:为×维矩阵,为假设高光谱图像的像元个数,包含了端元矩阵中所有端元在所有像元中的变异因子,变异端元为原始端元乘上对应的变异因子。
1.2 最小二乘丰度反演算法
丰度反演就是将每个端元在像元中所占比例精确地计算出来。大多数文献均以最小二乘丰度反演方法为基础,并在此基础上做进一步的改进。如果端元矩阵共有个端元,即=[,,…,],单个像元的丰度向量表示为=[,,…,],代表噪声向量。将高光谱图像中的任意混合像元表示为个端元在丰度值,,…,下的线性组合,即:
=+
(6)
如果高光谱图像的波段数较大,那么端元矩阵为列满秩矩阵。若将式(6)看成是方程组,即为超定方程组。通过最小二乘法求误差的方式可以将上式求解出来,具体的求解公式可以表示成:
(7)
由于端元丰度代表的是端元在像元中所占的比例,以及所有端元在某一像元中的丰度之和为1,因此通过给式(7)加上不同的约束条件可以得到不同约束条件下的最小二乘法,使获得的丰度结果更满足实际条件。不同条件下的最小二乘法如下:
(1) 无约束最小二乘算法
当不对可能得到的丰度解施加任何约束条件时,运用最小二乘法所得到的丰度的无约束解为:
(8)
(2) “和为1”约束最小二乘算法
由于各个端元在任一像元中的比例之和为1,当施加这个条件时,式(7)变成:
(9)
使用最小二乘法对式(9)进行求解时,可得部分解为:
(10)
式中:为阶单位矩阵;[1,1,…,1],是元素全是1的维列向量。
(3) “非负”约束最小二乘法
由于最终所得丰度值必须是非负的,因此需要求解的丰度值施加非负约束:
(11)
(4) 全约束最小二乘法
为了获得更加真实的丰度解,需要在式(11)中加上和为1的约束条件:
(12)
2 基于分组寻优的多端元高光谱解混算法
如果端元在像元中所占的比例较小,并且图像信噪比不高,那么使用传统的混合像元解混算法会受到噪声的影响,导致小丰度地物在该像元中的检测受到影响,使小丰度地物可能被噪声湮没,影响高光谱图像混合像元解混的精度。分组寻优算法提高混合像元解混精度的思想是将一种地物的端元分成1组,在进行混合像元解混时,可以利用端元光谱曲线之间的相关性充分扩大该种地物在像元中的存在。分组寻优算法的优点是对小信噪比的地物检测具有较好的效果。
如果1幅高光谱图像中有4种地物,分别记为、、和,为了考虑端元变异的情况,每种地物包含3种地物光谱曲线,分别记为[,,]、[,2,2]、[,3,3]和[,4,4]。每种地物的光谱曲线既可以从光谱库中提取,也可以使用端元提取算法从所要研究的高光谱图像中提取。下面简单叙述基于分组寻优的高光谱图像混合像元解混[]算法的过程:
() 先使用全约束最小二乘法对高光谱图像中的每一个像元分别使用类地物的端元集做混合像元解混处理,得到类地物的丰度向量,分别记为[,,]、=[,,]、=[,,]和=[,,]。
(2) 将每种地物的端元集对应乘上(1)中得到的丰度向量,得到反混像元,然后求取原始像元和反混像元的均方根误差,记为RMSE,假设各类地物中的最小均方根误差值对应的端元向量分别是、、和,且这4个端元向量对应的均方根误差值的大小顺序为:<<<。然后选取(2)中RMSE值比较小的2个端元,并将它们组成二端元组合,即=[,],并重新对指定像元使用全约束最小二乘算法进行混合像元解混处理,将得到的丰度结果记为=[,],计算此次解混结果的均方根误差,记为,如果>,那么可以确定该像元只包含端元,对应的丰度为1,否则进入下一步。
(3) 从(2)中选取第3个均方根误差值较小的端元,即,在的基础上组成三端元组合,记为=[,,],用对指定像元做解混处理,将丰度结果记为=[,,],然后计算此次解混结果的均方根误差,记为。如果>,则该像元最佳的端元组合为,丰度结果为,否则进入下一步。
(4) 在的基础上添加第4个端元,构成四端元组合,即=[,,,],用做混合像元解混处理,将得到的解混丰度结果记为=[,,,],然后计算本次解混结果的均方根误差,记为,如果>,那么最佳端元组合为,将丰度结果记为,否则最佳端元组合为,丰度结果为,然后结束实验,并对实验结果进行分析。
3 基于扩展线性模型的多端元高光谱分组寻优解混算法
基于分组寻优的多端元高光谱混合像元解混算法的优点是对小丰度地物的解混有好处,该算法能够扩大某种地物在像元中的存在,使小丰度地物不至于被图像中存在的噪声所掩盖,提高混合像元解混精度。但是该算法所用的变异端元有限,并不能完全代表所有高光谱图像中的变异端元。本文在基于分组寻优多端元高光谱图像混合像元解混算法的基础上提出一种基于扩展线性模型的多端元高光谱图像分组寻优算法,该算法与分组寻优算法的不同在于对像元的建模,传统的高光谱图像建模采用的是普通的线性模型,而本文算法使用的是扩展线性模型。从公式(1)和(3)可以看出,扩展线性模型使用的是类似于一个函数的形式对像元进行建模,能够更好地反映像元变异现象,尤其是对于由光线和地势引起的光谱变异。基于扩展线性模型的多端元高光谱图像混合像元解混算法的主要步骤:
(1) 求取每一种地物端元集的平均值,以此平均值为基准端元,对该基准端元做函数变换,即(),这个过程相当于对各个地物的端元光谱曲线做变异处理;
(2) 使用第一步做过变异处理后的端元集合对像元做混合解混处理,并求取各个端元所对应的RMSE,根据RMSE确定每组端元组合中所对应的最佳端元;
(3) 对上一步中所得到的每种地物对应的最佳端元的RMSE进行排序,选出RMSE最小的端元,并以此为基准,将该端元与RMSE第2个较小的端元组合成两端元组合模型,并比较两端元组合模型与RMSE最小的端元的均方根误差,如果该组合的RMSE比(1)中RMSE最小端元的RMSE还小,则依次组合三端元、四端元等;
(4) 重复步骤(1)和(2);
(5) 最后将每次解混处理所得到的均方根误差进行比较排序,选出这几次处理中均方根误差最小的端元组合,并将对它们解混处理所得的丰度作为最后的解混结果。
4 实验仿真与分析
本文里所采用的数据是美国的一块试验田数据,图像尺寸大小为144×144,具有100个光谱波段,真实图像如图1所示。
图1 试验田图像数据
这里使用了4类地物端元,分别是大豆、玉米、草地和由其它地物所组成的背景,每类地物端元的数量分别为3、3、3和7,具体如图2所示。
图2 实验中使用的端元个数及种类
本次实验结果如图3、图4所示,该结果主要展现基于分组寻优的高光谱图像混合像元解混算法与基于扩展线性模型的高光谱图像分组寻优解混算法的区别,这种区别不很明显,因为2种算法的解混效果相似性极大,具体的差别表现为2种算法的解混均方根误差及算法执行时间,如表1所示。
图3 基于分组寻优的多端元高光解混算法
图4 基于扩展线性模型的多端元高光谱分组寻优解混算法
表1 2种算法之间的比较
5 结 论
从表1可以看出,虽然基于扩展线性模型多端元高光谱分组寻优解混算法的执行时间比常规的分组寻优解混算法要长,以及算法迭代次数也要比常规的分组寻优解混算法多一点,但是本文算法在解混精度上取得了较好的结果,从表格数据计算得到解混精度大概提高了27.7%左右,取得了预期的效果,在以后的算法改进中可以考虑从提高算法计算效率出发,在提高解混精度的同时保证解混效率。