基于地物波谱形态参数化的高光谱图像分类方法研究
2015-10-19谢凯
谢凯
((长江航道测量中心,湖北 武汉 430010)
0 引言
在自然界中每个地物都是以光谱特征作为基本表现形式,且均有自己独特的波谱反射和辐射特性,可利用其地物波谱的差异对目标地物进行遥感识别[1-4].因此,精确地对遥感图像进行分类和专题信息提取,必须对各类地物波谱特性及其变化规律有较全面深入的认识.不同地物的反射率随波长的变化不相同,即使是同种地物,在内部结构和外部条件存在差异的情况下,其波谱曲线的形态表现也不相同,因此,波谱形态差异是地物遥感鉴别的重要依据之一.然而,从现有的研究结果可以看出,波谱形态差异作为地物遥感鉴别的重要依据未被充分用于遥感图像分类中,较多的研究者采用对单时相的多光谱或高光谱影像和多时次的时序影像进行地物的若干特征值提取等“降维”方式进行图像处理.然而,在“降维”处理中,地物波谱变化的形态信息会因“降维”处理丢失较多,所得数据信息无法使用.本研究中从曲线形态学[5]角度出发,在Matlab程序设计平台下,设计一种基于波谱形态差异的遥感影像分类方法[6-8],其研究成果可直接应用于高光谱遥感图像分类[6-8],同时有助于有明显季节性变化特征的植被遥感识别和土地覆被分类.
1 典型地物波谱形态参数化
为了从不同尺度定量描述地物波谱曲线的形态特征,本文中选择定义波形形态参数且将其编码化来实现.本文中用具有明确数学定义的基本语素定义波形形态参数,基本语素基于曲线的拐点,也称为曲线语素.曲线语素是一种表达信息的常用符号,但所能表达的信息十分有限,为使其有用信息最大限度地表达,需对语素向量[9]进行二次定义,即对曲线进行数值化描述[5],可用若干字符所组成的字符串对曲线进行表达.实际应用中,曲线数据信息常常受到噪声干扰,导致数据信息的可靠性较低,为使曲线的句法足够灵活、丰富且具有抽象性,本文中定义了曲线语素的通配符,以便更灵活地描述曲线[10]的真实形态.
从语素向量的说明可知,可用曲线抽取的向量序列组合起来的二维数据表对曲线形态进行描述[9].因应用领域不同,对选用的语素向量也有所不同.通过二维数据表对曲线形态的描述,最终实现曲线形态特征的数值化描述[10].从一个特定的地物类型的波谱曲线看出,同类地物反射率的变化和差异是由于时间不同或地物物质含量的不同所导致的,但其值是在一定标准曲线的范围内小浮动变化,不论变化幅度的大小,同种地物曲线的形态始终稳定在一定范围内变化.不同地物的波谱曲线形态存在或大或小的差异,在对波谱曲线形态描述转化为相应的二维表的同时,也设计相应地物的识别模板.为识别所选遥感影像地物类别[6-8],通过设计的模板对经过处理的遥感影像进行识别,若进行一次识别无法达到理想的识别效果,即对影像上的灌木丛、植被、水体等类别不能较好的识别出来,则进行二次或多次模板设计与识别,直至识别效果理想.识别模板中的语素数字化地表达了地物波谱曲线的形态变化,而形态变化的幅度则通过语素的属性定义表达.
2 基于波谱形态差异的高光谱影像分类
地物反射率的不同,是因地物波谱曲线的形态随波长的变化导致较大差异所致.通常,不同地物的波谱曲线形态不同,但在特殊情况下同种地物的波谱曲线形态也会在一定范围内波动变化,即内部和外部条件不同时,则出现波谱曲线形态的波动变化.地物波谱特性是地物遥感[11]技术应用中的物理基础,且是利用地物波谱特性研制遥感器和进行遥感图像处理与分析的重要依据,同时也是遥感定量分析的基础.所以,在遥感专题信息提取及应用分析[11]研究中,地物波谱特征的研究是十分重要的组成部分.
以往的分类过程中由于地物波谱信息的不足导致诸多不确定性,造成分类结果的可靠性较低.而今可从高光谱影像上找寻地物信息较为丰富的像元来提取连续光谱曲线[12],不仅可以进行光谱波形形态分析,还能实现依据光谱曲线形态进行的地物识别.
2.1 基于波谱形态差异的遥感影像分类研究意义遥感图像分类是依据遥感图像的光谱、纹理、形状等特征将图像划分为互不相交的地物类型区域的过程.地物的波谱特征研究历来是现代遥感技术研究的重要组成部分,与遥感技术的发展密不可分.它既是遥感器波段选择和设计的依据,又是遥感数据分析解译的基础,是建立地面数据和遥感数据关系的桥梁.所以,波谱形态差异的遥感图像分类研究对遥感图像分类精度的提高及有着明显季节性变化特征的植被遥感识别和土地覆被分类有着重要意义.
2.2 基于波谱形态差异的遥感影像分类原理同一物体的波谱曲线在不同情况下可以反映不同波段的不同光谱响应.地物类型的不同,导致地物对不同波长的电磁波的反射因物质的组成结构的差异而具有不同的选择性反射,形成了不同光谱反射率曲线,从而具有相异的波谱形态;通常,同类地物的光谱反射率差异是由于同类地物存在的物质含量不同而有所不同,且随时间变化而变化,但变化值在一个特定范围内小幅度变化.从变化情况可以看出,同一类地物的反射率虽有小幅度变化,但地物曲线的形态始终保持稳定.因此遥感图像分类研究[11]中可以把地物波谱曲线形态的相似性作为图像分类的重要判别依据之一.
2.3 基带通配符的波谱形态匹配本文中主要采用一种允许错位匹配、多层次的匹配算法,将识别模板与目标曲线二维表进行一一匹配.算法的步骤如下:首先,对模板中非通配符的语素的编号进行提取.其次,按错位匹配的思想,对目标曲线中的语素逐一考察,并用上一步中所得的语素集对语素进行过滤,得到初步匹配曲线.然后,在不考虑通配符的情况下,把初步匹配曲线按照语素的属性约束条件进一步过滤.最后,将上一步得到的每一个匹配曲线还原到原目标曲线中,并将错位跳过的部分计入通配符,形成具有语素和通配符的完整字符串组合与识别模板进行最终匹配,匹配的像元则属于识别模板的对应类别,达到地物识别和分类的目的,此方法是基于地物波谱曲线形态差异的遥感图像分类方法.
3 数据源的选取及预处理
3.1 数据源的选取本文中的分类研究选取的遥感影像是覆盖美国Colorado州Boulder市的AVIRIS(airborne visible infrared imaging spectrometer,机载可见光/红外成像光谱仪)航空高光谱遥感影像.所选影像的研究区域气候温和,具有多石的地貌特征,地层多为红色砂岩.研究区域内地表覆盖物主要包括植被、水体、湿地以及各种人工建筑物等.数据成像时间为2011年8月7日,获取飞机飞行高度为21 km,空间分辨率为10m,共224个波段.所选影像良好,无云覆盖等噪声,图像较为清晰,如图1所示.
3.2 数据源的预处理在进行图像分类之前需对所用遥感影像做几何精校正处理.本文中对遥感影像进行几何精校正采用的是2次多项式模型,且精度控制在一个像元以内.遥感影像的灰度值是经过量化和纠正过的以编码化的数字影像,然后将灰度值转化为大气层顶反射率以便精确表示地物反射、辐射特性,最后再进行大气校正以得到地表反射率影像.本文中用ENVI遥感软件对数据影像进行转换,成功生成地表反射率影像.
图1 研究区影像图
为提高本研究方法的实验效率,在不影响实验结果的前提下从影像中裁剪出一片地类较复杂较全面且质量较好无云的区域进行试验.裁剪后的试验数据为197*230像素.AVIRIS数据具有224个波段,去除水吸收和低信噪比的波段后,保留其中166个波段.本文中提出的分类方法因受软件和硬件限制的关系,需对166个波段进行相关性分析,用相关系数矩阵对经过上述处理的AVIRIS影像以原波段顺序按“同一组内任意两个波段之间的相关系数在0.99以上”的原则进行分组,然后对每一组进行主成分分析,取各组的第一主分量叠加成由20个波段组成的新影像,新影像用的20个波段包含了影像的绝大部分信息,且大大降低了相关信息之间的冗余,能够满足本研究的试验需求.原始影像和20个波段的新影像的波段对应关系如表1所示.同时,对影像进行上述预处理操作后,将得到的新影像的反射率数据进行拉伸后转换成TIF格式保存.
表1 新组合的影像和原始影像之间的波段对应关系
4 分类实现及精度对比分析
4.1 基于波谱形态差异的AVIRIS影像分类实现结合本试验的具体实际情况及需要实现的研究结果,设计如下几个主要功能模块:图像输入模块、波段选择模块、读取识别模板、分类.
1)图像输入模块.主要实现语句如下:
2)波段选择模块.遥感图像一般是多波段图像,不同类型的图像波段数目及特点不同.利用该模块可以对特定的遥感影像设置最佳显示波段.这里通过弹出式菜单Pop-up Menu对象实现其相应功能.
3)读取识别模板.用来实现对各类地物模板的读取,根据选择路径对话框选择各类设计模板.
4)分类.为达到识别地物与分类的目的,用该模块实现前述的地物波谱曲线形态的参数化描述以及曲线表达与识别模板之间的匹配算法.
基于前述的曲线形态参数化方法,地物波谱曲线描述算法的基本思想如下:首先读取遥感影像,再把影像中每个像元的相邻两个波段进行比较,若前一个波段值小于后一个波段值,则赋予编码0;若前一个波段值大于后一个波段值,则赋予编码1;否则赋予编码2,则得到一个由编码0、1、2组成的标识数组.把所得标识数组中多余的相邻重复元素进行剔除,使其相邻的重复元素只保留一个标识编码.把扩展语素3和4插入编码0和1、1和0之间,分别表示峰值点和谷值点.至此使每个元素都有相应的语素编码,然后根据前述的定义把属性特征赋予相应的每个语素,如起点位置、终点位置、语素平均值、第几个峰值(谷值)等,以得到对应的语素向量,从而实现对每个像元波谱曲线形态的参数化表达.
匹配算法的基本思想如下:采用允许错位匹配、多层次的匹配算法.步骤如下:第一步,对模板中的语素(不包括通配符)编号进行提取.第二步,在允许错位匹配的思想下,对目标曲线中的语素依次进行考察并按上一步得出的语素集进行过滤,得到初步匹配曲线.第三步,在不考虑通配符的情况下,以语素的属性作为依据,对初步匹配的曲线进行二次过滤.第四步,将上一步得到的每一个匹配曲线还原到原目标曲线中,并将错位跳过的部分计入通配符,形成完整的字符串组合(包括语素和通配符)与模板进行最终的匹配.匹配算法中最为关键的是第二步,由于错位匹配的思想,目标曲线中可能会存在多种情况和模板中去除通配符的的语素编号匹配,需要对每一种情况对应的匹配位置索引分别记录.
识别部分在程序内部通过执行相应的代码实现,以下是地物波谱形态参数化的图像分类实现运行界面(图2).
图2 基于地物波谱形态参数化的图像分类实现运行界面
图3 SVM方法分类实现运行界面
4.2 基于SVM方法的分类实现在本研究中,进行对比的SVM分类方法[13-15]也在Matlab平台中编程运行实现(图3).研究中需先进行原始影像中感兴趣区域的选择[16],选择的地物类型以不同颜色的矩形框进行区分.提取感兴区域中像元曲线的参数化表达二维表,以此为特征进行分类,其分类实现如图3所示.
图4 随机点生成图
4.3 两种分类方法分类精度对比分析
4.3.1 基于地物波谱形态参数化的图像分类实现精度评价 本研究中所采用的精度评价方法是随机采样法,首先在所选取实验的遥感影像上随机生成300的评价样点(图4),然后使样点与美国NLCD2006(national land cover database 2006)数据和 Google earth高清影像相结合对上述分类结果进行精度评价,建立基于地物波谱形态差异的遥感影像分类方法的精度评价误差矩阵(表2).根据表2的统计结果,总体精度为83.67%,Kappa系数为0.788 8,精度较高.
表2 基于地物波谱形态参数化的遥感图像分类结果混淆矩阵
4.3.2 基于SVM分类方法的分类实现精度评价 为了对两种分类方法进行客观的对比分析,同样应用前述随机生成的300个评价样点,对SVM方法的分类结果进行精度评价并做混淆矩阵(表3).根据表3,SVM方法分类总体精度为72.33%,Kappa系数达到0.660 1,精度较高.
表3 基于SVM方法的遥感图像分类结果混淆矩阵
4.3.3 两种分类方法分类精度对比分析 对比以上对两种分类方法的精度评价混淆矩阵可知:
1)本文中提出的基于地物波谱形态参数化的遥感影像分类方法取得了不错的分类效果,其分类总体精度达83.67%,高于SVM分类方法的总体精度72.33%;Kappa系数0.788 8,高于SVM分类方法的Kappa系数0.660 1,与SVM分类方法相比本文中提出的分类方法更为理想.
2)从地物波谱形态参数化的分类方法评价结果中看出,除灌木丛(Shrub)类别外,其他地类的精度均高于SVM分类方法.在SVM分类方法中,由于其他类别的地物像元被错分为灌木丛,导致分类范围大于实际类别范围,使得灌木丛这一类别在SVM分类方法中制图精度偏低.此原因也导致了SVM分类方法中水体(Water)类别的制图精度很低.
5 结论与展望
通过本文中的相关研究可以看出,波谱形态能够较好地表达非同类地物之间的差异性,可以作为遥感影像分类的依据.依据遥感资料所表达的地物波谱曲线形态(波形),按照一定的规则或算法,可以对土地覆被类型做出“量化”判别.提出的基于地物波谱形态差异的遥感影像分类新方法,方法简洁明了,易于理解,分类效果较好.从应用该方法对裁剪后的AVIRIS影像所覆盖的美国Colorado州Boulder市的土地覆被分类结果来看,其总体分类精度和Kappa系数都高于SVM分类方法.
本文中各种类别地物的识别模板以人工方式选择大量样本经过分析和反复总结得到,需要花费一定时间.在今后的研究工作中,将进一步实现计算机自动提取识别模板功能,缩短人工操作所需的时间.未来的研究方向将可能与人工智能的一些研究热点结合起来,实现自动化的分类系统.
[1]梅安新,彭望琭,秦其明,等.遥感导论[M].北京:高等教育出版社,2001.
[2]王丽.基于Landsat_TM的地物光谱分析及沙化土地信息提取[D].开封:河南大学,2005.
[3]喻小倩.基于最大似然分类的宁夏红寺堡灌区的景观变化[D].重庆:西南大学,2010.
[4]朱述龙,朱宝山,王红卫.遥感图像处理与应用[M].北京:科学出版社,2006.
[5]张桂梅,任伟,徐芬.基于特征点和最小面积的曲线描述和匹配[J].计算机应用,2009,29(4):1159-1164.
[6]汪权方,李家永.鄱阳湖流域季节性绿色覆被(作物)的NDVI指数变化特征分析[J].测绘科学,2009,34(3):22-24.
[7]汪权方,李家永.基于时序NDVI数据的中国红壤丘陵区土地覆被分类研究[J].农业工程学报,2005,21(2):72-77.
[8]汪权方,李家永,陈百明.基于地表覆盖物光谱特征的土地覆被分类系统—以鄱阳湖流域为例[J].地理学报,2006,61(4):359-368.
[9]林培群,徐建闽.一种曲线形态的描述与识别方法及其应用[J].华南理工大学学报:自然科学版,2009,37(2):77-81.
[10]崔明义,张新祥,苏白云,等.用蚁群算法实现地理信息系统空间曲线的描述[J].计算机工程与应用,2008,44(30):160-162.
[11]赵英时.遥感应用分析原理与方法[M].北京:科学出版社,2003.
[12]李飞,周成虎,陈荣国.基于光谱曲线形态的高光谱影像检索方法研究[J].光谱学与光谱分析,2008,28(11):2482-2486.
[13]李玲,王红,刘庆生,等.基于纹理特征和支持向量机的ALOS图像土地覆被分类[J].国土资源遥感,2011,91(4):59-63.
[14]朱海洲,贾银山.基于支持向量机的遥感图像分类研究[J].科学技术与工程,2010,10(15):3659-3663.
[15]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.
[16]王晓玲,杜培军,谭琨.高光谱遥感影像SVM分类中训练样本选择的研究[J].测绘科学,2011,36(3):127-129.