APP下载

基于最大似然法的钓鱼岛航空遥感监视监测信息提取

2013-08-14徐文斌林宁卢文虎岳昂

海洋通报 2013年5期
关键词:钓鱼岛类别精度

徐文斌,林宁,卢文虎,岳昂

(1.国家海洋信息中心 天津 300171;2.天津师范大学 天津 300387)

随着国家海岛监视监测系统的不断完善,其已积累了大量我国海岛高精度航空影像资料。为深入挖掘影像所蕴含的海岛信息,有必要深入开展影像分析归类。本文利用2012年5月地面分辨率0.1 m的钓鱼岛航空遥感图像作为数据源,基于最大似然法对钓鱼岛进行影像分类,旨在为海岛航空监视监测数据的有效应用进行探索。

1 研究方法

1.1 监督分类和非监督分类

遥感影像分类可分为监督分类和非监督分类,监督分类依据遥感目视解译、实地调查地物等先验的类别知识对训练区样本进行标签化处理,非监督分类则是对类别之间的空间属性、光谱属性、纹理特征进行对比分析。影像分类主要具有以下特征:

(1)光谱特征。相异地物在同一波段上灰度值不同,相近地物在同一波段上灰度值相似,相异地物在各个波段图像上灰度的呈现规律不同,这就构成了区分不同地物的物理依据。

(2)空间特征。距离、长度、面积等几何学中的空间特征,可对单个像元进行有效描述,也可针对多个像元进行系统分析,方法较灵活(黎展荣等,2010)。

(3)纹理特征。影像中灰度的反差在一定的面域中体现出周期变化性特征,例如密集的林地在影像中看起来具有粗糙纹理,而平静的水面看起来具有平滑纹理。

基于影像监督分类,在采集训练区样本时,各类地物样本之间应保证同质性,同时也需要具备一定的反差变化范围,从而确保样本能反映出地物解译特征。因此在实际应用中,就需要选择不止一个训练区,如果类别方差较大则很难选择正确的训练区。在选择同质区域时,一个常见的问题是,稀疏的植被区可能被分到植被类别或土壤类别。解决这种问题的一种技术就是在建立最终类别特征之前从数据中清除这些异常的像元,保证信息准确。

在进行监督分类前需采集样本,即采集感兴趣区域,而在使用最大似然法进行影像分类时,样本的选取应呈正态分布曲线,正态分布一般会取得比较理想的数学结果。本文采用影像的频率直方图来检验样本光谱特性是否服从正态分布,当样本服从正态分布时,其频率直方图应只存在一个波峰。

移民休闲制约因素包括:语言不通、在主流人群中感到不自在、工作疲劳、没时间、不熟悉迁入国的生活方式以及社会隔离、歧视等[57-58]。学者[57-58]用文化同化理论解释移民休闲制约的变化模式。Stodolska M[57]研究新迁入加拿大埃德蒙顿的波兰移民制约因素,将制约因素分为静态因素和动态因素2种:一些因素如歧视、缺乏获取资源的途径、文化差异显示出静态特征;另一些制约因素会随着同化程度的加深而减弱直至消失,如语言问题、不熟悉新环境等。

1.2 最大似然分类

最大似然分类是在两类或者多类判决当中,用统计的方法根据最大似然比贝叶斯判决准则法来建立非线性判别函数集而进行分类的一种图像分类方法,流程见图1。

算法本身是通过假设遥感图像的每个波段数据都为正态分布,每类地物数据在空间中构成特定的点群,每一类的每一维数据都在自己的数轴上为正态分布。根据各类的已知数据,可以构造出各类的概率密度函数(概率分布函数)。这种分类方法是基于贝叶斯准则的分类方法,是一种非线性分类,其错误概率最小,也是目前应用较广泛成熟的一种监督分类方法(王增林 等,2010)。其判别函数为:

图1 最大似然分类流程图

式中,p(n|i)为类别i中具有特征向量n的像元概率;p(i)是类别i的先验概率。通过假定地物光谱特征服从正态分布,上式贝叶斯判别准则可表示为:

通过取对数的形式,并去掉多余项,得出类别i的K维最大似然辨析函数:

计算不同类别的最大似然辨析函数,对于不同的地物类别i和j,如果有Mj(n)≤Mi(n),则将像元分配给类别i。

2 分类实验

2.1 研究区概况

钓鱼岛是钓鱼岛及其附属岛屿的主岛,是中国的固有领土,位于东海,距离浙江省温州市约356 km、福建省福州市约385 km、台湾省基隆市约190 km、台湾省彭佳屿约140 km(图2)。钓鱼岛面积约3.91 km2,最高点约362 m,地势北部较平坦,东南侧山岩陡峭,东侧岩礁颇似尖塔,中央山脉横贯东西。钓鱼岛盛产山茶、棕榈、仙人掌、海芙蓉及珍贵中药材,栖息着大批海鸟,有“花鸟岛”的美称。钓鱼岛附近海域鱼类资源丰富,是中国渔民的传统渔场,此外还拥有丰富的石油和天然气资源。

本次研究使用的航空影像数据(图3)图像清晰逼真,此时植物处于生长旺盛阶段,山茶花覆盖面积较大,随处可见。

图2 钓鱼岛及其附属岛屿位置示意图

图3 钓鱼岛航空遥感图像

2.2 训练区样本选择

最大似然分类算法是将样本区像元的统计特征值作为类别的统计特征值来构建类别的判别函数,所以样本区选择是否科学合理直接关系到判别函数的正确性和最后分类的精度。选择样本区一般采用人工选定或利用种子像元区域增长来获得。训练数据必须具有代表性、完整性和分散性。为了确保样本选择的准确,由若干名遥感解译工作人员依据先验知识和基础数据对航空影像进行人工目视解译和样本选择,并将钓鱼岛地物类型分为岩礁石、裸地、树木、山茶花、水体五类(表1),显示样本区直方图基本属于正态分布。在ENVI软件处理图像时,对样本区进行分类统计分析,剔除样本区分离度较大的样本像元,合并相似分类类型,确保样本之间的可分离系数达到1.9以上,实现最优方案。

2.3 分类实验

根据样本筛选,在ENVI软件中执行最大似然分类算法,得出钓鱼岛分类结果图像(图4)。

本文从生产精度、用户精度、总精度和Kappa系数四个类别对钓鱼岛裸地、岩滩、树木、山茶花和水体5种地物进行精度评价。

表1 钓鱼岛区域图像解译特征

图4 钓鱼岛分类图

生产精度指分类器将整个图像的像元正确分为A类的像元数(对角线值)与A类真实参考总数(混淆矩阵中A类列的总和)的比。用户精度指正确分到A类的像元总数(对角线值)与分类器将整个图像的像元分为A类的像元总数(混淆矩阵中A类行的总和)的比。总精度为正确分类的像元总和除以总像元数。

Kappa系数则是通过把所有真实参考的像元总数(N)乘以混淆矩阵对角线(xkk)的和,减去某一类中真实参考像元数与该类中被分类像元总数之积后,再除以像元总数的平方减去某一类中真实参考像元总数与该类中被分类像元总数之积对所有类别求和的结果。Kappa计算公式为:

根据历年同时段遥感影像及专家目视解译信息建立验证样本并建立混淆矩阵,在ENVI软件中运算得出分类精度(表2)。

2.4 分类结果及后处理

信息源分类后处理是遥感影像分类的重要部分,减少噪声和精度保持两个相互冲突的目的是所有研究者都面临的难题。随着分辨率的提高,传感器对噪声变得更加敏感,遥感影像采集传输过程中产生的复杂噪声等加大了去噪处理难度,对影像去噪的方法提出了更高的要求。

表2 钓鱼岛分类精度

由于钓鱼岛分类图像元尺寸的界定,图像上完全意义的地物像元较少,大部分为混合像元。混合像元有两种形式,一种是图斑边界处形成混合像元,另一种是小图斑以分散的方式位于背景地物之中。前者可以通过边缘检测等手段进行很好地识别提取,后者则需要一种尽可能不影响分类效果的去噪方式进行分类后处理。为了较好地反演图像地貌,本文采用主次要分析去噪法对分类图进行分类后处理。

对3×3的卷积核进行主次要分析运算,将9个像元内最中间像元的地物类型归为9个像元中地物类型概率最大的像元,从而在尽可能不影响图像分类效果的情况下,达到去噪目的。

经过反复实验分析,过大的滤波会产生模糊,过小则滤波效应有限。最终选定利用3×3的卷积核为一个运算体进行主次要分析运算能较好去除噪声,按照3×3卷积核模型(图5),x为中间像元,以9个像元为一个运算体进行运算。

按此方法,则可提高分类精度(图6、表3)。

图5 3×3卷积核模型

结果表明:

图6 局部区域主次要分析去噪法对比图

表3 去噪后分类精度

(1)该岛生态环境较好,植被面积约2.70 km2,覆盖率达69%。环岛四周有大量岩滩,岩滩高程值较低,地势平坦,坡度较缓,岩滩面积约0.27 km2,约占总面积的7%。近海岸线地区和植被间隙存在大片裸地,受地形地势影响,裸地以岩石为主,道路为辅,主岛东部区域岩石较多,分布均匀,西部裸地则以近海岸道路为主,裸地面积约0.94 km2,约占总面积约24%。影像拍摄正值山茶花开花时节,岛上山茶花覆盖区域明显,范围较广。

(2)裸地虽然解译特征较明显,但在近海岸区域和岩滩界限不易区分,受季节影响,岛上植被过于茂密,遮挡部分裸地区域,影响裸地分类精度;近海岸岸边附近岩滩和水体相连,二者解译特征区分显著,故分类精度较高;树木解译特征明显,形状呈区域连片,树木相对同一区域地物长势较高,对同一区域地物表面有效覆盖,故分类精度较高;山茶花像素范围较小,花瓣呈粉色,花蕊呈灰白色,受到混合像元的影响较大,区分不易,精度偏低。

(3)基于最大似然分类法得出钓鱼岛分类图像总精度达82.61%,由于受到同谱异物和同物异谱影响,难免影响分类精度,但总体上较好地鉴别出岛屿地物的基本类型,达到了预期效果。经过主次要分析去噪法处理后,表2和表3对比得出,遥感分类总精度提高2.1个百分点,裸地、岩滩、树木、水体等分类精度提高约1-2个百分点,去噪效果较为明显,山茶花去噪效果较突出,区域明显闭合成面图层,噪声减少,分类精度提升约5个百分点,达到了较好的去噪效果。

3 小结

本文总结了利用最大似然分类算法进行海岛监视监测信息提取时影响图像分类精度的主要环节。这些环节包括地物类型的先验识别、样本区选择、分类后处理的改进等。基于对各环节进行深入流程化分析,有效地提高了海岛监视监测信息提取的精度。为今后研究不同时段钓鱼岛区域动态监测提供依据,同时依托最大似然分类算法提供了一整套海岛影像计算机智能化分类的流程方法,从而减少了目视解译的工作量,提高了工作效率。

RichardJ,AspinallW,AndrewMarcus,etal, 2002.Considerations in collecting,processing,and analysing high spatial resolution hyperspectral data for environmental investigations.J Geograph Syst,(4):15-29.

Robert A.Schowengerdt,2010.Models and Methods for Image Processing.

陈敬柱,贺瑞霞,郭恒亮,2004.最大似然法在植被信息识别提取中的应用.水文地质工程地质,31(2):94-96.

黎展荣,陈朝晖,黄国强,2010.高分辨率遥感影像自动分类方法研究.广西师范学院学报:自然科学版,27(2):71-75.

李庆亭,张连蓬,杨锋杰,2005.高光谱遥感图像最大似然分类问题及解决方法.山东科技大学学报:自然科学版,24(3):61-64.

王增林,朱大明,2010.基于遥感影像的最大似然分类算法的探讨.河南科学,28(11):1458-1461.

胥兵,2008.遥感影像土地分类结果的矢量化研究.遥感信息,(4):81-85.

张倩,黄昕,张良培,2012.高分辨率遥感影像的全变分分割模型.测绘科学,37(5):81-83.

猜你喜欢

钓鱼岛类别精度
基于DSPIC33F微处理器的采集精度的提高
GPS/GLONASS/BDS组合PPP精度分析
服务类别
痛惜被贼惦记的钓鱼岛
改进的Goldschmidt双精度浮点除法器
论类别股东会
中医类别全科医师培养模式的探讨
巧用磨耗提高机械加工精度
聚合酶链式反应快速鉴别5种常见肉类别
钓鱼岛问题溯源