高标准农田建后遥感监测方法
2019-06-10陈震张耘实章远钰桑玲玲
陈震, 张耘实, 章远钰, 桑玲玲
(1.中国地质大学(北京)地球科学与资源学院,北京 100083; 2.自然资源部土地整治中心,北京 100035)
0 引言
遥感监测技术具有范围广、更新快的优点,可以用于土地的大面积变更监测[1],从20世纪90年代开始就被应用于我国土地分类、监测方面[2]。土地遥感监测为全国大面积的土地整治工作提供了快速、准确的技术手段[3]。随着高分卫星的发射,我国遥感技术领域进入了亚m级阶段。我国2014年发射的高分二号卫星,全色波段空间分辨率达到0.81 m,多光谱波段空间分辨率达到3.24 m[4]。土地遥感对卫星数据的空间分辨率要求为m级,所以高分二号的空间分辨率比较适合于土地监测的需求。
通常人工遥感解译的准确率较高,但工作效率较低,无法实现对全国大面积土地的遥感监测,故土地遥感监测技术应落脚于遥感自动分类技术。遥感影像分类方法较多,如最大似然法、决策树以及BP人工神经网络等方法[5]。面向对象的分类技术在对空间分辨率较高的影像进行分类中具有很大优势[6]。面向对象的BP神经网络是由大量神经元连接而成的具有反馈功能的网络,可以模拟复杂的函数关系,如今在人工智能和影像分类中得到了广泛的应用[7]。由于高标准农田建后利用情况的复杂性,基于像元的方法没有考虑空间像素之间的位置关系,而面向对象不仅考虑到单个像元的不同波段的辐射特性,而且考虑了像元和像元之间的空间纹理关系,所以面向对象方法比较适合高标准农田建后利用情况遥感监测工作。
本研究以广东省东莞地区为研究区,选取2017年2月15日的高分二号遥感数据作为数据源,针对高标准农田建后利用出现的“建设占用”、“调整用途”和“荒地”等情况,首先,采用人工解译部分地区; 然后,实地验证,选取训练样本和测试样本; 最后,对比研究了面向对象和最大似然2种遥感自动分类方法。探究能够满足高标准农田建后利用情况遥感监测需求的方法。
1 研究区概况及数据源
1.1 研究区概况
广东省东莞地区属于华南珠江三角洲平原地区,位于珠江口的东侧,地势平坦开阔,河网密集,沟渠纵横,水塘密集分布,地势东高西低,由北向南倾斜,其间发育的河流阶地区及漫滩区沿江河呈带状分布,地势平坦,微向河谷倾斜。该地区接近北回归线,气候温暖湿润,植被茂盛,土地肥沃,适合建设高标准农田。
1.2 数据源及其预处理
本研究选择国产高分二号卫星的遥感影像为数据源,其参数如表1所示。
表1 高分二号卫星有效载荷技术指标
研究区3—11月阴雨天气较多,云量较大,不利于进行遥感监测,所以本研究选择2017年2月15日的高分二号遥感数据。
本研究采用高斯克吕格投影,3度分带; 平面坐标系统采用1980西安坐标系,高程系统采用1985国家高程基准,IUG1975椭球体。遥感数据预处理总体流程为: 在ENVI5.3软件的支持下,进行大气校正、正射校正、几何纠正、影像增强、融合和坐标变换等预处理工作,消除了大气散射和几何畸变等误差。其中采用Gram-Schmidt方法进行融合处理; 利用ERDAS9.2软件将影像从WGS84坐标系转换成了1980西安坐标系。最后增加了归一化差异植被指数(nomorlized difference vegetation index,NDVI)、K-Means非监督分类结果2个波段,增加了数据的维度,有利于提高高标准农田建后利用情况的分类精度。
人工解译中彩色合成是通过高分二号数据各波段的相关性系数将各波段分组,然后按照分组结果进行波段组合。高分二号卫星数据各波段的相关系数如表2所示。
表2 高分二号各多光谱波段间相关系数矩阵
本研究在对高分二号数据波段相关性进行分析的基础上,计算了3组波段组合的最佳指数因子(optimum index factor,OIF)值,如表3所示。
表3 高分二号数据各组合方案及OIF值
从表3可知B1(R),B3(G),B4(B)组合的OIF最大,说明这种组合包含了最大的信息量,故选取这3个波段进行组合作为遥感信息提取的最佳波段组合。另外在B3(R),B4(G),B1(B)彩色合成影像上,水体、植被与建筑物的界线明显,也为人工解译、提取测试及验证样本提供了便利。
2 研究方法
本研究首先对高分二号数据进行了预处理; 然后,进行人工解译,对疑似图斑进行实地验证,再选取训练样本和测试样本,采用面向对象和最大似然方法进行了分类; 最后,对比了2种分类效果并分别评价了分类精度(图1)。
图1 工作流程
高标准农田建后利用情况的遥感监测中“占”、“调”、“荒”3种情况中,“占”和“调”2种情况较难区分,耕作层被破坏的判定为“占”,耕作层没被破坏但不为农田的地块判定为“调”。
普通农作物在遥感影像上一般呈均匀的浅绿色、绿色、深绿色和墨绿色的色调特征,并显示出条带状、斑杂状和块状等形状特征; 杂草在遥感影像上一般呈色调不均匀的绿色、浅绿色片状斑块,且纹理粗糙; 乔木则呈深绿色或墨绿色的色调特征和斑点状纹理特征; 农村房屋在遥感影像上一般呈边界整齐的长方形,常见棚顶呈蓝色或红色; 土壤在遥感影像上一般为土黄色,且纹理较均匀,农田土壤常见线状纹理; 水泥路面在遥感影像上一般呈灰白色色调特征和线条状特征; 沙石堆在遥感影像上一般呈白色、灰白色和灰色色调特征,斑点状纹理,斑点大小不一,比较耀眼; 裸地在遥感影像上一般呈白色色调,和相邻地块的反差较强。遥感监测主要类型的解译标志和实地验证照片如表4所示。
表4 高标准农田建后利用情况监测遥感解译标志
2.1 影像自动分类方法
本研究针对高标准农田建后利用情况监测工作中出现的“占”、“调”、“荒”等情况,在对高分二号卫星影像预处理的基础上,经过人工解译、实地验证,选取部分样本作为训练样本和测试样本,再对比不同的自动分类方法,找出适合全国推广的自动分类方法,为土地整治部门高标准农田建后遥感监测提供技术支撑。本研究主要对比了面向对象的方法以及最大似然2种监督分类方法。
1)面向对象分类方法。传统的基于像元的方法是将不同波段的同一像元的灰度值提取,形成光谱向量,然后设定向量之间的距离最大值(阈值),不同像元的向量距离如果小于阈值,就认为这些像元属于同一类。这种方法只考虑了单个像元的光谱向量特征,也就是说只考虑了光谱特征,没有考虑到像元和像元之间的空间位置和排列关系。面向对象的分类方法是为了克服基于像元分类方法的不足而研发的新方法,此种方法不仅考虑了像元的光谱特征,而且考虑了像元之间的空间位置关系(如纹理、形状等)来对地物进行分类。面向对象方法处理的对象不再是单个的像元,而是符合一定空间关系的像元群[7]。面向对象分类方法综合考虑了像元的光谱特征,同时也考虑到了像元之间的空间关系,如果经过实地验证的样本量大,就可以建立精准的函数模型,得到较为准确的分类结果[8]。
遥感影像的特征类型较多,需要对其空间降维,然后优化组合方式,基于充足的样本就可以得到较好的分类结果[9],在对遥感影像进行分割后,要选择影像特征的提取方法,常用的方法包括K-最邻近(K-nearest neighbor,KNN)方法和支持向量机方法。本研究选择了KNN分类方法来提取影像特征。KNN分类法的原理是基于多维的像元光谱特征,计算各像元的欧几里得距离,然后设定各分割对象的阈值,如果在阈值范围之内就分为一类,如图2所示。
图2 KNN分类原理
本研究利用ENVI5.3软件计算NDVI及HIS空间。影像分割参数设置Scale Level为50,Merge Level为80。
2)最大似然方法。该方法是传统的基于像元的遥感影像分类方法,在分类规则中,用概率统计的方法,如最大似然判定法则建立非线性的分类函数。分类函数的原理是每个类别的像元在二维或三维空间中组成一定量的点群,每一类的像元在各个数据维度都服从一个特定的正态分布,每一类各个维度的正态分布组成一个多维的正态分布。其基本思想为,在圈定感兴趣区的基础上,计算其他区域的归属概率,从而得到影像分类结果。具体实现步骤为,计算各个类别的所有像元的光谱特征的均值、方差等参数,构成分类函数,将未分类像元的光谱特征代入各个感兴趣区的分类函数,在所有返回值中取最大值,把此未分类的像元分入取最大值的一类,从而得到分类结果。
设数据集中有s个类别,用ω1,ω2,…,ωs来表示,每个类别的发生概率即先验概率分别为P(ω1),P(ω2),…,P(ωs),设有待分类别样本X,其条件概率分别为P(X|ω1) ,P(X|ω2) ,…,P(X|ωs),根据贝叶斯公式得到样本X出现的后验概率,即
(1)
然后以样本X出现的后验概率值作为判别函数来决定样本X的类别归属。通过简化,得到最大似然分类准则: 若
(2)
则X∈ωi。总体来说就是把先验概率P(ωi)转化为后验概率P(ωi|X),最后以后验概率最大的类别作为样本X的类别归属。
利用ENVI5.3软件计算感兴趣区域(region of interest,ROI)可分离性,用定量的方式来验证样本,阈值设定为1.8。
3 结果与分析
在对研究区高分二号影像进行预处理的基础上,经过人工解译、实地验证,选取部分样本作为训练样本和测试样本,对比了面向对象和最大似然2种监督分类方法的效果。
3.1 分类结果
用训练样本作为输入,采用面向对象和最大似然2种方法对影像进行了分类。面向对象的分类结果如图3所示,最大似然分类结果如图4所示。
(a) 原图 (b) 总分类图 (c) 农田 (d) 水体
(e) 公路 (f) 调整用途 (g) 建设占用 (h) 荒地
(a) 原图 (b) 总分类图 (c) 农田 (d) 水体
(e) 公路 (f) 调整用途 (g) 建设占用 (h) 荒地
3.2 分类精度评价
本研究利用验证样本验证了面向对象方法和最大似然方法的分类精度。面向对象方法的分类精度达到98.684 7%,Kappa系数为0.983 3,具体如表5所示; 而最大似然方法的分类精度则为78.587 1%,Kappa系数为0.718 0,具体如表6所示。
表5 面向对象分类结果混淆矩阵
表6 最大似然分类结果混淆矩阵
4 结论与讨论
1)基于面向对象的土地利用分类方法的优势是充分利用了地物的纹理特征、几何特征和光谱特征。本研究选择广东东莞地区作为研究区,采用2017年2月15日的高分二号遥感影像为数据源,首先,对高分二号数据进行了人工解译; 然后,对疑似图斑进行实地验证,选取部分经验证的样本作为训练样本和测试样本; 最后,采用面向对象和最大似然2种方法进行分类和对比研究。实验结果证明,实地验证结合面向对象的土地利用分类方法精度较高,适合高标准农田建后利用情况的遥感监测的需求。
2)本研究通过人工解译和实地验证获取样本,不同的地物类型具有不同的样本,样本的质量得到了提高,最终的分类精度也较高。本研究探索了面向对象土地利用信息的提取方法,实验证明该方法切实可行,能高效、精准地完成全国的高标准农田建后监测任务。通过推广此方法可以为全国高标准农田建成后的实时监管提供高效、精准的决策信息,为国家耕地保护、粮食安全工作提供技术支撑。本研究不足之处在于遥感影像自动分割方面不够精准,以后可以引入分形理论进行遥感影像自动分割。