基于“高分五号”遥感图像的地物分类方法
2020-09-23魏友华王瑶何雪梅郭科常睿春
魏友华 王瑶 何雪梅 郭科 常睿春
摘 要: 作为全波谱段高光谱卫星,“高分五号”卫星可提供丰富的遥感数据,研究利用“高分五号”卫星遥感图像实现精确的地物分类方法,这是实现高光谱遥感信息资源所有权的重要组成部分。文章立足于“高分五号”卫星数据,先进行遥感图像预处理,有效地消除大气干扰和噪声,优选核主成分分析方法进行“高分五号”卫星高光谱图像的特征提取,用最大似然法(MLE)、卷积神经网络(CNN)、支持向量机(SVM)3种分类器对高光谱图像数据分类。结果表明,RBF核的支持向量机分类器精度可达到97.889 7%,Kappa系数为0.966 7,比传统的最大似然法、神经网络分类方法分类精度分别高出15.478%,8.670 8%。由此可以实现“高分五号”卫星数据预处理,及其在土地利用分类应用上的可行性。
关键词: 地物分类; 遥感图像; 图像预处理; 大气干扰消除; 特征提取; 数据分类
中图分类号: TN965?34; TP79 文献标识码: A 文章编号: 1004?373X(2020)18?0085?04
Abstract: As a full spectrum hyperspectral satellite, GF?5 satellite can provide a rich remote sensing data. A method is studied in this paper to realize precise terrain classification by GF?5 satellite remote sensing image. It is an important component of realizing the ownership of the hyperspectral remote sensing information resource. The remote sensing image is preprocessed according to the data of GF?5 satellite, by which the atmospheric interference and noise is effectively eliminated. The kernel principal component analysis method is optimally selected to extract the features of the hyperspectral image of GF?5 satellite. The three classifiers of maximum likelihood method (MLE), convolutional neural network (CNN) and support vector machine (SVM) are utilized to classify the hyperspectral image data. The results show that the accuracy of SVM classifier based on RBF kernel function can reach 97.889 7%, which is 15.478% and 8.670 8% higher than that of traditional MLE and CNN respectively, and its Kappa coefficient is 0.966 7. It can realize the data preprocessing of GF?5 satellite and the feasibility for application in land use classification.
Keywords: terrain classification; remote sensing image; image preprocessing; atmospheric interference elimination; feature extraction; data classification
0 引 言
“高分五号”(GF?5)卫星是高分专项发展规划的唯一一颗拥有陆地生态环境高光谱进行观测的卫星,这也是国际上首次实现对大气和陆地进行综合观测的全谱段高光谱卫星[1]。“高分五号”卫星具有12个通道和330个波段,较其他现有光谱相机,其拥有波谱范围宽、定标精度高、光谱分辨率高等特点,可动态反映我国的生态、环境、大气各方面综合应用,提升中国资源勘查、环境污染状况监测等领域的质量与能力,这对于实现中国信息资源的自主性,以及推进 “一带一路”倡仪具有重要意义。
高光谱图像(HSI)由于其众多的应用和从可见光到近红外波长范围中获取遥感信息的能力而被发现富有价值,因此可在同一位置提供多光谱通道。HSI是高度创新的遥感影像,由数百个连续的窄光谱带组成,这与传统的全色和多光谱图像不同,可以更好地区分对象。但是,科学家面临的挑战主要是如何解决其中存在的冗余频谱信息和高维数等问题,实现对HSI进行有效分类[2?5]。几种常规的非监督和监督的机器学习分类器包括著名的非监督的常规分类器K?Means(KM)和监督分类器,如K最近邻(KNN),以及支持向量机(SVM)和人工神经网络(ANN),已用于HSI的分类。在图像识别和分类领域,尤其是大型多光谱和高光谱数据集的分类中,诸如深度学习等新算法的成功引起了广泛关注,但这些方法在多光谱和高光谱图像上的应用仍然存在限制。自从SVM出现以来,它已被证明在遥感(RS)图像分类、潮汐分析和城市土地利用变化预测方面非常有效[6]。由于SVM可通过不同的核函数处理非线性数据[7?8],具有对复杂的现实世界数据进行建模的能力,因此与相对于无法评估模型约束的模型相比,它们被认为是相对更好的预测模型[9?13]。因此,本文优选核主成分分析(KPCA)进行特征提取,采用最大似然法(MLE)、卷积神经网络(CNN)、支持向量机(SVM)3种分类器分别对“高分五号”图像进行地物分类,探讨SVM分类方法在GF?5卫星高光谱数据上的应用能力,为“高分五号”数据在土地利用分类方面的应用提供了可行的技术方法。
1 数据与处理
1.1 数据信息
“高分五号”卫星运行在平均轨道高度705 km、倾角为98.2°的太阳同步轨道,发射质量约2 800 kg,整星功率1 700 W,设计寿命[2]为8年,其主要载荷参数[9]见表1。
1.2 数据预处理
遥感图像数据预处理方法包括数据格式转换、辐射定标和大气校正。首先对数据格式转换,将“高分五号”数据转换为BIL或 BIP格式,本文利用ENVI的FLASH模块对完成辐射定标后的“高分五号”图像进行大气辐射校正。模块中并没有内置的直接校正“高分五号”数据参数,其中图像中心位置、 传感器高度、经纬度等参数均可以从头文件中获得。
整体地物分类实验步骤框架如图1所示。
2 研究方法
SVM的思想是给定一个训练样本集[D=x1,y1,x2,y2,…,xm,ym]。式中,[yi∈{-1,+1}] ,在训练集的基础上,在样本空间中找到一个划分超平面来分离不同类型的样本。对于线性可分问题,其最优划分超平面方程为[gx=ωTx+b],它对应一个凸二次规划问题,如下:
对于线性不可分情况,在Mercer理论下,通过内积函数变换到高维特征空间[14?15]:
3 结果与分析
3.1 研究区
本文采用2018年11月7日“高分五号”卫星拍摄东北某区域的图像数据,选取849×582像元窗口作为研究区域,如图2所示。本文结合Google Earth高清图像,收集研究区的土地利用现状图、行政规划图等,作为图像解译辅助。训练样本为5类地物:水域(3 030像素)、林地(247像素)、建筑(981像素)、耕地(3 218像素)、道路(1 039像素)。此外为了验证算法精度,分层随机选取了600个样本点作为一个验证数据样本:水域(129像素)、林地(96像素)、建筑(110像素)、耕地(158像素)、道路(107像素)。
3.2 特征提取
本文选定多项式核作为PCA变换的核函数。首先用KPCA变换对数据处理,取前20维数据作为特征数据,结合3种常规分类器最大似然法(MLE)、卷积神经网络(CNN)、支持向量机(SVM)对图像分类[14?18]。
本文选择RBF用作SVM分类器中的内核函数,调整惩罚系数C值和核函数参数γ值,使用网格搜索方法自动调整为5倍交叉验证。同样,CNN分类器的参数会自动调整。但是,本文使用5倍交叉验证来调整此处的参数,以实现最佳性能[18]。图3为不同分类器的分类图。
根据分类结果图可知,5倍交叉验证对高光谱数据特征提取后的地物分类效果明显。由于该地区道路和耕地面积较大且分布零散,所以并未提取准确。图3c)在林地的区分上和其他分类方法存在明显差别,此时可根据实际地物解释知,该研究区即遥感图像的左下角区域并未出现面积较大的林地,因此,图3c)的分类结果更加符合实际。故基于RBF核的SVM能明显地区分出5类地物,比传统的分类器中的道路提取更准确,与实际情况吻合较好,因此提升了分类精度。
为了定量评价这几种方法精度水平,在GF?5卫星高光谱图像上为每个类别选择验证点进行精度评价。同时采用4种精度指标分析实驗结果的准确性,分别为:生产者精度、用户精度、总体精度、Kappa系数。评价结果如表2所示。
从表2可以看出,5类地物中由于选取的研究区域水域样本较少,可分离度较高;该地区道路和耕地样本数较多,类可分离度较低。从表中可以看出,道路、建筑、耕地和林地的分类精度有所差异,基于核函数的SVM分类精度明显高于其他分类方法。而从总体精度来看,基于RBF核函数的SVM的分类精度是最高的,达到了97.889 7%,Kappa系数为0.966 7,故其分类效果较好。整体来说,基于KPCA的SVM分类器实验效果对比传统的分类器效果获得了较大的提升,有助于区分不同的地表类型。
4 结 论
本文基于GF?5卫星高光谱数据,并在数据预处理过程中,去掉大气影响与噪声影响,优选核主成分分析(KPCA)进行特征提取,采用最大似然法(MLE)、卷积神经网络(CNN)、支持向量机(SVM)3种分类器对研究区进行地物识别分类。实验效果表明,相比传统分类器而言,针对GF?5卫星蕴含海量的遥感数据,基于KPCA和SVM的组合方法能达到较好的分类效果,表现出极强的应用性,但在训练时间上还需要结合高光谱数据产生的样本集加以改进。
参考文献
[1] 刘银年.“高分五号”卫星可见短波红外高光谱相机的研制[J].航天返回与遥感,2018,39(3):25?28.
[2] 岳付升,付毅飞.高分五号卫星成功发射[N].科技日报,2018?05?10(01).
[3] 李盛阳,刘志文,刘康,等.航天高光谱遥感应用研究进展(特邀)[J].红外与激光工程,2019,48(3):9?23.
[4] 杜培军,夏俊士,薛朝辉,等.高光谱遥感图像分类研究进展[J].遥感学报,2016,20(2):236?256.
[5] 业巧林,许等平,张冬.基于深度学习特征和支持向量机的遥感图像分类[J].林业工程学报,2019,4(2):119?125.
[6] 杜培军,谭琨,夏俊士.高光谱遥感图像分类与支持向量机应用研究[M].北京:科学出版社,2012.
[7] 孙允珠,蒋光伟,李云端,等.“高分五号”卫星概况及应用前景展望[J].航天返回与遥感,2018,39(3):1?13.
[8] 陈洋波,张涛,窦鹏,等.基于SVM的东莞市土地利用/覆被自动分类误差来源与后处理[J].遥感技术与应用,2017,32(5):893?903.
[9] 申晨,岳彩荣,梅鸿刚.基于Landsat数据的普洱市土地利用变化动态监测[J].林业调查规划,2016,41(2):17?22.
[10] 李哲,张沁雨,彭道黎.基于高分二号遥感影像的树种分类方法[J].遥感技术与应用,2019,34(5):970?982.
[11] 宋明辉.基于高分二号数据的面向对象城市土地利用分类研究[J].遥感技术与应用,2019,34(3):547?552.
[12] 史飞飞,高小红,杨灵玉,等.基于HJ?1A高光谱遥感数据的湟水流域典型农作物分类研究[J].遥感技术与应用,2017,32(2):206?217.
[13] 张汉奎,黄波,俞乐.SVM?RFE高光谱数据波段选择中核函数的研究[J].遥感技术与应用,2013,28(5):747?752.
[14] 王春艳,徐爱功,赵雪梅,等.模糊神经网络高分辨率遥感影像监督分类[J].中国图象图形学报,2017,22(8):1135?1143.
[15] 王艳花,杨静.基于奇异值分解和小波神经网络的人脸识别[J].现代电子技术,2019,42(12):40?44.
[16] 金杰,朱海岩,李子潇,等.ENVI遥感图像处理中几种监督分类方法的比较[J].水利科技与经济,2014,20(1):146?148.
[17] 李静.高光谱遥感影像降维及分类方法研究[D].长沙:中南大学,2012.
[18] 谭琨,杜培军.基于再生核Hilbert空间小波核函数支持向量机的高光谱遥感影像分类[J].测绘学报,2011,40(2):142?147.
[19] 刘琴.机器学习[J].武汉工程职业技术学院学报,2001(2):41?44.
[20] 刘昕玥,姚建国,万定生.基于组合核函数SVM的中小流域流量预测研究[J].计算机仿真,2019,36(11):454?457.
[21] 张勇杰.基于分块KPCA和极限学习机的图像分类识别研究[D].郑州:郑州大学,2014.