基于Sentinel卫星影像的土地利用类型提取
2022-04-19陈媛媛雷鸣王泽远杨舒洁
陈媛媛 雷鸣 王泽远 杨舒洁
摘 要:为研究光学遥感和微波遥感数据在城市森林信息提取中的互补性,该文采用Sentinel-1A雷达影像与Sentinel-2A光学影像,基于面向对象决策树的方法和不同的特征组合策略(①Sentinel-2A的7个可见光波段;②Sentinel-2A的7个可见光波段加入5、6、7红边波段;③方案2中10个波段加入Sentinel-1A的VV、VH后向散射系数;④方案3中所有波段加上纹理特征、植被指数等共34个波段)对浙江省丽水市莲都區进行土地利用分类和比较。结果发现,Sentinel-2A的红边波段引入后森林的用户精度提高了15.32%,雷达后向散射信息使总体精度提高4.55%,但对森林的提取并无影响;当融合红边指数、后向散射、纹理特征和植被指数进行分类时,研究区域总体分类精度与单个地类的分类精度均有明显提高,总体精度达到90.06%,Kappa系数达到0.820 7。文中实验证明了融合Sentinel-1A与Sentinel-2A多源数据对森林覆盖度高的区域进行分类和信息提取是较为可靠的思路。
关键词:城市森林;Sentinel-1A;Sentinel-2A;多源数据;特征组合
中图分类号:S771.8 文献标识码:A 文章编号:1006-8023(2022)02-0054-08
Extraction of Land Use Types Based on Sentinel Images
——A Case Study of Liandu District, Lishui
CHEN Yuanyuan, LEI Ming, WANG Zeyuang, YANG Shujie
(College of Civil Engineering, Nanjing Forestry University, Nanjing 210037, China)
Abstract:In order to study the complementarity of optical remote sensing and microwave remote sensing data in urban forest information extraction, this paper uses Sentinel-1A and Sentinel-2A images, based on the object-oriented decision tree method and different feature combination strategies (① 7 visible bands of Sentinel-2A; ② 7 visible bands added 5, 6, 7 red edge bands of Sentinel-2A; ③ the VV and VH backscattering coefficient of the Sentinel-1A were added to the 10 bands in scheme ②; ④ all bands in scheme ③ added with 34 bands including texture features, vegetation index, etc.) to classify and compare in Liandu District, Lishui, Zhejiang Province. The results showed that the user accuracy of forest was improved by 15.32% after the red edge bands of Sentinel-2A were added in classification, and the radar backscatter information improved the overall classification accuracy by 4.55%, but it had little effect on the forest extraction results. When the red edge index, backscatter, texture feature and vegetation index were fused for classification, both the overall classification accuracy and the classification accuracy of a single land class were significantly improved, and the overall accuracy and the Kappa coefficient reached to 90.06% and 0.820 7, respectively. This paper proves that it is a reliable idea to classify and extract information from areas with high forest coverage by integrating multi-source data.
Keywords:Urban forest; Sentinel-1A; Sentinel-2A; multi-source data; feature combination
0 引言
城市森林用地在城市生态环境建设中具有重要地位,具有改善城市居住环境、调节城市温度和湿度等作用,因此加强对城市森林的监测对于相关部门管理与保护城市生态环境具有重大意义。目前,森林资源调查与监测主要依赖多光谱数据,并从森林分布的水平结构进行研究。光学图像光谱信息丰富,可见光到红外波段的植被反射光谱曲线有利于区别森林类型。但光学遥感穿透力较弱,无法进行全天候监测,且图像存在“同物异谱”和“同谱异物”现象,导致部分地类信息无法准确提取。合成孔径雷达(Synthetic Aperture Radar,SAR)可全天候、全天时成像,且穿透力较强,影像质量较高,有效数据较多。因此,综合多光谱遥感与合成孔径雷达是解决城市森林信息准确提取的有效途径。
分类方法的选择对于森林植被信息提取十分关键。遥感图像分类方法大体上可分为人工目视解译和计算机解译2类。早期传统的目视解译方法精度较高,但费时费力,很难在大范围的森林制图中推广应用。随着计算机技术的发展,目前计算机解译已经取代大部分人工解译的工作。遥感图像计算机分类方法根据划分标准不同而不同:根据分类过程中是否需要训练样本,可分为监督分类和非监督分类;根据分类最小单元的不同,可分为基于像元的分类和基于對象的分类;根据是否要求数据服从正态分布,可分为参数化分类和非参数化分类。随着人工智能技术的发展,机器学习方法逐渐被用于遥感图像分类领域。决策树算法是一种经典的机器学习算法,近些年经常被用于土地利用和土地覆被的分类中,均取得一定成效。
本文以丽水市莲都区为研究区域,以Sentinel-1A和Sentinel-2A数据为数据源,设置4种不同的特征组合策略,基于面向对象的决策树方法进行分类和精度评价,从而分析Sentinel-2A的红边波段、雷达后向散射、纹理特征和植被指数等在城市土地利用类型提取中的影响,探究多源数据融合较单一数据源在城市信息提取中的优势。
1 研究区域与数据
丽水市位于长江三角洲浙闽隆起区域,属于武夷山脉,是浙江省西南部陆地面积最大的地级市,地理坐标为118°41′~120°26′E, 27°25~28°57′N,如图1所示,森林覆盖率为81.7%,被誉为“浙江绿谷”。丽水市的地貌以中山及丘陵为主,东北部地貌以低山为主,也有中山和河谷盆地,西南部地貌以中山为主,偶有低山、丘陵和山间河谷。该地区因临近东海,所以受海洋影响较大。因此,丽水市具有显著的山地立体气候和中亚热带海洋性季风气候特征。2种气候的叠加为丽水市创造了优越的气候环境,总体特征为“四季分明,冬暖早春,雨量充沛,雨热同步,垂直气候,类型多样”,被誉为中国的气候养生之乡。本文以浙江省丽水市莲都区为典型研究区域,探讨集成多源遥感数据的森林信息提取。
本文实验采用的合成孔径雷达数据为欧空局网站下载的C波段IW模式Sentinel-1A数据。采用的光学数据为Sentinel-2A影像,该影像包含13个光谱波段,从可见光、近红外到短波红外,空间分辨率为10、20、60 m。Sentinel-2A数据在红边范围内包含3个波段,因此对植被监测和信息提取非常有效。2种中等分辨率影像均可以从欧空局网站免费获取,为城市土地利用类型提取提供了充足且成
本低廉的数据源。本文选取2020年8月浙江省丽水市莲都区Sentinel-1A和Sentinel-2A遥感影像各一景,并重投影到CGCS 2000坐标系下。Sentinel-1A有VV和VH 2种极化方式,数据格式为GRD格式,首先对Sentinel-1A进行多视处理、空间滤波、辐射定标、地理编码和重采样等预处理操作,数据重采样至10 m×10 m的空间分辨率。使用欧空局(ESA)的Sen2cor工具对Sentinel-2A数据进行辐射定标和大气校正处理,并将60 m分辨率的波段重采样至10 m×10 m,本文实验用到重采样后的2、3、4、8、8a、11、12波段以及3个5、6、7红边波段。
2 研究方法
本文的分类总体思路包括特征提取与组合、面向对象分割和决策树分类3部分,技术路线如图2所示,在对图像做过预处理后,分别采用图2中的4种波段组合策略获取不同的多波段组合图像,方案1:Sentinel-2A的7个可见光波段(2、3、4、8、8a、11和12波段);方案2:方案1中7个波段加入3个5、6、7红边波段;方案3:方案2中10个波段加入Sentinel-1A的VV、VH后向散射系数;方案4:方案3中所有波段加上纹理特征、植被指数等共34个波段,并采用面向对象多尺度分割方法对不同组合图像进行分割,然后基于CART决策树算法进行分类和精度评价。
2.1 特征提取
2.1.1 纹理特征
纹理特征属于一种全局性特征,可以用来描述地物对象内部的特征,需要基于对象尺度进行计算。纹理特征通常通过一些特征指标来描述,纹理提取有灰度共生矩阵、灰度差分统计和局部灰度统计等方法,本文选用最常用的灰度共生矩阵方法,用灰度共生矩阵计算出的方差、对比度、熵、角二阶距和相关度这5个特征来表征纹理,见表1,其中,Pi,j表示对灰度分别为i和j (i, j=0, 1,2 3,…, N)的像素对同时出现的频率,即灰度共生矩阵,进行归一化处理的结果。
本文分别对Sentinel-1A影像和Sentinel-2A影像提取纹理特征。对于Sentinel-1A数据,分别提取VV和VH图像的5个纹理特征值;对于Sentinel-2A图像,先对4个10 m空间分辨率的波段(2、3、4和8波段)进行主成分分析,选择前2个主成分波段来计算纹理,也可得到10个特征值。灰度共生矩阵的窗口尺寸大小选5×5,方向选择x=2,y=2。
2.1.2 植被指数特征
本文选用了2个植被指数,分别是归一化植被指数(NDVI,公式中用NDVI表示)和Sentinel-2A的红边指数。归一化植被指数是光学图像信息提取中最常用的一个指数,由近红外波段与红光波段计算得到。公式如下
NDVI=B8-B4B8+B4 。 (1)
式中:B8为Sentinel-2A数据的近红外波段;B4为Sentinel-2A数据的红波段。
归一化植被指数可以区分出植被与非植被区域,因此被广泛用于植被信息的提取中。
Sentinel-2的红边指数(公式中用S2REP表示),即红边范围内植被反射率曲线斜率最大处,研究表明,该参数对植被的提取尤其是植被类别区分非常有用。公式为
S2REP=705+35×(0.5B7+B4-B5)/(B6-B5)。
(2)
2.2 面向对象分割
面向对象分割以一个个独立的对象,即同质性像元的集合作为基本处理单元。对象比单个像元含有更加丰富的信息,能在更多维数组特征下表征其类别属性,并通过特征计算及组合达到信息提取的目的。且在面向对象的分割过程中,可综合考虑均质区域的光谱、纹理和几何形状等信息,得到与真实地物边界更加接近的分割多边形。后续的分类在分割得到的均质多边形的基础上进行,因此分类速度更快,分类结果与真实地表更加接近。
影像分割是面向对象分类的前提,也是分类中最重要的步骤,将对分类结果产生至关重要的影响。本文选用面向对象多尺度分割的方法进行影像分割。面向对象多尺度分割采用的是一种自下而上的区域合并算法。首先基于像元按异质性最小的原则合并成较小的对象;然后再根据小对象间的异质性合并成较大的对象;最后在给定的分割尺度下,达到设置的最小异质性时即完成分割。因此,多尺度分割是一种逐级合并的过程。分割结果的好坏直接影响最终的分类精度,分割尺度太小,地块过于零碎,分割尺度过大则会导致很多细节信息丢失。而在面向对象分割中,分割尺度、颜色因子、形状因子、光滑度和紧致度等参数共同决定分割的效果。本文通过多次实验,结合目视解译的方法来确定最佳的参数设置,最终确定本次实验所采用的参数为:最佳分割尺度为24,形状因子设为0.2,颜色因子为0.8,紧致度为0.6,光滑度为0.4。此外,分割在4个空间分辨率为10 m的波段上进行,即将2、3、4、8的波段权重设为1,其余波段设为0。
2.3 决策树分类及精度评估
用决策树方法进行分类的本质是从训练数据集中归纳出一组能对训练样本进行正确分类的规则。在选择决策树时,应选择与训练样本矛盾小、泛化能力强的决策树;而且选择的条件概率模型应该不仅对训练样本有很好的拟合,还对未知数据有很好的预测。
CART决策树的基本原理是通过对训练样本集的循环分析形成二叉树。CART决策树算法在分支结点上进行布尔运算,判断条件为真,则在节点的左分支,否则在右分支,通过运算最后得到二叉决策树。当决策树的层数达到预先设置的最大值,或所有叶结点中的样本属于同一个类别或样本数为1时,CART决策树算法建树停止生长,完成分类器的训练。CART决策树选择使子节点的GINI指数值最小或者回归方差最小的属性作为分裂的方案,也就是最小化分类树。
为保证分类规则的客观性,随机生成若干个矢量样本点,分别对其进行类别赋值,再将矢量数据转换为样本,用于决策树分类。本文结合高分辨率Google Earth影像和实地调研资料在Arcgis中随机生成1 500个随机样本点,其中987个作为训练样本,余下的为验证样本。为了减少监督分类中样本对分类结果的影响,本实验中选取同一组训练样本对不同的特征组合进行分类,并利用同一组验证样本计算每个分类结果中的总体精度(OA)、用户精度(UA)、生产者精度(PA)和 Kappa 系数,从而对分类结果进行定量评价。
3 结果与分析
通过计算不同方案分类结果的混淆矩阵,可得到各类别地物的分类精度及总体分类精度,见表2。4种方案的总体分类精度分别为79.55%、83.95%、88.50%和90.06%,Kappa系数分别为0.722 6、0.754 3、0.799 1和0.820 7。由此可见,当逐渐增加特征参与分类时,分类精度在一定程度上是逐渐提高的。第4种方案的总体分类精度和Kappa系数最高,表明当融合Sentinel-1A雷达影像与Sentinel-2A多光谱影像,且加入纹理、红边指数和植被指数时可显著提高研究区域地物的分类精度。由表2还可看出,在本实验的4种方案中,水体的分类精度相对于其他地类都是最高的,这也与实际情况较吻合,水体在整个光谱范围内都呈现出较弱的反射率,因此相对于其他地物更易于区分,这一点从4种方案的分类结果图(图3)中也可以很容易看出来。
在方案1中,仅使用可见光波段进行分类得到的结果较差,尤其是建筑和交通用地存在混淆,且整体的分类效果不佳,因为部分建筑和交通用地在视觉上较为相似,在光谱图像上也会存在“同谱异物”和“同物异谱”的现象,因此仅仅利用光谱信息很难将二者有效区分。加入了红边波段之后(方案2),总体精度提高4.4%,Kappa系数提高0.037 1,建筑和交通用地分类效果稍有改善,建筑区的生产者和用户精度分别提高了2.5%和0.51%,交通用地的生产者精度和用户精度分别提高了0.14%和1.84%,但在密集区错分现象依然明显,说明红边波段的加入对于光谱相似的地物区分效果不明显。对于林地,通过表2和图3可以看出,加入红边波段后提取效果明显变好,其用户精度提高15.32%,表明红边波段对城市植被提取有较为显著的作用,并在一定程度上可提高研究区域的整体分类精度。
方案3加入了VV和VH 2个后向散射系数,其他变量保持一致,可以看出加入雷达后向散射信息后整体分类效果变好,总体精度提高4.55%,Kappa系数提高0.044 8。对于交通用地和建筑分类精度明显提高,建筑的生产者精度和用户精度分别提高了16.4%和6.13%,可以看出雷达波段对于建筑和交通用地的提取有明显促进作用,这与实际情况较为符合,因为建筑物与地面之间构成的二面角具有较强的后向散射回波信号,在雷达图像上呈现高亮色调,易于区分。但通过观察林地分类结果并无明显变化,生产者精度和用户精度也无明显波动,说明雷达后向散射系数的引入对于城市森林的提取作用不明显。但基于总体分类效果的提升,仍可证实雷达波段有利于植被覆盖度较大区域地物类型的区分。
方案4中加入了纹理特征和2个植被指数,其余变量保持一致,从分类结果可知,建筑用地与交通用地的混淆现象大大降低,两者的用户精度和生产者精度均有大幅提高,建筑用地用户精度提高到89.25%,生产者精度提高到91.16%,对于交通用地,2个指标分别提高到92.19%和90.74%,通过观察可知,建筑用地与交通用地相比具有明显的纹理特性,因此纹理特征的引入可降低两者的混淆。与方案3相比,林地的分类精度也有明显提高,其生产者精度和用戶精度分别提高4.11%和8.01%,这与植被指数与红边指数的引入有关,进一步表明归一化植被指数和Sentinel-2A的红边指数对于植被信息的提取具有显著的影响。且方案4的整体分类精度是4种实验方案中最高的,总体达到90.06%,Kappa系数达到0.820 7。结果表明将Sentinel-1A数据和Sentinel-2A数据集成,结合提取的植被指数、纹理特征与雷达后向散射特征和Sentinel-2A红边信息用于植被高覆盖区域的分类中可以大大提高分类效果。
4 结论
本文利用Sentinel-1A与Sentinel-2A数据,并融合纹理特性、植被指数等多源特征,基于面向对象决策树分类的方法,进行浙江省丽水市土地利用类型的提取,通过实验对比可得到结论如下。
(1)将可见光波段与红边波段融合,能提高研究区的总体分类精度,对林地提取促进效果最为明显。
(2)光学影像数据与雷达影像数据特征融合,虽然对城市林地的分类提取没有明显改善,但相对于可见光与红边波段融合,可明显提高城市建筑用地及交通用地的分类精度,也在一定程度上提高了研究区域的总体精度。
(3)当融合纹理特征、植被指数、雷达后向散射和红边波段等所有特征时,更有利于植被、交通用地等的提取,无论是从分类结果的目视解译还是定量评价,其结果都是4种方案中最优的。
本文通过不同数据方案组合,证实了集成雷达数据与多光谱数据在城市土地利用类型分类上的优势,为高植被覆盖度区域的信息提取提供了一定的参考。
【参 考 文 献】
陶吉兴,季碧勇.浙江森林资源一体化监测理论与实践.北京:中国林业出版社,2016.
TAO J X, JI B Y. Zhejiang integrated monitoring of forest resources theory and practice. Beijing: China Forestry Publishing House, 2016.
郑亚卿,杨张海,高凯旋,等.基于多时相Landsat-8的森林生态系统树种精细分类.測绘与空间地理信息,2021,44(6):158-161.
ZHENG Y Q, YANG Z H, GAO K X, et al. Sophisticated classification of tree species in forest ecosystem based on multi-temporal landsat-8. Geomatics & Spatial Information Technology, 2021, 44(6): 158-161.
BALLERE M, BOUVET A, MERMOZ S, et al. SAR data for tropical forest disturbance alerts in French Guiana: benefit over optical imagery. Remote Sensing of Environment, 2021, 252: 112159.
王馨爽.多维度SAR森林及其类型分类识别方法研究.西安:西安科技大学,2013.
WANG X S. Multi-dimension SAR for forest recognition and forest type classification. Xian: Xian University of Science and Technology, 2013.
王长青,李贝贝,朱瑞飞,等.哨兵一号协同吉林一号影像的树种识别研究.森林工程,2020,36(2):40-48.
WANG C Q, LI B B, ZHU R F, et al. Study on tree species identification by combining sentinel-1 and JL101A images. Forest Engineering, 2020, 36(2): 40-48.
李树涛,李聪妤,康旭东.多源遥感图像融合发展现状与未来展望.遥感学报,2021,25(1):148-166.
LI S T, LI C Y, KANG X D. Development status and future prospects of multi-source remote sensing image fusion. National Remote Sensing Bulletin, 2021, 25(1): 148-166.
赵春霞,钱乐祥.遥感影像监督分类与非监督分类的比较.河南大学学报(自然科学版),2004,34(3):90-93.
ZHAO C X, QIAN L X. Comparative study of supervised and unsupervised classification in remote sensing image. Journal of Henan University (Natural Science), 2004, 34(3): 90-93.
陈云浩,冯通,史培军,等.基于面向对象和规则的遥感影像分类研究.武汉大学学报·信息科学版,2006,31(4):316-320.
CHEN Y H, FENG T, SHI P J, et al. Classification of remote sensing image based on object oriented and class rules. Geomatics and Information Science of Wuhan University, 2006, 31(4): 316-320.
刘旭升,张晓丽.森林植被遥感分类研究进展与对策.林业资源管理,2004,31(1):61-64.
LIU X S, ZHANG X L. Research advances and countermeasures of remote sensing classification of forest vegetation. Forest Resources Management, 2004, 31(1): 61-64.
杨剑锋,乔佩蕊,李永梅,等.机器学习分类问题及算法研究综述.统计与决策,2019,35(6):36-40.
YANG J F, QIAO P R, LI Y M, et al. A review of machine-learning classification and algorithms. Statistics & Decision, 2019, 35(6): 36-40.
陈磊士,高霞霞,廖玉芳,等.基于CART决策树的高分二号洞庭湖区湿地分类方法.测绘通报,2021,66(6):12-15.
CHEN L S, GAO X X, LIAO Y F, et al. Wetland classification method of Dongting Lake district based on CART using GF-2 image. Bulletin of Surveying and Mapping, 2021, 66(6): 12-15.
LIU X C, YU J, SONG W, et al. Remote sensing image classification algorithm based on texture feature and extreme learning machine. Computers, Materials & Continua, 2020, 65(2): 1385-1395.
JIA L H, ZHOU Z F, LI B. Study of SAR image texture feature extraction based on GLCM in Guizhou Karst mountainous region// 2012 2nd International Conference on Remote Sensing, Environment and Transportation Engineering. June 1-3, 2012, Nanjing, China. IEEE, 2012: 1-4.
BELLON B, BEGUE A, LO SEEN D, et al. A remote sensing approach for regional-scale mapping of agricultural land-use systems based on NDVI time series. Remote Sensing, 2017, 9(6): 600.
ZHANG T X, SU J Y, LIU C J, et al. Potential bands of sentinel-2A satellite for classification problems in precision agriculture. International Journal of Automation and Computing, 2019, 16(1): 16-26.
潘磊,孫玉军,王轶夫,等. 基于Sentinel-1和Sentinel-2数据的杉木林地上生物量估算. 南京林业大学学报(自然科学版), 2020, 44(3): 149-156.
PAN L, SUN Y J, WANG Y F,et al. Estimation of aboveground biomass in a Chinese fir (Cunninghamia lanceolata)forest combining data of Sentinel-1 and Sentinel-2.Journal of Nanjing Forestry University (Natural Science Edition), 2020, 44(3): 149-156.
陈丽萍,孙玉军.基于不同决策树的面向对象林区遥感影像分类比较.应用生态学报,2018,29(12):3995-4003.
CHEN L P, SUN Y J. Comparison of object-oriented remote sensing image classification based on different decision trees in forest area. Chinese Journal of Applied Ecology, 2018, 29(12): 3995-4003.
黄元,付义,康益堃,等.多元宇宙优化的林区道路图像检测方法.林业机械与木工设备,2020,48(2):16-19.
HUANG Y, FU Y, KANG Y K, et al. Forest road image detection method based on multivariate universal optimization. Forestry Machinery & Woodworking Equipment, 2020, 48(2): 16-19.
刘歆.基于遥感影像的土地资源利用区划自动识别技术.自动化技术与应用,2021,40(9):99-103.
LIU X. Automatic recognition technology of land resources division based on remote sensing image. Techniques of Automation and Applications, 2021, 40(9): 99-103.
王露,刘庆元.高分辨率遥感影像多尺度分割中最优尺度选取方法综述.测绘与空间地理信息,2015,38(3):166-169.
WANG L, LIU Q Y. The methods summary of optimal segmentation scale selection in high-resolution remote sensing images multi-scale segmentation. Geomatics & Spatial Information Technology, 2015, 38(3): 166-169.
马骁,王华,何瑞,等.基于非参数方法的黑河地区森林地上生物量估算及时空格局.林业科技情报,2020,52(4):10-16.
MA X, WANG H, HE R, et al. Estimation and spatial-temporal pattern of forest above ground biomass in Heihe region based on nonparametric method. Forestry Science and Technology Information, 2020, 52(4): 10-16.
劉雪莲,欧绍龙,陆双飞,等.基于Sentinel-1A微波遥感数据的森林蓄积量估测.西部林业科学,2020,49(6):128-136.
LIU X L, OU S L, LU S F, et al. Estimation of forest volume based on sentinel-1A microwave remote sensing data. Journal of West China Forestry Science, 2020, 49(6): 128-136.
毛学刚,陈文曲,魏晶昱,等.分割尺度对面向对象树种分类的影响及评价.林业科学,2017,53(12):73-83.
MAO X G, CHEN W Q, WEI J Y, et al. Effect and evaluation of segmentation scale on object-based forest species classification. Scientia Silvae Sinicae, 2017, 53(12): 73-83.
CHEN Y Y, HE X F, WANG J, et al. The influence of polarimetric parameters and an object-based approach on land cover classification in coastal wetlands. Remote Sensing, 2014, 6(12): 12575-12592.
毛学刚,竹亮,刘怡彤,等.高空间分辨率影像与SAR数据协同特征面向对象林分类型识别.林业科学,2019,55(9):92-102.
MAO X G, ZHU L, LIU Y T, et al. Object-oriented classification for tree species based on high spatial resolution images and spaceborne polarimetric SAR cooperation with feature. Scientia Silvae Sinicae, 2019, 55(9): 92-102.