基于星载极化SAR数据的农作物分类识别进展评述*
2020-01-10周清波
孙 政,周清波,杨 鹏,王 迪
(中国农业科学院农业资源与农业区划研究所/农业农村部农业遥感重点实验室,北京 100081)
0 引言
快速获取农作物播种面积信息,可为作物产量估计和国家粮食安全提供重要数据支撑[1-2]。准确的农作物种植面积估算结果,对国家农业政策分析和粮食宏观决策具有重要的意义[3]。传统的农作物种植面积的统计方式是通过行政单元逐级汇总上报或基于农户抽样调查进行,存在耗时、耗力、耗财等缺陷,另外,易受错报、漏报和空报等主观因素影响,因此很难及时准确地获取大区域农作物的种植面积、结构及空间分布信息[4-5]。由于遥感技术具有时效性、低成本、客观性、大范围等优点,自1970年以来,应用遥感技术进行农作物识别、长势监测及产量估算就已经受到世界各国重视。经过多年的发展,光学影像(Landsat-TM/ETM+、SPOT-HRV、MODIS等)在不同尺度、不同种植结构的环境下进行作物识别分类研究已经有了长足的进展[6-11]。而在作物生长的关键阶段,云雨天气往往对光学影像获取的质量和数量带来较大影响,从而影响到作物面积监测的准确性和时效性。合成孔径雷达不受云雨天气影像,不依赖太阳光成像,具有全天时、全天候监测的优点,能够为作物识别分类提供有力的数据保障。
遥感在大范围的农情监测中有着不可替代的作用,其中光学遥感受云雨天气影响较大,在作物生长关键期往往无法获得足量清晰的光学遥感影像,严重影像了遥感作物识别的准确性和时效性,而合成孔径雷达(Synthetic Aperture Radar,SAR)能够全天时、全天候对地物目标进行监测。和光学数据不同,极化SAR数据包含了目标的散射矩阵、几何结构细节和介电常数信息,对地表植被散射体的几何形状、高度都很敏感,能够弥补光学遥感的不足,在农作物识别和监测中具有独特优势。
近年来,随着SAR传感器的不断完善,以及极化SAR图像处理技术的不断发展,利用SAR数据在作物分类识别、土地覆盖/利用等方面的研究也逐渐增多。文章拟对基于SAR数据在农作物识别中使用的不同传感器数据,不同作物的识别特征,多源遥感图像的融合算法,目标分解方法等进行了详细阐述、分析、归纳和总结,最后在此基础上指出目前所存在的问题并进行展望。
1 基于单、双极化SAR数据的农作物识别研究
1.1 基于单极化SAR数据的农作物识别研究
早期的SAR采用单波段、单极化的方式发射和接收电磁波,只能获得地物对某种单一电磁波某1种极化方式下的散射特性。众多学者根据作物后向散射系数(σ0)的不同,开始进行基于SAR数据的农作物分类研究。
1989年,Toan[12]等通过分析X波段SAR图像中地物的后向散射特征,发现水稻σ0随时间的变化较其他作物大得多,首次提出利用SAR影像进行水稻识别的可能性。继ERS-1雷达卫星发射成功后,日本、泰国、印度等国家的学者根据水稻σ0随时相变化较大这一特点,开展了一系列水稻SAR识别研究[13-17]。其中Toan[18]等基于多时相的ERS-1和RADARSAT-1 C波段数据,在印度尼西亚三宝垄和日本秋田进行水稻遥感识别研究,根据水稻σ0时域变化差异和阈值分类方法可以有效提取水稻种植面积,精度可以达到80%以上。Choudhury和Chakraborty[19]基于多时相的RADARSAT-1窄幅ScanSAR数据对印度奥里萨邦的水稻面积和长势进行监测,结果表明水稻σ0在整个生长期内表现出明显的时序变化特征,同时存在1个较大的动态变化区间(>10 dB),基于这一特征,采用基于专家知识的决策树分类法对试验区的水稻进行识别,精度高达98%。张荣群[20]等对多时相单极化SAR数据在作物分类前的数据预处理方法进行了研究,结果表明SAR数据用于农作物分类时,进行辐射校正、几何校正、降噪处理可以有效提高图像解译、分类和制作专题地图的精度。Shao[21-22]等基于多时相C波段RADARSAT-1数据,在广东省肇庆市,建立水稻时域后向散射模型对水稻进行监测和估产研究,结果表明多时相的SAR数据能够用于水稻识别(平均分类精度在90%以上),而水稻的估产则至少需要3个生长时相(插秧期、抽穗期、收割前期)的雷达数据。于利峰[23]等基于多时相单极化的Sentienl-1A数据,使用最大似然法、CART决策树方法对大兴安岭西麓地区春小麦进行识别,两种分类方法精度均在74%左右。
1.2 基于双极化SAR数据的农作物识别研究
单极化、单波段的雷达数据包含的地物信息较少,极大地制约了农作物SAR分类精度的提高,尤其是在地块分布破碎、种植布局复杂的区域[24]。早期的SAR数据空间分辨率较低也制约了识别精度的提高[3,25]。随着雷达技术的不断发展,从2002年的ENVISAT-ASAR开始,各国相继发射了一系列雷达卫星,作物识别不再局限于单极化的工作模式。
Baghdadi[26]等基于TerraSAR-X、ENVISAT-ASAR和ALOS-PALSAR数据对留尼汪岛的甘蔗在不同波长下的反射情况进行对比,发现后向散射信号随着甘蔗高度增加而增强,而且交叉极化(HV/VH)的甘蔗识别精度要优于同极化(HH/VV)。Shang[27]等对4类传感器(TerraSAR-X、ENVISAT-ASAR、ALOS-PALSAR、RADARSAT-2),在加拿大的渥太华及卡斯尔曼地区的农作物识别能力进行评价,结果表明,使用单一频率的SAR传感器进行农作物识别时精度较低,4种单时相数据识别精度均低于60%,而ASAR与PALSAR或TerraSAR-X与RADASAT-2联合的农作物识别精度可以提高到87.3%。化国强[28]基于两景RADARSAT-2数据,对江苏省镇江市水稻进行识别,利用HH与VV两种极化建立比值,设立其阈值为1.393时识别效果最佳,精度为92.64%。Jia[29]等的研究表明,在区分棉花和冬小麦时,ASAR数据要优于TerraSAR-X,精度可以比TerraSAR-X 90%的识别精度更高,基于3个时相的ENVISAT-ASAR数据和1个时相的TerraSAR-X数据,使用SVM的方法对华北平原的旱地作物(冬小麦和棉花)进行识别,结果表明,联合C和X两个波段的SAR数据进行旱地作物识别可以达到较高的精度(最高可至91.83%)。单、双极化SAR数据有较长的发展历史,基于这类数据的研究也较多,根据研究年代及使用数据不同,表1选取了部分单极化和双极化SAR数据在农作物识别中的使用的数据、方法及存在的问题。
表1 基于单、双极化SAR数据的农作物识别研究小结
2 单、双极化SAR数据结合光学影像的农作物分类研究
由于SAR影像分辨率和信噪比相对较低,所以SAR影像所包含的信息往往达不到光学影像的水平,但其特有的极化信息和相位信息是其他传感器所无法获取的,两者结合能够减小或消除目标地物可能存在的多义性、不完全性、不确定性和差异性[0-33]。所以,不少学者在对农作物的分类时,将两种数据结合起来,较单一数据源有了更高的分类精度。
张海龙[34]等基于Radarsat SAR和Landsat TM数据,使用SVR(Synthetic Variable Ratio)融合后,采用BP神经网络算法,对研究区域内的果园、耕地等6种地物进行分类,总体分类精度从仅使用TM影像的82.96%(Kappa系数0.77)提高到了91.12%(Kappa系数0.85)。McNairn[35]等基于两种SAR数据(RADARSAT-1、ASAR)结合两种光学数据(SPOT、Landsat)对加拿大24个试验区的作物(大豆、小麦等),使用神经网络、最大似然法、决策树进行分类,结果表明,结合多源数据能够有效提高分类精度(总体精度可达85%以上)。赵天杰[36]等基于ENVISAT-ASAR、ALOS-PALSAR和TM影像数据,将MIMICS[37]模型结合模糊神经网络对北京昌平地区的作物进行识别,总体分类精度达到93.54%,Kappa系数为0.925。Soria-Ruiz[38]等基于墨西哥中部RADARSAT-1结合ETM+数据,对当地地物类型(玉米、水体等)进行分类,相比仅使用光学数据,结合SAR数据后,分类精度提高7%以上。贾坤[39]等基于环境星多光谱数据和ENVISAT-ASAR(VV极化)数据对山东省禹城市的小麦、棉花、树林等进行分类,相较于仅使用环境星数据,结合了SAR数据后,3种分类方法(MLC、ANN、SVM)总体分类精度都有至少5%的提升。Dong[40]等将Landsat TM/ETM+结合ALOS-PALSAR数据面对海南省儋州市的橡胶、农田等进行分类,结果表明利用光学与雷达数据结合,可以将橡胶的识别精度提高到96%,总体识别精度为92%(Kappa系数0.88)。将光学遥感影像和SAR数据相结合时,融合算法是研究的关键问题,表2列举了部分目前单极化、双极化SAR数据结合光学影像在农作物识别时所使用的数据类型、融合算法、分类算法以及当前研究中存在的问题。
3 基于全极化SAR数据的农作物分类研究
相较于单、双极化数据,全极化数据能够提取地物目标完整的极化矩阵、几何结构细节、介电常数等信息,对地表植被散射体的空间分布、高度、植被散射体的形状和方向均很敏感,大量研究表明全极化数据在农作物识别方面较单极化、双极化数据更具有优势[41-48]。
多波段的全极化数据相结合,根据作物在不同物候期上散射特征的变化,能够对作物进行分类。McNairn[49]等在基于RADARSAT-2和TerraSAR-X数据进行农作物识别时发现,单一波段数据(RADARSAT-2)识别农作物时,对于玉米有较高的精度,而大豆和牧草识别精度则较低;在增加1种波段数据(TerraSAR-X)后,大豆识别精度提高了37%,牧草识别精度提高了11.3%。Evans[50]等基于巴西潘塔纳尔地区多时相的ALOS、RADARSAT-2和ASAR数据,对该地区森林、草地等进行分类,总体精度达到83%。
使用多时相的极化SAR数据,根据作物在不同生长时期散射情况的变化也可以实现作物识别。丁娅萍[51]利用多时相、多极化的RADARSAT-2全极化数据,对河北省枣强县的玉米和棉花进行识别,发现玉米和棉花在不同生长期的雷达散射机制有差异,通过比较不同极化方式的分类效果,发现VV极化优于HH极化,且这两种同极化识别精度优于交叉极化方式。东朝霞[52]等基于河北省枣强县6景全极化RADARSAT-2数据,使用不同的极化组合结合随机森林分类算法,对该地区玉米和棉花进行分类,优选出玉米和棉花识别的最佳极化组合和识别时间,在加入极化信息后,分类结果提高近7%。以上研究虽然使用了全极化数据,但是并没有进行目标分解的方法,极化信息没有得到充分利用。
极化分解是有效提取出目标散射特征的理论核心,最早由Huynen[53-54]提出。近30年来,各国学者相继提出了各种目标分解的方法,基于极化SAR地物信息提取代表性方法[55]大致如表3所示。
表3 极化SAR地物信息提取代表性方法
极化目标分解是从极化SAR数据中提取目标特征的重要方法,其主要分为相干分解和非相干分解两类,许多学者基于极化分解理论,在农作物识别方面进行了研究。
3.1 相干分解在作物分类中的应用
化国强[56]等基于2009年江苏睢宁县全极化的RADARSAT-2数据,使用Pauli分解结合Wishart监督分类,对该地区6种地物(水稻、玉米、大豆等)进行分类,其中建筑和水稻分类精度较高(建筑物达90.34%、水稻达97.92%),玉米和大豆分类精度较低(玉米为74.31%,大豆精度为77.84%),树林分类精度最低,为50.06%,总体分类精度为78.1%,Kappa系数为0.72,该方法对复杂的地形和种植结构下农作物识别效果较差。李坤[57]等基于2009年7—10月贵州省扎佐地区4个时相的RADARSAT-2数据,采用Pauli分解和基于特征值特征向量的分解方法进行水稻的识别研究,结果表明:在Pauli分解中,在水稻以Double-Bounce散射和体散射为主,偶次散射特征明显,在Pauli-RGB图像中呈现红色;在基于特征值特征向量分解中,与地形相关性较大的参数β与水稻种植区吻合最好,选择一定数量的训练区,对β设定阈值提取水稻信息,识别精度可达到85%以上,对比4个时相的数据,抽穗初期水稻散射机制最为明显,识别效果最佳,但是其β参数的物理意义不明确,有待深入研究。陈军[58]等基于江苏溧水和南京横溪的全极化ALOS数据,提出了一种基于Pauli分解结合SVM的监督分类算法,对研究区域内农田、建筑、水体、森林进行了分类,结果表明,提出的Pauli-SVM算法较Wishart算法、Freeman-SVM法、Yamaguchi-SVM法,能够有效地提高分类精度(精度较其他方法分别高出4.73%、17.77%、7.95%),分类精度达到94.67%,Kappa系数为0.89,该方法没有考虑空间几何信息。朱腾[59]等基于海南陵水县高分辨率X波段影像,提出一种基于超像元与Span-Pauli分解的高分辨率SAR影像非监督分类方法,对比分析了H/α-Wishart、像元级的Span-Pauli法与该方法对研究区域内5种地物类型(辣椒、幼苗耕地、茂密作物、裸土、水体)的分类结果,结果表明,基于超像素与Span-Pauli分类方法能够有效抑制分类结果中的椒盐现象,将总体的分类精度至少提高8%,该方法过分割保留了边缘信息,使分类结果出现较多的锯齿状类边缘。
3.2 非相干分解在作物分类中的应用
McNairn[60]等基于多时相的3种数据(ASAR、RADARSAT-1和全极化ALOS-PALSAR),比较Cloude分解、Freeman分解和Krogager分解对加拿大渥太华附近的玉米、大豆、谷物进行识别,使用决策树分类,总体分类精度达到88.7%。Jiao[61]等基于加拿大安大略省West Nipissing农业区2011年至2012年19幅全极化的RADARSAT-2数据,使用面向对象的分类方法,比较了Cloude分解和Freeman-Durden分解在该地区的分类精度,小麦、大豆等作物的整体分类精度达到95%,其中使用Cloude分解精度较使用Freeman-Durden分解精度高出近3%。Qi[62]等基于多时相的RADARSAT-2数据,对广州市番禺区土地覆盖(稻田、香蕉、裸地等地)进行分类及变化监测,在进行分类时,提出一种新的四分量算法,使用面向对象结合决策树分类,最终精度较Wishart分类法高出15%以上,达到了86.64%;在进行变化监测时,使用了面向对象结合Wishart分类的方法,并分析了不同地物混合对分类精度的影响,平均变化监测精度达85.2%,但是没有考虑农作物收割和播种对土地利用的改变,降低了监测精度。吴尚蓉[63]等基于河北省枣强县RADARSAT-2数据,在Freeman分解的基础上引入了体散射分量参数γ、二次散射分量参数y、θ和布拉格散射分量参数x,将农用地信息提取精度提高到96%以上,但该方法地物类型较复杂地区普适性较差。Tamiminia[64]等基于多时相L波段全极化SAR数据,利用目标分解理论设计一种核参数分类算法,并使用该算法对加拿大温尼伯5种农作物进行了分类研究,结果表明,相对于以往的常规分类算法,该法的分类精度平均提高5%,该方法核参数由试错法确定,如何找到最佳的参数有待进一步研究。Huang[65]等基于多时相的RADARSAT-2数据,分析了不同时相下地物散射特征的差异,使用二叉树的分类方法对加拿大安大略省西部地区玉米、小麦、大豆等进行分类,最终分类精度为87.5%,Kappa系数为0.85,但该方法只适用于全极化数据。
3.3 全极化SAR分类算法与光学数据结合的应用
全极化数据同样也能跟光学数据进行结合,但目前运用到植被分类中较少。Kussul[66]联合SAR数据(RADARSAT-2)和光学影像(EO-1)对乌克兰地区的作物(玉米、大豆等)进行分类,比较了神经网络、SVM、决策树的分类精度,其中神经网络分类结果最佳,精度达80.4%,结合SAR影像后,向日葵和甜菜的分类精度分别提高了6.6%和13.3%,但没有对作物整个生长期进行比较,缺乏一定的普适性。万剑华[67]等基于全极化RADARSAT-2和TM/ETM+数据,提出了主成分分析(PCA)结合HSV变换的图像融合方法,通过选取均值、熵和平均梯度与传统的影像融合方法(PCA变换、HSV变换、小波变换)进行定量对比,结果表明,新提出的方法增强了融合影像的纹理特征和细节反差,提高了影像的解译能力,但只使用SAR数据的第1主成分信息一定程度上丢失部分极化信息,降低了识别精度。
目前全极化数据在土地利用[68-70]、森林[71]、水稻[72-73]、土壤水分[74-75]等方面都有了广泛的应用。SAR图像分类算法可以分为基于统计规律或目标极化散射特性的非监督分类方法,以及基于先验知识的监督分类方法[55,76]。表4从相干分解、非相干分解、与光学数据相结合3个方面对基于全极化数据的农作物识别研究进行了小结。
表4 基于全极化SAR数据的农作物识别研究小结
4 总结与展望
国内外在利用极化SAR数据开展农作物类型识别与面积监测的研究日益增多,在理论、技术方法和应用上都取得了一定的成果,SAR技术在农作物遥感监测领域应用前景十分广阔。然而,SAR在作物识别中依然存在一些关键问题有待进一步的研究。
(1)研究对象单一。以往的研究对象大多为水稻,对旱地作物的研究较少。由于旱地作物在我国的种植面积大,对粮食产量的贡献率高,且在其关键生长期云雨雾天气频繁,而且,旱地作物种植结构、种植环境相对比较复杂,识别及分类难度更大。因此,开展基SAR数据的旱地作物分类识别研究显得尤为重要。
(2)识别精度不高。随着SAR技术的不断发展,尽管基于SAR数据的农作物识别精度有了一定程度的提高,但相比于光学遥感,总体精度水平仍不高。尤其是旱地作物,平均识别精度不足85%。无论作为独立的数据源还是光学遥感的补充数据,SAR数据尚不能满足我国农作物面积监测业务的精度要求。因此,急需开展提高旱地作物SAR识别精度的相关研究。
(3)分类算法缺乏机理性。在基于SAR数据的农作物分类算法研究方面,以往国内外大多采用常规统计算法或机器学习算法。这类算法均根据目标变量的统计学特征进行分类,分类过程中包含经验成分较多。由于对旱地地物的散射机制缺乏研究,该类算法无法从机理角度将旱地作物与周围地物的后向散射特征逐一区分,致使旱地作物分类精度偏低、普适性差。因此,充分利用全极化SAR数据提供的极化、相位及能量信息,以及结合面向对象的方法,不仅可以结合空间信息,还能有效抑制相干斑噪声,对开展复杂种植结构背景下的旱地作物散射机理机制研究对于提高农作物分类精度具有重要意义。
综上,今后应加强旱地作物散射机制的相关研究,从机理上将不同作物与周围地物的后向散射特征进行区分,提升作物分类精度,提高分类算法的稳定性和普适性,结合光学影像等多源数据,为改善SAR数据的作物分类效果提供合理、有效的方法。