基于SAR遥感的北方旱地秋收作物识别研究*
2016-10-12东朝霞周清波陈仲新
东朝霞,王 迪※,周清波,陈仲新,刘 佳
(1.中国农业科学院农业资源与农业区划研究所,北京 100081; 2.农业部农业信息技术重点实验室,北京 100081)
·技术方法·
基于SAR遥感的北方旱地秋收作物识别研究*
东朝霞1, 2,王迪1, 2※,周清波1, 2,陈仲新1, 2,刘佳1, 2
(1.中国农业科学院农业资源与农业区划研究所,北京100081; 2.农业部农业信息技术重点实验室,北京100081)
在我国北方旱地秋收作物生长关键期,云雨天气影响较大,无法及时、有效地获取光学遥感数据,因此利用雷达遥感进行旱地作物识别研究非常必要。文章以河北省衡水市为研究区,选择6期RADARAST-2全极化影像作为数据源,分类方法为随机森林法。首先通过对比不同时相间的组合结果,优选出了研究区典型秋收作物(玉米、棉花)的最佳识别时相及组合方式。其次,提取最优识别时相的后向散射信息、纹理信息、极化分解等3部分信息,依据信息间相互组合的结果及随机森林算法对变量的重要性评价,文中对上述3部分信息进行了重要性评估。结果表明:利用SAR识别旱地秋收作物时应着重关注作物生长前期的时相,其中玉米在6月27日单一时相下就可获得90%以上的高精度; 棉花面积小、地块破碎,但通过6月3日与6月27日两个时相的结合也得到了70%以上的精度。在玉米识别中极化信息具有较大的贡献,极化变量的加入主要增加了玉米和建筑用地的可分离性,与单纯利用后向散射信息分类相比精度提高了近7%; 同样,纹理信息和极化分解信息的加入也使棉花的精度提高了3%。最后,利用随机森林算法对变量的重要性评价机制,优选出对玉米识别最为重要的5个变量,依次为:VH、Alpha、Yamaguchi4-Odd、Freeman-Vol和Mean(HV)。该研究利用雷达数据进行旱地作物识别,验证了雷达影像对旱地秋收作物的识别能力,不仅保证了数据获取与天气状况的独立性,还凭借SAR独有的数据获取方式,为光学数据提供了补充。
合成孔径雷达(SAR)旱地农作物分类随机森林变量优选
0 引言
农作物识别是农作物农情监测的初始阶段和关键步骤,及时准确的监测农作物种类的空间分布是农情信息监测的基础。随着遥感技术的发展和遥感数据的普及,卫星遥感技术以其宏观、动态、及时、准确等优点成为许多农作物监测的重要手段[1-3],尤其是应用光学遥感数据进行作物识别已经形成了一套成熟的技术方法,其作物识别精度已达到较高水平,理论和技术也已经非常成熟,然而在实际应用中发现,在我国北方地区,多云雨的气候条件限制了光学遥感对作物的监测,很难在作物生长期内获得完整、连续的观测数据,致使不能满足农作物类型、面积及其空间分布等监测业务的需求。合成孔径雷达(synthetic aperture radar,SAR)的出现,使农作物监测不受云、雾、雨的影响,保证了数据获取与当地天气的独立性,并且微波遥感探测植被信息时,可获得与光学传感器完全不同的信息,鉴于以上优点,SAR被广泛地应用于作物监测与估产[4~9]。其中利用SAR监测南方水稻的研究最多[10-13],原因是水稻生长的季节往往为多云雨天气,很难获得光学遥感数据,并且由于水稻的介电常数较高,相对于其他共生植物,易将水稻和其他地物进行区分。当前国内外的相关研究主要集中在水稻长势监测和水稻制图的研究[14~16],监测的农作物类型过于单一,对旱地作物(小麦、玉米、棉花等)的识别与面积监测研究相对较少[17]。McNarin[18]使用机载C波段极化数据对苜蓿、玉米、大豆和小颗粒谷物(如小麦等)进行了识别研究。Hong Gang等[19]通过融合MODIS和RADARSAT-2遥感影像对草地和苜蓿进行区分,结果表明光学遥感影像和雷达遥感影像的联合应用可有效地提高作物识别精度。华国强等[20]利用Radarsat-2全极化影像数据,着重分析了玉米后向散射特征,并利用不同地物后向散射特征的差异提取玉米种植分布情况,精度达到84%。Jia Kun等[21]利用ENVISAT-ASAR和Terra-SAR数据,对我国北方旱地作物冬小麦和棉花进行识别和分类,结果表明雷达数据可作为旱地作物识别的有效遥感数据源。这些研究都表明了雷达遥感数据在旱地作物识别方面的可行性和潜力,然而旱地作物在其全生长期内没有水层覆盖,其介电常数与周围共生植被差异不明显,再加上复杂的种植结构,雷达遥感在旱地作物识别中具有一定的挑战性。旱地作物在我国分布极广,及时准确地掌握旱地作物的长势状况和种植面积信息是保障国家粮食安全的基础。文章通过系统的分析雷达对旱地秋收作物(玉米、棉花)的识别能力,掌握了玉米和棉花的最优识别时相及特征变量组合,为数据的获取和信息的利用情况给予了参考,为光学数据提供了补充。
针对我国北方旱地作物在关键生长期内受云雨天气影响,进而无法及时、有效获取光学数据的现状,该文使用覆盖作物全生育期的6期Radarsat-2全极化数据探究雷达数据在北方旱地秋收作物(玉米和棉花)识别中的适用性。该文主要包括3部分:(1)通过对研究区内5类典型地物后向散射系数进行统计,分析玉米、棉花与其他地类间的混淆程度; (2)通过对单极化、单时相及时相间的不同组合进行分析,探究玉米、棉花的最佳识别时相及组合方式; (3)对比分析后向散射信息、纹理信息和极化分解信息,探究不同信息组合对结果的贡献,并通过变量的优选改善了分类效率。
1 研究区和数据
1.1研究区概况
研究区位于河北省衡水市(图1),地处河北平原中部,介于东经115°21′~115°50′,北纬37°42′~38°11′之间,是中国北方典型的旱地作物种植区。地属北温带季风气候,全年大于或等于0 ℃的积温为4863 ℃,无霜期200 d左右,日照时数2563 h,年平均气温12.8 ℃,年降水量在500 mm左右,降雨主要集中在6~8月份。研究区面积为25 km×25 km,主要土地利用类型为农业用地,作物熟制为一年一熟或一年两熟制,秋收作物主要是玉米和棉花。玉米于6月初种植, 10月初收获,棉花为4月份种植, 10月下旬收获,玉米占绝大部分,棉花的比例较少。研究区主要覆盖地物类型共5类,分别是玉米、棉花、树林、水体和建筑用地。
1.2数据准备
结合玉米和棉花的物候特征,选取了2014年6月3日至2014年10月1日共6期精细全极化(Fine-Quad polarization,FQ)模式Radarsat-2数据,覆盖了研究区内玉米和棉花的整个生育期。该模式数据标称幅宽为25 km,重访周期24 d,分辨率为5.2 m×7.6 m(距离向×方位向),入射角约为18°~49°, 4种极化方式即HH、HV、VH和VV。表1为雷达数据的具体参数。为全面分析玉米、棉花与研究区其它地类的关系,将研究区的土地覆盖类型归结为5类:玉米、棉花、建筑用地、树林和水体,并于2014年6月利用差分GPS实地采集了玉米、棉花、水体的样方边界和地理位置坐标数据并详细记录了其覆盖类型。与此同时,记录了30个地面控制点,用于影像精矫正,其均匀分布在研究区内。为减少工作量且考虑到建筑物和树林随时间变动较小,研究获取了2013年5月份的GF-1号光学数据,通过多光谱和全色图像的融合得到了2 m分辨率的影像,建筑用地和树林样方的选取利用GF-1号光学数据作为辅助。研究共选择了225个典型地物样本,其中164个为训练样本, 61个为验证样本。
1.3数据处理
1.3.1数据预处理
GF-1号光学数据的处理过程包括图像拼接、感兴趣裁剪、投影转换和几何精矫正等。其中几何精矫正利用地面实测的30个控制点进行,保证误差控制在一个像元之内,满足后续研究的需要。
表1 研究区雷达遥感数据主要参数
获取时间入射角(°)极化分辨率(m)产品级别玉米生育期棉花生育期标注时间2014-06-0338.51全极化5.2×7.6SLC—苗期6/032014-06-2738.51全极化5.2×7.6SLC拔节前期蕾期前期6/272014-07-2138.51全极化5.2×7.6SLC抽穗前期蕾期后期7/212014-08-1438.51全极化5.2×7.6SLC抽穗后期花铃前期8/142014-09-0738.51全极化5.2×7.6SLC乳熟期花铃后期9/072014-10-0138.51全极化5.2×7.6SLC成熟期吐絮期10/01
图1 研究区位置
图2 3种极化分解
SAR数据预处理过程包括辐射定标、几何校正、影像配准、噪声滤波(LEE自适应滤波算法,窗口大小为5×5)等,雷达数据的预处理过程主要在NEST中进行。影像间相互配准是多时相SAR图像应用中必不可少的处理步骤之一,该研究中影像配准以GF-1光学数据作为基准影像,将SAR数据匹配到光学数据中,因光学影像参与了房屋和树林地面样方数据的选取,所以需要将其与雷达数据进行配准和坐标系的统一。雷达数据经处理后,空间分辨率为8m。
1.3.2纹理信息
纹理是遥感图像上的重要信息和基本特征,是进行图像分析和图像理解的重要信息源[22]。分类过程中纹理信息的加入已经成为一种重要的提高遥感影像分类精度的手段,因为纹理信息可以帮助抑制异物同谱和同物异谱现象的发生。许多研究也表明了纹理信息可以提高图像识别的精确性[23-24]。文中纹理信息的提取利用了Haralick提出的灰度共生矩阵(GLCM),它是一种最常见和广泛应用的纹理统计分析方法[25]。纹理提取过程中窗口大小设置为3×3,灰度量化级别为64,共有8个基于二阶矩阵的纹理滤波,这些滤波包括:均值(Mean)、方差(Variance)、协同性(Homogeneity)、对比度(Contrast)、相异性(Dissimilarity)、信息熵(Entropy)、二阶矩(Second Moment)和相关性(Correlation)。
1.3.3极化信息
全极化合成孔径雷达可测量观测目标的全散射矩阵,全散射矩阵包含着所观测目标的重要信息。利用目标分解理论对全极化数据进行目标散射机制的解译,可进一步分析物体的物理和几何特征[26-28]。首先将地物回波的复杂散射过程分解为几种互不相关的单一的散射分量,由于这些单一的散射分量都对应于具有不同物理和几何特征以及分布特征的地物,从而提供了更加丰富的地表覆盖信息,这样就很大程度地改善了地物信息的分类精度[29]。
将散射矢量矩阵k与其共轭转置矢量矩阵k*求外积,可得到三维极化相干矩阵T3,如式(1)所示:
(1)
式中,SX=SHV=SHV;SHH、SVV为同极化分量;SHV、SVH为交叉极化分量。
在PolSARPro-v4.2.0软件中利用T3矩阵进行分解,分解方法选择了Cloude-Pottier分解[30],Freeman分解(FM)[31]以及Yamaguchi分解(YG)[32]。图2给出了不同分解方式下的图像表达。
1.3.4分类方法
随机森林法(RandomForest,RF)是由美国科学家LeoBreimanHo[33]于2001年联合发表的一种新的机器学习算法。该算法以K个决策树为基本分类器,随机森林输出的分类结果由每个决策树的分类结果简单投票决定[34]。其已被成功的应用到土地覆盖制图中[35]。随机森林算法有很多优点: 1)对于很多种资料,它是可以产生高准确度的分类器; 2)它可以处理大量的输入变量; 3)它可以在决定类别时,评估变量的重要性; 4)在大的、高维数据训练时,不容易出现过拟合而且速度较快。RF分类过程在EnMAPBox软件[36]中实现,该软件包含多个内置分类算法,其中就包括随机森林算法。
图3 研究区典型地物不同极化雷达后向散射特征(a:HH b:HV c:VH d:VV)
J-M距离6/277/218/149/0710/01玉米玉米玉米玉米玉米棉花1.440.851.191.041.30树林1.840.600.520.500.85建筑物1.590.530.510.530.79水体1.921.821.881.801.81制图精度(%)87.1146.2645.8450.0163.39用户精度(%)95.6451.9948.4447.7258.48
表3单时相条件下棉花的识别结果
J-M距离6/36/277/218/149/0710/01棉花棉花棉花棉花棉花棉花玉米0.991.440.851.191.051.30树林1.660.510.370.410.260.21房屋1.170.790.961.050.830.87水体1.992.01.991.961.921.95制图精度(%)35.1416.899.4622.6410.143.72用户精度(%)45.0216.8911.4315.999.975.26
2 结果与讨论
2.1玉米、棉花与其他典型地物间的混淆性分析
图4 单极化对玉米识别精度的影响
利用获取的训练样方数据,从多时相全极化SAR数据中提取了玉米、棉花、水体、建筑用地和树林的后向散射系数,如图3所示。6月3日至10月1日分别对应棉花的苗期至吐絮期,棉花的后向散射系数先后经历了先上升后稳定的过程, 6月3日棉花处于出苗期,被地膜覆盖,裸露地表所占比重较大,表面散射强,此时其后向散射强度最小,与其他地物差异最大,随着棉花进入生长盛期,冠层体散射占据主要的后向散射部分,导致后向散射系数增加。玉米在6月27日交叉极化方式下与其他地物的差异最明显,除水体外,玉米与其他地物的差异达到5.7dB,易与其它地物进行区分,经过拔节期茎叶的迅速生长, 7月21日玉米的后向散射强度基本达到最大。从图4可以看出,玉米和棉花的后向散射系数均在7月21日左右达到最大,其后,除水体外的四类地物后向散射系数集中在3.4dB范围之内,互相混淆。研究区的城区高大建筑物因其独特的建筑结构和坚硬的水泥表面会形成二面角反射形成高亮区域,易与作物区分,但在农村地区情况却不同,部分村庄建筑物分布稀疏且较多为砖土结构的房屋,二面角反射不明显,加上周围常会有蔬菜或树林的影响,降低了整体建筑物后向散射系数的均值,对玉米的识别形成阻碍。树林的组成包括树苗、果树和树林,成分复杂,其与棉花的后向散射系数接近,在棉花的识别中会产生影响。
2.2玉米、棉花最佳识别时相的优选
首先利用单一时相进行玉米和棉花的识别,目的是探究单时相雷达数据对旱地秋收作物的识别能力及对特定地物的识别时相进行优劣排序。统计了玉米、棉花与研究区典型地物间的J-M距离,Jeffries-Matusita距离[37](J-M)用于确定2个类别间的差异性程度,这是一种定量的方式来衡量训练样本(ROI)的可分离性,它不需要假定地物的正态分布,具有较好的通用性[38]。这个参数的值在0~2.0之间,越接近1.8说明样本之间可分离性越好。结果见表2和表3。如表2所示,在玉米的整个生育期中6月27日获取了最高的识别精度,并且在该时相条件下玉米与其它四类地物的J-M距离均为最大,说明在玉米的整个生长期中6月27日即玉米的拔节前期为识别的最优时相。原因是在该时期玉米处于苗期和拔节期之间,植株普遍偏小,且玉米播种时行距与株距本身就较大,土壤裸露比例高,地表结构简单,在这种情况下,造成交叉极化方式表现出明显异于其它地物的特性,从图3可以明显地发现,在6月27日交叉极化条件下,除水体外,玉米与其它地物的差异达到了5.7dB。7月21日后玉米识别精度大幅降低,原因是树林、建筑物对玉米的影响增大,其J-M距离在0.5左右,其中8月14日玉米识别效果最差,该时期玉米与树林、建筑物的可分离度降到最低。因此,以制图精度作为标准,识别玉米的优势时相依次为: 6月27日、10月1日、9月7日、7月21日、8月14日。从表3可以看出,在覆盖棉花全生育期的6个时相中, 6月3日即棉花的苗期取得了最高的识别精度,该时期玉米尚未播种,取代玉米的为处于收获期的小麦,此时棉花植株小、覆盖率低,大部分土壤被地膜覆盖,由统计的J-M距离可以看出,该时期棉花与其它地物的差异性基本达到最大,说明棉花的苗期为识别的最佳时相。以分类后的制图精度作为标准,识别棉花的优势时相依次为: 6月3日、8月14日、6月27日、9月7日、7月21日、10月1日。通过表2、表3的对比可以发现,利用单时相进行玉米和棉花识别时,玉米的精度要优于棉花,原因可能是由于玉米为研究区的主要作物类型,棉花所占的比例很小,给识别带来了困难。
表4 时相组合对玉米识别的影响
J-M距离6/276/27+10/016/27+9/0710/01+9/076/27+10/01+9/07玉米玉米玉米玉米玉米棉花1.441.761.671.551.84树林1.841.891.861.051.90房屋1.591.771.750.971.83水体1.921.971.971.881.98制图精度(%)87.1189.8788.8267.3889.46用户精度(%)95.6495.7195.9762.3396.09
表5 时相组合对棉花识别的影响
J-M距离6/036/03+8/146/03+6/278/14+6/276/03+8/14+6/27棉花棉花棉花棉花棉花玉米0.991.521.731.721.85树林1.661.771.740.861.82房屋1.171.771.601.381.845水体1.192.02.02.02.0制图精度(%)35.1447.9768.9227.0363.85用户精度(%)45.0245.0864.7627.4977.78
接着,选取玉米识别的前3个优势时相,即6月27日、10月1日和9月7日; 棉花识别的前3个优势时相,即6月3日、8月14日和6月27日。将时相间进行组合,以优选出合适的时相组合。结果见表4、表5。表4为针对玉米识别进行的组合分析,从表中可以看出6月27日单一时相条件下玉米的识别精度达到了87.11%,识别精度最好的为6月27日与10月1日两个时相的结合,识别精度提高了约2.7%,发现通过6月27日与其他时相的结合精度并没有太大的提升,考虑到该识别精度只利用了后向散射信息,还未充分的利用极化信息和纹理信息,因此后期只选择了6月27日单一时相进行玉米的识别。从表5可以看出, 6月3日与6月27日两个时相的组合使棉花获取了最优的识别精度,与最优时相6月3日的分类结果相比精度提高了近34%,在该条件下棉花与其他地物的J-M距离均在1.6以上,说明6月3日与6月27日为棉花识别的最优组合方式。
最后,为比较极化贡献的差异性,对所有时相的单极化进行了分类,由于研究区棉花面积小,地块破碎,对结果的影响因素多,该过程只对玉米进行。结果见图4。从图中可以看出在玉米整个生育期中,交叉极化对精度的贡献浮动最大,同极化变化平稳。在玉米播种前期交叉极化对精度的贡献要远优于同极化,随着生育期的推进,交叉极化的优势迅速减小, 7月21日后同极化略高于交叉极化。同极化间进行比较发现,HH极化优于VV极化,且在生育期的初始期和结束期优势明显。
表6 不同信息组合对玉米、棉花识别精度的影响
玉米不同组合(6/27)棉花不同组合(6/03+6/27)12341234后向散射系数****后向散射系数****纹理信息**纹理信息**极化信息**极化信息**制图精度(%)87.1189.1893.9893.68制图精度(%)68.9269.9367.2371.96用户精度(%)95.6498.2999.0699.19用户精度(%)64.7684.8482.2385.89
图5 玉米变量重要性评价 图6 棉花变量 重要性评价(0603为6月3日;0627为6月27日)
建筑物棉花树林水体玉米建筑物713120014671592棉花8456100042树林983323805水体00091023玉米19271074829玉米制图精度87.11% 用户精度95.64%
表8组合3(玉米)精度
建筑物棉花树林水体玉米建筑物7302738850213棉花691371340116树林948079300水体0009187玉米406305155玉米制图精度93.98% 用户精度99.19%
2.3纹理和极化信息的重要性分析
根据上述分析,选择6月27日单一时相进行玉米的识别,棉花的识别时相确定为6月3日与6月27日2个时相的结合。以上分类过程只利用了后向散射信息,下面将在后向散射信息的基础上添加纹理和极化信息,探究二者的加入对分类精度的影响,结果见表6。从表6可以看出,纹理信息与极化信息的加入使玉米的识别精度有了较明显的提升,其中纹理信息的加入使精度由原来的87.11%增加到89.18%,增幅为2.07%,极化信息的加入使精度由87.11%增加到93.98%,增幅达6.87%,说明纹理信息和极化信息都在一定程度上提高了玉米的识别精度,相比之下,在玉米识别过程中极化信息的重要性要优于纹理信息。表7、表8分别为组合1和组合3的具体精度,通过二者的比较发现,在玉米识别过程中建筑用地对其影响最大,而极化信息的加入主要减少了玉米和建筑用地的混淆,进而提升了玉米的识别精度。组合4将后向散射系数、纹理信息和极化信息进行结合后分类,其分类效果与组合3类似,表明在玉米识别过程中后向散射信息与极化信息结合就能获得理想的结果。对于棉花,从表中可以看出纹理信息和极化信息的加入均起到了积极的作用,制图精度没有明显改善,用户精度提高了近20%。通过组合2和组合3的比较可知在棉花的识别过程中纹理信息的作用略优于极化信息,组合2相较于组合3而言制图精度和用户精度均有2.6%以上的提升,组合4为3部分数据的结合,其获取了最高了识别精度,说明在棉花的识别中,纹理信息和极化信息对于精度的提升都起到了积极的促进作用。图5、图6分别为对玉米、棉花识别过程中所有变量的重要性评价结果,二者趋势一致,从图中可以看出,后向散射信息和极化信息的重要性都要远优于纹理信息,除均值信息外所有的纹理信息对结果的贡献均较小,在玉米识别过程中贡献度最大的3个变量依次为α、FM-Vol、HV-Mean; 棉花识别过程中最优的3个变量依次为0627-HV、0603-FM-Vol、0627-HV-Mean。将玉米识别的组合3与棉花识别的组合4相互结合,得到最终分类结果,见图7。
图7 研究区玉米、棉花分布
图8 玉米变量优选
玉米的识别利用了6月27日单一时相,加上纹理信息和极化信息,特征数为38个(图5是对不同变量重要性的评价结果); 棉花的识别利用了两个时相的结合,其特征数共76个。理想情况下,每个变量都可提供额外的信息以提高分类精度,然而在机器学习的实际应用中,特征数量往往较多,其中可能存在不相关的特征,特征之间也可能存在相互依赖,特征个数的增加,会导致分析特征、训练模型所需的时间长,且容易引起“维度灾难”; 除此之外,多源数据的加入必然会引起因配准误差而产生的噪声。因此,该文将探究在玉米识别的多特征基础上,通过特征选择剔除不相关和冗余信息,以提高计算效率。由于研究区棉花面积小,地块破碎,受配准误差的影响要远大于玉米,特征的优选只针对玉米进行。为进行变量的优选,研究主要利用随机森林算法对变量的重要性评价机制,通过迭代依次除去重要性最小的变量,再对剩余的变量进行分类并进行精度评价,以此类推。结果见图8。在移除33个变量之前,玉米的识别精度浮动微小,剩余5个变量时精度迅速降低,这5个变量分别为:VH、Alpha、Yamaguchi4-Odd、Freeman-Vol、Mean(HV)。
3 结论
该文以河北省衡水市为研究区,获取了覆盖旱地秋收作物(玉米和棉花)全生育期的6期影像,系统分析了玉米、棉花在各个生长时期的后向散射系数,并结合随机森林算法对玉米和棉花进行了识别,验证了雷达数据在旱地作物识别中的可行性,并为光学数据的获取提供了补充。结论如下:
(1)研究利用全生育期的单极化数据对玉米进行识别,结果发现在不同生育期4种极化方式对结果的影响存在差异。拔节期之前,交叉极化方式在玉米的识别中贡献最为突出; 全生育期内HH极化优于VV极化,且在生育期的初始和结束期优势明显。
(2)研究利用单一时相及时相间的组合对玉米和棉花进行了识别,结果表明6月27日即玉米的拔节前期为玉米识别的最优时相, 6月3日与6月27日为棉花识别的最优时相组合。由于作物本身物候期的差异,导致在作物耕作的交替期往往会表现出极大的差异性,因此利用雷达数据识别旱地秋收作物时应着重关注作物生长前期的时相。
(3)研究对后向散射信息、纹理信息、极化分解信息等3部分信息进行了不同方式的组合,并针对玉米进行了变量优选,结果表明在北方地区玉米识别过程中,极化信息贡献度较大,其在后向散射信息分类结果的基础上精度提高了近7%,极化信息的加入主要增加了玉米和建筑用地的可分离性。纹理信息和极化信息的加入也使棉花的精度提高了3%。通过针对玉米的变量优选,其中5个变量的组合可使玉米获得较高的精度,然而所有信息结合获取的结果仍为最优。
该文利用雷达数据对华北平原地区的旱地作物进行识别研究可能还存在一定不足:研究区内旱地作物品种单一(大多数农田农作物类型仅包括玉米、棉花两类),且棉花面积小、地块破碎,今后的研究将在作物类型复杂的地区进一步深入。
[1]Gonzalez-Sanpedro M C,Le Toan T,Moreno J,et al.Seasonal variations of leaf area index of agricultural fields retrieved from Landsat data.Remote Sensing of Environment,2008, 112: 810~824
[2]Wang Dan,lin Hiu,Chen Jinsong,et al.Application of muti-temporal ENVISAT ASAR data to agricultural area mapping in the Pearl River Delta.International Journal of Remote Sensing,2010, 31: 1555~1572
[3]李志鹏, 李正国,刘珍环,等.基于中分辨TM数据的水稻提取方法对比研究.中国农业资源与区划, 2014, 35(1): 27~33
[4]Liu Chen,Shang Jiali,Vachon P W,et al.Multiyear crop monitoring using Polarimetric RADARSAT-2 Data.IEEE Transactions on Geoscience and Remote sensing,2013, 51(4): 2227~2240
[5]邵芸, 郭华东,范湘涛,等.水稻时域散射特征分析及其应用研究.遥感学报, 2001, 5(5): 340~345
[6]Le Toan T,Laur H,Mougin E,et al.Multitemporal and dual-polarization observations of agricultural vegetation covers by X-band SAR images.IEEE Transactions on Geoscience and Remote Sensing, 1989, 27(6): 709~718
[7]谭炳香, 李增元.SAR数据在我国南方水稻分布图快速更新中的应用研究.国土资源遥感, 2000, 43(20): 24~27
[8]李坤, 邵芸,张风丽.基于RadarSat-2全极化数据的水稻识别.遥感技术与应用, 2012, 27(1): 86~93
[9]丁娅萍, 陈仲新.基于最小距离法的RADARSAT-2遥感数据旱地作物识别.中国农业资源与区划, 2014, 35(6): 79~84
[10]董彦芳, 孙国清,庞勇.基于ENVISAT ASAR数据的水稻监测.中国科学D辑, 2005, 35(7): 682~689
[11]凌飞龙, 汪小钦,史晓明.多时相SAR图像水稻分布信息提取方法研究.福建师范大学学报(自然科学版), 2007, 23(3): 15~19
[12]汪小钦, 王钦敏,史晓明,等.基于主成分变换的ASAR数据水稻种植面积提取.农业工程学报, 2008, 24(10): 122~126
[13]杨沈斌, 李秉柏,申双和,等.基于多时相多极化差值图的稻田识别研究.遥感学报, 2008, 12(4): 614~618
[14]张萍萍, 申双和,李秉柏,等.水稻极化散射特征分析及稻田分类方法研究.江苏农业科学, 2006,l: 148~151
[15]杨沈斌, 李秉柏,申双和,等.基于ENVISAT ASAR数据的水稻遥感监测.江苏农业学报, 2008, 24(1): 33~38
[16]Haldar D,Patnaik C.Synergistic use of Multi-temporal Radarsat SAr and AWiFS data for Rabi rice identification.J.Indian Soc.Remote Sens, 2010, 38: 153~160
[17]王迪, 周清波,陈仲新,等.基于合成孔径雷达的农作物识别研究进展.农业工程学报, 2014, 30(16): 203~212
[18]McNairn H,Van der Sanden J J,Brown R J,et al.The potential of RADARSAT-2 for crop mapping and assessing crop condition//Proceedings of the Second International Conference on Geospatial Information in Agriculture and Forestry. Lake Buena Vista,FL,2000, 2: 81~88
[19]Gang Hong,Zhang Aining,Zhou Fuqun,et al.Integration of optical and synthetic aperture radar(SAR)images to differentiate grassland and alfalfa in prairie area.International Journal of Applied Earth Observation and Geoinformation, 2014, 28: 12~19
[20]化国强, 肖靖,黄晓军,等.基于全极化SAR数据的玉米后向散射特征分析.江苏农业科学, 2011, 39(3): 562~565
[21]Jia Kun,Li Qiangzi,Tian Yichen,et al.Crop classification using multi-configuration SAR data in the North China Plain.International Journal of Remote Sensing, 2012, 33(1/2): 170~183
[22]舒宁. 关于多光谱和高光谱影像的纹理问题.武汉大学学报(信息科学版), 2004, 29(4): 292~295
[23]张顺谦, 杨秀荣.神经网络和分形纹理在夜间云雾分离中的应用.遥感学报, 2006, 10(4): 497~502
[24]Shaban M A,Dikshit O.Improvement of classification in urban area by the use of textural features:The case study of lucknow city,Uttar Pradesh.International Journal of Remote Sensing.2001, 22: 565~593
[25]刘龙飞, 陈云浩,李京.遥感影像纹理分析方法综述与展望.遥感技术与应用, 2003, 18(6): 441~448
[26]Armando Marino,Irena Hajnsek.A change detector based on an optimization with polarimetric SAR imagery.IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(8): 4781~4798
[27]V Alberga.A study of land cover classification using polarimetric SAR parameters.International Journal of Remote Sensing, 2007, 28(17): 3815~3870
[28]Stefan Uhlmann,Serkan Kiranyaz.Integration color features in polarimetric SAR image classification.IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(4): 2197~2216
[29]陈劲松, 邵芸,李震.基于目标分解理论的全极化SAR图像神经网络分类方法.中国图象图形学报, 2004, 9(5): 552~557
[30]Cloude S R,Pottier E.An entropy based classification scheme for land applications of polarimetric SAR.IEEE Transactions on Geoscience and Remote Sensing, 1997, 35(1): 68~78
[31]Freeman A,Durde S L.A three-component scattering model for polarimetric SAR data.IEEE Transactions on Geoscience and Remote Sensing, 1998, 36(3): 963~973
[32]Yamaguchi Y,Moriyama T,Ishido M,et al.Four-component scattering model for polarimetric SAR image decomposition.IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(8): 1699~1706
[33]Breiman,L.Random forests.Machine Learning, 2001, 45, 5~32
[34]董师师, 黄哲学.随机森林理论浅析.集成技术, 2013, 2(1): 1~7
[35]Gislason P O,Benediktsson J A,Sveinsson J R.Random Forests for land cover classification.Pattern Recognition Letters, 2006, 27, 294~300
[36]Jakimow B,Oldenburg C,Rabe A,et al.Manual for Application:image RF(1.1), 2012
[37]Richards,J.A.Remote Sensing Digital Image Analysis.Berlin:Springer-Verlag,1999
[38]凌飞龙, 汪小钦,史晓明.多时相SAR图像水稻分布信息提取方法研究.福建师范大学学报(自然科学版), 2007, 23(3): 15~19
DRYlAND CROP IDENTIFICATION BASED ON SYNTHETIC APERTURE RADAR IN THE NORTH CHINA PLAIN*
Dong Zhaoxia1, 2,Wang Di1, 2※,Zhou Qingbo1, 2,Chen Zhongxin1, 2,Liu Jia1, 2
(1.Key Laboratory of Agri-informatics,Ministry of Agriculture,Beijing 100081,China;2.Institute of Agricultural Resources and Regional Planning,Chinese Academy of Agricultural Sciences,Beijing 100081,China)
Crop identification is the initial phase and key step of crops condition monitoring.Timely and accurately monitoring the spatial distribution of crop types is the basis of monitoring the information of farming condition.With the development of remote sensing technology and the popularization of remote sensing data, remote sensing has become an important means in agricultural monitoring. In particular, a complete set of technological method using optical remote sensing data for crop identification has already formed. However, during the key grow period of dryland crops in North China, since rainy or cloudy it is difficult to obtain timely and effective optical remote sensing data, it′s impossible to ensure the acquisition of the data during the key growth period of crops by using optical remote sensing technology, thus the continuous monitoring and research of crops are hindered. Therefore, it is necessary to conduct the study of dryland crops identification by the means of Synthetic aperture radar (SAR), which overcomes the above restrictions due to its all-weather, all-day imaging capability. In addition, when detecting vegetation information with microwave remote sensing technology, information different from that acquired through optical remote sensing can be acquired. Based on the SAR data, this paper chose Shenzhou, Hengshui city of Hebei Province as the study area and used the RADARSAT-2 images covering the area from June 3 to October 1, 2014 as the study data source. Classification method was the Random Forest (RF). First, by contrasting the combination of different time, the optimal phase and phase combination was selected for typical dryland crop (corn/cotton) in the study area. Second, we extracted backscattering coefficients, texture information and polarimetric decomposition from optimal phase, and combine the information in different ways. The contribution of different combination of input data to a random forest classifier was evaluated with map accuracy statistics and the evaluation of variables importance. The results showed that when identifying dryland crops, radar remote sensing should pay attention to the early phases during the growth period of crops. The accuracy can reach more than 90% for corn on condition of single phase, cotton areas were usually small and distributed sporadically, but it also reached more than 70% through the combination of June 3 and June 27.While using texture information and polarimetric decomposition it also increased3%. Finally, variable importance was estimated following by VH、Alpha、Yamaguchi4-Odd、Freeman-Vol and Mean(HV). The results demonstrated the capacity of SAR can identify the dryland crops and the independence of data. SAR with unique acquisition mode provided a complement to optical data.
synthetic aperture radar (SAR); dryland crop; classification; random forest (RF); variable selection
10.7621/cjarrp.1005-9121.20160804
2015-12-23
东朝霞(1989—),女,河北石家庄人,硕士研究生。研究方向:农作物遥感监测。※通信作者:王迪(1977—),男,辽宁鞍山人,副研究员。研究方向:农业遥感基础与应用。Email:wangdicaas@126.com
S127
A
1005-9121[2016]08-0027-10
*资助项目:国家科技重大专项项目“高分农业遥感监测与评价示范系统”(09-Y30B03-9001-13/15)