APP下载

基于非线性降维时序遥感影像的作物分类

2018-10-11翟涌光屈忠义

农业工程学报 2018年19期
关键词:时相训练样本降维

翟涌光,屈忠义



基于非线性降维时序遥感影像的作物分类

翟涌光1,2,屈忠义1※

(1. 内蒙古农业大学水利与土木建筑工程学院,呼和浩特 010018; 2. 中国科学院遥感与数字地球研究所,北京 100101)

当前基于时序遥感数据的作物分类方法大都需要较多专家知识及人工干预,难以自动化,也难以移植到其他地区。将光谱降维技术用于时序遥感影像分析可以很好地解决这一问题。其中,非线性降维方法已经成功应用于高光谱数据,并且获得了比线性降维方法更好的结果。但是,直接将非线性降维方法用于时序遥感影像无法充分利用其时相维度的信息。该文改进了一种非线性降维算法——Laplacian Eigenmaps(LE)用于时序遥感影像的作物分类,该方法更加关注相同时相下不同作物生长季的物候特征差异,而不再仅依赖于整个生长季的物候曲线轮廓。改进的LE算法被应用于美国伊利诺伊州覆盖作物全生长季的Landsat 8时间序列影像。降维后保留的波段结合随机森林分类器基于美国农业部Cropland Data Layer(CDL)提供的训练数据完成了一系列的分类试验,并与传统插值未降维的方法进行对比。试验结果表明,改进的LE降维方法完成了更高的整体及各个类别的分类精度,其中整体分类精度达到85.37%,该方法作为一种自动化的方法,不需要人工干预,可直接移植到其他研究区,并且只需要较少的训练样本就可以完成一个较高的分类精度,为日后不同尺度的作物识别和提取研究提供了有效的方法。

遥感;数据处理;作物;分类;非线性光谱降维;时间序列;动态时间弯曲

0 引 言

近年来,全球人口数量持续增长,预计到2030年将达到87亿[1]。由于全球土地总量有限,因此人口增长将带来严重的粮食安全问题。为了更好地解决粮食短缺引起的经济和社会问题,急需提升农业用地的管理和监测水平[2-3]。精确、及时的作物种植结构信息对于各级政府制定相应农业政策和经济发展计划、确保国家粮食安全和社会稳定具有重要意义。遥感技术凭借其观测范围大、监测周期短等优点,已经成为农情监测最主要的手段之一,广泛应用于作物种植结构识别及面积估算等方面[4]。

当前,已有很多研究人员使用遥感数据,结合监督或非监督分类算法,完成作物种植结构制图[5-7]。由于作物类型复杂多样,不同作物间的“异物同谱”现象使得仅利用单一时相遥感数据进行作物类型识别存在明显不足,而基于时间序列遥感影像的制图方法已经被证明可以完成更高的分类精度[8-12]。尽管时间序列遥感数据已经广泛应用于作物种植结构识别,但是要建立高精度、自动化的分类模型,仍然面临着一些挑战。首先,对于一定时期内,土地覆盖类型没有发生变化的区域,其相应时间序列数据之间存在高度相关性,这一特点已经在遥感影像变化监测研究中被广泛使用,换言之,高度相关性意味着时间序列遥感数据也存在着数据冗余问题[13-15]。因此,为了提高分类精度,时间序列遥感影像在分类前有必要进行降维处理。其次,遥感影像在成像过程中,观测到的场景分量贡献与其表面积不成线性关系,这一点对植被类型尤其明显。加之,遥感影像成像过程会经历不同场景分量之间的多次散射,这种散射受波长、观测角度和光照条件、及场景分量三维结构等多种因素影响,因此,使得遥感影像有着内在的非线性特征,所以非线性降维技术更适合用于遥感影像[16-18]。其次,时间序列影像在成像过程中易受云覆盖的影响,导致部分时相数据无效,这使得时间序列数据使用前往往需要较多的人工预处理操作,例如可用数据筛选、时相插值或者时间序列曲线滤波等,这显然降低了分类模型的自动化程度,难以移植到其他地区。为了解决上述问题,Zhai等将非线性降维方法LE(laplacian eigenmaps)与DTW(dynamic time warping)度量相结合,提出了一种自动化的时间序列土地覆盖分类方法——LE-DTW[19]。选择LE降维算法的原因包含以下3个方面。第一,LE是一种非线性降维方法,当应用于高光谱遥感数据时已经被证明比线性降维方法效果更好[20-21]。第二,LE是一种局部流形学习方法。局部流形学习方法的优点是通过构建近邻图可以保留原始数据的局部特征,与全局方法(例如,ISOMAP方法[22])相比,近邻图构建时更强调数据的自然聚类属性[16]。第三,LE是一种基于图理论的方法,降维只依赖于数据点间的相似性程度,因此与其他局部保留方法相比,更容易结合不同的相似性度量。LE-DTW方法不仅利用了时间序列影像中全部可用的数据,而且不需要进行时间序列重构等人工预处理操作,就能完成高精度的土地覆盖制图。

然而,当将LE-DTW方法用于作物种植结构识别时,也存在着不足。这主要是因为LE-DTW方法对时间序列影像中的每一个时相数据都赋予了相同的权重。而识别作物种植结构主要依赖于作物生长的物候特征差异,这种物候特征差异往往只体现在作物生长的几个关键时期。因此,要提升作物种植结构识别精度,需要充分利用作物生长季的关键物候特征。本研究为实现高精度、自动化的作物种植结构识别,提出一种基于时相加权改进的LE-DTW方法——LE-wDTW(LE-weighted DTW)。该方法可用于任意传感器的时间序列数据,本文以Landsat 8数据为例。

1 研究区和数据来源

1.1 研究区概况

本文以美国中部的主要农业种植区伊利诺伊州为研究区(图1)。该州属温带气候,80%的土地为农业用地,夏季炎热,冬季多雪。其地理位置位于:36°58¢N—42°30¢N、87°30¢W—91°30¢W。年平均降水,北部为800~1 200 mm,南部为1 200~1 600 mm。北部作物生长期为160 d,南部为210 d,主要种植作物为玉米和大豆等。

图1 研究区位置示意图(2017年6月27日Landsat8数据)

1.2 数据来源

1.2.1 Landsat 8数据

本研究所用的Landsat 8 OLI(operational land imager)数据从美国地质勘探局网站下载(http:// earthexplorer.usgs.gov/)。Landsat 8的重访周期是16 d,每年可获取22或23景影像。本研究中,下载使用了条带号为Path 23/Row 32对应区域的2017年4月—10月Landsat 8 OLI L1T全部13景影像,每景影像的获取日期及云覆盖比例如图2所示,不同时相影像包含不同程度的云覆盖现象,影像大小为7 686×7 880 pixels。本研究使用空间分辨率为30 m的反射率波段1-7(包括海岸、蓝、绿、红、近红外、短波红外1和短波红外2波段)和2个云掩膜文件。波段9由于对水汽吸收较敏感,故没有使用[23]。所有影像数据通过系统的几何校正和辐射校正,采用UTM-WGS84投影坐标系。

图2 研究区2017年影像的获取日期及云覆盖比例

1.2.2 验证数据

本研究选择由美国农业部国家农业统计服务中心发布的2017年CDL(Cropland Data Layer)数据作为参考验证数据,该数据可从CDL网站下载(http:// nassgeodata.gmu.edu/CropScape/)[24-26]。每年的CDL数据均采用中高分辨率遥感影像结合大量地面数据通过无参监督分类方法来完成,该数据对于主要作物类型的分类精度高达95%,已在很多研究中被用作监督分类方法的训练和验证数据[16, 27]。CDL数据的空间分辨率为30 m,定义了110个土地覆盖及作物类型,研究区主要土地覆盖及作物类型(覆盖面积大于2%)如下:玉米占41.92%,大豆占35.06%,建设用地占8.77%,落叶林占6.1%,草地占5.57%。

2 研究方法

2.1 LE-wDTW方法

LE降维算法[22]起源于图谱理论,通过保留局部流形结构来寻找高维数据的低维表达。对于遥感影像而言,其波段数量就是每个像元所在的原始特征空间维度。特征空间中的流形结构可以用近邻图来表达,每个像元都是一个图结点,将它与特征空间中距离(通常是欧氏距离)最近的个结点连接起来,这种连接表达了像元间的相似性程度。LE算法通过图拉普拉斯矩阵计算其特征向量作为原始数据降维后的结果。

LE-DTW方法是在原始特征空间中,用DTW度量[28]代替欧氏距离来为每个样本寻找其个最近邻点。对于时间序列遥感影像,在原始特征空间中,如果某像元的某个时相维度数据是无效的(例如,被云覆盖),那么在降维前构建时间序列输入数据时直接剔除即可,将其他全部有效数据保留。这就使得所构建的时间序列数据是不等长的,而DTW度量可以寻找到2个不等长时间序列间的最优弯曲路径,从而衡量出2个不等长时间序列的相似性程度。

标准的DTW度量在寻找2个时间序列间的最优弯曲路径时,对每个时相都赋予相同的权重,而不考虑路径中每一步所对应2个时间序列在时相上的差异。对于作物分类而言,所依赖的物候特征与时相有密切的关系,相同时相下的物候差异才是用来区别不同类型作物的主要特征。因此,在用DTW计算2个时间序列间路径的最小累积距离时,如果路径对应的两个时相一致或相近时,应赋予更小的权重,而当路径对应两个时相距离较远时,则应赋予更大的权重。据此,本文提出一种加权版的LE-DTW算法(LE-wDTW)。

在LE-wDTW算法中,用加权DTW(wDTW)度量代替原始DTW距离来为每个样本寻找其个最近邻点。设时间序列和的时相长度分别为和:

时间序列和可以按序构成一个´的路径矩阵,矩阵的每个元素()对应于点ts的排列。计算wDTW距离时,在´的路径矩阵中,ts的距离如下计算:

式中(t,s)代表ts的时相间隔,是一个经验常数,其取值范围为[0, +µ],为时间序列中点,即作物整个生育期覆盖天数的一半,本研究区作物整个生育期约为190天,故应为95 d。

其中用来控制函数曲率(斜率),通过试验发现,不同的值对函数曲率的影响包含以下4种情况:1)当=0时,所有时相的权重值相等,此时,LE-wDTW即为LE-DTW;2)当=0.03左右时,权重与时相间隔成正比,即Logistic model接近线性模型;3)当=0.10左右时,不同时相间隔对应“S”型权重模型,不同的值代表不同的“S”型弯曲程度,这也是本研究主要采用的权重计算模型;4)当 >3时,权重模型接近二值模型,即前一半时相间隔权值一致,后一半时相间隔权值一致。本研究中,不同值的权重计算模型如图3所示。

2.2 分类方法

在对原始数据完成降维之后,可以将降维后的数据直接输入任意分类器完成最终作物种植结构提取。为了验证LE-wDTW方法的效果,进行了一组定量分类试验。为了更好体现出作物物候特征,将时间序列数据按波段-时相进行排列,即同一波段的所有时相数据排列在一起。试验共选择3种数据处理方法进行对比,分别为TI(Temporal Interpolation)、LE-DTW和LE-wDTW方法。其中,TI法,是直接对原始时间序列数据进行插值而不进行数据降维操作,将被云覆盖的无效数据用前后相近时相的有效数据来代替,然后直接输入分类器完成分类。LE-DTW和LE-wDTW方法则直接将原始时间序列数据中的无效数据剔除,保留全部有效数据进行降维,将降维后的数据输入分类器完成分类。本试验采用随机森林分类器[29],树分类器数量设置为500。

图3 不同经验值a下的Logistic model权重(时间序列中点b=95)

2.3 试验设计

2.3.1 分类方法对比

所有试验均采用相同的参数设置,训练和测试数据分别从2017CDL数据中获取。从各个类别中随机选择1%的CDL像素作为训练数据,其余数据进行测试。LE-DTW和LE-wDTW有2个共同参数需要设置:一个是为每个像元选择最近邻的数量,本试验采用“图生长”策略来自适应选择,无需人工设置[30-31];另一个参数是降维后保留的波段数量,本试验中降维后所有方法均保留10个波段,事实上,保留的波段数量大于类别数(本试验类别数为5)就可以确保保留了足够的有效信息[16]。对于LE-wDTW方法中计算权重所需的参数,通过预试验发现,当=0.1和=95天时,有最好的全局精度,故分类试验中按此参数设置。最后,计算每种方法分类结果的混淆矩阵,用总体分类精度、各类别分类精度和Kappa系数评价各方法的表现。

2.3.2 训练数据敏感性分析

此外,为了验证LE-wDTW方法对不同比例训练数据的敏感程度,随机选择0.1%、0.3%、0.5%、0.7%,0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%和10%的CDL像素作为训练数据分别进行试验。为了确保结果的可靠性,所有试验重复10次。

3 结果与分析

3.1 分类结果

LE-wDTW方法应用于研究区的分类结果(训练样本比例为1%)如图4b所示,对于分类结果分别用定性和定量的方法对其进行评价。

图4 研究区3种数据处理方法结合随机森林分类器的分类结果

3.1.1 局部分类图对比

由于研究区覆盖范围较大,为了更好地对比分类结果,选择2个局部区域进行展示。从图4c、4d和4e可以看到该局部区域内,3种方法对于2种主要作物玉米和大豆的分类情况。通过目视分析,显然,TI方法的分类结果中,玉米和大豆之间存在着较多的错分和漏分情况,“椒盐现象”明显。LE-DTW方法的分类结果比TI方法要好,“椒盐现象”有所改善。效果最好的是LE-wDTW方法,玉米和大豆交叉种植的块状特征明显,符合实际种植情况。

从图4f、4g和4h的分类对比图可以看出,该局部区域除了主要作物玉米和大豆外,还分布有建设用地、牧草地和落叶林。通过目视判读发现,TI方法对于2种主要作物与牧草地和落叶林的区分程度较差,甚至于将部分牧草地和落叶林划分到了建设用地类别中,出现明显错误。而LE-DTW方法对于作物与牧草地和落叶林的区分效果较好,但是对于牧草地与落叶林二者之间的分类结果不如LE-wDTW方法。

3.1.2 分类精度对比

3种方法应用于整个研究区的总体分类精度、Kappa系数及各个类别的生产者精度和用户精度如表1所示。从表中可以看到,整体分类精度最高的是LE-DTW方法,比TI和LE-DTW方法分别提高了9.05个百分点和3.45个百分点。不仅如此,与TI和LE-DTW相比,LE-wDTW方法在各个单一类别的分类精度上也是最高的。对于2种主要作物玉米和大豆而言,LE-wDTW方法的生产者精度比TI方法和LE-DTW方法分别提升8.61个百分点和3.44个百分点,用户精度分别提升了6.19个百分点和3.02个百分点。对于其他占比较小的土地覆盖类型而言,LE-wDTW方法分类精度的提升更加明显,例如,建设用地类别的生产者精度比TI方法提高了15.94个百分点,比LE-DTW方法提高了6.30个百分点;所有占比较小类别中提升最低的是落叶林类别,其生产者精度提升了8.04个百分点和4.79个百分点,用户精度提升幅度与生产者精度类似。

表1 三种数据处理方法结合随机森林分类的总体分类精度和Kappa系数

Note: PA, Producer’s accuracy; UA, User’s accuracy.

3.2 算法对训练样本的敏感性

分类精度通常与训练数据集大小成正比,通过仔细选择训练样本可以在不损失监督分类精度的前提下减小训练数据集的大小。由于光谱降维技术在变换高维数据到低维空间的过程中,会最大化保留有用信息并且最小化噪声,因此,一种理想的降维方法应该是使用较少的训练数据就能完成较高的分类精度。

图5展示了LE-DTW方法和LE-wDTW方法应用于Landsat时间序列数据时,选择不同比例训练样本完成的整体分类精度情况。从图5可以看到,LE-wDTW方法的整体分类精度均值始终高于LE-DTW方法。并且,当LE-DTW和LE-wDTW方法在训练样本比例分别达到3%和2%时,整体分类精度趋于稳定,这一点上,LE-wDTW优于LE-DTW。此外,每个训练样本比例分类试验重复10次,通过其标准差可以看到,当训练样本比例高于1%时,2种方法的正负标准差均在1%以下,最大标准差出现在训练样本比例最低(0.1%)时,LE-DTW方法的负标准差为2.8%。结果表明,LE-wDTW方法应用于时间序列遥感影像的作物分类时,比LE-DTW方法表现更好。

图5 不同比例训练样本的分类精度

3.3 讨 论

本文提出了一种加权LE-DTW方法,称为LE-wDTW,用于作物种植结构提取,并与时相插值法和原始LE-DTW法进行对比试验。结果表明,2种基于非线性光谱降维的作物分类方法,其精度均高于未降维的时相插值法,这与以往的研究结果一致[16,19],可能的原因如下:1)时间序列数据存在数据冗余,降维技术可以有效避免“休斯现象”[32]。2)时相插值法并不能增加有效的数据信息,反而会因为这种“预测”而带来新的误差。3)卫星影像时间序列数据存在内在的非线性特征,使用非线性降维方法可以在减少数据冗余的同时保留适合于分类的属性特征。

与LE-DTW方法相比,LE-wDTW方法完成了更高的分类精度。这说明在充分利用时间序列遥感影像中全部有效数据的前提下,LE-wDTW方法更好地挖掘并使用了作物的物候特征。一方面,适合用于分类的物候特征应该是在相同时相下,不同作物生长状态的差异特征,寻找这种差异特征往往需要依赖较多的人工干预,这意味着所建立的分类模型不仅难以自动化,而且也难以移植到其他地区。LE-wDTW方法是基于统计学理论结合机器学习方法而建立的自动化作物种植结构提取模型,使用wDTW度量可以更好地强化这种相同时相下的物候特征差异,该方法不需要人工干预,就可以完成高精度的作物分类制图。另一方面,除了研究区主要作物玉米和大豆外,还有占比较小的落叶林、建设用地和牧草地等土地覆盖类型,通过试验可以发现,对于这些占比较小的类型,LE-wDTW方法也获得较高的精度,这说明该方法对于小样本类别也有较好的适用性,这符合机器学习方法的特点。此外,算法对训练样本的敏感性试验表明,LE-wDTW算法只需要较少的训练样本就能获得稳定的分类精度,这对于作物分类研究意义重大,因为获取较多的训练样本是一项需要消耗大量人力和物力的工作。

本研究也存在一些不足之处,在今后研究中有待加以改进。LE-wDTW算法的复杂度较高,尤其是随着空间维度的增加,计算量会迅速增长。因此,当将本文方法用于更大尺度研究,例如全球尺度作物分类时,如何提升计算效率是一个待解决的问题。事实上,这个问题存在于大部分的流形学习降维算法中,已经成为流形学习的一个研究方向。虽然已经有研究者提出多种解决方案,例如使用Landmark points策略[33],或者增强Graphics Processing Unit (GPU)的运算能力[34]等,但是如何与本文方法相结合,仍有待进一步研究。

4 结 论

本文以作物全生育期Landsat 8时间序列遥感影像为数据源,改进了基于流形学习的特征提取方法,形成了一种结合物候特征的时间序列光谱降维算法——LE-wDTW,结合随机森林分类器,提取了美国伊利诺伊州主要作物的种植结构信息。

1)采用2种非线性光谱降维方法对研究区作物分类,取得了较高的分类精度,总体精度都优于81.92%,其中LE-wDTW方法总体精度达到85.37%,比传统的时相插值法提升9.05个百分点。这说明时间序列遥感数据存在着数据冗余,在进行分类前需要进行光谱降维处理。

2)LE-wDTW方法在度量时间序列数据点间的相似性时,对于时相上相近的物候特征赋予了不同权重,获得了比赋予相同权重的LE-DTW方法更高的分类精度。这表明对于作物分类而言,相同时相的物候差异特征对于区分不同作物起着至关重要的作用。因此,LE-wDTW方法更适合于作物分类。

3)LE-wDTW方法不需要人工干预,只需要较少的训练样本,就可以获得较高并且稳定的分类精度,将其应用于不同尺度的作物分类有很大的潜力。

[1] United Nations. World Population Prospects: The 2017 Revision. Key Findings and Advance Tables[R]. 2017.

[2] Gong Peng, Wang Jie, Yu Le, et al. Finer resolution observation and monitoring of global land cover: First mapping results with Landsat TM and ETM+ data[J]. International Journal of Remote Sensing, 2013, 34(7): 2607-2654.

[3] 陈仲新,任建强,唐华俊,等. 农业遥感研究应用进展与展望[J]. 遥感学报,2016,20(5):748-767. Chen Zhongxin, Ren Jianqiang, Tang Huajun, et al. Progress and perspectives on agricultural remote sensing research and applications in China[J]. Journal of Remote Sensing, 2016, 20(5): 748-767. (in Chinese with English abstract)

[4] Maxwell A E, Warner T A, Fang F. Implementation of machine-learning classification in remote sensing: an applied review[J]. International Journal of Remote Sensing, 2018, 39(9): 2784-2817.

[5] Xiong J, ThenkabailP S, Gumma M K, et al. Automated cropland mapping of continental Africa using Google Earth Engine cloud computing[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 126: 225-244.

[6] Yan Li, Roy D P. Automated crop field extraction from multi-temporal Web Enabled Landsat Data[J]. Remote Sensing of Environment, 2014, 144: 42-64.

[7] 郝鹏宇,牛铮,王力,等. 基于历史时序植被指数库的多源数据作物面积自动提取方法[J]. 农业工程学报,2012,28(23):123-131. Hao Pengyu, Niu Zheng, Wang Li, et al. Multi-source automatic crop pattern mapping based on historical vegetation index profiles[J]. Transactions of the Chinese Society of Agricultral Engineering (Transactions of the CSAE), 2012,28(23): 123-131. (in Chinese with English abstract)

[8] Gómez C, White J C, WulderM A. Optical remotely sensed time series data for land cover classification: A review[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2016, 116: 55-72.

[9] Victor Maus, Gilberto Câmara, Ricardo Cartaxo, et al. A time-weighted dynamic time warping method for land-use and land-cover mapping[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2016, 9(8): 3729-3739.

[10] Cornelius Senf, Pedro J Leitão, Dirk Pflugmacher, et al. Mapping land cover in complex Mediterranean landscapes using Landsat: Improved classification accuracies from integrating multi-seasonal and synthetic imagery[J]. Remote Sensing of Environment, 2015, 156: 527-536.

[11] Hannes Müller, Philippe Rufin, Patrick Griffiths, et al. Mining dense Landsat time series for separating cropland and pasture in a heterogeneous Brazilian savanna landscape[J]. Remote Sensing of Environment, 2015, 156: 490-499.

[12] François Waldner, Guadalupe Sepulcre Canto, Pierre Defourny. Automated annual cropland mapping using knowledge-based temporal features[J]. Isprs Journal of Photogrammetry & Remote Sensing, 2015, 110: 1-13.

[13] Andrew P Tewkesbury, Alexis J Comber, Nicholas J Tate, et al. A critical synthesis of remotely sensed optical image change detection techniques[J]. Remote Sensing of Environment, 2015, 160: 1-14.

[14] Löw F, Michel U, Dech S, et al. Impact of feature selection on the accuracy and spatial uncertainty of per-field crop classification using support vector machines[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 85: 102-119.

[15] Ludmila I Kuncheva, William J Faithfull. PCA feature extraction for change detection in multidimensional unlabeled data[J]. IEEE Transactions on Neural Networks and Learning Systems, 2014, 25(1): 69-80.

[16] Yan Li, Roy D P. Improved time series land cover classification by missing-observation-adaptive nonlinear dimensionality reduction[J]. Remote Sensing of Environment, 2015, 158: 478-491.

[17] Crystal Schaaf, Feng Gao, Alan H Strahler, et al. First operational BRDF, albedo nadir reflectance products from MODIS[J]. Remote Sensing of Environment, 2002, 83(1): 135-148.

[18] Ben Somers, Kenneth Cools, Stephanie Delalieux, et al. Nonlinear hyperspectral mixture analysis for tree cover estimates in orchards[J]. Remote Sensing of Environment, 2009, 113(6): 1183-1193.

[19] Zhai Yongguang, Qu Zhongyi, Hao Lei. Land cover classification using integrated spectral, temporal, and spatial features derived from remotely sensed images[J]. Remote Sensing, 2018, 10(3): 383.

[20] Bachmann C M, Ainsworth T L, Fusina R A. Exploiting manifold geometry in hyperspectral imagery[J]. IEEE Transactions on Geoscience & Remote Sensing, 2005, 43(3): 441-454.

[21] Zhang Liangpei, Zhang Lefei, Tao Dacheng, et al. Tensor discriminative locality alignment for hyperspectral image spectral–spatial feature extraction[J]. IEEE Transactions on Geoscience & Remote Sensing, 2012, 51(1): 242-256.

[22] Tenenbaum J B, Silva V De, Langford J C. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000, 290(5500): 2319-2323.

[23] Roy D P, Wulder M A, Loveland T R, et al. Landsat-8: Science and product vision for terrestrial global change research[J]. Remote Sensing of Environment, 2014, 145(145): 154-172.

[24] ClaireBoryan, Yang Zhengwei, RickMueller, et al. Monitoring US agriculture: The US Department of Agriculture, National Agricultural Statistics Service, Cropland Data Layer Program[J]. Geocarto International, 2011, 26(5): 341-358.

[25] Hansen M C, Egorov Alexey, Potapov P V, et al. Monitoring conterminous United States (CONUS) land cover change with web-enabled Landsat data (WELD)[J]. Remote sensing of Environment, 2014, 140: 466-484.

[26] Han Weiguo, Yang Zhengwei, Di Liping, et al. CropScape: A Web service based application for exploring and disseminating US conterminous geospatial cropland data products for decision support[J]. Computers & Electronics in Agriculture, 2012, 84(11): 111-123.

[27] David Johnson. A 2010 map estimate of annually tilled cropland within the conterminous United States[J]. Agricultural Systems, 2013, 114(114): 95-105.

[28] Berndt D J. Using dynamic time warping to find patterns in time series[C]// in KDD Workshop, 1994:359-370.

[29] Leo Breiman. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.

[30] Zhai Yongguang, Zhang Lifu, Wang Nan, et al. A modified locality-preserving projection approach for hyperspectral image classification[J]. IEEE Geoscience & Remote Sensing Letters, 2017, 13(8): 1059-1063.

[31] 翟涌光. 综合时空谱多维遥感特征的作物精细分类方法研究[D]. 北京:中国科学院大学,2017. Zhai Yongguang. Detailed Crop Classification using Integrated Spectral, Temporal and Spatial Features Derived from Remotely Sensed Images[D]. Beijing: University of Chinese Academy of Sciences, 2017. (in Chinese with English abstract)

[32] Gordon Hughes. On the mean accuracy of statistical pattern recognizers[J]. IEEE Transactions on Information Theory, 1968, 14(1): 55-63.

[33] Silva V D, Tenenbaum J B. Global versus local methods in nonlinear dimensionality reduction[C]// in International Conference on Neural Information Processing Systems, 2002: 721-728.

[34] Bachmann C M, Ainsworth T L, Fusina R A, et al. Manifold coordinate representations of hyperspectral imagery: Improvements in algorithm performance and computational efficiency[C]// in Geoscience and Remote Sensing Symposium, 2010: 4244-4247.

Crop classification based on nonlinear dimensionality reduction using time series remote sensing images

Zhai Yongguang1,2, Qu Zhongyi1※

(1.010018,; 2.100101,)

Compared with the traditional method of ground statistics, remote sensing technology has the unique advantages of high efficiency, fast speed and high precision. It is suitable for agricultural monitoring, especially the time series remote sensing data can provide spectral information covering the whole growing season of crops. At present, most of the crop classification methods based on time series remote sensing data need many expert knowledge and manual intervention, which are difficult to automate and transplant to other areas. The application of dimensionality reduction (DR) technique to time series remote sensing image analysis can solve this problem efficiently. The imaging process of remote sensing image will experience multiple scattering between different scene components. This scattering is influenced by many factors such as wavelength, observation angle, illumination condition, and three-dimensional structure of scene component. Therefore, the remote sensing image has inherent nonlinear characteristics, and the nonlinear DR technology is more suitable for remote sensing images. The nonlinear spectral DR method has been successfully applied to hyperspectral data and obtained better results than linear DR methods. However, the nonlinear DR method cannot make full use of the temporal information in time series remote sensing images. In this study, a nonlinear DR algorithm, Laplacian Eigenmaps (LE), is refined for crop classification in time series remote sensing images. This method emphasizes the phenological characteristics difference of different crop growing seasons. In the refined LE algorithm, the dynamic time warping (DTW) measurement with different weight value is used to calculate the similarity between the time series. If the two phases of the calculated path are consistent or close, a smaller weight should be given, and a greater weight should be given when the two phases correspond to the path are far away. In addition, the refined LE method can be applied to time series data with unequal length and reduce the preprocessing operation of time series data. Moreover, the proposed method is simple to run and only requires two input parameters. One is the midpoint of time series, and the other is the number of retained bands after DR. Both two parameters are easily to obtain. The refined LE algorithm is applied to the Landsat time series images of the whole growing season of crops in Illinois, USA. A series of classification experiments based on the training data provided by the United States Department of Agriculture National Agricultural Statistics Services Cropland Data Layer (CDL) are completed and compared with the traditional interpolation method without DR and the LE-DTW method proposed for land cover classification. The experimental results show that the refined LE DR method has completed a higher classification accuracy and per-class accuracy than other methods. And the overall classification accuracy of the proposed method reaches 85.37%, which is 9.05 and 3.45 percentage points higher than that of temporal interpolation (TI) method and LE-DTW method respectively. And the method can achieve a given degree of classification accuracy with only a small number of training samples. When the proportion of training samples is higher than 1%, the positive and negative standard deviations of the proposed method is below 1%. The overall classification accuracy of the proposed method tends to be stable when the proportion of training samples reaches 2%. The refined LE dimensionality reduction method is an automatic method and can be directly applied to other research areas without manual intervention. It provides an effective method for crop identification and extraction on different scales in the future.

remote sensing; data processing; crops; classification; nonlinear spectral dimensionality reduction; time series; dynamic time warping

10.11975/j.issn.1002-6819.2018.19.023

TP79

A

1002-6819(2018)-19-0177-07

2018-05-17

2018-07-21

内蒙古农业大学高层次人才科研启动金项目(NDYBH2017-2);内蒙古自然科学基金项目(2018BS04001);“十三五”国家重点研发计划项目(2016YFC0501301);国家自然科学基金项目(51779117)资助

翟涌光,内蒙古呼伦贝尔人,讲师,博士,研究方向:农业遥感。Email: ychia@imau.edu.cn

屈忠义,内蒙古巴彦淖尔人,教授,博导,研究方向:区域灌溉排水。Email: quzhongyi@imau.edu.cn

翟涌光,屈忠义. 基于非线性降维时序遥感影像的作物分类[J]. 农业工程学报,2018,34(19):177-183. doi:10.11975/j.issn.1002-6819.2018.19.023 http://www.tcsae.org

Zhai Yongguang, Qu Zhongyi. Crop classification based on nonlinear dimensionality reduction using time series remote sensing images[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(19): 177-183. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2018.19.023 http://www.tcsae.org

猜你喜欢

时相训练样本降维
绝对时相收缩期采集心律不齐患者冠状动脉CT血管造影的可行性
混动成为降维打击的实力 东风风神皓极
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
人工智能
降维打击
滑冰式滑雪动作体系的建构
血清白细胞介素及急性时相反应蛋白在细菌性痢疾患者中的变化研究
滑行技术的革命:速度轮滑双蹬技术的运动生物力学研究
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究