基于GF-1时间序列影像的引黄灌区农作物种植结构监测
2022-11-30高浩符瑜
高浩 符瑜
(1 国家卫星气象中心,北京 100081;2 中国科学院大气物理研究所碳中和中心,北京 100029)
0 引言
卫星遥感技术因其具有覆盖范围广、时效性强、成本低等优势特点,取代传统的实地采集的方法,成为农作物种植结构监测的重要手段[1-2]。中低分辨率卫星影像数据,因其更新快、易获取、覆盖范围广等优势,被广泛应用于大范围农作物空间分布监测、农作物估产、农情和预报等方面[3-8]。但中低分辨率数据混合像元现象严重,光谱识别度有限,制约了农作物识别和面积估算精度的提高。
2013年我国第一颗高分系列卫星(GF-1)发射成功后,面向农业应用的高时间、高空间及高光谱分辨率的数据得到应用。国内学者基于GF-1号卫星数据开展了农业种植结构监测应用的研究,并取得了重要进展[9-16]。总的来说,尽管不同的卫星应用技术方案具有通用性,但由于不同空间分辨率、时间分辨率、轨道特点等差异,导致卫星应用的具体实施技术可移植性较差,基于GF-1卫星数据的农作物识别、种植面积估算方法的适应性和应用精度还有待进一步评估和验证。
本研究综合考虑农作物种植结构监测的空间覆盖、时效性和精细化等需求特点,利用2018年宁夏引黄灌区主要农作物生长期的GF-1/WFV高空间分辨率宽幅卫星影像数据,经时间序列谐波分析法(HANTS)去除云和水汽等因素引起的噪声,重新构建了高质量的归一化植被指数(NDVI)时间序列数据,结合实地考察获取的主要农作物地面样本数据,进行研究区主要农作物关键生育期的特征统计分析,构建农作物决策分类模型,开展宁夏引黄灌区主要农作物种植面积、空间分布等种植结构的监测分析,从而提高研究区农情信息监测精度,提升高分卫星在西北旱区农业领域的精准精细化服务能力,为农业生产、管理和决策服务提供信息支持。
1 研究区概况和数据
1.1 研究区概况
宁夏引黄灌区位于黄河上游下河沿和石嘴山水文站之间,地貌类型为黄河冲击平原,地势平坦,属于温带大陆性干旱气候,日照充足、温差较大、干旱少雨、蒸发强烈。年平均温度为8~9 ℃,年降水量为180~200 mm,年蒸发量为1100~1600 mm。灌区涉及范围包括银川市、石嘴山市、吴忠市和中卫市的12个县(市),土地面积为6573 km2,其中耕地面积2213 km2,主要农作物有春小麦(3—7月);玉米(4—9月);水稻(3—10月)等。
1.2 遥感影像数据
国产高分一号卫星(GF-1)搭载4台宽覆盖多光谱相机(WFV),扫描幅宽800 km,16 m空间分辨率,重返周期2 d,光谱范围0.45~0.89 μm,包含4个波段(表1)。根据研究范围和主要农作物的物候历,从中国资源卫星中心获取2018年覆盖主要农作物(春小麦、玉米和水稻)生长季(3—10月),云覆盖度小于5%,共计184景多时相GF-1(WFV)影像数据。对GF-1影像数据进行几何粗校正、辐射定标、大气校正、几何精校正和镶嵌等预处理,形成GF-1时间序列影像数据,用于农作物种植结构的监测。
表1 GF-1卫星有效载荷技术指标Table 1 Payload technical specifications of GF-1 satellite
1.3 地面样本点数据
2018 年8 月13—17 日,利用手持Garmin-GPSMap60CS和数码相机,采取分层随机采样的方式,到宁夏引黄灌区进行主要农作物的地面样本采集(图1)。实地采集地面样本点470个,其中春小麦样本50个,玉米样本195个,水稻样本164个,其他样本61个。按7∶3的比例将采集到的样本分为训练样本和验证样本,用于农作物的分类和精度验证。
图1 研究区主要农作物地面样本点分布Fig.1 Spatial distribution of ground sample points of main crops in the study area
2 研究方法
2.1 技术路线
基于2018年覆盖研究区主要农作物生长期的GF-1/WFV卫星影像数据,进行时序数据的预处理,然后进行归一化植被指数(NDVI)的计算和高质量NDVI时序数据的重构,通过对主要农作物NDVI时序曲线关键生育期特征的统计分析,构建农作物决策树分类模型,实现基于高分卫星的农作物种植结构精准和精细化的监测分析(图2)。
图2 高分一号卫星农作物分类技术路线Fig.2 The flowchart of crop classification using GF-1 satellite data
2.2 GF-1卫星NDVI时间序列数据重构
基于宁夏引黄灌区2018年3—10月的184景GF-1/WFV卫星影像数据,进行了3—10月的卫星影像的辐射定标、大气校正、正射校正、地理校正、影像镶嵌等预处理,通过NDVI计算和月最大值合成,形成了覆盖宁夏引黄灌区的2018年3—10月的NDVI时序数据集。NDVI的计算公式如下:
其中:NDVI是归一化植被指数,Rnir和Rred分别为近红外波段和红波段的反射率。
研究选取的GF-1/WFV卫星影像虽然云覆盖较低,但是原始数据中仍然存在一些噪声,不宜直接进行分析和信息提取。因此,针对建立的NDVI时间序列数据,采用HANTS方法去除云、水汽等干扰的噪声,重新构建高质量的NDVI时间序列数据。HANTS方法进行影像重构时充分考虑了植被生长周期性和数据本身的双重特点,能够用代表不同生长周期的植被频率曲线重新构建时序NDVI影像,真实反映植被的周期性变化规律,已被广泛的应用到农业遥感领域。
研究中HANTS方法对NDVI时间序列数据进行重构的有效数据范围(Valid data range)设置为[-1,1],拟合误差(Fitting error tolerance)为0.05,剩余点个数(DOD)为8,频率数(Number of frequencies)为3[9]。对经过滤波重新构建的NDVI时序数据和最大值合成的NDVI时序数据对比(图3),可以看出,经过时间序列谐波分析法进行平滑处理过的NDVI时间序列数据有效地消除了异常波动,减少了噪声的影响,基本保持了原有曲线的基本趋势,使得NDVI时间序列能够比较真实地反映NDVI植被指数随时间的变化,滤波后的NDVI曲线能更准确地反映作物生长发育状况。
图3 NDVI时序数据重构前后对比Fig.3 Comparison of NDVI time series data before and after reconstruction
2.3 决策树分类模型构建
根据宁夏主要农作物的种植情况,采用主要农作物物候观测资料归纳典型物候期特征(表2),并结合HANTS滤波后的NDVI时间序列数据获得各个主要类型农作物不同时间段时序曲线。水稻生长前期稻田含有水体特性是区别于其他植被的最显著特征[11],利用归一化水体指数(NDWI)可以区分水稻和其他植被。NDWI由以下公式计算:
表2 研究区主要农作物生长历程Table 2 Growth process of main crops in the study area
其中,NDWI是归一化水体指数,Rgreen和Rnir分别为绿波段和近红外波段的反射率。
本研究以农作物的NDVI值时序曲线和特征值,以及关键生育期的NDWI特征作为识别主要农作物的关键切入点,通过地面样本和先验物候信息的统计分析获得目标作物的NDVI标准时序曲线和多时相特征,以及关键生育期的NDVI和NDWI的分割阈值,建立分类决策树模型(图4),采用分层决策树方法逐像元提取出主要农作物的空间分布。研究中农作物的关键分割阈值基于70%的地面样本确定,以地面样本统计主要农作物和下垫面类型逐月的NDVI值,获得其NDVI时间序列曲线,同时统计得到不同农作物的NDVI的最大值、最小值、方差等统计特征值,依据地面样本的特征统计信息最终确定识别主要农作物的关键阈值。
图4 基于GF-1/WFV的研究区主要农作物识别流程Fig.4 Identification process of main crops in the study area based on GF-1/WFV
3 结果与分析
3.1 主要农作物分类时序特征
不同地物NDVI时间序列特征显示(图5a),春小麦、玉米和水稻的NDVI时序曲线都呈现典型的单峰型结构,植被和非植被的NDVI最大值差别较大。从发育过程来看,3—5月间春小麦各个生育期较玉米和水稻提前,其NDVI值都明显高于玉米和水稻,5—6月的拔节期和孕穗期,其NDVI值逐渐增大,6月NDVI值达到生育期峰值,随着灌浆乳熟期的到来,NDVI值逐渐下降,到7月收割后春小麦NDVI值骤降。4—7月玉米的NDVI值迅速增大,7月玉米进入抽穗期,其NDVI值达到整个生育期的高峰,之后玉米停止营养生长进入生殖生长阶段,NDVI值呈现下降趋势,至9月玉米成熟并收割,NDVI值急剧下降。3—4月水稻未开始发育,NDVI值较低,5月水稻开始灌水移栽,至拔节期前水稻具有明显的水体特点,6月水稻处于生长旺盛期,作物特征明显,NDVI值逐渐增大,7月底至8月上旬NDVI值达到生育期最大值,随后水稻成熟并收割,NDVI值急剧下降。
图5 研究区主要地物NDVI时间序列特征(a)和统计特征(b)Fig.5 NDVI time series characteristics (a) and statistical characteristics (b) of main ground features in the study area
不同地物NDVI的统计特征表明(图5b),不同地物类型全年的NDVI方差有较大的差异,荒漠、城市等非植被类型的方差较植被明显较低,可以通过全年NDVI的方差区分植被和非植被;林地全年的NDVI平均值、最小值比农作物偏大,同时1—3月的林地NDVI值比农作物大,可以通过此特征区分林地和农作物;1—5月的春小麦的NDVI值较玉米和水稻都较大,并且6月春小麦NDVI值达到生育期最大值,7月末春小麦全部收获,春小麦地块NDVI值骤降,而此时研究区玉米处于抽穗期,正值整个生育期NDVI峰值期,可以通过此特征区分出春小麦和玉米。5月水稻灌水移栽后包含了水体、土壤和水稻信息,NDWI接近0或小于0,而到7月水稻扬花期,稻田水体减少后反映不出水体信息,NDWI的变化最大,而其他植被区变化较少,通过5月和7月两个关键物候期的NDWI的差值扩大水稻与其他植被的差异,再结合NDVI的增长变化区分水稻。基于地面样本对NDVI和NDWI进行时序统计分析,得到的主要作物的NDVI多时相特征和关键生育期NDWI的分割阈值用于农作物的决策分类。
3.2 主要农作物的分类结果
基于GF-1/WFV卫星利用决策树分类模型提取的宁夏引黄灌区春小麦、玉米和水稻空间分布显示,春小麦、玉米和水稻主要分布在研究区引黄灌区的黄河两岸。其中,春小麦主要散布在研究区北部的引黄灌区;玉米广泛分布在引黄灌区;水稻集中分布于引黄灌区黄河两岸,银川平原分布较为集中。
各作物的种植面积统计结果显示(图6),春小麦的分布面积为45451.0 hm2,占引黄灌区农作物面积的9.0%;水稻的分布面积为81472.6 hm2,占引黄灌区农作物面积的16.1%;玉米的分布面积为214703.1 hm2,占引黄灌区农作物面积的42.3%。与2018年宁夏各市县农作物播种面积的对比结果显示,水稻面积相对误差0.5%,玉米相对误差为1.0%,春小麦相对误差为6.3%。
图6 基于GF-1/WFV的研究区主要农作物空间分布(a)春小麦,(b)玉米,(c)水稻Fig.6 Spatial distribution of main crops in the study area based on GF-1/WFV (a) Spring wheat,(b) Corn,(c) Rice
3.3 主要农作物分类精度评估
采用2018年8月13—17日在宁夏引黄灌区采集的主要农作物30%的地面样本,对基于分层决策树分类的主要农作物种植空间分布进行精度验证,结果显示(表3),研究区春小麦的制图精度为76.9%,用户精度为100%,玉米的制图精度为88.8%,用户精度为91.9%,水稻的制图精度为85.5%,用户精度为98.3%,研究区主要农作物的总体分类精度为86.5%,Kappa系数为0.77。结果表明基于GF-1/WFV多时相影像数据的决策树分类方法能够获得较高的精度,具有一定的业务监测应用价值。
表3 基于GF-1/WFV多时相影像的主要农作物遥感分类精度Table.3 Classification accuracy of main crops based on GF-1/WFV multi temporal images
4 结论和讨论
基于GF-1/WFV卫星时间序列影像的农作物决策树分类结果显示,研究区主要农作物的分类总体精度为86.5%,Kappa系数为0.77,其中春小麦、玉米和水稻的分类精度分别为76.9%、88.8%和85.5%。春小麦、玉米和水稻主要分布在引黄灌区的黄河两岸,春小麦、玉米和水稻的种植面积分别为45451.0 hm2、214703.1 hm2和81472.6 hm2,分别占引黄灌区农作物面积的9.0%、42.3%和16.1%。与2018年宁夏各市县农作物播种的统计面积对比,春小麦、玉米和水稻的相对误差分别为6.3%、1.0%和0.5%。
相对于以往研究中采用MODIS和Landsat数据的融合获得高空间分辨率时序数据进行农作物的分类[17-18],本研究采用同一高分辨卫星的时间序列数据,保证了时空数据的一致性,可以减小时间序列特征提取上的误差,获得更准确的时间序列特征,从而提高农作物分类的准确性。已有研究多基于光谱特征来进行农作物的分类,忽视了农作物生长过程的关键特征,本研究基于农作物时间序列的关键特征进行分类,将农作物的物候与波谱信息结合,抓住农作物关键期特征区分农作物,避免单景卫星影像中同物异谱、同谱异物现象导致的错分和漏分,从而提高农作物分类的准确性。
本研究虽然通过时间序列影像在主要农作物分类中取得了较高的精度,但仍存在一些不足之处。研究区的农作物关键生育期的6—8月,受到高分辨率卫星影像幅宽和云的影响,无法合成更高时间分辨率的NDVI时间序列数据,对关键生育期的农作物特征阈值的确定造成一定的影响。研究区春小麦和玉米多采用间作种植模式,虽然GF-1卫星具有16 m的空间分辨率,但仍无法避免春小麦和玉米的混合像元,其综合光谱信息影响了作物识别。由于间作模式春小麦和玉米多呈现线状分布,其对春小麦的分类识别影响更加突出,这也是本研究中春小麦提取相对误差较大的重要原因。
采用多时相影像分类的关键在于抓住农作物的关键生育特征,研究中通过时间序列数据分析了研究区的主要农作物物候特征,全年的数据应用存在一定的冗余,对分类的效率会造成较大的影响。本研究的结果为研究区开展主要农作物分类提供了最佳时相高分卫星影像数据选择的依据,从而可以通过选取较少量关键生育期的高分卫星数据,抓住农作物关键特征进行信息提取,在保证分类精度的同时也兼顾了业务应用的时效性。
高分一号卫星具有4台16 m分辨率的WFV相机,使得其幅宽达到800 km,从而提高了完全覆盖研究区的可能性,但4台相机红绿蓝和近红外波段的中心波长设置略有差异,从而导致相同时间的NDVI值存在一定的差异,造成分类的特征值的适应性不足,有待于在今后研究区的主要农作物信息提取中进一步改进,提高农作物种植结构监测的精度。
致谢:感谢中国资源卫星应用中心(http://www.cresda.com/)提供的高分卫星影像数据,以及宁夏气象科学研究所协助进行农作物样本采集。