基于遥感云计算的阿拉尔市棉花种植面积提取
2022-08-18吕绍伦赵阳陈万基张灿然穆耶赛尔赛达合麦提卢吉瑞
吕绍伦,赵阳,陈万基,张灿然,穆耶赛尔·赛达合麦提,卢吉瑞
(伊犁师范大学资源与生态研究所/伊犁师范大学生物与地理科学学院,新疆 伊宁 835000)
棉花(Gossypium hirsutum linn)是第一大经济农作物,也是重要的国民战略物资,其用途涉及人类生活的衣食住行各个方面。中国棉花种植历史悠久,现已是世界最大的棉花生产国,已形成长江流域、黄河流域、西北内陆(新疆)三大产棉区,其中新疆棉花种植面积位居全国第一,也是新疆国民经济重要的组成部分。研究棉花种植面积是当地棉花产量估测、发展预测等农业活动普遍采取的方法。
遥感技术凭借其较大覆盖范围、时效性强、信息量大、低成本等优势现已广泛应用于农业监测。伴随着我国对地观测卫星的发展以及遥感技术与农业的深度结合,已有学者开展基于遥感的农作物种植区提取。黄青,等基于时序植被指数,结合新疆棉花种植结构、物候特征建立了棉花提取模型,实现棉花种植面积提取,总体精度达到78%以上。王琼,等基于环境卫星数据,根据棉花与其他作物的光谱差异和物候特征,运用不同分类方法成功提取了新疆北部一农场棉花种植面积,提取精度达87.7%。玉苏普江·艾麦提,等基于环境卫星影像数据,运用决策树方法提取了库车县、新和县、沙雅县棉花种植面积,种植面积精度达94.29%,位置精度达88.57%。张佳琪,等基于高分1号遥感影像,结合耕地掩膜运用不同监督分类方法,成功提取昌吉市棉花种植面积,提取精度高达95.24%。刘玫岑基于陆地观测卫星遥感影像,通过最优波段组合运用最大似然法对影像进行监督分类,成功提取了新疆生产建设兵团农一师十六团垦区棉花种植面积,精度达90%以上。魏瑞琪,等基于中分辨率成像光谱仪遥感数据,运用时间序列卫星遥感数据处理和分析的工具软件集成的多种拟合方法,将石河子市时序归一化差分植被指数与棉花生长曲线拟合,分析棉花生长特征,进而提取了棉花种植区,精度达90%左右。近年来,遥感云计算技术蓬勃发展,航天宏图公司开发的遥感云计算平台致力于我国农业遥感监测云平台建设,现已在智慧农业建设、自然灾害监测等方面做出了突出成果,为政府部门决策提供了依据。但是,基于遥感云计算平台对新疆南部棉花种植区提取却鲜有研究。
阿拉尔市自然条件适宜棉花生长,且该地区对棉花种植与品种培育投入较高成本,已建设较为完善的棉花产业链,棉花种植产业已成为该地区优势产业和整地发展产业。在宏观视角下研究该地区棉花种植情况,对其农业统计及后期农业经济活动至关重要。轻量化、高精度、低成本的棉花种植区提取方法是现在亟待需要解决的问题。通过遥感云计算平台可以实现轻量化、低成本的需求,因此,研究基于国产遥感云计算平台结合2020年哨兵2号卫星影像数据,通过解译遥感影像中作物光谱特征结合阿拉尔市棉花物候特征,对新疆阿拉尔市棉花种植区进行提取。为该地区及南疆大部分相似环境地区棉花种植、经营、发展等提供一定的理论指导和依据。
1 数据与方法
1.1 研究区概况
研究区为棉花种植产业较为发达的阿拉尔市。阿拉尔市属新疆生产建设兵团第一师阿拉尔垦区(80°30′~81°58′E,40°22′~40°57′N),人工开垦耕地面积广阔(见图1)。阿拉尔市北靠天山山脉南麓,南接世界第二大沙漠塔克拉玛干大沙漠。地势相对平坦,最大高差不超过500 m,平均海拔1011 m。阿拉尔市属于温带大陆性气候,干旱特征明显,年平均气温4~20℃,年平均降水量40.1~82.5 mm,年平均蒸发量1876.6~2558.9 mm,蒸发量是降水量的30倍以上,属于绝对干旱地区,该地区农业受气候条件限制,农作物以棉花等耐旱喜光作物为主,林果以红枣(Ziziphus jujuba Mill)等耐旱温带果树为主。该地区农业储水工程相对发达,将流经该地域的阿克苏河、塔里木河进行适度的农业改造,以及修建胜利、上游、多浪三大水库进行储水,为农业灌溉和居民生活用水提供保障。2020年阿拉尔市生产总值332亿元,其中农业生产占43.73%,且主要以棉花产业贡献为主。棉花种植占阿拉尔市国民经济重要部分,实现系统的棉花清查,是阿拉尔市宏观调控棉花产业及棉花种植产业发展亟待需要解决的问题。
图1 阿拉尔市2022年7月哨兵2号遥感影像(B4,B3,B2真彩色合成)图
1.2 数据来源
研究基于遥感云计算平台(https://engine.piesat.cn/),所用的哨兵2号卫星遥感影像数据、阿拉尔市行政区边界、2020年阿拉尔市土地利用类型等都来自平台提供的数据集。
哨兵2号卫星是高分辨率多光谱成像卫星,携带一枚多光谱成像仪,用于陆地观测,可提供植被、土壤、水体等图像。本研究选取遥感云计算平台中经过正射校正和几何精校正的空间分辨率为10 m的哨兵2号遥感影像,有13个光谱波段,包括可见光和红外光,可满足对农作物分类提取和动态监测。阿拉尔市行政边界数据来自于国家基础地理信息中心的“中国城市区划边界”数据集。2020年阿拉尔市土地利用类型数据采用全球30 m地表覆盖数据集,该数据集将地表划分为耕地、林地、草地、灌木地、湿地、水体、苔原、人造地表、裸地、冰川和永久积雪十个类型,可以满足研究提取阿拉尔市耕地需求。
数据预处理和后期统计计算都在遥感云计算平台内进行,通过编译器交互式编程实现数据处理与计算过程。
1.3 研究方法
1.3.1棉花生长发育期分析
通过实地调查和走访阿拉尔市棉花种植户制定阿拉尔市主要农作物农时历。冬小麦在3月下旬和4月上旬进入拔节期,4月中下旬至5月上旬处于抽穗期,5月中下旬进入灌乳期,6月上旬进入成熟期。玉米在4月中上旬播种,5月进入苗期,6月中上旬处于拔节期,7月进入灌乳期,8月份成熟。棉花在4月上旬播种,5月份出苗,6月份进入蕾期,7月份开始进入花铃期,8月中下旬及9月处于吐絮期。
1.3.2光谱分析
基于遥感云计算平台选取2020年哨兵2号卫星遥感影像数据进行研究区裁剪等预处理。基于最优波段组合的思想,对遥感数据进行波段组合实验,寻找可以最佳反应农作物生长状态的波段组合,通过反复实验发现B11(红外2波段)、B8(近红外波段)、B2(蓝光波段)波段组合突出显示绿色植被,有利于农业监测和本研究。结果表明4~9月完整贯穿棉花生长周期,且通过真彩色合成影像(见图1)可以发现研究区主要植被为覆盖耕地的农作物,其他类型植被地表对研究干扰较小。因此选择4~9月为棉花物候期进行研究。
图2表明,4月份植被覆盖较低,只有少量冬小麦生长,棉花和其他作物正处于播种期;5月份棉花和其他作物相继出苗,影像呈现浅绿色;6月份冬小麦进入成熟期,棉花和其他作物开始进入第二生长阶段,形成植株,影像上呈现绿色越来越深;到7、8月份棉花生长进入全盛时期,影像上呈现深绿色。到9月份棉花进入吐絮期,其他作物基本进入收割期,影像绿色开始变浅。
图2 阿拉尔市棉花物候期遥感影像(B11、B8、B2合成)图
由于植物叶片和植株中含有大量叶绿素,影响可见光波段反射,因此根据遥感影像不同光谱特征可以对地面不同植物进分类识别。受地形、天气、地物复杂程度等影响,在研究中只依靠单波段光谱信息很难做到农作物精细分类。植被指数是根据植被光谱特征,将对地观测卫星的可见光波段和近红外波段进行组合形成的指数,实现多光谱波段信息组合的量化,可以很好地表示植被变化情况。因此引入恰当的植被指数,可以有效实现对作物精细分类。
归一化差分植被指数(Normalized Difference Vegetation Index,NDVI)是最常用的植被指数,它能够反应植被生长状态,反演植被覆盖度。NDVI取值范围在[-1,1]之间,当NDVI为负值时,表示地表为水体、冰雪、云等;当NDVI=0时,表示地表为裸露的岩石或土地;当NDVI为正值时,表示地表有植物覆盖,一般NDVI值在0.2~0.8时,认为地表有绿色植物覆盖。NDVI是对近红外光和红光的反射率,通过一定的数学法则计算得到的,计算公式:NDVI=(B-B)/(B+B)。式中B表示近红外光反射率,B表示红光反射率。
比值植被指数(Ratio Vegetation Index,RVI)是反映绿色植物健康状态时常用的植被指数。当RVI远大于1时,表示绿色植物健康状态良好;当RVI趋近于1,则表示地表无植被覆盖、植被已枯死或植被遭受严重虫害。通过计算近红外光波段与红光波段比值可得RVI,计算公式:RVI=B/B。式中B表示近红外光反射率,B表示红光反射率。
差值植被指数(Difference Vegetation Index,DVI)可以监测植被生长状态,但对土壤变化极为敏感,因此在耕地监测中,可以帮助播种期或收割期不同的农作物进行分类。DVI是由近红外光反射率减去红光反射率得到,计算公式:DVI=B-B。式中B表示近红外光反射率,B表示红光反射率。
研究通过计算阿拉尔市不同时期植被指数寻找其变化规律构建分类规则,将耕地农作物进行分类,进而算出棉花种植面积。
1.3.3提取模型构建
通过对各物候期各作物植被指数计算,寻找各物候期不同作物之间的植被指数变化,构建棉花种植区提取模型(见图3)。在遥感云计算平台基于阿拉尔市2020年4~9月哨兵2号卫星遥感影像数据按月尺度计算物候期阿拉尔市植被指数,并基于2020年地表覆盖数据提取阿拉尔市2020年的耕地数据,两者相交获得阿拉尔市2020年物候期耕地植被指数数据,根据不同物候期棉花指数范围,提取出各物候期可能棉花种植区,将提取的6个物候期的棉花种植区进行叠置分析,获得阿拉尔2020年棉花种植区,并通过计算几何,计算出种植面积,将提取结果与2020年阿拉尔市统计公报中棉花种植面积数据相对比,验证提取精度。
图3 棉花提取模型
2 结果与分析
2.1 棉花物候期各项植被指数
基于遥感云计算平台结合植被指数计算公式,计算各物候期三种植被指数(见表1)。
表1 各物候期的三种植被指数
表1物候期植被指数表明,物候期4月到7月,各植被指数整体呈现增长趋势。这一阶段冬小麦生长旺盛,趋于成熟发展;棉花、玉米及其他作物正在经历从播种到出苗再到形成植株过程,农作物逐渐繁茂。7月份,冬小麦虽已经收割,但是各项植被指数却达到了整个物候期最大值,因为这一阶段棉花处于花铃期,生长旺盛,对光吸收需求增大,超过6月份冬小麦等其他作物对光吸收需求的总和。8月份以后,各项植被指数开始下降,这一时期作物都趋于成熟,植株内叶绿素含量开始减少,农作物进入枯萎期。
结合研究区农时历对植被指数变化进行分析,可以辨析植被指数和农作物生长之间的关系,有利于不同农作物敏感特征提取,帮助农作物进行分类。
2.2 棉花种植区面积提取
基于提取模型,获得阿拉尔市耕地植被指数数据。如图4所示,4月份和5月份中部和东部部分区域归一化差分植被指数介于0.6与0.8之间,结合阿拉尔市主要作物农时历分析可知,此时棉花和玉米处于播种期和幼苗期,归一化差分植被指数较小,而冬小麦处于抽穗期和灌乳期,归一化差分植被指数处于较高水平,从而可以确定冬小麦的主要分布地区。6月份归一化差分植被指数值介于0.7与0.8之间,冬小麦开始成熟,棉花和玉米分别进入蕾期和抽穗期,进入7月份,冬小麦预备收割,棉花和玉米也逐渐成熟,归一化差分植被指数在部分地区达到了0.8,玉米的生长周期比棉花短,8月下旬玉米成熟,棉花也到了吐絮期,冬小麦已经收割,归一化差分植被指数虽然开始减小,但仍然达到了0.8。到了9月份,玉米开始收割,棉花也已经成熟,此时地表基本只有棉花一种作物类型,再根据不同物候期棉花归一化差分植被指数范围,提取出各物候期可能棉花种植区,对不同物候期的棉花种植区进行叠置分析,从而获得阿拉尔2020年棉花种植区。
图4 阿拉尔市2020年各物候期归一化差分植被指数图
在遥感云计算平台中,计算提取的2020年阿拉尔市棉花种植面积为14.47万公顷,而2020年阿拉尔市统计公报棉花面积为15.98万公顷,从而得出本次提取精度为90.53%,提取精度较高,可以作为阿拉尔市棉花种植面积提取的一种方法。
3 讨论
阿拉尔市2020年棉花种植面积15.98万公顷,本次实验提取面积14.47万公顷,提取精度达90.53%。因此,基于遥感云计算平台与哨兵2号卫星影像数据可以实现较高精度提取阿拉尔棉花种植面积,与相关研究相比,本研究可实行性更强,实施成本更低。
基于高分辨率遥感影像的研究,通过机器学习训练样本可以实现高精度的分类,但是高分辨率影像获取难度大、成本高;基于传统遥感影像处理平台的研究,可以使用成熟的监督分类组件、决策树模型或构建分类模型实现较高精度的分类,但是调节分类阈值需要多次实验调试,不同作物对应分类阈值也有较大差别。遥感云计算平台拥有丰富的数据集,可以实现多源数据同步处理,且使用成本较低。基于遥感云计算平台和哨兵2号卫星影像数据对以阿拉尔市为代表的新疆南部棉花种植面积高精度提取还需要后续遥感云计算广泛应用在农作物种植面积提取研究中讨论。
4 结论
基于遥感云计算平台和哨兵2号卫星影像数据,通过分析物候期耕地植被指数变化特征,构建棉花提取种植区模型可以实现研究区棉花种植面积高精度提取。本研究选取新疆南部阿拉尔市4~9月遥感影像数据,依据阿拉尔市主要农作物农时历和棉花种植面积提取模型,成功的提取了2020年阿拉尔市棉花种植面积,总体精度达90.53%,能够较高精度提取以阿拉尔市为代表的新疆南部棉花的种植面积,为棉花估产、种植业发展、政府宏观调控农业布局等提供依据和参考。