基于高分遥感数据的昌吉市棉花面积识别研究
2017-11-04张佳琪武红旗
张佳琪++武红旗
摘 要:本文探讨了如何利用高分遥感数据大范围快速提取棉花种植面积。本研究以昌吉市为研究区,基于高分一号(GF-1)遥感影像,利用实地调查的2015年昌吉市作物种植信息,选取不同的监督分类方法,加入耕地掩膜,分析得出昌吉市棉花识别的最佳识别时相以及最佳识别方法。结果表明,棉花与其他种植作物分离程度最好月份为7月,棉花种植面积最佳识别月份为7月,支持向量机分类方法总体精度最高,总体精度为95.24%,Kappa系数0.935。棉花种植面积提取以小于6个像元为最小图斑时结果最佳。高分一号遥感影像7月以支持向量机分类法解译出的2015年昌吉市棉花面积为15 974 hm2,棉花面积提取精度为95.79%。
关键词:昌吉市;高分遥感数据;棉花;面积识别
中图分类号:S127 文献标识码:A DOI 编码:10.3969/j.issn.1006-6500.2017.10.012
Research on Cotton Area Identification of Changji City based on High-revolution Remote Sensing Data
ZHANG Jiaqi, WU Hongqi
(College of Pratacultural and Environmental Sciences, Xinjiang Agricultural University, Urumqi, Xinjiang 830052, China)
Abstract: This paper aimed to investigate how to use the high-revolution remote sensing data to extract cotton acreage on a large scale. This research selected Changji as the experimental area, and was based on the remote sensing images collected by GF-1. This research used the 2015 field survey of crop planting information, selected different supervised classification methods, and involved mask of arable land, to analyze and obtain the best distinguishing time phase and top identification method. The results showed that the best degree of separation of cotton from other crops was July, cotton acreage of best recognition month was July. Support vector machine method has been the supervise classification method with the highest interpretation accuracy so far, the overall accuracy was 95.24%, Kappa coefficient 0.935. Cotton acreage extraction with results was nicely when the minimum map spot was less than six pixel. GF-1 remote sensing image in July to support vector machine classification method of interpretation in 2015 Changji City, survey area was 15 974 hectares, the extraction precision of cotton area was 95.79%.
Key words: Changji city; high-revolution remote sensing data; cotton; area identification
新疆是中国最大的棉花生产基地,无论在国内还是国际都占据重要地位,每年棉花种植面积及总产量受到全世界的关注[1-3]。传统调查方法需要大量的人力和物力,且交通困难地区不方便到达、调查时间长,造成国家补贴分多次兑付且到位较晚,影响了棉农还贷和准备次年生产。如何快速、准确地获取棉花种植面积是解决农业种植计划的关键。随着研究的不断发展,国外Mathur[4]等人指出监督分类的准确性在很大程度上取决于所使用的训练样本数据。同时在数据源方面,不同遥感数据源在农作物遥感识别方面的研究应用广泛,Landsat TM[5]、MODIS[6]、QuickBird[7]等影像数据在农作物空间分布提取中发挥了重要作用。近年来,我国在作物遥感识别方面也开展了大量研究工作,包括单一影像的作物遥感识别、基于时间序列影像的作物遥感识别以及遥感数据与非遥感数据结合的作物遥感识别等方面[8-11]。作物遥感识别和种植面积提取的影像数据大部分来源于Landsat系列卫星、ERS-1卫星和SPOT系列衛星,基于我国研发的高分一号卫星的遥感识别研究还有待深入探索研究。本研究从面向对象生产实践角度出发,结合实地调查的2015年作物种植信息,以昌吉市为研究区,加入耕地掩膜,探讨基于高分遥感数据的最佳识别月份、最佳识别方法,以期能大范围快速提取棉花种植面积。
1 研究区概况endprint
昌吉市位于天山北麓、亚欧大陆腹地、准噶尔盆地南缘,地处东经86°24′~87°37′,北纬43°06′~45°20′。昌吉市地貌主要由山地、平原、沙漠三部分组成。由南向北,地势从高到低呈阶梯状,南北高差4 000多m。由于地形条件的影响,由南向北气候差异较大,南部山区气候特征明显。积温高,降雨少,夏季降水充沛,年际变化大,并且光热资源丰富。昌吉市农产品资源品质较好主要源于独特的光热水土条件,非常有利于粮食作物的生长,平原地区年平均气温6.10 ℃,作物主要生长季节4—6月,日较差14.60 ℃左右,有利于作物干物质合成的积累,有效积温为3 400~3 584 ℃,平均无霜期160 d,平原地区年降水量180.1 mm,是最适宜种植番茄、葡萄、小麦的地区之一。
2 研究方法
本文利用提取棉花生长周期的2015年5月至9月高分一号遥感数据,所获得的数据通过ENVI 5.3进行辐射定标、大气校正、几何校正,并对遥感影像进行镶嵌、裁剪,得到研究区经过处理的影像;通过野外实际调查获得棉花种植信息,并以此类信息建立ROI;选择不同分类器对影像进行分类,对分类结果进行分析,从而实现对昌吉市棉花的面积的识别研究。
2.1 研究区数据来源
昌吉市作为研究区,影像数据包括高分一号、高分二号的高分卫星遥感数据来自新疆卫星遥感应用工程中心;用于提取耕地掩膜的土地利用现状图数据来源于2010年全国第二次土地调查得到的比例尺为1∶10 000的土地利用现状图;积温数据来自国家气象中心颁布的1961—2010年全国积温栅格图。
2.1.1 栅格数据介绍 本研究两种栅格数据的数据源分别是高分一号(GF-1)和高分二号(GF-2)。高分一号卫星搭載了2台分辨率为2 m全色、8 m多光谱的高分辨率相机(PMS)和4台分辨率为16 m的多光谱分辨率宽幅相机(WFV),现已下传有效数据上万景[12]。高分二号卫星搭载有两台高分辨率1 m全色、4 m多光谱相机,观测幅宽达到45 km。高分二号卫星的发射标志着中国遥感卫星进入亚米级“高分时代”[13]。本次研究所使用的高分一号卫星遥感影像数据是2015年5月至9月云量为0的影像,范围是新疆维吾尔自治区昌吉市,如表1所示。
2.1.2 矢量数据介绍 通过实地调查了解2015年昌吉市的作物种植分布,并结合同一时期空间分辨率2 m的高分二号数据,以2010年第二次全国土地调查中投影为UTM_WGS_1984的1∶10 000土地利用现状图为基础,更新该区的农田分布图。并根据研究区实地调查的2015年作物地块的实际种植情况,获取研究区2015年的土地利用现状图。根据昌吉市有效积温图,提取有效积温大于3 000 ℃适宜棉花生长的耕地掩膜参与监督分类计算,排除非耕地对监督分类精度的影响。在后期监督分类处理时加入掩膜,非耕地区域不参与监督分类计算。
2.1.3 实地调查数据 (1)作物物候数据。昌吉市种植的作物主要有棉花、小麦、玉米和其他作物,棉花播种时期在4月中下旬,蕾期在6月下旬至7月下旬,花铃期在7月下旬至8月下旬,吐絮期在9月上旬至10月中旬。小麦从拔节到成熟是从4月下旬至7月下旬。玉米从播种到成熟是从4月下旬至10月上旬[14]。
(2)野外作物调查点数据。本研究分别于2015年8月、11月两次实地调查采集昌吉市作物样本经纬度、调查时间、种植类型等信息在内的共计1 130个野外调查点。综合实地调查2015年昌吉市作物分布样点信息与对遥感影像的目视解译,由于不同月份的作物光谱特征不同,在遥感影像上表现出纹理不同,可以建立作物感兴趣区,分别有棉花、小麦、玉米和其他作物四类。选取作物样本时一部分样本选取作为训练样本,另一部分样本选取作为验证样本,用来检验监督分类时样本的精度。选择的样本要具有代表性,能够代表作物的显著特征。以7月份的影像为参照,每种作物分类选取了100个训练样本和50个验证样本,共计600个作物样本。见表2。
2.2 数据预处理方法
遥感影像的预处理过程就是纠正遥感成像的过程,也是对影像数据纠正与重建的过程[15-16]。受传感器姿态、高度、速度等外在因素的影响,使遥感影像在一定程度上产生了几何变形,很大程度会降低遥感影像的精度,需要对遥感图像进行预处理工作[17-18]。本文对GF-1影像进行预处理,主要进行几何校正、辐射定标、大气校正和图像裁剪等预处理。
(1)利用ENVI 5.3提供的Radiometric Correction工具箱中的Radiometric Calibration工具完成影像的辐射定标。
(2)以ENVI 5.3中FLASSH Atmospheric Correction对辐射定标后的影像进行大气校正。
(3)将得到的经过大气校正的影像进行几何校正,本文使用空间分辨率2 m的GF-2影像为基准图像,对GF-1影像进行校正,采用二次多项式、双线性内插法重采样,地图投影采用UTM_Zone_45_North,地理坐标系为WGS-84。
(4)利用昌吉市行政区划矢量数据对GF-1影像进行裁剪,裁剪时保持裁剪边界与影像投影一致,利用ENVI 5.3的裁剪模块对影像完成裁剪。
3 结果与分析
3.1 最佳识别月份的确定
对不同月份的影像进行监督分类之前需验证样本可分离性,根据昌吉市2015年5—9月高分一号遥感影像数据的棉花与其他三类作物可分离性报表可以看出,棉花与其他三类作物可分离性精度合格(分离度>1.8),可以进行监督分类可分离性精度(表3)。
根据研究区主要的四种作物分类类型分析,选择2015年5—9月GF-1共5期遥感影像作为监督分类的基础数据,基于提取的适宜棉花生长的耕地掩膜运用支持向量机的分类方法(SVM)进行监督分类,结果如表4所示。endprint
选取支持向量机分类方法对GF-1不同时期遥感影像进行监督分类精度对比,其中支持向量机分类方法对GF1影像监督分类结果进行精度分类验证,分类精度为95.24%,Kappa系数为0.935分类精度最高的是7月影像。
3.2 最佳识别方法的确定
根据棉花与其他作物分类的可分离性分析(表3)可知,2015年7月GF-1遥感影像各待分地类之间的可分离性最高。研究中选择2015年7月GF-1遥感影像进行监督分类,以提取棉花面积种植信息。如表5所示。
将可分离性最高7月GF-1遥感影像,分别用最大似然法、平行六面体、最小距离法、马氏距离法、支持向量机这五种分类方法进行分类,从表5可以看出支持向量机分类法总体精度、Kappa系数均高于其他四类分类方法。
3.3 提取棉花種植面积精度计算及验证
3.3.1 最小图斑处理 在计算机上,通常面积大于6个像元的面状地类、地物在遥感影像图上可以解译识别[19-20]。本研究在确定最佳识别月份和最佳识别方法后,对监督分类后的结果先进行碎斑处理,主要目的是去除分类图中比较均匀的图斑上散乱分布的孤立像素。本文分别选取将小于3、6、9个像元点合并到其他图斑,旨在研究合并最小图斑像元点个数差异对于面积解译精度的影响。
3.3.2 野外实地调查点验证解译精度 根据监督分类解译的矢量数据结果图与实地野外作物调查点数据叠加,以实地调查的野外调查点检验分析监督分类精度。在ARCGIS 10.2中,通过Intersect工具对监督分类结果矢量图与1 130个野外调查点叠加,获得野外调查点相对应地块的解译类型,根据属性表筛选出监督分类解译与野外调查点信息一致的地块数目。以野外调查点验证监督分类解译精度(表6)。
由表6可知,根据野外调查点进行精度验证得到作物总体分类精度为75.93%,野外调查点中共计154个棉花野外调查点,其中解译棉花部分的精度评价显示,解译结果与野外调查点一致的棉花野外调查点共136个,其中有18个漏分的棉花野外调查点,由于棉花与玉米生育期重叠时间比较长,其中12个漏分的棉花野外调查点被划分为玉米野外调查点,棉花野外调查点漏分误差11.69%。在验证解译精度的总体野外调查点中共有57个包括玉米、小麦、其他作物的野外调查点被错分为棉花野外调查点,棉花错分误差29.53%,棉花解译精度为88.31%。
3.3.3 作物样本验证解译精度 根据野外调查样本数据建立的600个地表真实数据感兴趣区(ROI)与监督分类解译的矢量数据结果图叠加,可以获得作物样本相对应地块的解译类型。以作物样本检验分析监督分类精度,根据属性表筛选出监督分类解译与作物样本一致的地块数目。以野外调查点为基础建立的ROI验证监督分类解译精度(表7)。
由表7可知,根据野外调查点建立的作物样本进行精度验证得到作物总体分类精度为94.50%,其中解译棉花部分的精度评价显示,作物样本中共计150个棉花作物样本,其中解译结果与作物样本一致的棉花样本共146个,由于棉花与玉米生育期重叠时间比较长,其中有4个漏分的棉花作物样本,被划分为玉米作物样本,棉花作物漏分误差2.67%。在验证解译精度的总体作物样本中共有5个包括玉米、小麦、其他作物在内的作物样本被错分为棉花作物样本,棉花错分误差3.31%,棉花解译精度为97.33%。
本研究选取的作物样本很合理,无论是对于作物总体分类精度还是棉花分类精度,选取的包括训练样本和验证样本的作物样本对棉花种植分布进行精度检验显示作物解译精度和棉花解译精度很好。
3.3.4 提取棉花种植面积精度计算 在ENVI 5.3中得到的最佳监督分类方法解译出的最佳识别月份的遥感影像数据,其监督分类结果数据类型为栅格数据,然后通过ARCGIS 10.2软件中Raster to Polygon工具,将处理后的不同月份监督分类结果图矢量化。通过以上处理分析后,ARCGIS 10.2中,根据属性表计算棉花分布区域的面积,并根据昌吉市统计局公布的棉花面积与解译面积计算精度,提取精度=1-[ABS(调查面积-解译面积)/调查面积],根据合并不同大小最小图斑处理结果,选取棉花最佳识别面积方案。
由表8可以看出,选择不同像元点个数最小图斑合并对解译面积影响存在较为明显影响,随着合并像元图斑个数的增加,合并0个像元图斑对应的解译面积相比合并3个像元图斑对应的解译面积差异较大,相差21 hm2。选择合并9个像元图斑对应的解译面积与合并6个像元图斑对应的解译面积差异不显著,相差1 hm2。选择合并6个像元图斑的棉花种植面积提取结果最准确。
4 结论与讨论
4.1 结 论
本研究选取2015年5—9月GF-1共5景遥感卫星影像,对研究区昌吉市进行棉花种植面积信息提取研究,得出以下结论。
(1)作物样本可分离性最高影像为7月,GF-1支持向量机分类法确定的最佳时相也是7月。7月是识别棉花面积的最佳时相,可分离性高,分类精度高,提取棉花种植面积最为准确。
(2)利用监督分类方法中的马氏距离、最小距离、平行六面体、基于支持向量机、最大似然法分别对GF-1遥感影像数据进行监督分类,支持向量机分类法为解译精度最高的监督分类方法。
(3)棉花面积解译识别的最佳方案是,基于GF-1遥感数据7月为最佳识别月份的基于支持向量机为最佳识别方法,选取合并小于6个像元的最小图斑处理为最佳,实现精度最高的棉花面积识别。2015年昌吉市棉花提取面积为15 974 hm2,提取精度为95.79%。
4.2 讨 论
通过野外实地调查并结合2015年昌吉市作物物候历可知,7月是棉花生长最旺盛的时期,棉花生物量达到饱和,而玉米处于营养生长期,小麦已收获,通过影像上的纹理最容易区分棉花与其他农作物。9月玉米还在成熟期,其他作物都已收获,而棉花还在吐絮期,在此生长期棉花与玉米并不容易区分。面积提取结果表明,选取合并小于6个像元的最小图斑处理为最佳,7月的识别精度最高最易于识别,提取精度高达95.79%,支持向量机是精度最高的监督分类方法。endprint
此外,本次研究也存在一些不足之处。主要有以下几点。
(1)本研究监督分类选取空间分辨率为16 m的GF-1遥感影像数据,未能与其他数据源进行对比研究,不同分辨率的遥感影像数据可能会影响监督分类精度。
(2)GF-1影像数据受时间分辨率影响,可选择使用的影像时间范围较小,所获得的影像时间与作物生长期重合度有待提高。
(3)本研究采用监督分类的方法识别棉花种植面积。为更加快速解译棉花分布范围并获得棉花种植面积,可以通过对数据的挖掘,获得基于决策树的作物分类方法,以提高地面调查工作量,提高棉花种植面积的提取周期。
参考文献:
[1]蒙继华, 杜鑫, 张淼, 等. 物候信息在大范围作物长势遥感监测中的应用[J]. 遥感技术与应用, 2014, 29(2): 278-285.
[2]李郁竹. 农作物气象卫星遥感监测和估产研究进展及前景探讨[J]. 气象科技, 1997, (3): 30-36.
[3]江东, 王乃斌, 杨小唤. 我国粮食作物卫星遥感估产的研究[J]. 自然杂志, 1999, 21(6): 351-355.
[4]MATHUR A, FOODY G M.Crop classification by support vector machine with intelligently selected training data for an operational application[J]. International journal of remote sensing, 2008,29(8): 2227-2240.
[5]ZHONG L, GONG P, BIGING G S. Efficient corn and soybean mapping with temporal extendability: A multi-year experiment using Landsat imagery[J]. Remote sensing of environment, 2014, 140(1): 1-13.
[6]PAN Y, LI L, ZHANG J, et al. Crop area estimation based on MODIS-EVI time series according to distinct characteristics of key phenology phases: a case study of winter wheat area estimation in small-scale area[J]. Journal of remote sensing, 2011, 15(3): 578-594.
[7]TURKER M, OZDARICI A. Field-based crop classification using SPOT4, SPOT5, IKONOS and QuickBird imagery for agricultural areas: a comparison study[J]. International journal of remote sensing, 2011, 32(24): 9735-9768.
[8]王瓊, 王克如, 李少昆, 等. HJ卫星数据在棉花种植面积提取中的应用研究[J]. 棉花学报, 2012, 23(6): 503-510.
[9]熊勤学, 黄敬峰. 利用NDVI指数时序特征监测秋收作物种植面积[J]. 农业工程学报,2009,1(24): 144-148.
[10]彭代亮. 基于统计与MODIS数据的水稻遥感估产方法研究[D]. 杭州: 浙江大学, 2009.
[11]刘佳岐. 基于Landsat8遥感影像的扶风县苹果园地信息提取研究[D]. 杨凌: 西北农林科技大学, 2015.
[12]陈文倩, 丁建丽, 王娇, 等. 基于高分一号影像的土地覆被分类方法初探[J]. 干旱区地理, 2016, 39(1): 182-189.
[13]潘腾, 关晖, 贺玮. “高分二号”卫星遥感技术[J]. 航天返回与遥感, 2015, 36(4): 16-24.
[14]赵良斌, 曹卫彬, 唐春华, 等. 新疆棉花遥感识别最佳时相的选择[J]. 新疆农业科学, 2008, 45(4): 618-622.
[15]刘排英. 基于光谱面积和IHS变换的水体提取的研究[D]. 长沙: 中南大学, 2010.
[16]何同弟. 高光谱图像的分类技术研究[D]. 重庆: 重庆大学, 2014.
[17]YANG G, STWART C, SOFKA M, et al. Registration of challenging image pairs:initialization, estimation, and decision[J]. IEEE transactions on pattern analysis and machine intellingence, 2007, 29(11): 1973-1989.
[18]王媛, 叶思菁, 岳彦利, 等. 面向高分一号遥感影像的自动几何配准算法对比[J]. 农业机械学报, 2015, 46(12): 260-266.
[19]韦燕燕. 高分辨率遥感数据最小上图图斑面积的研究[D]. 焦作: 河南理工大学, 2012.
[20]陈粲, 张忠启, 史学正, 等. 不同分类级别土壤矢量图与最小可分栅格的关系研究[J]. 土壤学报, 2011, 48(3): 470-477.endprint