FY-3C/MERSI卫星影像水稻信息自动提取的决策树方法研究
2016-03-24陈兴鹃黄淑娥祝必琴樊建勇
陈兴鹃,黄淑娥,祝必琴,樊建勇
(江西省气象科学研究所,江西 南昌 330096)
FY-3C/MERSI卫星影像水稻信息自动提取的决策树方法研究
陈兴鹃,黄淑娥,祝必琴,樊建勇
(江西省气象科学研究所,江西 南昌 330096)
摘要:为了推进风云三号系列卫星资料在水稻信息提取中的应用,分析了FY-3C/MERSI影像中江西省区域水稻及其他典型地物的光谱特征及通道间的关系,并讨论了各地物在光谱特征上的可分性。研究发现:除植被外,其他地物均可依据适当的阈值与水稻分开;水稻与其他植被在各单通道上的光谱特性相似,因此引入归一化植被指数来提高水稻提取的精度。根据以上研究结果,建立了决策树模型对水稻信息进行自动提取。目视检验结果表明,该方法的提取效果较好,只是在水稻与其他植被交界处有误判现象。提取精度评价结果显示,该方法的总体提取精度较高,基本上可以满足水稻生育期面积遥感监测与产量预报的需求。
关键词:FY-3C/MERSI;卫星影像;水稻;信息提取;决策树
0引言
利用遥感技术监测农作物的长势和进行大面积作物估产,是遥感应用于植物宏观研究的重要方面,也是卫星遥感与农业交叉领域的研究重点。水稻遥感识别作为遥感技术在农业领域应用的重要内容,近年来在国内有许多相关研究:杨晓华等在PNN模型理论的基础上,针对水稻种植面积遥感信息的提取问题,建立了PNN模型遥感影像分类模型,并将其与BP模型和传统的最小距离法分类结果做了对比[1];郑长春等利用8 d合成MODIS陆地表面反射率数据的特点和水稻典型物候特征,通过归一化植被指数、增强植被指数及利用对土壤湿度和植被水分含量较为敏感的短波红外波段计算得到的陆地表面水指数进行了水稻种植面积信息的获取[2];陈燕丽等应用面向对象的分类方法提取了广西玉林市辖区晚稻种植面积[3];魏新彩等选取样区水稻生长关键期的多时相HJ-1A/1B卫星数据,构建了HJ卫星数据的水稻种植面积识别方法[4];李根等通过研究证明,采用MODIS09A1数据结合线性光谱混合模型可以更高精度地提取大范围水稻的种植面积[5]。
风云三号卫星(FY-3)是在风云一号卫星基础上发展起来的我国第二代极轨气象卫星,目标是实现全球大气和地球物理要素的全天候、多光谱和三维观测。风云三号03星(FY-3C)于2013年9月23日在太原发射成功,它充分继承了A/B星的成熟技术,星上搭载了12套遥感仪器,其中的中分辨率光谱成像仪(MERSI)可以探测来自地球大气系统的电磁辐射,得到20个通道的多光谱信息,其中5个通道具有250 m的空间分辨率,可提供可见光、近红外和远红外波段监测数据;另外15个通道具有1000 m的空间分辨率。江西省为水稻种植大省,应用遥感技术可以及时、准确、客观地对水稻面积进行大范围监测研究,对快速收集农业信息、科学指导农业生产具有重要意义。目前,利用FY-3C卫星资料提取水稻信息的研究尚鲜见报道,为了推进风云三号系列卫星数据在水稻监测业务中的应用,最大限度地发挥FY-3C卫星应用工程建设效益,本文尝试利用FY-3C/MERSI数据,结合江西省土地利用现状资料,对江西省水稻信息自动提取的决策树方法进行了研究,并与统计部门下发数据作对比,对提取面积进行了精度评价。
1研究区概况及数据
江西省地处长江中下游(113°34′~118°28′ E,24°29′~30°04′N),日照充足,雨量充沛,气候资源优越。全省总面积16.69万km2,其中耕地面积2.90万km2,是全国13个粮食主产省之一。水稻作为江西省最主要的粮食作物,种植面积和总产量均居全国第二[6-10]。
本研究筛选了2014年度江西省二季晚稻生育期内风云三号C星的晴空数据,其中仅2014年10月4日全省基本无云,且该时段水稻田在遥感影像中色彩相对单调统一,十分便于水稻信息的提取。故使用2014年10月4日的FY-3C/MERSI遥感影像资料,选择MERSI传感器1~5通道数据对江西省水稻信息进行监测分析,其主要性能参数见表1。首先利用国家卫星气象中心的卫星监测分析与遥感监测系统(SMART)对0级数据进行定标、等角投影等处理,生成250 m分辨率1级数据。再利用ENVI遥感软件转换为栅格数据,并结合ERDAS遥感软件进行后续光谱信息提取与分析。为突出图像上的不同地物以便于目视判读,选取CH2、CH4、CH3(RGB)3个通道进行假彩色合成,在该合成影像上水稻表现为嫩绿色。
表1 MERSI(中分辨率光谱成像仪)各通道的性能参数
注:在第5~6栏中,第1~4通道的数据为反射率,第5通道的数据为温差或最大温度。
2水稻与背景地物的光谱特征分析
结合目视判读和江西省土地利用现状分类情况,将研究区分为水体、林地、水稻、裸地、草洲和云共6种典型地物。利用ERDAS遥感软件的Spectral Profile光谱剖面工具对每种地物按照空间分布进行均匀采样(样本数见表2),对比分析通道1~通道5的光谱特性,统计其最小值、最大值、均值和标准差,统计结果见表2。为了便于分析,根据这些统计值做出各地物的光谱曲线,见图1、图2。
遥感图像反映的是影响区域内地物的电磁波辐射能量,有明确的物理学意义。在遥感图像数据中,像元亮度值的大小及其变化主要由地物类型的变化引起[11]。
2.1典型地物不同通道的反射率比较
由表2和图1、图2可知:对于地物水体而言,不同通道的反射率表现为CH1>CH2>CH3>CH4,反射率在CH4达到最小,且小于其他地物CH4的;在林地下,不同通道的反射率表现为CH4>CH1>CH2>CH3,其中CH4的反射率明显高于CH1~CH3的;对于地物水稻,反射率表现为CH4>CH1>CH2>CH3,CH4的反射率明显高于CH1~CH3的;对于裸地,CH4>CH1>CH2>CH3,CH1和CH4的反射率相近;就草洲来说,CH4>CH1>CH2>CH3,CH4的反射率明显高于CH1~CH3的。
图1 典型地物的光谱响应曲线
通道统计值水体林地水稻裸地草洲云1样本数415459419395303354最小值9.57.410.411.811.214.0最大值17.913.414.922.013.784.7均值13.110.312.715.312.244.9标准差1.81.20.81.40.514.42样本数415459419395303354最小值5.23.77.77.97.910.0最大值17.19.011.521.210.684.2均值9.56.59.811.59.042.5标准差2.71.00.71.40.614.93样本数415459419395303354最小值2.82.05.16.35.27.7最大值19.06.510.821.28.587.9均值7.24.17.411.06.543.2标准差3.60.80.91.70.616.14样本数415459419395303354最小值0.59.123.86.115.228.9最大值10.635.138.424.833.188.2均值3.222.232.016.724.751.9标准差1.84.82.62.74.012.65样本数415459419395303354最小值288.5283.1289.5290.6290.1276.5最大值295.2294.7296.8300.2295.6295.8均值290.5289.7291.9296.1292.4282.7标准差1.01.91.41.51.03.6
注:第1~4通道的数据为反射率(单位为%),第5通道的数据为亮温(单位为K)。
图2 典型地物通道5的亮温值比较
由此可见:林地、水稻、草洲及裸地的光谱响应曲线的走势大体相似,均有CH4>CH1>CH2>CH3的特点,仅水体表现为CH1>CH2>CH3>CH4,这是因为水体在4通道(近红外波段)上具有很强的吸收性,而植物、土壤在此通道上吸收能量较小且有较强的反射特性,因此可根据水体CH1>CH4的特性对其进行剔除。
2.2典型地物间反射率对比
CH1(blue):反射率表现为裸地>水体>水稻>草洲>林地,水稻和水体、草洲几乎重叠,但与裸地、林地有差异。CH2(green):情况与CH1类似。CH3(red):情况与CH1、CH2类似,且裸地与其他地物的差异更加明显。CH4(NIR):水稻>草洲>林地>裸地>水体,各地物的反射率差异较大,其中水体明显小于其他地物,水稻明显大于其他地物。据此可尝试分别设定阈值剔除水稻以外的其他地物。CH5(FIR):裸地>草洲>水稻>水体>林地>云。影响云的反射率的因素较多,不同时相云的光谱与其他地物相比不太稳定,但在5通道上,云的亮温相比于其他地物明显偏低,而水体、林地、水稻和草洲的亮温相近。据此可将云剔除。
3自动提取水稻信息的决策树方法
决策树是遥感图像分类中的一种分层处理结构,可以逐级分层次地把所研究的目标一一区分、识别出来,具有灵活、直观、运算效率高的特点。在分类过程中,在结构层次间可以不断加入遥感或非遥感的决策函数、专家知识及有关资料(如一些边界条件、分类参数等),进一步改善分类条件,提高分类精度。本文根据上述分析,提出以下利用决策树方法进行水稻信息提取的基本过程,提取工作利用ERDAS遥感软件提供的Knowledge Engineer工具,提取流程如图3所示。
图3 水稻信息自动提取流程
(1)根据云体在5通道上的亮温值明显低于其他典型地物的特点,首先设定阈值T1将云体剔除。根据典型地物样点的统计数据,云体在CH5的亮温值变化范围为276.5~295.8 K,均值为282.7 K;水稻在CH5的亮温值变化范围为289.5~296.8 K,均值为291.9 K。为了不去除水稻,将T1设定在283~289 K之间,并经反复试验最终确定以T1>287.1 K剔除云体。同时,由于亮温值有重叠,所以一小部分水体和林地也被剔除。
(2)从前面的分析可知,水体具备CH1>CH4的特性,同时水体在4通道的反射率明显低于其他地物的,故可设定阈值T2将水体剔除。根据典型地物样点的统计数据,水体在CH4的反射率变化范围为0.5%~10.6%,均值为3.2%;水稻及草洲在CH4的反射率远超出该范围。因此,可将T2设定在5%~11%之间,并经反复试验最终确定以T2>8.8%剔除水体。同时,由于反射率有重叠,故一小部分裸地也被剔除。
(3)在4通道,裸地的反射率明显低于水稻的,因此可设定阈值T3将裸地剔除。根据典型地物样点的统计数据,裸地在CH4的反射率变化范围为6.1%~24.8%,均值为16.7%;水稻在CH4的反射率变化范围为23.8%~38.4%,均值为32.0%。因此,可将T3设定在15%~20%之间,并经反复试验最终确定以T3>17%剔除裸地。同时,由于反射率有重叠,所以一小部分林地和草洲也被剔除。
(4)林地、草洲和水稻作为植被,反射率变化趋势一致,且在各个通道上反射率均有重叠,经对比分析,这3种地物在4通道的反射率重叠相对较少,其中水稻的反射率情况在(3)中已经给出,林地在CH4的反射率变化范围为9.1%~35.1%,均值为22.2%;草洲在CH4的反射率变化范围为15.2%~33.1%,均值为24.7%。因此,可以设定阈值T4剔除一部分林地和草洲。初步将T4设定在20%~30%之间,并经反复试验最终确定以T4>29.5%剔除大部分的林地和草洲。
(5)由于植被在各单通道上的光谱特性相似,从中提取完整的水稻信息较困难,因此考虑引入对植被有指示意义的归一化植被指数,通过波段间运算增加信息量并参与分类,提高水稻提取的精度[12]。本研究利用2014年10月4日FY3C/MERSI影像数据计算归一化植被指数,计算公式为:NDVI=(CH4-CH3)/(CH4+CH3),其中CH4对应近红外波段,CH3对应红光波段。对计算过NDVI的影像进行采样,所得统计结果见表3。
表3 典型植被的归一化植被指数(NDVI)统计结果
根据表3,可设定阈值T5对水稻信息进行进一步的提取,从而提高提取精度。初步将T5设定在0.55~0.75之间,并经反复试验最终确定以0.58 经过以上5步,就可通过剔除原始图像中的云体、水体、裸地、林地和草洲等背景,得到水稻信息,将提取出的水稻信息标识为黄色,结果见图4。 图4 水稻信息提取结果 4结语 本研究采用目视判读和精度验证来评价水稻信息提取结果。首先,将通过上述方法提取的水稻信息与原始影像进行叠加,并利用ERDAS遥感软件的地理链接功能,将遥感影像与江西省土地利用现状数据进行点对点的比较分析。判读检验结果表明该方法的总体提取效果令人满意。在定量统计方面,将《江西统计年鉴》[13]中记载的2007~2013年江西省二季晚稻面积统计数据的平均值作为精度验证的标准,对提取的水稻面积进行精度评价。图5是2014年10月4日江西省11个地市水稻面积遥感提取结果与统计面积平均值的对比,从中可以看出,水稻信息的提取精度总体上在90%以上,该精度基本上可以满足水稻生育期面积遥感监测与产量预报的需求。在目视检验中发现,提取时的误判主要发生在水稻与其他植被的交界处,因为这些交界处通常具有相似的光谱特征。因此,进一步的研究重点是在现有理论的基础上,融合更高分辨率的空间信息来提高水稻信息提取的精度。 图5 江西各地市水稻面积精度评价 参考文献: [1] 杨晓华,黄敬峰.概率神经网络的水稻种植面积遥感信息提取研究[J].浙江大学学报:农业与生命科学版,2007,33(6):691-698. [2] 郑长春,王秀珍,黄敬峰.多时相MODIS影像的浙江省水稻种植面积信息提取方法研究[J].浙江大学学报:农业与生命科学版,2009,35(1):98-104. [3] 陈燕丽,莫伟华,莫建飞,等.基于面向对象分类的南方水稻种植面积提取方法[J].遥感技术与应用,2011,26(2):163-168. [4] 魏新彩,王新生,刘海,等.HJ卫星图像水稻种植面积的识别分析[J].地球信息科学学报,2012,14(3):382-388. [5] 李根,景元书,王琳,等.基于MODIS时序植被指数和线性光谱混合模型的水稻面积提取[J].大气科学学报,2014,37(1):119-126. [6] 陈建军.基于EOS/MODIS的江西省水稻长势遥感监测研究[D].南京:南京信息工程大学,2012:1-20. [7] 黄淑娥,田俊,吴慧峻.江西省双季水稻生长季气候适宜度评价分析[J].中国农业气象,2012,33(4):527-533. [8] 吴珊珊,王怀清,黄彩婷.气候变化对江西省双季稻生产的影响[J].中国农业大学学报,2014,19(2):207-215. [9] 彭春瑞,刘小林,李名迪,等.江西水稻主要气象灾害及防御对策[J].江西农业学报,2005,17(4):127-130. [10] 陈大洲,江莉,刘红安,等.江西水稻育种现状及其发展方向[J].江西农业学报,2006,18(4):14-17. [11] 邓劲松,王珂,李君,等.决策树方法从SPOT-5卫星影像中自动提取水体信息研究[J].浙江大学学报:农业与生命科学版,2005,31(2):171-174. [12] 郑长春,王秀珍,黄敬峰.基于特征波段的SPOT-5卫星影像水稻面积信息自动提取的方法研究[J].遥感技术与应用,2008,23(3):294-299. [13] 江西省统计局.江西统计年鉴[M].北京:中国统计出版社,2008-2014. (责任编辑:黄荣华) Study on Decision-tree Algorithm for Automatically Extracting Paddy Rice Information from FY-3C/MERSI Images CHEN Xing-juan, HUANG Shu-e, ZHU Bi-qin, FAN Jian-yong (Meteorological Research Institute of Jiangxi Province, Nanchang 330096, China) Abstract:In order to promote the application of FY-3 series of satellite data in information extraction of paddy rice, the author analyzed the spectral characteristics of paddy rice and other typical objects and the relationship among channels on FY-3C/MERSI image in Jiangxi province, and discussed the separability around objects on the spectral characteristics. The results showed the other typical objects could be separated from paddy rice on the basis of appropriate threshold besides vegetation. The spectral characteristics of paddy rice on every single channel was similar with the other vegetation, so the Normalized Difference Vegetation Index of vegetation was introduced to improve the extraction accuracy of paddy rice. According to the results of the research, the decision-tree model was established to automatically extract paddy rice information. Visual inspection showed that the extracting effect of this method was better, however, some pixels in the neighborhood area between paddy rice and other vegetation were judged by mistakes. Precision evaluation results showed that the overall extraction precision of this method was higher, the extraction results could meet the demand of remote sensing monitoring of rice area in the growth period and yiejd forecast. Key words:FY-3C/MERSI; Satellite image; Paddy rice; Information extraction; Decision-tree algorithm 中图分类号:TP79、S127 文献标志码:A 文章编号:1001-8581(2016)02-0085-05 作者简介:陈兴鹃(1986─),女,硕士,助理工程师,从事农业气象与卫星遥感方面的研究。 基金项目:国家发改委项目“风云三号气象卫星应用系统二期工程应用示范系统”;江西省气象局面上项目“FY-3卫星资料对水稻长势遥感监测的应用研究”。 收稿日期:2015-07-22