基于决策树和多时相遥感数据的苜蓿分类研究
2018-12-25秦景逸郑逢令阿斯娅曼力克艾尼玩艾买尔
秦景逸,郑逢令,阿斯娅·曼力克*,艾尼玩·艾买尔
(1.新疆畜牧科学院草业研究所 3S技术应用实验室,乌鲁木齐 830000;2.新疆畜牧科学院工程咨询中心,乌鲁木齐 830000)
近几年来,新疆的畜牧业逐步由传统放牧向舍饲、半舍饲放牧转变,但是随着天然草地的持续退化,导致产草量下降、载畜量超标等一系列问题,制约畜牧业发展总体水平。为减轻天然草地的放牧压力,必须要大力发展人工草地,苜蓿被称为饲草之王,其产量高、营养丰富、易消化的特征备受重视。从2011年开始,全疆大部分地区种植苜蓿面积达到了26.67万hm2左右,及时、准确的获取苜蓿分布情况和提取种植面积对人工草地宏观管理具有重要的实践价值。然而提取苜蓿面积的遥感卫星在实际操作中也存在一定的问题,时间分辨率高的卫星[7]其空间分辨率较低;空间分辨率高的卫星受天气影响大且重访周期长,导致提取精度难以保证。想要获取同一区域,同一时相,精度较高无云干扰的遥感图像比较困难。
利用多时相遥感影像监测草地资源面积及动态演变规律已成为近年来国内外众多学者研究的热点问题。李春干[1]等人在2007年到2008年利用多时相ALOS PRISM/AVNIP-2的数据生成相应的植被指数序列获取红树林的空间分布。李晓东[2]等人设计了农田分类提取方案,对2013年1月到12月的卫星数据集的植被指数、水体指数和土壤指数进行数学方法运算,得到具有明确物理意义和物候信息的指标因子,自动分类提取不同农田类型。Hong G[3]等人将卫星与雷达数据融合,利用更丰富的卫星遥感信息源提高了加拿大草原苜蓿人工草地信息提取的精度。Nidamanuri[4]等人利用航空成像光谱仪所得图像对5种不同的作物信息进行提取研究,精度均达到80%以上。李敏[5]等人基于两种不同的卫星图像,采用决策树的分类方法提取乡镇级的棉花种植面积,精度达到90%以上。陈家琪[6]等人利用多时相的两种不同的卫星数据源,对甘肃省定西县2000年到2001年土地利用和土地覆盖进行遥感调查,采用多时相多数据源的组合相互补充,增加信息量,根据不同作物不同时相的光谱特征进行精确的作物面积划分,从而明确了该县土地利用结构,耕地退耕还林、还草的变化状况,实现了对该区域生态环境变化的动态监测。分析不同作物的生长发育规律在遥感影像上表现出的时相变化特征,从而利用作物波谱时间效应特征实现作物面积提取的分类精度。NDVI时间序列数据可以有效解决遥感反演遇到“同物异谱,同谱异物”问题。可以利用不同时间序列遥感图像生成NDVI时间序列数据,从而达到作物分类继而提取作物面积的目的。
本文选择全疆范围内3个不同纬度的试验地,分别是阿勒泰市640台地农业产业化示范园、塔城市铁斯克塔斯乡、齐巴尔吉迭乡和呼图壁县种牛场畜牧队,通过2015年至2017年三年的Landsat 8卫星、高分遥感和哨兵遥感数据结合的方式,共获取36景遥感影像,分析研究区苜蓿与其他农作物之间的差异,运用专家知识决策树(CART)分类法,结合实地定位调查,为当地区域苜蓿分类信息高精度提取提供一定的参考。
1 研究区及观测数据
1.1 样地选择与定位
试验区分别选择在自治区2015年实施的“草牧业发展试验试点项目”区阿勒泰市、塔城市和呼图壁县。阿勒泰市数据采集区布局在640台地农业产业化示范园区内,塔城市的布局在铁斯克塔斯乡和齐巴尔吉迭乡,呼图壁县的布局在种牛场畜牧队,覆盖了北疆大部分地区大面积连片种植人工草地即苜蓿地。
按照试验需求苜蓿分布区域布设监测样地,样地数量200个苜蓿样地。具体试验区包括阿勒泰市(54个),塔城市(52个),呼图壁县(94个)。于2015年4月5日-6月28日进行外业工作,获取野外地面数据。进行实地调查时,通过当地草原工作部门提供的初始信息,通过遥感图像和地形图规划调查路线。通过GPS标定样地的位置。见图1。
图1 研究区位置图
1.2 实地观测数据
在试验区开展野外实地考察,利用手持GPS采集研究区苜蓿作物样本,结合理论知识和实地观测获取不同作物的物候期[10]。见表1。
表1研究区4种主要作物物候期
2 数据来源和处理方法
2.1 数据来源
Landsat 8卫星数据和高分遥感图像数据从美国地质勘查局网站 (http://glovis.usgs.gov.)下载,哨兵遥感图像数据从欧盟卫星数据服务平台(http://scibub.copernicus.eu.)下载。用手持GPS,2016年5月-10月每个月1次共6次,2017年5月-10月每个月6次重复采集200个样点数据,并对苜蓿分布区域进行统计。
2.2 卫星图像的预处理
图像预处理是遥感信息处理中一个十分重要的环节,它直接关系到信息提取的精度与实用程度[11]。利用2016年4月-10月和2017年4月-10月的影像为基准,利用ENVI5.1软件进行常规的遥感数字图像处理,包括几何校正、大气校正、裁剪、镶嵌等。
2.3 光谱数据采集
2015年开始野外调查,按照计划好的样地分布情况,用GPS定位打点、拍照片、做记录。通过Unispec光谱分析仪对试验区周边农作物和苜蓿分别进行光谱数据采集。2016年进行第二次野外调查,对第一年的分类结果进行初步验证,对发现的问题进行分析调整。2017年进行第三次野外调查,通过之前两年的分类结果,分析导致影响精度的因素,改进分类方案进一步提高分类精度。
2.4 技术路线
通过2016年对研究区的实地调查,结合遥感影像反演试验区苜蓿面积及空间分布情况,总结苜蓿不同物候期的光谱特征,制定决策树分类规则,在ENVI中利用决策树分类提取2016、2017年苜蓿面积,最后利用已知的样地数据进行分类精度验证。见图2。
图2 研究技术线路图
3 试验区苜蓿遥感分类结果
3.1 遥感解译的思路
苜蓿遥感分类的基本思路就是先根据实地采集的样地资料和多时相的遥感数据,归纳出苜蓿区别其他地类的多时相光谱特征,然后总结出分类规则。本次研究以决策树算法为主,其他分类方法为辅。
3.2 遥感影像数据源
采用Landsat 8影像数据作为主要的遥感数据信息源,由于云量的影响,一般不能获取整个苜蓿生长期的光学图像数据,所以选用与Landsat 8特点相似的哨兵多光谱数据作为补充,构建苜蓿生长季完整的时间序列数据。遥感数据在ENVI中进行辐射校正、大气校正和几何校正,进而获得反射率数据和植被指数时间序列。
除了使用遥感数据源之外,还需要用到其他数据。主要包括:(1)新疆各个县及市的行政界线图;(2)与试验区相关的数据统计资料。
3.3 运用决策树分类法应用于苜蓿分类
决策树分类法[12]是监督分类的一种方法,具有简单、高效、直观、分类过程符合人类认知过程的特点。为从背景中分离出目标地物,需要专家经验总结、简单数学统计和归纳方法等获得分类规则并进行遥感分类。专家知识决策树分类的步骤大体上可分为四步:知识(规则)定义、规则输入、决策树运行和分类后处理,其中最重要的是获取分类规则,本研究中规则的获取来自统计与经验总结,是根据样本所对应的像元的NDVI时间序列统计特征总结出阈值范围,然后进行分类。
3.4 阈值选取和分类流程
通过2016年和2017年野外调查数据,根据获取的样地数据统计苜蓿、其他作物、天然草地像元的NDVI特征,以多时相NDVI数据为基础构建决策树模型。主要思路为:在不同月份影像数据中获取NDVI系列特征,统计苜蓿样地NDVI值的高频分布区域,总结出阈值范围,分类时通过不停的调整参数范围,获取高精度的分类结果。
本研究通过分析试验区苜蓿种植区域的植被指数,对苜蓿特征进行精确描述,由此产生分类规则,然后再由专家知识构建的分类器进行分类,得到分类结果。其主要步骤:①遥感图像处理;②获取NDVI;③构建分类规则并进行分类,主要流程如图3所示。
图3 决策树流程图
3.5 分类精度分析
本研究使用混淆矩阵进行图像分类精度分析,本文使用混淆矩阵的总体分类精度、制图精度和用户精度等三项评价指标。见表2。
表2 决策树混淆矩阵结果
从制图精度方面而言,能达到比较高的精确度,但有个别分类出现错误的地方,如苜蓿和林地,苜蓿和冬小麦。可能是由两方面的原因造成的:(1)苜蓿和冬小麦阈值相似导致自动判别后的点大部分处在较相近区域;(2)两者的绿度在相同时间区域内较为相似。结合NDVI植被指数4月、5月和9月、10月的阈值进行分析,确保分类结果的准确性。
3.6 专题图的制作
将分类结果导入Arc GIS中形成一个分类结果图层,根据遥感影像目视解译出研究区的道路,居民区,水系等地类,然后进行整饰制作专题图,最后进行苜蓿面积统计。见图4。
图4 专题图制作流程图
4 结论与讨论
以北疆3个不同区域农区苜蓿集中连片种植范围为研究对象,借助于光谱特征曲线和物候特征,利用地面调查数据和遥感技术结合在一起,通过决策树分类方法对研究区苜蓿进行分类,应用混淆矩阵进行精度评价,结论如下:
(1)基于时间序列遥感数据,使用的决策树分类在苜蓿方面分类精度较高,说明决策树分类方法在苜蓿遥感识别中有很高的可靠性;本次研究的总体精度达到99.27%,总Kappa系数为0.78;
(2)通过研究发现在遥感分类中与苜蓿容易混淆的农作物有冬小麦、苗圃、天然草地中的低矮灌木、隐域性草甸。
(3)通过分类识别出3个地区的苜蓿面积,其中阿勒泰市640台地的苜蓿面积为3 688 hm2、呼图壁县种牛场畜牧队苜蓿面积为1 888 hm2、塔城市铁斯克塔斯苜蓿面积为1 493 hm2、塔城市齐巴尔吉迭苜蓿面积为3 740 hm2。
通过多源、多时相遥感数据构建不同物候期苜蓿的NDVI时间序列,统计总结出苜蓿光谱特征变化规律,构建分类规则,再结合决策树的分类方法实现苜蓿面积的提取,且这种分类方法达到了较高的精度,实现了北疆地区三个典型苜蓿种植区的面积变化动态监测。但是,本研究在数据采集、遥感图像源的选择、时间序列完整性等方面存在一些不足,有待今后研究中加以改进。现阶段只在北疆3个试验区进行了苜蓿面积的分类,将来有意推广至全疆范围内,通过遥感数据的获取进一步研究人工草地产草量、病虫害等其他领域。