基于多源卫星遥感影像的水生药材芡实遥感监测方法研究*
2017-03-27吴啟南郝振国段金廒孙成忠杨泽东戴仕林
吴啟南,郝振国,段金廒,孙成忠,严 辉,杨泽东,戴仕林
(1.南京中医药大学药学院 南京 210046;2.中国测绘科学研究院 北京 100039)
芡实,又名鸡头子,大都生长于浅水的湖泊区域,素有“水中人参”和“水中桂圆”的美誉,是传统的中药材和珍贵的天然补品[1],是江苏省传统的水生道地药材之一。芡实作为一种浮叶型水生草本植物,传统的中药调查方式是通过实地调查布设样带、样方的方式进行。由于芡实生长在水中,常规调查方法通常无法进行,因此,水生类药材的调查需要采用新技术来完成。
遥感是20世纪60年代发展起来的一门综合性应用学科,遥感技术作为大面积、实时全球观测技术,正在广泛用于植物的调查和监测,近些年,业界一些学者把遥感技术应用于中药资源监测开展了相关研究,但针对水生药用植物调查与监测还没有进行研究先例。由于水生植物尤其是水生药材大多生长于湖泊、河流等湿地环境中,受到湿地内地形、地貌等诸多因素的限制,人们难以对药材的生长区域进行直接的考察[2]。而遥感技术具有多时相、多波段、覆盖范围广等特点,近几年已广泛用于湿地植被及湿地资源的调查和研究中。目前有很多研究利用多光谱遥感数据进行湿地植被识别及提取[2-17],但目前缺乏基于遥感影像的水生药材识别的系统性研究。
近年来,在中药资源领域,陈士林、张本刚等利用遥感技术对人参种植区域的人参种植面积进行调查,建立了人参资源遥感调查的技术路线和方法,并对产区面积进行了测算和估产[18]。孙宇章、郭兰萍等人利用遥感技术对野生中药苍术的资源量进行了调查,并估算了茅山苍术的资源量[19]。目前众多的研究主要是利用单一遥感数据对陆生药材分布进行监测研究,而对水生植物药材的遥感监测研究还处于空白,水生药材由于受水体和水草等因素的影响,其监测更为复杂。
本文针对高邮湖地区水生药材芡实种植区域的遥感识别,获取多时相Pléiades卫星遥感影像资料和高分一号(GF-1)卫星影像数据,构建芡实分类决策树模型,利用GIS空间分析技术,提取芡实种植区域,对高邮湖地区的芡实种植面积和空间分布进行研究,结合实地调查,能够比较准确反映水生药用植物芡实的分布面积。
1 研究区概况和卫星遥感数据获取
1.1 研究区概况
高邮湖位于淮河下游地区,江苏省扬州市宝应湖以南,京杭大运河以西,东经119°06′-119°25′,北纬32°30′-33°05′之间,总面积760.67平方公里,仅次于太湖,洪泽湖,为江苏省的第三大湖。本次影像获取区域主要位于界首区域内,研究区地理位置如图1所示。
研究区域内,芡实主要种植于堤坝围成的水域内,在该域内,还生长着芦苇、浮萍、菱角、野菜等水生植物。
1.2 多源卫星遥感数据获取及处理
本文采用Pléiades和GF-1卫星遥感数据,两种遥感影像各一景。Pléiades数据包括蓝、绿、红(波长分别为蓝430-550 nm绿500-620 nm红590-710 nm)3个可见光波段和一个近红外波段(波长为740-940 nm),空间分辨率为2 m,Pléiades数据的获取时间为2015年7月31日,该时段内,芡实的生长已经较为繁茂,枝叶已经基本覆盖湖面。
GF-1数据同样包括蓝、绿、红(波长分别为蓝450-520 nm绿520-590 nm红630-690 nm)3个可见光波段和一个近红外波段(波长为770-890 nm),空间分辨率为8 m,GF-1的影像获取时间为2015年6月6日,该时段内芡实还未种植或刚刚种植,在遥感影像上,种植芡实的区域主要表现为水体。
通过遥感图像处理软件ENVI对两种数据源遥感影像进行辐射校正(辐射定标和大气校正),消除一切与辐射有关的误差。此外,通过在研究区域实测控制点(控制点如表1所示),并在影像上选取同名地物控制点的方式对遥感影像进行几何精校正,最终校正误差控制在0.5个像元内。
图1 研究区地理位置
2 水生植物光谱测量
不同植被的光谱特征是水生药材植物遥感识别方法建立和验证的基础。由于芡实生长环境中不同种类植被光谱特征的相似性,植物在空间遥感探测中容易形成“异物同谱”及“同物异谱”现象。同时,芡实的生长受到水体环境的影响,其复杂性远远高于陆生植物,从而影响遥感分类解译的准确性。
为了更清楚地了解芡实及其周围水生植物的光谱特征,使用ASD公司生产的FieldSpec Pro JR便携式地物光谱仪,测定水生植物的光谱发射率。光谱仪的波段覆盖350-2 500 nm,其采样间隔在350-1 000 nm内为14 nm,在1 000-2 500 nm内为2 nm,光谱分辨率在700 nm为3 nm。传感器探头全视场角(FOV)为25°。
2015年8月21日,在高邮湖芡实生长区选取4种典型的水生植物进行光谱测定,所有水生植物均测量植物的冠层的光谱发射率,每个点位测定20组光谱数据,以20组光谱测量的平均值作为最终测量结果。
测量光谱反射率时,选择天气晴朗时段,测量工作从上午10:30开始到13:30结束。测定时探头垂直向下,距离水面高度为1 m,实际光谱采样样方大小直径为44.3 cm的圆形区域。每20分钟利用漫反射参考板(反射率为98%)进行仪器优化1次。
3 卫星遥感分类方法研究
研究区域位于陆地和湖泊的交接地带,随着水域的变化,形成了不同的植物群落,芡实种植区由围堰分割成不同的种植区,种植区内,典型的植被有芡实、芦苇、野菜、菱角等。大体上可分为挺水植物、浮水植物和沉水植物3种类别。
在遥感信息提取和分类上,决策树方法通过不同的决策级别设定阈值,克服了单指标阈值的缺点,具有更好的适应性。Luo Juhua等人[4,12]针对太湖流域建立了浮水植物、挺水植物和沉水植物的分类树模型。本研究针对研究区的实际情况,以归一化植被指数(NDVI)、挺水植物指数(EVI)、浮水植物指数(FVI)三种光谱特征指数,对芡实等浮水植被进行区分。为了更精确的区分芡实和其他浮水植物,利用主要浮水植物生长的差异性和多时相遥感影像,对GF-1号遥感数据的分类结果中水体部分和Pléiades的浮水植被区进行叠加,进而对分类结果进行优化。
表1 控制点名称及经纬度
3.1 模型构建
由于水生药材植物生长环境的复杂性,基于Pléiades卫星遥感影像,通过构建NDVI、EVI和FVI三种指数,利用选取样点处的反射率值,建立决策树分类算法。
3.1.1 NDVI指数
基于卫星影像的蓝、绿、红和近红外4个光谱波段,通过波段组合计算,首先计算归一化植被指数(NDVI)以此区分植被和非植被,排除道路、村庄、水体等地面覆盖类型的干扰。
NDVI=(NIR-R)/(NIR+R)
(1)NDVI的应用:检测植被生长状态、植被覆盖度和消除部分辐射误差等;
(2)-1<=NDVI<=1,负值表示地面覆盖为云、水、雪等,对可见光高反射;0表示有岩石或裸土等,NIR和R近似相等;正值表示有植被覆盖,且随覆盖度增大而增大
3.1.2 EVI指数和FVI指数
在区分出植被的基础上,根据前人的研究成果,建立FVI指数和EVI指数,区分出挺水植物、浮水植物。基于遥感影像的蓝、绿、红和近红外4个光谱波段,通过波段组合和影像变化技术(主成份变换和缨帽变换)构建两个光谱特征指数EVI和FVI。
EVI指数是第4波段和第1、2、3波段的差值与它们之和的比值,即
该指数可以较好地区分挺水植物。
FVI指数是主成份变换后的第二主成份,该指标能够较好地识别浮水植物,而芡实作为浮水植物的一种,可利用该指标进行区分[4,12]。
图2 分类决策树算法
分类阈值的确定是构建决策树的关键之一。本研究中采用CART(classification and regression tree)算法确定分类阈值。CART算法采用经济学中基尼系数作为选择最佳测试变量和分割阈值的准则,通过随机抽取样本的方式确定基尼系数的大小[20],其数学定义如下:
式中是从训练样本集中随机抽取一个样本,当某一测试变量值为h时属于第 j类的概率;nj(h)为训练样本中测试变量值为h时属于第 j类的样本个数;n(h)为训练样本中测试变量值为h的样本个数;j为类别个数。
基于NDVI、FVI、EVI构建了芡实分类决策树如图2所示。
3.2 卫星影像叠加
根据芡实及菱角等植物的种植和生长史可知,6月是芡实的种植期,此时芡实种植区在遥感影像上主要表现为水体或者水体与较少水生植物的混合区,而菱角等植物的生长区已被较大面积的绿色叶片覆盖。基于浮水植物区多时相空间分布的差异,利用6月获取的GF-1卫星数据,通过NDVI指数,以NDVI<0.198为分类指标,区分出6月底高邮湖中主要水体及较少水生植物的混合区,将这些区域与Pléiades分类结果进行空间叠加分析,可以区分出较为准确的分析结果。
3.3 结果优化
根据芡实生长的特性,如叶片覆盖面积高达1平方米以上、大面积分布等生长特性,对浮水植物的分类去进行优化,利用合并、删减等处理方式对分类结果进行处理。并将非浮水植物和其他地物进行合并,进行精度验证。
4 芡实卫星遥感监测结果
4.1 研究区水生类典型地物光谱特征分析
从图3中可以看出,不同种类的水生植物波谱曲线都呈现出典型植物光谱特征,在560 nm附近形成了明显的反射“绿峰”;在可见光部分的红光波段(670 nm为中心)附近有较强的吸收,形成吸收谷;在680-740 nm之间反射率增高最快,出现“红边”;在740-1 300 nm之间其光谱反射率较高,形成水生植物在近红外波段的反射高原区,而在1 670 nm和2 200 nm附近分别有一个明显的反射峰。不同类别水生植物光谱反射率大小在可见光和近红外波段差异明显,在近红外发射高原区(740 nm-1 300 nm)有位突出。而芡实和菱角的发射光谱在1 980 nm之后都趋近于0。
图3 四种水生植物的光谱曲线图
针对遥感影像上对应的波段,提取该波段的反射率值,得到图4的光谱曲线。
从图4中可以看出,在495、585、656三个波段:芦苇和芡实发射率值极为接近,而野菜和菱角极为接近,存在“异物同谱”现象,而在842.5波段,芦苇的反射率绝对值要高于其他三种植物。
4.2 研究区域水生药材芡实遥感监测分类结果
从光谱特征曲线中可以看到,水生植物在蓝、绿、红三个波段的反射率极为相近,最大的偏差也只有0.1左右。尽管在近红外波段,芦苇的发射率高于其他三种水生植物,但芡实、野菜和菱角的反射率却极为相近,这对于利用遥感影像进行芡实区域的分类将造成极大的干扰。为此,利用GF-1卫星的NDVI分类图,对决策树结果进行空间叠加分析,可以极大地提高分类精度。
通过实地调查了解到,在6月初时,芡实种植区还没有被芡实覆盖,在遥感影像上表现为水体,而菱角等浮生植物已有叶片覆盖,所以将高分一号卫星上的水体区和决策树结果中的浮水植物区域进行交集叠加运算,叠加区域即为芡实分类区域。由于芡实生长区域同时存在野菜、菱角等水生植物的伴生,造成分类结果中存在“孤岛”和分类中的混合像元问题,为此,对分类后的影像进行了图斑去除、合并、过滤等后处理操作。最终叠加结果如图5所示。
在GIS技术的支持下,经在研究区内分析统计,有近5.0平方公里的范围种植了芡实。
5 芡实卫星遥感监测分类结果的验证
对本次芡实遥感监测分类结果的验证采用ENVI的混淆矩阵法验证和实地验证相结合的方法。
ENVI的混淆矩阵法验证法是以图斑对象为最小单位,以混淆矩阵为基础,利用分类前预先设置好的样本评价当前的分类结果。混淆矩阵的原理是将地表真实像元的位置和类别与分类结果中相对应像元的位置和类别作比较,混淆矩阵的每一列代表了地面参考验证信息,每一列中的数值等于地表真实像元在分类图像中对应于相应类别的数量;混淆矩阵的每一行代表了遥感数据的分类信息,每一行中的数值等于遥感分
类像元在地表真实像元相应类别中的数量。
表2 分类精度验证
精度检验结果如表2所示。
对上述验证结果研究人员进行实地调查验证,并对多个种植农户进行调研分析,影像总体的分类精度也在80%左右,基本上与上述验证相吻合。经实地走访发现,2015年高邮湖北部地区发生洪水,造成部分种植区域水深过深,芡实生长受到影响,导致种植区内中心部分芡实无法生长,在遥感图像上呈现为水体,在种植区内出现了不连续分布的局面。对于研究区北部和东部出现的不连续种植,是由于部分农户在该区域内进行引种试种,并非分类错误。
图4 四种植物对应波段上的光谱曲线值
图5 影像叠加分析结果
6 结束语
近些年,应用卫星遥感技术监测中药资源的生长、分布及资源变化受到业界诸多学者的关注,也取得了一些研究成果。但基于多源卫星遥感数据对水生药材监测研究还处于空白。
本文以高邮湖为研究试验区,基于Pléiades和GF-1高分辨率影像的波段特征和影像变换技术及前人的研究成果,提出了基于NDVI、EVI和FVI指数,利用CART算法中基尼指数的原理确定分割阈值,构建了高邮湖芡实的决策树分类模型,较为精确地区分出了高邮湖地区浮水植物的生长区域。算法建立过程中,利用光谱仪实地采集了芡实生长区内相似地物的光谱反射率,并进行了光谱特征分析,为分类算法的发展和最终技术路线的建立提供了基础。
本文根据文献调研和野外实测数据,获取了高邮湖芡实生长区域水生植物的相关信息,考虑芡实不同时间的生长趋势,利用多源、多时相卫星遥感数据,通过不同时间芡实生长状态的变化来确定芡实的分布区域,为进行大范围水生药材监测探索了一种新的思路和方法。
1 沈蓓,吴启南,陈蓉,等.芡实的现代研究进展.西北药学杂志,2012,27(2):185-187.
2 林川,宫兆宁,赵文吉.基于中分辨率TM数据的湿地水生植被提取.生态学报,2010,30(23):6460-6469.
3 Brooks C,Grimm A,Shuchman R,et al.A satellite-based multitemporal assessment of the extent of nuisance Cladophora and related submerged aquatic vegetation for the Laurentian Great Lakes.Remote Sens Envirom,2015,157:58-71.
4 Luo J,Ma R,Duan H,et al.A New Method for Modifying Thresholds in the Classification of Tree Models for Mapping Aquatic Vegetation in Taihu Lake with Satellite Images.Remote Sens,2014,6(8):7442-7462.
5 Villa P,Brisciani M,Braga F,et al.IComparative Assessment of Broadband Vegetation Indices Over Aquatic Vegetation.IEEE JSelec Top Appl Earth Obser Remote Sens,2014,7(7):3117-3127.
6 简永兴,李仁东,王建波,等.鄱阳湖滩地水生植物多样性调查及滩地植被的遥感研究.植物生态学报,2001,25(5):581-587.
7 李俊生,吴迪,吴远峰,等.基于实测光谱数据的太湖水华和水生高等植物识别.湖泊科学,2009,21(2):215-222.
8 刘晖,胡湘阳,张田凤.遥感影像在水生植物提取中的探讨.科技传播,2012(10):71-72.
9 刘洁.基于TM、ETM~+影像的东平湖湿地信息提取及时空演变研究.泰安:山东农业大学硕士学位论文,2013.
10龙娟.基于光谱特征分析的野鸭湖湿地典型植物信息提取方法研究.北京:首都师范大学硕士学位论文,2011.
11龙娟,郭逍宇,宫兆宁,等.基于光谱特征的湿地水生植被信息提取研究.北京:中国地理学会百年庆典大会,2009.
12王琪,周兴东,罗菊花,等.考虑生活史的太湖沉水植物优势种遥感监测.湖泊科学,2015,27(5):953-961.
13夏双,阮仁宗,颜梅春.基于TM影像的水体信息提取方法研究(英文).南京林业大学学报(自然科学版),2012,36(4):29-35.
14夏晓瑞,韦玉春,徐宁,等.基于决策树的Landsat TM/ETM+图像中太湖蓝藻水华信息提取.湖泊科学,2014,26(6):907-915.
15杨凯,林开愚,张荣幸,等.遥感数字图象处理技术在洪湖水生植物分布调查中的应用.植物生态学报(英文版),1983(05):472-481.
16邹维娜.上海地区典型沉水植物光谱特征研究及其应用.上海:华东师范大学博士学位论文,2014.
17邹维娜,张利权,袁琳.基于光谱特征的沉水植物种类识别研究.华东师范大学学报(自然科学版),2014(04):132-140.
18陈士林,张本刚,张金胜,等.人参资源储藏量调查中的遥感技术方法研究.世界科学技术-中医药现代化,2005,7(4):37-43.
19孙宇章,郭兰萍,朱文泉,等.道地药材茅苍术的资源遥感监测.中国中药杂志,2008,33(4):353-356.
20 Trendowicz A,Jeffery R.Classification and regression tree.oftware Project Effort Estimation.Springer,Cham:295-304.