基于无人机遥感的高潜水位采煤沉陷湿地植被分类
2019-03-06吕雪娇闫皓月孙诗睿
肖 武 任 河 吕雪娇 闫皓月 孙诗睿
(1.中国矿业大学(北京)土地复垦与生态重建研究所, 北京 100083; 2.浙江大学公共管理学院, 杭州 310058)
0 引言
中国90%的煤炭为井工开采[1]。井下煤炭资源的开采使得土地大面积沉陷,形成采煤沉陷区[2]。特别是在高潜水位矿区,大面积的沉陷加之较高的潜水位,使得沉陷区内存在大量的积水区域。丰富的地表水资源、植物、动物、微生物、土壤等要素使高潜水位采煤沉陷地具备了湿地生态系统的基本特征[3]。与常规的天然湿地及景观湿地相比,高潜水位采煤沉陷湿地具有土地利用变化剧烈、物质能量转化迅速、水陆植物演替频繁等特点。开采导致的地面沉陷发生在几个月至几年不等,原有的陆地农作物与水生植物生长环境随着地面沉降的动态变化而发生剧烈改变,因而其植被的演替与更新更为频繁,掌握采煤沉陷区湿地植被的类别和分布,可以一定程度上反映沉陷区生态环境敏感程度,同时为采煤沉陷湿地生态治理和高潜水位地区生态修复提供参考[4]。
图1 研究区地理位置及无人机影像Fig.1 Location and UAV images of study area
湿地植被是湿地生态系统中能量的固定者和有机营养物质的最初生产者,作为重要的营养级,它能综合反映湿地的生境特征,并在湿地水分、物质、能量循环中起重要作用[5-6]。湿地植被的动态变化能够反映湿地的生态环境变化,被认为是一个反映生态环境变化的敏感指示器,已成为研究热点,其中植被分类是进行植被覆盖状况和动态变化规律研究的基础[7]。针对湿地复杂环境下植被信息的提取,国内外学者进行了大量研究[8-12]。然而,卫星遥感影像分辨率低、尺度大、周期较长的问题依旧不能忽视,无人机的兴起为这一问题提供了新的解决思路[13-15]。
目前对于湿地植被的研究多集中于天然湿地、城市湿地景观等区域,而采煤沉陷区湿地作为人工湿地,其形成是一个动态过程[16]。调查采煤沉陷湿地植被类型对掌握其动态演变规律与过程至关重要,也是后期营造景观生态、进行土地复垦与生态修复的重要基础数据。探究高潜水位矿区开采沉陷后地面生态系统的动态转变与转化,不少学者进行了采煤沉陷地与作物的调查[17-18]。沉陷是一个复杂的演变过程,时域和空间尺度较大。常规的野外实测可以消除土壤对于植被作物的影响,并可以提高分类精度,但是难以刻画这样复杂的过程。近年来随着无人机遥感技术的发展,使得大面积的植被覆盖监测和动态研究变得更加客观[19]。同时,针对高空间分辨率影像,面向对象分类可以更好地使用形状和拓扑增强图像空间信息[20-21],相比基于像元的分类,具有更高的分类精度。为了探究采用无人机获取高空间分辨率影像进行采煤沉陷湿地植被类型调查的方法,本文以山东省济宁市东滩煤矿3304工作面为研究区,利用无人机多光谱影像对采煤沉陷湿地植被进行面向对象分类,结合地面实测采样数据进行精度分析,并与传统的监督分类方法进行比较,论证基于无人机影像采用面向对象方法进行采煤沉陷湿地植被分类的可行性。
1 研究区概况
以东滩煤矿3304工作面为研究区。东滩煤矿位于山东省济宁市境内(图1),跨兖州、邹城、曲阜三市(县),地理位置为116°50′49″~116°56′56″E,35°24′11″~35°31′25″N,南北向长约14 km,东西向长约10 km,属于高潜水位矿区。地处鲁中低山丘陵到平原洼地的过渡地带,为第四系山前倾斜冲积-洪积平原,整体地势由东北向西南逐渐降低,坡度极为平缓,地面标高42.46~54.48 m,潜水埋深为2 m左右。历年平均降水量为715.54 mm,年平均气温14.4℃。矿区内主要河流有白马河与泥河,向南流入南阳湖,均为季节性河流。
其中3304工作面位于三采区南部3号煤层,工作面走向长1 064~1 161 m,倾向宽约为260 m,地面标高为50.16~51.28 m,平均高度为50.72 m,开采标高为-519.1~-476.5 m,平均高度为-497.8 m。
2 数据资料与研究方法
2.1 高潜水位沉陷湿地概况
东滩煤矿作为东部典型的煤-粮复合产区,积水严重影响了作物的生长环境。自开采起3304工作面地表变化显著,植被演替明显(图2)。煤炭的开采使地表产生积水,沉陷区内出现挺水植物。随着开采的进行,水位逐渐上升,浮水植物、沉水植物逐渐丰富。丰富的水资源、动植物使得高潜水位采煤沉陷地具备了湿地生态系统的基本特征。自2014年开采至今工作面沉陷已经稳定,沉陷区内形成永久性积水湿地,平均水深3.2 m,水生植被类型丰富。考虑到湿地附近人类活动、水位和面积、地理位置等要素情况,研究区不适宜规划发展为湿地公园、水产养殖、污水处理[22-23]等,应优先复垦为耕地。
图2 高潜水位湿地演变和植被演替Fig.2 Wetland evolution in high phreatic sites and vegetation succession
图3 湿地植被情况Fig.3 Wetland vegetation
2.2 沉陷湿地植被分类体系
结合研究区无人机影像和实地采样结果构建植被分类体系(图3)。采样表明,研究区内水生植被类型丰富,随着水深的增加,形成了不同的植被群落。主要包含挺水植物如芦苇、莎草、荷花、红蓼、香蒲、苔藓等;沉水植物如菹草等;陆生植被包含杂草、玉米。考虑到研究区内玉米覆盖面积较小并且存在大量死亡,杂草分布不均、受长势不一的影响难以分辨,因此不作为本文的研究对象。水体污染物质虽然属于非植被,但由于面积较大,因此也纳入分类体系中。
2.3 数据获取与处理
航飞试验于2017年8月12日11:00—12:00在沉陷区上方开展,试验过程中天气晴朗,无风,视野良好。试验采用matric 100型四旋翼无人机搭载瑞士parrot sequoia型多光谱相机(以下简称sequoia)和X3型数码相机。sequoia相机包含绿(Green)、红(Red)、红边(Red-edge)、近红外(NIR)4个波段。试验飞行高度为110 m,设定航速9 m/s,传感器镜头视场角15,镜头垂直向下。航飞面积1.1 km2,获得了覆盖整个研究区的多光谱影像(分辨率12.8 cm)和全色数码图像(分辨率5 cm)。内业数据处理利用8个像控点进行影像校正,选择pix4dmapper软件对航拍图像进行拼接和空三加密,形成点云数据(图1)。
本研究利用南方银河一号RTK在实地获取采样点322个。由于沉陷区内常年积水无法进入,故在积水边缘0~0.5 m深处选择采样点,水体、水体污染物质、荷花的采样选择在水中乘船采样。
2.4 研究方法
以无人机多光谱影像为基础,采用面向对象分类的方法对采煤沉陷湿地植被进行提取。在筛选最优分割尺度的基础上确定分类特征,构建分类决策树并对研究区植被进行分类,结合野外实测数据进行精度验证。技术流程如图4所示。
图5 监督分类分类图和采样点在监督分类下的分类结果Fig.5 Classification results of supervised classification and sampling points under supervised classification
图4 研究技术路线图Fig.4 Research technology roadmap
3 沉陷区湿地植被监督分类
监督分类(Supervised classification)又称训练分类法。它通过人工目视解译确认不同类别的样本,对样本进行训练得到判别函数,最后用训练好的判别函数对其余像元进行对比,按照不同的规则将其归化到最相似的样本中。其中,最大似然分类也称为贝叶斯(Bayes)分类,是基于图像统计的监督分类法,被认为是应用最广、分类精度最高的分类方法[24]。
以研究区无人机影像为基础,根据湿地植被分类体系,对各地物进行采样,保证每种地物样本的数量在80左右。选取的样本通过Jeffries-matusita距离和转换分离度衡量样本的可分离性[25]。当可分离性值大于1.9时,表示分离性较好;可分离性值小于1.8时,需要重新分类;可分离性值小于1时,考虑将两类样本合为一类。确定训练样本后,对图像进行分类。分类后,合并、剔除图像中的小斑块,得到最终分类结果及野外采样点在监督分类下的分类结果(图5)。
4 沉陷区湿地植被面向对象分类
4.1 无人机影像分割尺度确定
在进行面向对象的分类方法过程中,对影像数据的良好分割是获得高精度分类结果的前提[26],分类对象的分割尺度和整体异质性因子的确定是获得较好分割结果的关键。考虑到研究区面积较小,因此可以尽可能降低不同类别的“错分”现象,减小影像分割尺度。本研究将分割过程分为2部分:①分割尺度对于分割效果有较为显著的影响,因此首先在保持其他参数不变的情况下,比较不同分割尺度下的分割结果,筛选最优分割尺度。②在选择最优分割尺度的前提下,先后改变形状因子、紧凑度因子的权重,对比得到分割结果(图6),选择最优参数。
图6 不同分割尺度的结果对比Fig.6 Comparison of results of different segmentation scales
对比图6a、6b、6c可知,当分割尺度为10时(图6a),同种植被被分割为多个小块,影像分割较为破碎。在保持其他参数条件不变的情况下,增大分割尺度至30、60。当分割尺度为60时(图6c),水域和水体污染物被分割为同一区域,不能很好地与地物边界吻合,而当分割尺度为30时(图6b),分割尺度较好,因此确定30为最优分割尺度。分割尺度确定后,首先在保持紧凑度因子不变的前提下改变形状因子。由于研究区内植被在空间分布分散不规整,同时形状因子的权重太高会导致光谱均质性的损失[27],因此可以将形状因子权重的初值设置为
0.1(图6b)。保证其他参数不变的条件下,依次增大形状因子权重至0.3(图6d)、0.7(图6f),此时分割得到的影像对象不能与地物边界吻合,对比形状因子权重为0.1时的分割影像,水体和苔藓有明显的混淆,因此确定形状因子权重为0.1。保持分割尺度和形状因子权重不变的前提下,依次改变紧凑度因子的权重至0.3(图6g)、0.5(图6b)、0.7(图6h)、0.9(图6i)。分析发现,随着紧凑度因子的权重逐渐降低,得到的植被对象逐渐接近于植被的实际轮廓。通过综合分析分割尺度、形状因子和紧凑度因子的影响,最终确定分割参数为30、0.1、0.3,得到分割图像 (图6g)。虽然此时某些地物仍存在过分割现象,但考虑到研究区面积较小,在一定程度上过分割的影响在可接受范围内[28]。因此,以此参数对影像分割并进行后续研究。
4.2 湿地植被分类规则建立
结合分割后影像中不同地物在光谱、形状、纹理表现出的差异,建立分类规则。在无人机影像中均匀选取30个区域对不同的地物进行采样,统计典型地物(不考虑水体污染物质和杂草)像元在sequoia相机获取的4个波段中的统计值(DN值),包含最大值、最小值和平均值,统计结果见表1。考虑到植被的长势差异,以像元平均值作为分析各地物在不同波段下总体差异的指标,绘制光谱特征曲线 (图7)。
表1 典型地物光谱特征Tab.1 Statistics of spectral characteristics of typical ground objects
图7 典型地物光谱曲线Fig.7 Spectral curves of typical terrain
结合表1和图7可以发现:①在典型非植被地物中,水体在近红波段与其他地物没有重叠现象,像元值显著低于其他地物;而裸地在绿光波段和红光波段与其他地物存在明显区别。②植被在红光波段上数值范围存在重叠,在40~60之间,仅利用红光波段不易将它们区分,而在红边波段和近红外波段(以红蓼为例)各自存在不同的差异,因此综合红边、近红外波段易将其区分。③芦苇、荷花、菹草、香蒲在绿光波段像元值突出,因此引入绿光波段会提高分类精度。④莎草在各波段下与其他地物的差异均不明显,综合4个波段会得到更好的效果。植被指数作为光谱数据的线性和非线性组合,可以有效地减小其他因素影响,从而增强感兴趣地物信息[29]。结合sequoia多光谱传感器的多通道优势和现有研究成果,针对上述分析过程,确定了7个应用广泛的植被指数 (表2)。
然而,根据上述光谱分析可知,芦苇、香蒲、菹草、莎草、苔藓光谱值在近红外、红边波段有不同程度的重叠,同时考虑到植被因长势不同所产生的光谱差异带来的误差,在此情况下仅依靠不同的植被指数组合很难加以区分。因此在考虑地物光谱特征的基础上,结合纹理特征进行综合分析能够提高分类精度。灰度共生矩阵(Gray level co-occurence matrix,GLCM)作为当前公认的纹理分析方法,能够有效地反映图像灰度的综合信息[30]。结合现有研究和研究区自身特征,选择均值(Mean)、方差(Variance)、协同性(Homogeneity)、对比度(Contrast)、相异性(Dissimilarity) 、熵(Entropy)6类特征。针对于无人机多光谱影像的4个波段,考虑到工作量和植被在近红波段强反射率的特性,对无人机影像近红波段中上述地物分别选取20个训练区,进行纹理特征分析(表3)。
表2 选用的植被指数公式Tab.2 Selected vegetation index formula
注:ρR、ρG、ρNIR、ρRed-edge分别为红光、绿光、近红外、红边波段反射率。
表3 不同地物的纹理分析Tab.3 Texture analysis of different features
由表3可知: ①裸地纹理结构单一,排列规则,对比度最小,数值范围在0.16~0.44之间;菹草面积较小,呈小片分布,纹理沟纹深,对比度较大,数值范围在6.44~11.2之间。②芦苇分布较为分散,纹理不均匀,熵明显高于其他地类。③苔藓长势均一,灰度变化小,方差变动范围最小,为0.24~0.91。④香蒲因水势差异导致长势变化较大,协同性较差,数值范围在0.16~0.40。综合上述分析,可以在植被指数的基础上利用纹理参数的阈值范围加以区分。
4.3 湿地植被分类结果
对分割后的无人机影像结合不同地物表现出的光谱、纹理、形状差异,建立分类规则。在第1层,由于水体在近红波段(NIR)与其他地物的差异最大,因此NIR波段是提取水体的最佳参数。通过选取训练样本发现,当NIR在[0.05,0.15]时水体可以被有效提取。在第2层,归一化植被指数(NDVI)是目前体现植被覆盖度高度的最佳参数[31],选取样本结果表明当NDVI大于等于0.6时植被会被有效提取。第3层中,对于非植被来说,以红光波段、绿光波段构建的归一化差异绿度植被指数(NDGI)加以长宽比的限制可以很好地区分裸地与水体污染物质;考虑到植被在光谱、纹理上表现出的差异,根据上述分析运用多种植被指数及其组合、纹理特征限制进行区分。荷花形状近似于圆形,在植被指数的基础上利用形状指数加以区分。确定不同特征的阈值,根据分类规则(图8)得到分类结果以及验证样点的分类分布图(图9)。
图8 分类决策树Fig.8 Classification decision tree
图9 面向对象分类图和采样点在面向对象分类下的分类结果Fig.9 Classification results of object-oriented classification and sampling points under object-oriented classification
4.4 精度分析
验证样本来源于研究区野外实地采样点,采样过程中利用南方银河一号RTK进行采样,考虑到积水较深等环境因素,因此在研究区周围选择采样点共322个。以采样点所代表的真实地物为基础,对采样点在两种分类方式下的分类结果(图5、9)采用混淆矩阵(Confusion matrix)进行分类精度评价。监督分类的总体分类精度较低,总体精度为44.3%,Kappa系数为0.4。面向对象的总体分类精度较高,总体精度为84.2%,Kappa系数为0.8。精度具体结果如表4所示。
对比图5和图9可以发现,监督分类结果中存在大量错分现象。相比之下,面向对象分类结果具有更优的效果。在面向对象分类的结果中,水体污染物错分现象降低,芦苇、苔藓、香蒲、菹草混淆现象减轻,小斑块数量降低,地物边界平滑。从监督分类结果中发现,由于水体、红蓼、裸地、荷花、水体污染物质的光谱差异较大,因此分类精度能够达到70%以上;但对于其他植被来说,仅依靠光谱信息很难对不同植被信息进行有效提取,分类精度普遍在20%左右。而面向对象分类充分利用了图像的光谱、纹理、形状等特征,获得了较优的效果,除香蒲外,各类地物分类精度都在80%以上。通过对比总体精度与Kappa系数可以发现,面向对象分类的方式更加适用于研究区湿地植被提取。
表4 植被分类精度Tab.4 Vegetation classification accuracy
注:括号中的数字为正确分类的样点数量。
5 结论
(1)利用无人机获取东滩煤矿3304工作面的多光谱影像,针对无人机影像高分辨率的特点,充分利用了影像的光谱、纹理、形状信息,对高潜水位采煤沉陷湿地的植被进行面向对象分类。研究结果表明:利用无人机影像进行植被分类是可行的,基于面向对象的分类能够有效地提取湿地植被,提取精度可以达到84.2%,Kappa系数达到0.8。研究中以无人机影像为数据源能够有效地解决卫星周期长、分辨率低、尺度大等问题。相比于监督分类的总体精度44.3%,基于面向对象的分类精度提高了约40个百分点, Kappa系数提高了0.4。面向对象分类充分发挥了无人机影像高分辨率的优势,综合了不同地物的光谱、纹理、形状特征构建决策树,提高了分类精度。相比于单一波段,利用植被指数能够更好地突出光谱信息,增强不同植被间的光谱差异性。同时,近红、红边波段是植被光谱信息的有效标志,借助于多光谱传感器的优势,以近红、红边波段构建植被指数提取植被信息,相比于可见光植被指数,能够在一定程度上提高分类精度。
(2)结合研究区的自身特征,研究中对影像采用了同一分割尺度,但是考虑到不同研究区的面积、地形地貌、植被空间分布的差异,本文的分割尺度不能完全适用于其他采煤沉陷研究区。根据矿区监测站资料统计,研究区平均水深达到3 m,在实际工作中难以保证采样点在研究区内均匀分布,限于样点的特殊情况,本文的分类精度仍有一定的提高空间。本研究通过改进不同的分割参数确定最优分割尺度,虽然获得了相对较好的分割尺度,但是浪费了大量的时间。同时,对于敏感波段的植被指数选择上考虑还不够充分,进而对分类精度造成一定影响。此外,考虑到高潜水位采煤沉陷湿地生态系统的复杂性和植被演替迅速的特点,研究中实际采样的植被种类数目不能够完全包含湿地中实际的植被种类,这也是当前采煤沉陷湿地研究中的主要问题。