基于多源遥感数据的赣南稀土矿植被覆盖动态监测
2023-02-18李媛
李媛
(东华理工大学 地球科学学院,江西南昌, 330013)
稀土是世界上的稀缺资源,在航天、军工等高科技领域有着重要的作用[1]。赣州市拥有丰富的离子型稀土矿,具有宝贵的开采价值,带动当地经济快速发展,但也严重的破坏了生态环境[2]。植被恢复是矿山生态修复的关键阶段,植被覆盖度是植被长势和质量的综合体现,是评价矿区复垦效果的重要指标[3]。
传统的植被覆盖变化调查大多依靠野外实地调查,监测范围小且成本高。而遥感技术可快速动态的获取地面信息且监测范围广,已成为植被覆盖变化动态监测的重要手段[4]。在多云多雨、地形复杂的中国南方地区,仅依赖Landsat TM/ETM+、MODIS等中等空间分辨率遥感数据的光谱特征难以保证分类精度[5],通过结合雷达和光学数据可有效提高地物类型的识别精度。Wang等[6]融合合成孔径雷达数据和Sentinel-2数据来监测美国俄克拉荷马州本地牧场的生产力,与中等空间分辨率的数据源相比,本研究使用的数据具有更高的分辨率,提高了估算的精度。Scarpa等[7]首先通过数据融合和深度学习来估计在多云条件下缺失的光学特征,再用卷积神经网络估算布基纳法索农业地区SAR雷达数据和光学数据融合后的NDVI值,和单一数据源相比,光学和雷达时间序列数据的联合处理提高了结果的精度。在监测和评估矿山恢复治理效果时,早期有研究人员利用遥感影像开发对地形、土壤、气候和水敏感的多种植被指数,作为调查植被覆盖度的重要手段[8]。植被覆盖度(FVC)可评估区域的植被状况和土地退化情况,是一个非常重要的地表植被参数[9]。近年来,机器学习算法广泛应用于许多领域,如土地利用分类和植被生物量计算等[10],其中随机森林算法运算速度快、分类精度高,显示出巨大的应用潜力[11]。Schultz等[12]基于Landsat时间序列数据,使用Breaks for Additive Season and Trend(BFAST)监测器和随机森林算法来识别卡万戈-赞比西跨边界保护区从封闭树冠森林到开放草原的6个土地覆盖类别的退化情况,及时准确地获取稀土矿区复垦后的植被覆盖情况,对于实现稀土矿区绿色可持续发展十分重要。
上述研究表明,使用雷达、光谱和纹理特征的融合影像可提高稀土矿区植被信息的提取精度[13]。因此,本研究以赣州市南部6个县市为例,结合sentinel-1和sentinel-2遥感影像,基于像元二分模型和随机森林算法,构建适合于南方丘陵地区稀土矿植被信息的提取模型,并且监测2016—2020年赣州市稀土矿区的植被变化情况,该研究可以为监测稀土矿区治理效果和政府进行生态环境管理决策提供科学依据。
1 材料与方法
1.1 研究区概况
稀土矿广泛分布在赣州市的安远县、全南县、寻乌县、定南县、信丰县和赣县。因此,本文以这6个县作为研究区域。研究区域属于亚热带季风气候,光照充足,雨水充沛,无霜期长,年平均降水量1 318 mm,年均气温为19.8℃,地理位置如图1。地形复杂,主要以山地和丘陵为主。研究区拥有丰富的离子型稀土矿,被誉为“稀土王国”,从上世纪八十年代开始进行稀土开采,经历了池浸、堆浸和原地浸出等开采方式,造成了植被破坏、土壤污染和水土流失,加剧了地下水的污染和滑坡的风险。近年来,很多稀土矿陆续开展了治理工作,并取得了一定的成效,地表植被逐渐增多,生态功能逐渐恢复。
图1 研究区概况
1.2 遥感数据来源及预处理
本研究采用2016—2020年共5年的基于Sentinel-1干涉宽幅模式(IW)的地距(Ground Range Detected,GRD)极化雷达影像数据,因赣州市常年多雨,影像采集时间集中在10—12月,该数据拥有VH、VV 2种极化方式,数据质量较高。利用官方预处理软件SNAP对选用的Sentinel-1影像数据进行预处理,并裁剪出研究区[14]。
Sentinel-2包括Sentinel-2A/2B两颗卫星,携带一致的MSI传感器,收集13个波段的数据,其中4个是红边波段,2个是短波红外波段,广泛应用于陆地植被、土壤、水体等的监测[15]。本研究采用与Sentinel-1同一时间段匹配的Sentinel-2数据,对其进行大气校正、辐射定标和重采样,裁剪出研究区[16]。
1.3 稀土矿区影像特征
研究区域目前主要用堆浸法和原地浸矿法进行稀土开采,这会形成不规则的裸露开采区,其在Google高分影像中呈土黄色,可能会伴有蓝色的沉淀池和长方形建筑物。本研究根据野外的调研结果,以及在Google Earth目视解释的稀土矿区分布范围,勾绘稀土矿区边界。
1.4 像元二分模型
NDVI(Normalized Difference Vegetation Index)是定量评价植被覆盖度最常用的指标之一,可用来监测植被生长状态。用像元二分模型将像元信息分为裸土或纯植被,计算植被覆盖度[17]。其公式为:
式中,NDVIsoil为完全裸土或无植被覆盖区域的NDVI值;NDVIveg则代表完全被植被所覆盖的像元NDVI值,即纯植被像元的NDVI值[18]。针对赣南稀土矿区植被恢复现状和植被覆盖度的特征,结合野外考察和建立的植被覆盖度等级(表1),本研究将FVC共划分4级:裸地(0≤FVC<0.25)、低植被覆盖(0.25≤FVC<0.5)、中等植被覆盖(0.5≤FVC<0.75)和高植被覆盖(0.75≤FVC<1)。
表1 赣南稀土矿区不同植被恢复程度的土地类型划分
1.5 随机森林分类模型
1.5.1 随机森林算法 机器学习分类法指通过计算机从大量的数据中学习其内在的规律性信息,获得经验知识,在复杂的数据中分离出图像的主要特征,机器学习分类法适用于多种传感器获取的图像,并且具有较高的精度[19]。随机森林是一个监督分类器,使用一组分类和回归树,利用随机选择的训练样本和变量的子集进行预测,随机森林分类器使用随机选择的特征来生长一棵树,通过从森林中所有的树状预测器中选取最受欢迎的投票类别来对像素进行分类[20]。与其他机器学习方法(如人工神经网络等)相比,运行随机森林需要指定的参数较少,同时,随机森林已被越来越多的用于遥感领域的图像分类,且具有较高的效率和准确率[21]。
1.5.2 特征变量提取 为了提高分类的精度,提取雷达影像中的极化特征,以及光学影像中的光谱特征和纹理特征,进行波段融合[22]。为充分利用Sentinel-2特有的红边波段,通过Band maths波段计算获取Sentinel-2的红边指数和植被指数[23](表2)。
表2 特征变量说明
1.5.3 建立植被覆盖度分类的解译标志 赣州市属于南方红壤丘陵区,根据《南方红壤丘陵山区水土流失综合治理技术标准》(SL757—2014)[24]、实地调研情况和Google Earth高分影像,通过历史影像对比和直观解读来确立不同植被覆盖度的解译标志,并以此作为稀土矿植被覆盖度分类的标准。
1.5.4 精度评价指标 研究利用融合后的影像,采用像元二分模型和随机森林算法,提取稀土矿植被覆盖的分类结果,并对结果做聚类处理去除零碎斑块,使用混淆矩阵计算总体精度和Kappa系数对分类结果进行精度评价[25]。总体精度公式如下:
式中,PC为总分类精度;m为分类类别数;N为样本总数。Pkk为第k类的判对样本数。
Kappa系数公式如下:
式中,K为Kappa系数;N为总样本数;Ppi为某一类所在列总数;Pli为某一类所在行总数。
2 结果与分析
2.1 稀土矿区植被覆盖度提取结果
基于像元二分模型和随机森林算法得到的植被覆盖度分类结果如图2、图3所示。由此可以看出,分类后稀土矿区裸地类型的空间分布基本一致,整个赣南6县稀土矿区主要以低植被覆盖和中等植被覆盖为主,植被覆盖程度较低的地区主要集中在寻乌县和龙南县。从各个县的情况来看,赣县的稀土矿区数量较少,空间分布较为分散,自矿区复垦以来,赣县稀土矿区的植被逐渐恢复,几乎所有稀土矿区都已复绿。信丰县和安远县的稀土矿区相对赣县来说,数量较多,空间分布相对集中,从政府积极推广矿山治理以来,大部分稀土矿区的植被恢复情况良好,植被覆盖率增加,但仍有大面积的裸地,容易引起水土流失和山体滑坡等自然灾害,需要尽快治理。定南县和龙南县稀土矿的数量很多,空间分布集中且开采面积较小,在2002年以后,改进采矿方式,基本采用原地浸矿工艺,这种工艺对地表植被的破坏较小。定南县自2009年大规模开展稀土矿区综合治理以来,矿区植被大面积恢复。寻乌县稀土矿开采面积较大且分布集中,自稀土矿停止开采以来,寻乌县积极对矿区进行综合治理与生态修复,取得了显著的成效,柯树塘矿、双茶亭矿以及周围的矿区基本实现全面复绿,恢复了生态功能。老鸦桥和石角里等稀土矿区没有采用生态恢复措施,而是将土地平整后建设为工业园区等建设用地。总体来说,矿区复垦和稀土矿开采工艺的改进使矿区的植被恢复效果较好。
2.2 植被覆盖度分类方法的比较分析
在图像上随机选取400个样点,结合调查数据和Google Earth高分辨率数据,确认样点的属性,将其分别与本文提出的像元二分模型和随机森林算法提取的植被信息相比较,生成2020年稀土矿区植被覆盖度分类精度评价混淆矩阵,来反映2种模型的优劣。像元二分模型的总体精度为81.37%,Kappa系数为0.78,随机森林算法的总体精度为89.86%,Kappa系数为0.83,随机森林算法在稀土矿区植被覆盖度分类结果的精度明显优于像元二分模型。2种方法在高植被覆盖区域的提取效果差异较小,而随机森林算法在裸地、低植被覆盖区域和中等植被覆盖区域上分类精度较高。
对比图2和图3笔者发现,与像元二分模型相比,随机森林算法得到的分类结果能更详细反映稀土矿区的植被信息,各种地物之间的界限也更加清晰,分类结果更为细致明显。根据分类结果,结合同时期的Google高分影像对比发现,裸地主要集中在稀土矿点开发区域,呈连片分布,稀土矿开采造成的尾砂分布范围和水土流失区域在分类结果上得到了很好体现,表明稀土矿开采引起的裸露地表和尾砂区域是矿区植被覆盖度很低的主要原因。低植被覆盖区域主要集中在稀土矿区内的耕地及果园,自稀土矿停止开采以来,赣州市政府做了大量的矿山治理工作,在矿区内种植脐橙、百香果、油茶等经济作物。中等植被覆盖区域和高植被覆盖区域,主要由大量林地、灌木组成,这些区域进行矿区复垦工作较早,植被恢复效果很好。
图2 像元二分模型分类结果图
图3 随机森林算法分类结果图
2.3 不同提取方法的差异分析
像元二分模型和随机森林算法在提取稀土矿区植被覆盖分类的适用性上存在一定的差异。像元二分模型把1个像元只划分为2种地物,即植被和裸地,通过对端元的光谱测定,计算其丰度。但是,实际情况是1个像元可能包括多种地物,因此该方法不适用于复杂的植被覆盖度分类,只能满足简单的土地覆盖情况[26]。而基于多种特征的随机森林算法可以综合利用影像的光谱、纹理和雷达特征,雷达波段可以穿透冠层获取植被信息,且对地表的起伏变化很敏感,主要通过微波在植物表面以及内部的反射和散射来获取植物信息,因此可以很好的识别出植被[27]。而sentinel-2新增的3个红边波段能够较准确地反映出不同植被覆盖类别的光谱特征差异,纹理特征的加入可以有效地改善分类效果,因此,多源数据融合与随机森林算法相结合可以提高稀土矿区植被覆盖度分类的精度。但是,Sentinel高分辨率影像数据仍然存在“混合像元”的问题,在不同地物类型的交界处,混合地物类型划分不准确。在使用随机森林算法时,稀土矿区植被覆盖分类评价体系繁多、指标多样,具体如何划分稀土矿区的植被恢复程度还没有统一的标准。在研究过程中,由于一定的因素限制,没有更加细致全面考虑影响植被覆盖度的多种因素,从而导致2种方法下的分类结果存在差异。
2.4 植被覆盖度时空变化
赣南矿区属于典型的亚热带季风湿润气候,植被类型丰富,降水充沛,植物生长周期快。因此,构建中高分辨率的遥感数据时间序列,对于提高监测效率具有重要意义。由于哨兵数据系列在2015年才开始使用,笔者选取了2016—2020年的Sentinel-1和Sentinel-2数据,通过随机森林算法提取稀土矿区的植被覆盖信息,在统一的尺度上研究了近5年来稀土矿区植被覆盖情况的时空演变规律,分析了不同时期的植被覆盖变化,结果见表3和图4。
表3和图4显示,在2016—2020年期间,裸地面积在不断的减少,共减少了1 467 hm2,总体比例下降了24.23%。总的来说,植被覆盖面积是在不断增加的,在2020年低植被覆盖区域面积为2 026hm2,在研究区中所占的比例最大,达到33.48%。高植被覆盖区域先逐渐增加,在2017年面积达到最高,为734 hm2,后有所下降,至2020年,高植被覆盖区域面积为520 hm2,在稀土矿区中所占的比例为8.60%。在2013年之后,赣州市政府建立了规范有序的稀土资源开采技术和流程,限制了开采范围和规模,为遏制生态环境的恶化,政府投入大量资本进行矿山土地复垦,并对稀土矿进行针对性的治理,大部分稀土矿的整体恢复情况良好,稀土矿区的裸地面积在明显减少,植被面积在不断地增加。由于大多数的稀土矿停止开采,为了解决失业问题,政府大力推广当地居民在废弃的稀土矿区种植脐橙、油茶和百香果等经济作物,缓解当地的经济压力。由于矿区生态环境恶劣,治理过程缓慢,需要较长时间才能恢复,尚未恢复到开采前的水平,目前主要以低植被覆盖为主。
图4 赣南稀土矿不同时期植被覆盖面积变化
表3 赣南稀土矿不同时期植被覆盖面积统计
对不同时期各县稀土矿区植被覆盖面积的统计结果表明(图5),2016—2020年,赣南6县稀土矿的植被恢复面积呈逐渐增加的态势,共增加了4 254 hm2。从各个县情况来看,裸地面积都呈下降趋势,其中赣县裸地减少的比例最大,为47.86%;龙南县裸地减少的比例最小,为8.21%。从植被恢复情况来看,安远县、寻乌县和赣县的植被增加的比例较多,恢复效果较好。赣县是赣州市最早开始稀土矿治理工作的县区,当地政府首先对稀土开采后留下的裸露地表进行土地平整,再种植可富集稀土元素的宽叶雀稗、铁芒萁等植物进行土壤改良,改善稀土矿区及周边的生态环境。因此,稀土矿区的植被恢复效果很好。而龙南县的植被恢复效果较差,原因是龙南县有许多稀土矿仍在开采,虽然已经采用原地浸矿工艺,对地表植被的破坏较少,但还是会破坏土壤的酸碱平衡,使植被难以恢复,并且人工治理的面积不大,主要靠自然恢复。总体来看,赣南6县各县区的植被恢复情况整体效果较好。
3 讨论与结论
本研究以赣南6县的稀土矿区为例,研究稀土矿区植被覆盖度的提取方法以及监测矿区的植被恢复效果,得到如下结论:
(1)与以往的稀土矿区植被覆盖信息提取的研究来比,本研究选用的数据源具有更高的分辨率,稀土矿区植被覆盖度的分类结果显示,像元二分模型和随机森林算法提取的植被覆盖区域在空间分布上大致相同,说明利用像元二分模型对稀土矿区的植被恢复度分类信息提取具有一定的可行性,但是随机森林算法具有更高的精度,能够更加细致的反映稀土矿区植被覆盖的实际情况。
(2)在随机森林算法中加入雷达特征、光谱特征和纹理特征后可以提高稀土矿区植被覆盖度分类结果的精度,能够有效地区分和统计不同植被恢复程度的稀土矿。此外,随机森林算法可以从图像中学习其他特征,并评估选定的特征参数在植被覆盖度分类中的重要性,与像元二分模型相比,随机森林算法的结果更加准确。整体而言,这一研究结果和方法有利于对离子型稀土矿区植被恢复程度进行定量监测与分析。
(3)赣南6县的稀土矿开采规模较大,并且多以堆浸法为主要的开采工艺,该工艺对地表植被的破坏很大,在国家管控稀土矿无序开采之后,各个县区稀土矿的植被恢复效果整体较好,植被覆盖率较高。并且近年来赣州市政府积极实施绿色生态修复工程,稀土矿区的植被恢复速度大大加快,原先裸露的地表大部分都已经转化为植被覆盖区,有的区域甚至恢复到稀土矿未开采前的植被覆盖状态。总体来说,赣南6县的稀土矿区治理效果较好。