基于无人机和机器学习的川西北修复沙地植被信息提取
2024-03-09徐渝杰舒向阳陶敏孙奕函刘唯佳董高成何沁李杰李一丁邓良基杨雨山
徐渝杰,舒向阳,*,陶敏,孙奕函,刘唯佳,4,董高成,何沁,李杰,李一丁,邓良基,杨雨山
(1.四川农业大学资源学院,成都 611130;2.四川师范大学西南土地资源评测与监测教育部重点实验室,成都 610068;3.四川师范大学地理与资源科学学院,成都 610068;4.成都市农林科学院,成都 611130;5.仁寿蜀锦置业有限公司,四川 眉山 620500)
草原是世界陆地生态系统的主要类型之一,其面积占陆地总面积的40%。草原生态系统是一个复杂的综合体,但非常脆弱。近年来草原生态系统已经开始退化,原因是人们对草原系统过度开垦。草原退化、沙化已经影响到了人类经济和社会发展[1]。鉴于草地生态系统的重要性[2-4],修复退化草地[5]已成为国家层面的关键任务。同时,建立有效的修复成效评价方法与技术对于未来的生态修复与管理工作至关重要[6]。基于RS技术的植被覆盖度遥感影像信息提取来监测区域植被变化情况是近几年一项普遍使用的技术,可以作为草地退化程度评价指标的有力技术手段[7]。
植物覆盖度是描述地表植被分布的重要指标,也是生态系统、水土流失和气候变化模型的重要参数,通常被定义为植被在单位面积内的垂直投影面积所占百分比,是描述植被生长变化及覆盖率的重要参数,也是区域生态环境变化的重要因子[8]。目前植被覆盖度的检测方法主要有地面实测方法和遥感反演方法。地面实测方法包括目估法、样方法和摄影法,这些方法精度高,但是很大程度上受到人力、物力的制约,难以获取区域尺度上的植被覆盖度,因此遥感监测逐渐成为监测覆盖度的重要手段。目前,植被指数方法[9-12]、混合像元分解法[13-15]、机器学习法[16-21]及利用深度学习网络[22-23]等方法均为植被覆盖度遥感估算的较为成熟的方法。其中,针对卫星的遥感测量中发生的“椒盐现象”,采用无人机遥感影像技术提取植被覆盖度[24-25]可以对其进行有效避免。但是卫星影像在时间分辨率上存在周期长,空间分辨率上的存在精度不够的限制,因此多用于中,小尺度的监测。而无人机巡航下生成的高分辨率影像则可以在监测方面填补大尺度下植被覆盖度检测的空白。
本文以四川省红原县沙化治理示范区为对象,利用无人机监测平台获取治理示范区高分辨遥感影像,使用基于U-Net网络的语义分割方法、最大似然法、最小距离法和马氏距离法4种机器学习方法提取植被信息,而后选择其中精度最高的方法,最终建立一套适合红原县沙化治理示范区的快速植被监测体系,用以辅助示范区管理者监控植被覆盖情况,更好地进行沙化治理。
1 研究区概况
1.1 研究区位置
研究区地处川西北高原阿坝藏族羌族自治州红原县瓦切乡,是四川省沙化治理典型示范区之一,地理坐标30°35′~34°19′N,东经100°30′~104°27′E(图1),地势由东南向西北倾斜,地貌为山原向丘状高原过渡的典型区,海拔3 600 m以上。该地气候为大陆性高原寒温带季风气候,春季,秋季短促、冬季较长,夏季极短。该地区年均降雨量791.95 mm,每年降雨主要集中在5—10月,年均气温较低,为1.1 ℃,最冷月平均气温为-10.3 ℃,最热月平均气温为10.9 ℃,最低极端气温为-36 ℃。日照充分,太阳辐射强,年均日照时间2 158.7 h。该地属于长江、黄河水系分水岭,西南向北注入黄河,是四川省三大江河岷江、大渡河及嘉陵江支流涪江、白龙江的发源地,经济以农业和畜牧业为主。20世纪90年代以来,该地区开展了大规模的生态修复工程[26]。
图1 红原县地理位置Figure 1 The position of Hongyuan county
1.2 数据来源
本研究采用的数据为998张4 864 × 3 648大小的无人机影像,是通过Smart 3D平台生产研究区的无人机正射影像,如图2。无人机飞行高度为100 m,所生产的无人机正射影像分辨率为2.67 cm/像素,该区域面积大小为0.59 km2。结合川西北高寒矢量数据对研究区植被覆盖度进行了监测,以及对分类结果进行精度对比。
图2 沙化治理示范区概况Figure 2 The desertification control demonstration area
1.3 研究方法
1.3.1 样本库构建
①样本标注。通过ArcGIS Pro对目标区域利用图像标注工具进行标注,分为灌木、草地、水体和沙地4类。
②制作数据集。本次实验是根据无人机所拍摄的65 154 × 33 270,每个像元为0.026 m × 0.026 m大小的无人机高分辨率遥感影像。将影像进行裁剪,在X、Y方向上步幅均设置为256,制作大小为512×512的样本切片共10 000张。
1.3.2 机器学习方法
(1) 最大似然法
最大似然法[27]预设每个遥感图像波段均为正态分布,每类地物数据在空间中构成特定的点群,每一类数据在自己的各个维度上的数轴上为正态分布,选取每一维度概率密度最大的值,作为划分标准进行分类。
(2) 马氏距离
马氏距离(Mahalanobis distance classification)[28]表示点与一个分布之间的距离,能够有效地计算2个未知样本集的相似度。马氏距离在欧氏距离的基础上考虑了对象属性的方差,将变量按照主成分变换得到相关性最小的多个维度,然后缩放特征值倍数进行标准化,最终马氏距离值最小时,归入该类别。
(3) 最小距离法
在有先验知识的前提下,利用训练样本数据求出未知类别至已知类别中心向量的距离D,通过计算每一类的均值向量,将均值向量为在该类特征空间中的中心距离,并统计输入图像中各种像元至各种中心之间的距离,如某像元至某一个中心的间距为最小,则可归入该范围内[29]。
(4) 基于U-Net神经网络的深度学习方法
U-Net网络[22]是全卷积神经网络结构的一种变形,是一种基于FCN框架的网络结构,其整体地分为编码和解码,编码部分为下采样,解码部分为上采样。U-Net网络基本可以对任意尺寸的图片进行卷积操作,特别是大尺寸图片。网络结构中舍弃了全连接层(fully connected layers),极大程度减少了需要训练的参数,使网络运行更加高效。同时,得益于U形结构的编码解码过程以及特征拼接操作,更好地利用了高分辨率图片中的语义信息。
1.4 实验过程
1.4.1 无人机影像处理
本研究利用大疆无人机获取四川省阿坝州红原县瓦切乡沙化治理示范区高分辨率影像,通过3DSmart软件对获取的所有单张小幅无人机图像进行去除噪声、裁剪图像,最后将小幅图像拼接成大幅完整的全景图。
1.4.2 样本勾画
用GIS软件对正射遥感图像进行目视解译,建立图层,分别勾绘出灌木、草地、水体和沙地分别赋值并命名。
1.4.3 样本可分离性分析
Jeffries-Matusita(Jefries-Matusita距离)[30]和Diver gence transformed divergence(转换分离度)[31]2个指标被应用来描述不同样本种类的可分割程度,这2个指标的取值范围是0~2.0。如果这2个指标的取值超过1.9,那么就说明样本的可分割程度较高,能够进行有效的监控和分类;反之,如果这两个指标的取值低于1.8,则需要重新选择样本。如果数值低于1,就必须考虑是否应该把2种类型的数据整合到同一类别中。
Jeffries-Matusita公式:
式子中,U为样本的均值向量,∑为协方差矩阵,i和j分别表示2个地物类型。
Diver gence transformed divergence公式:
式中:Dij为2个类别间的离散度;Ci和Cj为类别i和j的协方差矩阵;μi和μj为类别i和j的平均矢量。
由表1可知,我们选择红原地区灌木、草地、水体和沙地4类地物,所有地物类型的参数值均大于1.9,说明样本均满足划分标准,可用于实验。
表1 样本可分离性Table 1 ROI separability
1.4.4 样本训练
本研究采用正射全景影像,利用最大似然法、马氏距离法、最小距离法和深度学习(U-Net网络[31])4种机器学习算法进行灌木、水体、草本植物和裸露沙地信息进行提取,利用预测后的结果图像计算植被的覆盖度。结果验证则通过混淆矩阵上述4种机器学习算法的准确性进行评价,通过总体分类精度和kappa系数的高低,来选择最适宜该区域景观类型的分类算法。
利用最大似然法、最小距离法、马氏距离法3种算法,以及GIS软件中深度学习算法(U-net网络),分别得到4个植被信息提取结果。采用混淆矩阵,总体分类精度,kappa系数作为精度评价指标,其中混淆矩阵能够反映出真实值与预测值相互吻合的部分,也可以反映出与预测值不吻合的部分。总体分类精度的高低,可以判断模型预测的精确性,而kappa系数的高低可以衡量每个地物分类的正确性。
本研究利用ArcGIS Pro软件中的deep learning模块执行语义分割,该模块基于Tensor flow框架,实现了U-Net深度学习模型。
1.4.5 总体分类精度与kappa系数
混淆矩阵是分类精度评价中常用的评价指标如下表2。
表2 混淆矩阵Table 2 Confusion matrix
TP表示被预测预测值与真实值均为正确的个数,TP为预测值为错误且真实值为错误的个数,FP为真实值为错误,预测值为正确的情况,FN为真实值为正确,预测值为错误的情况的个数。
总体分类精度与kappa系数均是混淆矩阵中的评价指标。其中,总体分类精度等于被正确分类的像元总和除以总像元数,总体分类精度表示分类正确的样本占总样本的分类个数的比例,结合上述混淆矩阵。其公式如下:
kappa系数用于衡量分类精度,由前文中的混淆矩阵,得到真实值和预测值,将对角线上的真实值×预测值减去某一地物真实值×预测值,最后除以总像元数的平方减去某一类地物真实值×预测值之和。其公式如下:
总体分类精度与kappa系数两者的值越大,代表分类精度越高,分类效果越好。
2 结果与分析
2.1 深度学习结果精度
本文将影像按照512×512的大小,步幅为256进行裁剪,制作标签,最终得到10 000张影像和标签,作为数据集。将数据集按比例7∶2∶1分别划分为训练集,预测集,验证集。
由图3可知,随着训练程度的深入,损失值不断下降,大约在25 000个batches后,loss最后达到0.2左右,准确率达到0.87,模型具体参数如下表3。
表3 网络模型具体参数Table 3 The specific arguments of the network model
图3 训练和验证损失值Figure 3 Training and validationloss
2.2 影像分类结果
本试验选择了一个0.11 km2的沙地范围进行分类,其中包含了灌木、草地、沙地和水体4个类别。在使用3种机器学习方法以及深度学习方法之后,得到分类结果如下图4所示。
图4 训练区域分类结果对比Figure 4 The sample district and the comparison between the four methods
2.3 评判精度分析
由表4可知,其中采用U-net网络得到的深度学习的总体分类精度与kappa系数最高,最小距离法的总体分类指数与kappa系数最低,且这2个参数之间的差距均在20%以上,差异明显。其次马氏距离法与深度学习法接近,传统的机器学习方法也能符合植被信息提取标准。而深度学习方法的精度方面存在如此优越之处,在于能够从大量样本中学习各种特征,从不同的角度去对图像进行描述,结合了地物之间的关系。
表4 总体分类精度与kappa系数Table 4 Overall classification accuracy and kappa
通过对4种分类结果(图5)进行对比,我们可以发现样本中未对防护网进行分类,而3种机器学习方法最大似然法,马氏距离法,最小距离法将防护网分别分类成灌木、水体和草地,而U-net模型却没有将其提取出来。
图5 防护网识别与灌木阴影识别对比Figure 5 The comparison between the protective net identification and the identification of the bush shadow
2.4 面积统计
通过比较,我们采用精确度最高的深度学习方法进行植被信息提取。本研究采用无人机影像像元大小为0.026 m×0.026 m,通过像元个数乘以像元面积,最后再进行加和,即可得到每一类地物面积。
经统计,整个沙化治理示范区内,灌木有0.09 km2,草地有0.14 km2,沙地有0.32 km2,水体有0.04 km2,该区域植被覆盖度(草木+灌木)为39%(图6,表5)。
表5 沙化治理示范区地类统计Table 5 The classification statistic of the desertification control demonstration area
图6 沙化治理示范区分类Figure 6 The desertification control demonstration area classification
3 讨论与结论
从总体分类精度而言,4种方法的精度为:深度学习>马氏距离法>最大似然法>最小距离法,其中深度学习方法准确性高,且能对目标样本进行准确分类,其在识别过程中能从多个方面综合地物之间的关系。
深度学习方法能够区别植物冠层的阴影与水体,更进一步地加强了分类的准确性,为植被覆盖度计算提供了强有力的技术支持。本文通过对4种分类方法的精度进行比较和评价,筛选出深度学习U-net作为最优的分类方法,建立了一套可重复使用、精确的植被盖度测量方法,做到能够及时准确地掌握该区域植被覆盖情况,进行区域生态质量的监测和评估,利于维护红原县沙化治理示范区生态系统的持续稳定发展。
本文基于无人机遥感技术和机器学习技术,可以大大提高评估的效率和结果的准确性,研究成果还可以为未来该区域的治理投入提供数据支持,同时减少人力、物力和财力投入。此外,本研究成果可为未来该区域的治理投入提供数据支持,促进川西北沙化草地治理的可持续发展,亦可为其他地区的沙化治理提供参考和借鉴。