基于深度学习的人工滑坡隐患自动识别新方法
2023-08-08隆星宇李辉白雪山翟星王贤敏潘怡
隆星宇 李辉 白雪山 翟星 王贤敏 潘怡
摘要:
针对植被茂密且地形陡峭地区的人工滑坡隐患识别难题,提出了耦合变化检测与深度学习的人工滑坡隐患自动识别思路,构建了由影像光谱、NDVI、土地利用、高程、坡度和地表覆被变化组成的隐患识别指标体系,建立深度学习卷积神经网络CNN算法,并在植被茂密、地形陡峭的河北省涉县、邢台县和宽城县等地区进行了应用验证,自动识别出2016~2020年间出现的人工滑坡隐患134处。目视验证和野外调查验证结果表明:该方法识别精度为91.9%,F1分数值为93.6%。此方法在广袤地区具有普适性,为滑坡隐患自动识别提供了新思路,为人类工程活动的合理规划提供了科学依据。
关 键 词:
人类工程活动; 滑坡隐患; 滑坡识别; 遥感影像; 数字高程模型; 卷积神经网络; 变化检测
中图法分类号: P237;P642.22
文献标志码: A
DOI:10.16232/j.cnki.1001-4179.2023.07.016
0 引 言
近年来,随着城市化进程加快,人工滑坡(人类工程活动诱发的滑坡)灾害隐患为城镇智慧化建设和社会经济可持续发展带来了巨大的风险和挑战,如特大型深圳光明滑坡导致73人死亡、4人失踪,直接经济损失8.81亿元[1]。诱发滑坡隐患的人类工程活动主要包括削坡建房和削坡修路,通过开挖山体,形成高陡人工边坡,破坏了坡体的稳定性,在降雨、融雪、地震、地下水等外力作用下,易发生滑坡。此外,斜坡上的工程建设增加了坡体的荷载,在建设过程中产生的弃渣,未经夯实、堆积过高、范围过大,亦可能导致滑坡灾害[2-3]。因此,亟需开展针对人工滑坡隐患的自动识别方法研究,及时采取有效防治措施,从源头上化解滑坡灾害风险,规避巨大损失,并且为合理指导人类工程活动和城市化发展提供科学依据。
目前滑坡隐患识别主要采用InSAR或LiDAR技术。钟储汉等[4]采用SBAS-InSAR方法提取黑方台地区地表形变速率,根据地表形变特征,识别滑坡隐患。戴可人等[5]利用时序InSAR技术,在雅砻江流域雅江县-木里县段的高山峡谷区域成功识别出8处隐患。Fobert等[6]借助InSAR调查多米尼加地区的边坡滑动前状况,发现坡度较缓的黏土质边坡比坡度较陡的在滑动前有更强的变形运动;同时,使用连续的高分辨率SAR数据识别和监测活动边坡,用于验证和更新当地的滑坡易发性图和滑坡编目,很好地协助了当地的防灾减灾工作。然而,在植被茂密、地形陡峭、地表变形剧烈的地区,InSAR技术会因失相干导致不能有效识别灾害隐患[7-8];而LiDAR技术价格昂贵,难以在大尺度区域广泛开展监测,且在植被茂密地区应用效果有限[9]。因此,亟需针对植被茂密、地形陡峭的广袤地区,提出适用的滑坡隐患自动识别方法,将灾害风险化解在萌芽状态。此外,针对人工滑坡隐患这类特殊的城镇灾害隐患的识别,目前研究较少。针对现有研究的局限性,本文采用高分二号影像和数字高程模型(DEM)数据,提出了耦合变化检测与深度学习的人工滑坡隐患自动识别新方法,应用于InSAR和LiDAR技术难以实施、植被茂密且地形陡峭的河北省三县,以分析这些隐患的分布特征、类型、规模与威胁对象,以及导致这些隐患的人类工程活动类型,以期为滑坡隐患自动识别与合理的人类工程活动规划提供新的思路。
1 研究区概况
研究区位置如图1所示。河北省涉县、邢台县和宽城满族自治县(以下简称“宽城县”)地质复杂、地形陡峭。涉县和邢台县位于太行山东麓,地势西北高、东南低,地形复杂,峰峦叠嶂;宽城县位于燕山山脉东段,全县平均海拔300~400 m。
研究区地层主要由太古界和第四系地层组成。太古界地层以麻粒岩、片麻岩、变粒岩、斜长角闪岩、磁铁石英岩、大理岩等为主,裂隙发育,易风化,强度低[10];第四系松散堆积地层土体抗剪性差,易发生剪切破坏,土层沿着某个面产生与剪切方向一致的滑动,从而引发滑坡灾害[11]。研究区地质构造复杂、断裂发育、新构造活动较活跃,为地质灾害的发生提供了条件。
研究区内矿产资源丰富,人类工程活动频繁。2016~2020年,开展了大量道路、铁路修建工程和城镇建设项目。在山区工程建设中,如果开挖不稳定斜坡,则坡脚会形成较大临空面而造成岩土体失稳,当达到临界点时就可能产生岩崩或者滑坡灾害。
研究区内人类活动导致灾害隐患发育,然而植被覆盖较茂盛,地形起伏较大,InSAR技术难以实施,人工滑坡隐患较难准确识别,制约了城镇快速发展。
2 数据源
本文采用高分遥感影像和DEM數据开展人工滑坡隐患自动识别,如表1所列。其中,多时相高分二号影像用于:① 开展2016~2020年地表覆被变化检测,反映人类工程活动特征;② 建立2016年与2020年归一化植被指数(Normalized Difference Vegetation Index,NDVI)和土地利用信息,反映孕灾和致灾特征。DEM数据用于提取高程和坡度等地形特征,反映孕灾环境特征。
变化检测技术路线如图2所示,通过构建变化检测特征集,建立CNN模型,提取地表覆被变化。
3 研究方法
3.1 人类工程活动区域确定
3.1.1 基于CNN的地表覆被变化自动检测
3.1.1.1 变化检测特征集建立
变化检测特征集包括影像光谱、NDVI和变化强度图特征。光谱信息反映了地物类型的变化,NDVI反映了植被覆盖的变化,变化强度图反映了空间邻域上地物的变化特征[12]。其中,变化强度图由改进的RCVA(Robust change vector analysis)算法[12]生成。该算法能够有效减少配准误差的影响,从而提高变化检测精度。
采用(2w+1)大小的移动窗口提取邻近像元的光谱变化特征,计算过程分两步。
(1) 获取变化后影像x2中每点与变化前影像x1对应点邻近像元内光谱差异值最小的点,计算差异影像d1;再通过变化前影像x1中每点与变化后影像x2对应点邻近像元内光谱差异值最小的点,计算差异影像d2,如式(1) ~(2) 所示。
d1j,k=min(p∈[j-w,j+w], q∈[k-w,k+w])ni=1[xi2j,k-xi1p,q]2(1)
d2j,k=min(p∈[j-w, j+w], q∈[k-w,k+w])ni=1[xi1j,k-xi2p,q]2(2)
式中:d1(j,k)和d2(j,k)分别为差异影像d2和d1中(j,k)处的像元值;xi1和xi2分别为第i个波段遥感影像变化前与变化后的像素值。
(2) 根據式(3) 计算考虑邻近像元信息的光谱变化强度图(D)。
D=d2j,k d1j,k≥d2j,kd1j,k d1j,k<d2j,k(3)
3.1.1.2 变化检测CNN模型构建
CNN是由Lecun等[13]提出,包括局部感受野、权值共享和池化3个主要结构,以提高神经网络的预测性能[13]。局部感受野(或稀疏连通性)是指卷积层的节点仅与前一层的部分节点相连,以学习局部特征,从而减少网络参数,提高学习效率[14]。权值共享意味着相同的参数可以用于多个函数,使参数数量减少,提高CNN的计算能力[15]。池化可以降低网络的输入维数和复杂性,不仅可以避免过拟合问题,还可以减少网络的计算,提高CNN网络的泛化能力和效率[16]。
本文建立的变化检测CNN模型包括两个卷积层、两个池化层和一个全连接层,模型结构如图2所示,输入是大小为m×n行11列的变化检测特征集,变化检测特征集包括11个特征,其中光谱特征8个,NDVI特征2个,变化强度特征1个。第一层卷积核大小为5×1,进行初步变化特征提取,第二层卷积核大小为5×1,用于提取更深层的变化特征;每一层卷积后通过一个3×1的池化层进行特征降维,减少参数量以减少模型过拟合,提高模型效率;每一层池化后面添加一层dropout,减少模型过拟合[17]。全连接层用于将卷积层学习到的变化特征映射到变化样本标记空间,通过一个带退出策略的softmax函数计算每个像素是变化区域的空间概率,进而得到1(变化)、0(未变化)的预测结果。此外,使用ReLU函数作为非线性激活函数,相比sigmoid、tanh等传统激活函数,它具有计算简单、有效缓解梯度消失和减少过拟合等优点[18],其函数表达式如式(4) 所示。
ReLUx=x x≥00 x<0(4)
根据变化强度图结合目视解译圈定研究区部分变化区域作为训练数据,构建变化检测数据集,选取其中70%作为训练集,30%用做测试,调整参数,获取最优检测模型。
3.1.2 人类工程活动区域识别
人类工程活动通常体现为地表覆被的变化,因此将变化检测结果与2020年土地利用分类结果进行耦合分析,将农业用地、林业用地、建筑用地、交通建设用地和水域及水利设施用地等地类中地表覆被变化的区域确定为人类工程活动区域。其中,土地利用分类采用多尺度分割算法[19]和CART决策树算法[20]实现。
3.2 隐患识别指标集建立
选择能够反映滑坡灾害隐患发育特征的指标,包括NDVI、变化检测、土地利用类型、高程、坡度等,构建隐患识别指标集。① NDVI指标:由于植被根系的固土作用和冠层遮挡降雨减少雨水入渗的作用,裸露坡体通常比有植被覆盖的坡体更易发生水土流失和滑坡灾害[21],NDVI能够反映地表植被覆盖信息及滑坡隐患活动导致的裸地面积扩大。② 变化检测指标:变化检测反映了人类工程活动区域和特征和滑坡隐患导致的地表覆被变化。③ 土地利用类型:土地利用类型反映了人类工程活动的类型,对河北省涉县、邢台县等多个县的野外实地调查表明,滑坡灾害通常发生在道路和建筑附近的裸露地区,而在耕地、林地和水系及水利建设等土地类型上鲜有发生。④ 地形指标:滑坡通常发生在山区,发生在一定高度且坡度大于10°的地区[22]。
综上,构建了包含2016年和2020年影像的单波段光谱特征(共8个波段)、2016年和2020年的NDVI、土地利用类型、高程、坡度和变化检测结果等14个隐患识别指标的识别特征集。
3.3 人工滑坡隐患自动识别
根据建立的植被覆盖、地表覆被变化、土地利用类型、地形等各类指标,同时综合遥感影像的光谱特征,建立包括14个指标的隐患识别综合指标集,构建CNN模型开展人工滑坡隐患自动识别,并采用数学形态学方法对识别结果进行优化。人工滑坡隐患识别的技术路线如图3所示。
建立的隐患识别CNN模型包括两个卷积层、两个池化层和一个全连接层。输入为大小m×n×14的识别指标集,输出为隐患(1)和非隐患(0)识别结果。算法思路与变化检测CNN模型类似。根据历史灾害和已知的潜在隐患构建数据集,选取其中70%用于训练模型,30%用于测试模型的性能和精度,调整参数,获取最优识别模型。
为了保障识别的隐患区域的连续性,同时消除一些无物理意义的破碎区域,采用二值形态学开运算[23]对隐患识别结果进行优化。
对识别结果进行腐蚀,如式(5) 所示,其中“-”为腐蚀运算符,表示图像A用卷积模板B进行腐蚀处理,计算覆盖区域的像素点最小值,并用最小值替代参考点的像素值。
3.4 精度评价指标
采用精确率(Precision,P)[24]、F1分数[25]作为评价指标定量评价隐患识别的精度。精确率P的计算公式如式(7) 所示,其中,TP为正确识别隐患区域的数量,FP为错误识别隐患区域的数量,FN为正确识别的非隐患区域数量,P表示在隐患识别结果中正确识别的比例,R为召回率,如式(8) 所示。F1分数值是用来衡量二分类模型精确度的一种指标,如式(9) 所示。
P=TP/TP+FP(7)
R=TP/TP+FN(8)
F1=2·P·RP+R(9)
4 识别结果
选取研究区中3个典型区域展示滑坡隐患识别指标值,如图4所示。由图4的NDVI数据、变化检测结果和土地利用类型数据可知,区域内的土地利用类型以林地和耕地为主,道路和建筑物多位于山谷处或开挖山体形成的坡脚位置,附近均为裸地区域。各区域均有明显的地表覆被变化,基本表现为山体开挖导致的农林业区域转变为裸地、道路或建筑区域,结合土地利用类型发现这些地区表现为明显的道路修建和房屋修建等人类工程活动。由图4的高程与坡度数据可知,各隐患区域均位于山区,高程均在300 m以上,大部分地区坡度在10°以上。
河北省涉县、邢台县和宽城县3个区域的隐患自动识别结果如图5所示,底图为2020年的高分二号影像。共正確识别出人工滑坡隐患134处。为更清楚地显示隐患识别结果,选取部分典型隐患区域叠加于3D谷歌影像上进行显示,如图6所示,图中编号与图5隐患编号相对应。图7为邢台县典型隐患的遥感影像和实地拍摄照片,明显看到有些隐患区域修建了护坡。通过目视验证和实地验证对隐患识别结果进行精度验证,得到识别精度为91.9%,F1分数值为93.6%。识别结果显示滑坡灾害隐患均由交通建设和城镇建设开挖山体导致,共同点在于均为工程建设活动开挖山体形成的高陡切坡,坡度均大于10°,坡脚存在较大临空面,易造成岩体失稳,形成危岩体,在其他外力(二次人类工程活动、持续性强降雨等)作用下可能产生滑坡(包括岩崩)灾害。隐患主要分布在省道和县道的山区路段两侧,部分位于山区乡道以及居民房屋建筑附近,威胁对象为道路、通行车辆和房屋建筑。
根据导致滑坡隐患的人类工程活动类型和护坡修建情况得到隐患识别统计结果(见图8),可见,97%(130个)的滑坡灾害隐患位于道路两侧,仅有3%(4个)位于城镇建筑附近,说明研究区导致滑坡隐患形成的人类工程活动大多为交通建设。对于未来的工程建设活动,应尽量避开山体开挖或合理进行山体开挖(开挖前进行地质稳定性评估),若进行山体开挖形成高陡切坡,需及时评估其危险性,并进行相关治理工作。如图8(b)所示,72%的隐患处未修建护坡,仅有28%的隐患处修建了护坡,说明尚未对研究区域内大部分切坡造成的隐患进行治理,存在发生灾害的风险。对于已进行治理的切坡,仍需定期对治理工程进行检查和加固。
5 讨 论
5.1 基于时序InSAR的地表形变监测
以宽城县为例,开展基于时序InSAR技术的地表形变监测。采用2018年6月3日至2020年7月31日32景Sentinel-1A升轨影像,基于SBAS-InSAR方法提取地表形变。由于滑坡通常发生于坡度大于10°的山区,因此对形变结果进行掩膜,仅保留坡度大于10°地区的形变,并与本文方法识别的滑坡隐患进行叠加(见图9),底图为宽城县的山体阴影图,图中白色区域表示InSAR技术失相干或者为平原地区。宽城县86.8%的区域出现失相干,不能提取到有效形变,且形变速率值较小,最大值为16 mm/a,形变存在不确定性。此外,62.5%的隐患均位于失相干地区。图9中存在地表形变的地区主要有3类:① 本文方法识别的滑坡灾害隐患区;② 不具有滑坡形貌特征,非滑坡隐患区;③ 与人类工程活动无关的地表形变区。因此,在植被茂密和地形陡峭的影响下,InSAR技术在研究区不能有效检测到滑坡隐患,具有明显局限性。
5.2 与其他机器学习算法比较
与2种经典机器学习算法随机森林(Random Forest,RF)和梯度提升树(Gradient Boosting Decision Tree,GBDT)比较隐患识别精度,展示本文方法的优势。采用准确率(Accuracy)、精确率(Precision,P)、F1分数(F1-Score)、Kappa系数、均方误差(RMSE)5个指标对模型的性能和精度进行评估,验证精度如图10所示,可见,本文提出的CNN算法的隐患识别精度明显优于RF和GBDT两种机器学习算法。
6 结 论
本文提出了耦合变化检测与深度学习的人工滑坡隐患自动识别新思路,在InSAR技术难以开展的植被茂密且地形陡峭的河北省涉县、邢台县和宽城县地区进行应用,取得了较好的识别效果,为滑坡隐患识别提供了新思路和新方法。研究主要得出以下结论。
(1) 变化检测技术能够提取人类工程活动导致的地表覆被变化地区,如削坡建房、削坡修路等人类工程活动变化区域,为人工滑坡隐患识别提供了有效靶区。
(2) 本文提出的耦合变化检测和CNN的隐患识别方法,建立在滑坡灾害隐患发生发育的孕灾环境和致灾因素上,综合了隐患的活动性(面积扩张)、对植被的破坏、地形的控制作用以及人类工程活动诱发影响,取得了较好的识别结果,可应用于其他滑坡灾害易发高发地区。
参考文献:
[1] 高杨.人工堆填体滑坡远程滑动机理研究[D].北京:中国地质大学(北京),2018.
[2] 汪潮,徐世光,李文尧,等.填土与切坡影响下滑坡的特征与防治[J].低温建筑技术,2016,38(2):149-152.
[3] 冯玉涛,牟海峰,周小平,等.堆积体陡斜坡路基滑坡机制及其处治对策[J].灾害学,2021,36(3):57-59.
[4] 钟储汉,王强,樊茜佑,等.InSAR技术在黑方台滑坡隐患早期识别中的应用[J].山西建筑,2021,47(16):164-165.
[5] 戴可人,铁永波,许强,等.高山峡谷区滑坡灾害隐患InSAR早期识别—以雅砻江中段为例[J].雷达学报,2020,9(3):554-568.
[6] FOBERT M,SINGHROY V,SPRAY J.InSAR monitoring of landslide activity in Dominica[J].Remote Sensing,2021,13(4):815.
[7] 劉国祥.InSAR应用实例及其局限性分析[J].四川测绘,2005(3):44-48.
[8] MORETTO S,BOZZANO F,MAZZANTI P.The role of satellite InSAR for landslide forecasting:limitations and openings[J].Remote Sensing,2021,13(18):3735.
[9] 刘世振,邓建华,冯国正,等.机载LiDAR在山区型河道地形测绘中的适用性研究[J].人民长江,2021,52(1):108-113.
[10] 罗靖筠,房浩,孙秀娟,等.河北省泥石流分布特征及防治对策[J].中国地质灾害与防治学报,2009,20(2):31-35.
[11] 王瑞丰,翟延亮,张宝君,等.基于GIS与AHP耦合技术的承德地区地质灾害危害性评价[J].现代地质,2021,160:1-12.
[12] 张鑫龙,陈秀万,李飞,等.高分辨率遥感影像的深度学习变化检测方法[J].测绘学报,2017,46(8):999-1008.
[13] LECUN Y,BOTTOU L,BENGIO Y.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[14] GOODFELLOW I,BENGIO Y,COURVILLE A.Deep learning[M].Cambridge:MIT Press,2016.
[15] LECUN Y,RANZATO M.Deep learning tutorial[C]∥IMLS.International Conference on Machine Learning(ICML′13),Atlanta:IMLS,2013.
[16] LIU R,MENG G,YANG B,et al.Dislocated time series convolutional neural architecture:an intelligent fault diagnosis approach for electric machine[J].IEEE Transactions on Industrial Informatics,2016,13(3):1310-1320.
[17] HINTON G E,SRIVASTAVA N,KRIZHEVSKY A,et al.Improving neural networks by preventing co-adaptation of feature detectors[J].Computer Science,2012,3(4):212-223.
[18] NAIR V,HINTON G E.Rectified linear units improve restricted Boltzmann machines[C]∥IMLS.Proceedings of the 2010 International Conference on Machine Learning,Madison:Omnipres,2010.
[19] TRIMBLE.eCognition developer 8.7:user guide[R].Munich:Trimble Germany GmbH,2011.
[20] BREIMAN L I,FRIEDMAN J H,OISHEN R A,et al.Classification and regression trees[J].Biometrics,1984,40(3):358.
[21] 刘辰光.基于植被护坡的河道浅层滑坡防护技术[J].水利科技与经济,2021,27(5):55-59.
[22] 廖代强,马力.重庆市山体滑坡发生条件初步分析[C]∥中国气象学会.新世纪气象科技创新与大气科学发展:中国气象学会2003年年会“城市气象与科技奥运”分会论文集,北京:气象出版社,2003.
[23] SERRA J.Image analysis and mathematical morpholog[M].London:Academic Press,1982.
[24] ZHU M.Recall,precision and average precision[D].Waterloo:University of Waterloo,2004.
[25] RIJSBERGEN C J V.Information retrieval[M].London:Butterworth,1979.
(编辑:高小雲)
Automatic identification of engineering landslide hazards based on deep learning
LONG Xingyu1,2,LI Hui1,BAI Xueshan1,ZHAI Xing1,WANG Xianmin2,PAN Yi3
(1.Hebei Key Laboratory of Geological Resources and Environment Monitoring and Protection,Hebei Survey Institute of Environmental Geology,Shijiazhuang 050000,China; 2.Institute of Geophysics and Geomatics,China University of Geosciences,Wuhan 430074,China; 3.Hebei Vocational College of Geology,Shijiazhuang 050000,China)
Abstract:
Aiming at the problem of engineering landslide hazard identification in dense vegetation and steep terrain areas,an automatic identification idea of engineering landslide hazard by coupling change detection and deep learning was proposed.The hazard identification index system composed of image spectrum,NDVI,land use,elevation,slope and surface coverage vegetation change was constructed,and a deep learning convolutional neural network CNN algorithm was established.The application verification was carried out in Shexian County,Xingtai County and Kuancheng County of Hebei Province with dense vegetation and steep terrain,and 134 hidden dangers of engineering landslide hazards from 2016 to 2020 were automatically identified.The results of visual verification and field investigation showed that the recognition accuracy of this method was 91.9%,and the F1 score was 93.6%.This method is universal in the vast area,which can provide a new idea for the automatic identification of landslide hazards and a scientific basis for the rational planning of human engineering activities.
Key words:
human engineering activity;landslide hazard;landslide hazard identification;remote sensing image;digital elevation model;convolutional neural network;change detection