基于GIS和K-means聚类方法的滑坡气象预警模型
2018-07-10金福喜袁权威秦帅帅
金福喜 袁权威 秦帅帅
(1.中南大学地球科学与信息物理学院,湖南长沙410083;2.有色金属成矿预测与地质环境监测教育部重点实验室,湖南长沙410083)
目前,地质灾害预测领域的基础理论主要包括:成因论、统计论和信息论[1]。国内外在滑坡灾害预警方面做了许多研究。吴益平等[2]基于有效降雨强度建立了滑坡灾害危险性预警模型;薛群威等[3]引入地质灾害潜势度,对突发地质灾害气象预警统计模型进行了改进;张桂荣等[4]建立了滑坡灾害时空分布与降雨过程的统计关系,开发出了降雨型滑坡预警预报系统;柯福阳等[5-6]基于机器学习中的算法,建立了区域地质灾害综合气象预警模型。现阶段中国区域地质灾害气象预警模型主要是基于统计方法建立的第一代隐式统计模型和第二代显式统计模型,两代预警模型并行验算,相互校验与补充[7]。近年来,第一代预警模型不断发展完善,建立了双参数的临界降雨判据,然而单一临界降雨判据不能反映不同滑坡对降雨敏感性的差异,预测准确度具有较大的局限性。
在分析滑坡影响因素时,一般从地形地貌、地质条件、水文气象和人类工程活动等几个方面来考虑[8-10],没有将滑坡的地理位置作为一个因素。基于牛顿范式的经典预测评价中,地理位置虽然不是直接导致滑坡的影响因素,但其隐含了丰富的地质信息,体现了滑坡的空间相似性,如距离相近的滑坡,其性质相近,容易受同一场降雨而共同失稳。因此,在进行气象预警区划时,需考虑到这一点。
本研究在收集湖南某县滑坡的类型、物质组成、分布、规模、诱发因素等要素的基础上,采用加权欧式距离的K-means算法,根据滑坡要素,将该县滑坡分类。采用GIS将滑坡分布与地质灾害危险性分区进行叠加,得到滑坡气象预警区划图。并对滑坡历史降雨数据进行统计分析,构建每类滑坡的降雨判据。
1 滑坡气象预警模型建立
1.1 加权欧式距离的K-means聚类算法
K-means聚类算法的目的是:假设有n个研究对象,将研究对象划分为k个聚类,同一聚类中的研究对象具有较高的相似度。具体算法如下:
Step1:随机选择k个聚类中心μ1,μ2,…,μk∈Rn;
Step2:计算每个研究对象所属的簇:
Step3:重新计算该簇的中心:
Step4:重复Step2和Step3直到收敛,聚类中心不再发生变化。
采用K-means算法时,度量对象的相似度常采用的方法有欧式距离、闵可夫斯基距离和曼哈顿距离,其中最常用的是欧式距离。假设研究区有N个研究对象,其特征由空间向量(xi,yi)和属性向量(ai,bi,ci)组成。则2个研究对象的欧式距离定义如下:
(1)普通距离
式(1)为K-means聚类算法中常用的相似距离定义,认为研究对象的所有属性重要性相同。
(2)加权距离
式(2)为在式(1)的基础上进行了改进,基于先验知识,对研究对象的属性进行赋予权重,认为研究对象的重要性不同。
式(2)相对于式(1)更符合实际情况。
物质组成、规模、成灾层位和诱发因素是滑坡的固有属性,是研究滑坡机理模型的基础。滑坡作为一个地理空间对象,聚类不仅应考虑属性特征的相似性,还要考虑空间邻近性[11]。地理位置隐含了丰富的地质信息,体现了滑坡的空间相似性。采用加权欧式距离的K-means算法,考虑滑坡的物质组成、斜坡结构、规模、成灾层位、诱发因素、地理位置,将性质相似、对降雨敏感性相同的滑坡划分为一类。
1.2 构建滑坡气象预警判据
采用GIS方法,将该县划分为多个气象预警区,并构建气象预警判据。前文将滑坡进行了分类,根据每类滑坡的分布和地质灾害危险性区划,采用GIS将2个图层进行叠加,得到最终的气象预警区划。采用统计分析的方法,研究滑坡与降雨关系,构建滑坡气象预警判据。
采用当日降雨量和前期有效降雨量构建降雨判据模型。当日降雨量为滑坡发生当天的降雨量,前期有效降雨量则是滑坡发生前n天的有效降雨量。一般认为滑坡的发生受一周的降雨影响,因此取n=6。前期有效降雨量的计算公式如下[7]:
式中,R为前期有效降雨量,mm;Ri为前i日降雨量;k为有效降雨系数,取0.84。
选取该县历史滑坡数据进行统计分析,将滑坡发生的当日降雨量和前期有效降雨量绘制在图中。根据滑坡发生的聚集程度,绘制临界降雨曲线,将滑坡发生可能性划分为大、中、小3个等级。
滑坡气象预警的目的是将滑坡所引发的风险降至最低,是一个风险评估的过程。因此,要结合该地区危险性区划,危险性大的地区预警等级相对于危险性小的地区要高。滑坡风险程度分级如下:
?
表1中,失稳可能性由滑坡气象预警判据判定;H为风险性高,M为风险性中等,L为风险性小。对于风险性高的地区发布红色预警,风险性中等的地区发布橙色预警。
使用滑坡气象预警判据,做出预警区滑坡可能性预测,结合该地区滑坡危险性等级,做出实时风险性评估,最终根据滑坡风险性等级,发布滑坡预警。与第一代预警模型比较,该方法预测准确度更高,预警更加合理。
2 研究实例
2.1 研究区概况
选取湖南某县作为研究对象。研究区位于湖南省西南部,南岭山系北西端和雪峰山脉的交接地带,全县以丘陵地貌为主,三面高山环抱。地层除缺失石炭系、二叠系、三叠系、侏罗系、白垩系外,其余均有出露;其中,以震旦系和泥盆系最发育。岩性主要为板岩、浅变质砂岩、含砾板岩、浅海相碎屑岩及碳酸盐岩。县境地处新华夏系第三隆起带的东缘及新华夏系雪峰断褶带的南端。在漫长的历史时期中,经历了多次周期性的强烈构造运动,形成了各种各样的构造组合形式。
该县地质灾害以滑坡、崩塌、泥石流为主,其中以滑坡灾害数量最多,分布最广,有23个乡镇发生过滑坡,以中部地区中山、低山地貌区发育最多;次为西部地区中山、低山地貌区发育中等,南东部丘陵地貌区和中北部中山、低山地貌区发育中等;县境南端滑坡灾害不发育。
该县滑坡具有典型的特征,多为降雨型浅层小型土质滑坡。研究区地处亚热带山地型季风湿润气候,该地区风化作用速度介于气候干燥的寒冷地区和气候炎热潮湿的热带地区。又因该县多山,地势高低起伏,多发生剥蚀作用,因此全县地表风化壳厚度较薄。根据野外调查,绝大多数滑坡灾害都是浅层小型的土质滑坡,且多受降雨触发失稳。
2.2 基于K-means算法的滑坡聚类研究
该县共有滑坡210处,对滑坡影响因素进行分析,选取物质组成、斜坡结构、规模、成灾层位、诱发因素、地理位置共6项指标作为聚类指标,其权重向量w=[0.2,0.1,0.2,0.1,0.2,0.2]。在将各指标输入到模型中进行计算前,需要先进行数据处理。由于物质组成、斜坡结构、成灾层位及诱发因素属于定性数据,需要转化为定量数据,其量化如表2所示:
?
定性数据进行量化后,需要进行无量纲化处理,公式如下:
式中,xˉ和S分别为均值和标准差。
处理后无量纲化数据见表3。
注:地理位置采用西安80坐标表示。
2.3 聚类结果分析
数据经处理后,采用加权欧式距离的K-means算法进行计算。根据滑坡要素,将该县210处滑坡,共分为3种类型,3类滑坡具有典型的分布特征,第一类滑坡分布于县境北部,第二类滑坡分布于县境中部,第三类滑坡分布于县境西南角,如图1所示。
2.4 构建滑坡气象预警判据
对研究区进行滑坡危险性区划,主要考虑以下因素:人口分布密度、人口经济活动、灾害点密度、人类工程活动、岩土体特征、地质构造、植被覆盖率、降雨量、地形坡度。采用信息量法,将研究区的评价指标进行量化,使用GIS空间分析功能,叠加单因素图层,得到滑坡危险性区划图。然后根据前文得到的滑坡空间分布图,使用GIS将2个图层进行叠加,得到滑坡气象预警区划图,如图2所示。
按研究区滑坡分类,将滑坡发生的当日降雨量和前期有效降雨量绘制在图3中。由图3可知,3类滑坡对应的降雨量聚集程度有明显差异。第一类滑坡受前期降雨影响显著,滑坡对应的前期有效降雨量绝大多数位于18~35 mm的区间,与此比较,滑坡对应的当日降雨量位于0~25 mm的区间;在前期降雨量维度上聚集更加密集,说明第一类滑坡受前期降雨影响显著。第二类滑坡临界降雨量比第一类滑坡的要高一些,滑坡对应的当日降雨量和前期有效降雨量均分布广泛,说明第二类滑坡受当日降雨和前期降雨共同影响。第三类滑坡的降雨临界值最高,在当日降雨量维度上聚集更加密集,说明第三类滑坡受当日降雨量影响显著,滑坡对应的前期有效降雨量临界值约为40 mm,而当日降雨量临界值仅18 mm,说明滑坡在遭受前期降雨后,遭受弱降雨即发生失稳。
根据滑坡的发生情况,绘制滑坡临界降雨量曲线图,如图4所示。对于第一类滑坡,在临界曲线A之下,发生失稳的可能性小,而在该曲线之上,则发生失稳的可能性大。对于第二类滑坡,在临界曲线A之下,发生失稳的可能性小,在临界曲线A和临界曲线B之间,发生失稳的可能性中等,在临界曲线B之上,发生失稳的可能性大。对于第三类滑坡,在临界曲线B之下,发生失稳的可能性小,在临界曲线B之上,发生失稳的可能性大。
根据地质灾害风险程度分级表和滑坡预警区划图(见表1和图2),对预警区做出滑坡风险性评估,并根据评估结果做出滑坡气象预警。例如,根据气象局降雨统计资料和气象预报,得到第一类滑坡分布区的前期降雨量和预测当日降雨量,将其绘制到滑坡临界降雨曲线图中,发现其位于临界曲线A之上,则第一类滑坡分布区中,地质灾害危险性大区和危险性中区的滑坡风险等级高,发布红色预警,地质灾害危险性小区的滑坡风险等级中等,发布橙色预警。
3 结论
针对滑坡气象预警问题,开展了K-means聚类算法和GIS在滑坡气象预警中的应用研究。为解决单一滑坡预警模型的局限性,采用基于加权欧式距离的K-means算法,将研究区滑坡分为3类,发现这3类滑坡受降雨影响具有显著差异:第一类滑坡主要受前期降雨影响,第二类滑坡受前期降雨和当日降雨的综合影响,而第三类滑坡主要受当日降雨影响。并且这3类滑坡的降雨临界值也不相同,第一类滑坡的降雨临界值最低,第二类滑坡的降雨临界值其次,第三类滑坡的降雨临界值最高。因此,相对于采用单一预警判据,对每类滑坡采用对应的临界降雨判据,能够提高预测精度。对于滑坡气象预警,提出根据滑坡的风险性发布相对应等级的预警更加合理,即发布气象预警需综合考虑滑坡发生的可能性和危险性。
[1] 吴树仁.突发地质灾害研究某些新进展[J].地质力学学报,2006(2):265-273.Wu Shuren.Some progress in the study of sudden geological hazards[J].Journal of Geomechanics,2006(2):265-273.
[2] 吴益平,张秋霞,唐辉明,等.基于有效降雨强度的滑坡灾害危险性预警[J].地球科学,2014(7):889-895.Wu Yiping,Zhang Qiuxia,Tang Huiming,et al.Landslide hazard warning based on effective rainfall intensity[J].Earth Science,2014(7):889-895.
[3] 薛群威,刘艳辉,唐 灿.突发地质灾害气象预警统计模型与应用[J].吉林大学学报:地球科学版,2013(5):1614-1622.Xue Qunwei,Liu Yanhui,Tang Can.Early warning statistical model of sudden geological hazards and its application[J].Journal of Jilin University:Earth Science Edition,2013(5):1614-1622.
[4] 张桂荣,殷坤龙,刘礼领,等.基于WEB的浙江省降雨型滑坡预警预报系统[J].地球科学,2005(2):250-254.Zhang Guirong,Yin Kunlong,Liu Liling,et al.Warning system for rain-induced landslides based on internet in Zejiang province,China[J].Earth Science,2005(2):250-254.
[5] 柯福阳,李亚云.基于BP神经网络的滑坡地质灾害预测方法[J].工程勘察,2014(8):55-60.Ke fuyang,Li Yayun.The forecasting method of landslides based on improved BP neural network[J].Geotechnical Investigation&Surveying,2014(8):55-60.
[6] 徐 晶,张国平,张芳华,等.基于Logistic回归的区域地质灾害综合气象预警模型[J].气象,2007(12):3-8.Xu Jing,Zhang Guoping,Zhang Fanghua,et al.Regional integrated meteorological forecasting and warning model for geological hazards based on logistic regression[J].Meteorological Monthly,2007(12):3-8.
[7] 刘艳辉,刘传正,温铭生,等.中国地质灾害气象预警模型研究[J].工程地质学报,2015(4):738-746.Liu Yanhui,Liu Chuanzheng,Wen Minsheng,et al.Study of early warning models for regional geo-hazards in china[J].Journal of Engineering Geology,2015(4):738-746.
[8] 周光红,裴勇军,吴彩燕.基于贡献率模型与GIS的滑坡地质灾害风险评价——以沐川县为例[J].金属矿山,2013(11):130-134.Zhou Guanghong,Pei Yongjun,Wu Caiyan.Regional lanslide risk assessment of Muchuan County as a case based on contributing weight model and GIS[J].Metal Mine,2013(11):130-134.
[9] 谢全敏,李晓辉,杨文东.滑坡灾害风险评估的FA-ECM法[J].金属矿山,2017(1):25-29.Xie Quanmin,Li Xiaohui,Yang Wendong.Factor analysis and efficacy coefficient method(FA-ECM)of landslide risk assessment[J].Metal Mine,2017(1):25-29.
[10]赵向辉,付忠良,谢会云,等.神经网络和集成学习在地质灾害危险度区划中的应用研究[J].四川大学学报:工程科学版,2010(S1):50-55.Zhao Xianghui,Fu Zhongliang,Xie Huiyun,et al.Application research of ensemble learning and neural network on geological hazard fatalness zoning[J].Journal of Sichuan University:Engineering Science Edition ,2010(S1):50-55.
[11]王海起,张 腾,彭佳琦,等.空间加权距离的GIS数据Fuzzy C-means聚类方法与应用分析[J].地球信息科学学报,2013(6):854-861.Wang Haiqi,Zhang Teng,Peng Jiaqi,et al.Fuzzy C-means clustering for GIS data based on spatial weighted distance[J].Journal of Geo-Information Science,2013(6):854-861.