APP下载

基于LR模型的管线地质灾害易发性评价

2022-06-03赵喻文中国石油西南油气田公司生产运行处四川成都610051

化工管理 2022年11期
关键词:易发降雨量斜坡

赵喻文(中国石油西南油气田公司生产运行处,四川 成都 610051)

0 引言

在西南地区,地质灾害一直是影响山区油气管道安全运营的最大问题。截至2017年,中石油西南地区在役油气管道里程已长达1.33万千米[1]。山区长输管道通常穿越山地、丘陵、河沟谷等多种复杂地貌单元,沿线地质形貌复杂,地质灾害难以避免,轻则造成管道埋深不足或局部出露,重则造成管道长距离悬空、变形、扭曲、断裂等,经济损失不可估量[2]。地质灾害易发性评价是预防及缓解各类地质灾害的有效手段之一,更是危险性评价乃至风险评价的基础。因此,开展油气管道沿线典型地质灾害的易发性评价,不仅为风险管理奠定基础,而且为其监测、防治提供理论依据。

美国于20世纪70年代开展长输油气管道的安全评价研究工作,并应用于工程实践。1985 年,美国Battle Columbus研究院首次引入了专家评分法,对油气管道地质灾害易发性进行了判断和评价。2006年,加拿大BGC 公司开发了管道地质灾害风险管理系统(GRM),首次采用半定量评价方法对滑坡、崩塌、水毁、地面塌陷等进行了风险评价与排序[3]。2009年,中国石油管道科技研究中心研发的管道地质灾害风险管理系统(PGR MS)采用了指标评分的半定量评价方法[4]。近些年,随着3S技术的快速发展,区域地质灾害易发性评价模型的评价精度大大提高,从过去直接地貌制图、基于专家经验的定性分析发展到统计模型和更高级的机器自主学习模型的定量分析[5-6]。其中统计模型在地质灾害易发性评价研究中运用最广[7-8],该方法是以地质环境条件为基础,通过对过去发生地质灾害的数据统计分析来建立评价模型,然后预测同类地区以及周边地区以后可能发生地质灾害的概率,然后得出易发程度分区。

本次研究以四川省东南部的20余条管线穿越区域为研究对象,以野外实际调查数据为基础,基于地质灾害的发生机理,收集了9个地质灾害易发性条件因子。所有因子相关性检验后采用广泛使用的机器学习方法:逻辑回归模型对研究区地质灾害的易发性进行建模计算,并评估了研究区的地质灾害易发性,以期为该区及周边地区油气管道建设的风险管理提供依据。

1 研究区概况

研究区位于四川盆地东南部,管线穿越处以丘陵、侵蚀构造低山地貌为主。区内属亚热带湿润季风气候,具有气候温和、降雨量丰富、冬暖夏热等特点,多年平均气温16.7~18.1 ℃。区域年平均降雨量约1 000 mm,降雨量多集中在5月—10月,约占全年雨量的79%。降雨多以暴雨形式发生,日最大降雨量257.9 mm,小时最大降雨量122.0 mm。管线经过地区新构造运动较强烈,地震烈度为Ⅵ~Ⅶ度。区内广泛出露侏罗系的砂岩、泥岩以三叠系的灰岩,第四系以粘土、粉土及砂卵石层为主。岩土体结构较为疏松,主要赋存第四系松散岩类孔隙潜水以及基岩裂隙水。研究区内人类工程经济活动复杂,主要有公路、房屋、基础设施建及矿区井田建设等。

2 材料与方法

2.1 数据来源和评价因子的选择和分级

2.1.1 数据来源

研究区管线穿越地区的基础数据来源于近4年的野外调查结果。以管线评估区段(0.2~2.0 km)的斜坡为评价单元,共统计地质灾害点94处(正样本数据),其中滑坡20处,崩塌13处,水毁61处。考虑到机器学习需要保持正负样本的平衡性,我们还选取了94处非地灾点作为负样本数据。

2.1.2 评价因子的选择和分级

根据文献查阅及现场调查数据的可用性,本文综合考虑了影响管线地质灾害形成的地形地貌、地层岩性、气象水文、人类工程活动以及已有灾害发育情况等因素,初步选择了如表1所示的9个评价因子构建数据库,并参照现有规范进行了分级[9]。

表1 管线地质灾害易发性条件因子选择及等级划分

2.2 评价因子筛选

选择合适的地灾易发性条件因子对地灾易发性建模至关重要,因为冗余信息可能在建模过程中产生噪声并降低模型的预测能力。因此,本文采用随机森林(RF)以及Pearson相关系数(PCC)方法来筛选地灾易发性条件因子。

2.3 逻辑回归模型

逻辑回归(LR)模型是一种二项分类变量的回归分析模型,因为它考虑简单的线性关系,计算速度快,模型具有显示性等特点,使其广泛应用于地质灾害的易发性评价中。该方法在评价过程中,选取自变量为条件因子(xi),以某类地质灾害发生与否为因变量(设置1为发生灾害,0为不发生灾害)。设置地质灾害的发生概率为P,Y=1-P为地质灾害不发生的概率。将P/Y取对数为ln(P/Y),则以P为因变量、条件因子集[x1,x2,…,xn]为自变量,建立逻辑回归方程:

式中:P为0到1之间的数字;β为回归常数;C1,C2,…,Cn为回归系数,X1,X2,…,Xn为影响灾害发生的自变量,于是可得逻辑回归方程:

2.4 模型训练和验证

本文基于Python3.9.5环境中的scikit-learn库,用于地质灾害易发性的逻辑回归建模。首先将研究区收集的样本数据集划分为训练和验证数据集,二者之比为7∶3。然后通过随机训练100次,得到地质灾害发生概率的最优LR预测模型。最后利用验证数据集和受试者工作特征(ROC)曲线下面积AUC对LR模型的预测性能进行评估。评价指标AUC通常用来衡量地灾易发性预测模型的评估性能,该值越大预测能力越好。

3 结果

3.1 条件因子检验结果

结果表明,9个地灾易发性条件因子的皮尔逊相关系数均小于0.5,因此9个条件因子之间没有多重共线性关系。图1显示了基于RF方法的各影响因素的相对权重,其中已有灾害发育(0.216)是影响火后泥石流预测的最重要因子,其次是斜坡坡度(0.208 7)、日降雨量(0.184 4)、斜坡高差(0.089 4)、斜坡坡形(0.068 5)、斜坡结构(0.054 5)、地层岩性(0.052 4)、人类工程活动(0.049 3)、地下水活动(0.038 1)。因此已有灾害发育,斜坡坡度,日降雨量,斜坡高差为影响管线地质灾害形成的控制性因子,而人类工程活动、地下水活动则影响较小。

图1 基于RF方法的地质灾害易发性条件因子的相对权重大小分析结果

3.2 易发性预测模型及评价结果

本文基于Python3.9.5环境中的scikit-learn库,用于地质灾害易发性的逻辑回归建模。通过随机训练100次,得到地质灾害发生概率的最优LR预测模型如式(4)所示。根据预测模型计算所得地质灾害发生概率值(P),使用自然断点法将概率P分为4个区间:0~0.185、0.185~0.475、0.475~0.825、0.825~1.000,分别对应4个易发性等级:极低易发、低易发、中等易发、高易发。其中极低易发区占比为39.39%,低易发区为17.42%,中易发区为12.12%,高易发区31.06%,且高易发性区域主要集中在川南地区的管线穿越区段。

式中:P为地灾发生概率;X1为已有灾害发育情况;X2为斜坡坡度;X3为日降雨量;X4为斜坡高差;X5为斜坡坡形;X6为斜坡结构;X7为地层岩性;X8为人类工程活动;X9为地下水活动。

式(4)中所有评价因子均已量化,量化标准参考表1,其中极低易发、低易发、中等易发、高易发分别量化为1、2、3、4。

3.3 预测模型验证结果

利用验证数据集和受试者工作特征(ROC)曲线对LR模型预测性能的验证结果如图2所示。结果表明,LR模型具有良好的预测能力,其AUC达94.9%。

图2 ROC曲线及LR模型预测准确率

4 结语

(1)基于RF算法的各条件因子的重要性分析结果表明,已有灾害发育情况、斜坡坡度、日降雨量、斜坡高差为影响管线地质灾害形成的控制性因子,而人类工程活动、地下水活动则影响较小。

(2)本研究提出的LR模型具有良好的预测能力,其AUC达94.9%。

(3)易发性评价结果表明,研究区极低、低、中及高易发性管线区段各自所占比例分别为39.39%、17.42%、12.12%和31.06%。其中,中、高易发区段主要集中于川南地区的管线穿越区段,评价结果与研究区实际情况相近,因此采用逻辑回归模型能够较为客观准确地评价四川省东南地区管线地质灾害易发性。

猜你喜欢

易发降雨量斜坡
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
来安县水旱灾害分析与防灾措施探讨
夏季羊易发疾病及防治方法
降雨量与面积的关系
冬季鸡肠炎易发 科学防治有方法
信仰的“斜坡”
梦是长长的斜坡(外一首)
无轨斜坡道在大红山铁矿中的应用
降雨量