基于支持向量回归的隧道地下水环境负效应等级评价研究
2021-09-26鲍学英
张 薇,鲍学英
(兰州交通大学土木工程学院,兰州 730070)
我国铁路建设过程中,普遍采用隧道来缩短线路里程,隧道开挖与土石方开挖等工程建设结构类型相比,对环境的负面影响较小。但在隧道施工过程中,对周边环境仍存在一定程度的扰动。隧道开挖势必会破坏原有的地下水循环系统,使围岩空隙中的地下水、地表水、暗河等水体因压力作用进入隧道,主要表现为:隧道突涌水、地下水位下降、地表水枯竭、地面沉降等。其中,隧道突涌水产生的环境负效应尤为突出[1-2]。目前,已有不少学者对隧道施工引起的地下水环境负效应进行研究[3-5]。付宏渊等[3]结合隧道工程特点,从地质、水文、洞体特征及施工因素4个方面,构建了隧道施工对路域水环境影响指标体系。刘建[4]遵循PSR模式和全过程管理思想,从自然地理、地质水文、隧道工程等3个方面构建了地下水环境负效应指标体系。李苍松等[5]对钻爆法和TBM施工工艺对环境的影响及隧道施工废水处理技术现状进行分析,提出了川藏铁路隧道施工地下水环境保护建议。上述研究在构建指标体系方面起到了重要作用,推动了地下水环境负效应评价的发展。但在现阶段,为能更加科学合理的解决此类问题,上述研究存在一定的局限性。付宏渊等[3]在指标体系选取时,重点围绕隧道工程特点和施工对隧址区地质水文的影响,但实际施工中隧道也会对周边环境产生不可逆的破坏,因此,还应注重隧道工程与周边环境的交互作用。刘建[4]运用模糊数学方法对地下水环境负效应进行评价研究。模糊数学方法一般以指标的上下限为界限值代入隶属函数,得到指标的隶属度,但这样会将超出界限的指标值,仍归类于现有隶属函数中,无法准确评价超出界限值的指标。李苍松等[5]重点提出了隧道施工工法及施工废水两方面对地下水环境的影响,隧道作为铁路建设中的大型结构工程,在实际施工过程中对地下水的影响涉及更广也更加复杂。除此之外,依然缺少关于隧道地下水环境负效应等级评价的研究。
隧道开挖是一个动态的过程,不同岩层不同埋深的施工受到诸多外部因素的影响,因此,隧道地下水环境负效应等级评价体现出非线性、随机性等复杂特点。基于此,采用一种机器回归分析方法—支持向量回归(Support Vector Regression, SVR),对地下水环境负效应等级进行评价。支持向量回归在处理小样本、非线性、高维数问题时具有很大的优势,能够更好地评价地下水环境负效应等级,为隧道地下水环境负效应等级评价提供一种新的选择。
1 评价指标体系的构建与等级分级标准
1.1 评价指标体系的构建
文献[2]指出隧道涌水发生的条件为丰富的水源补给、快速汇集地下水的流动途径及足够大的含水构造。根据文献[1-2]及TB/10049—2014《铁路工程水文地质勘察规范》中的内容,列出造成隧道涌水的各项影响因子,将各指标因子通过德尔菲法进行筛选,并经过不断优化最终形成以隧道地下水“补给-径流-隧道受体”3个子系统为框架的隧道地下水环境负效应指标体系,各指标以Ui(i=1,2,3,…,19)表示,如图1所示。
图1 隧道地下水环境负效应评价指标体系
(1)地下水补给
地下水水源补给主要来自大气降水、地表水、河流及水库等水体,因此选用多年平均降雨量、多年平均蒸发量等7个具体指标因子反映水源补给造成的地下水环境负效应。多年平均降雨量反映当地降雨对地下水补给强弱,降雨量越大对地下水的补给越强;多年蒸发量表示大气降水、地下水等因蒸发作用回到大气中,不参与地下水循环作用,可能会使地下水位降低,地下水补给量减少,蒸发量越大环境负效应越小;降雨入渗系数一定程度上反映了降水转化为地下水的能力,具体表示为大气降水渗入地下的过程中实际对地下水起到补给作用的补给量与降水量比值;汇水面积指补给隧道形成涌水受地下水影响的面积,汇水面积指标值越大,可能积聚的降水就越多,水体进入隧道的可能性也越大;河流规模、湖泊(水体)规模反映隧址区影响范围内原本的地下水活跃程度。隧道发生涌水时涌水量大小受地形地貌条件影响较大,可能引起的环境负效应也随之改变。
(2)地下水径流
地下水径流指重力作用下地下水在隧道水循环过程中的流动。褶皱、破碎带发育程度直接影响地下水的流通。褶皱发育核部裂隙较多,破碎发育地带岩体松散、稳定性差,地下水容易进入隧道。隧道穿越富水性岩层或裂隙较大的岩性地层时,地下水导水条件良好,发生涌水时涌水量通常较大。可溶岩发育地区生态环境脆弱,大气降水贮存在裂隙中,通过裂隙水流通,可溶岩出露面积越大地下水越丰富,在该地区建设隧道产生的环境负效应更加突出。
(3)隧道工程
隧道工程因素主要指隧道施工过程对地下水环境的影响和对围岩的扰动程度。隧道长度、埋深和防堵水技术主要影响地下水环境,长度越长或埋深越大的隧道跨越地形、地质复杂,含水层多,对地下水环境的负效应影响越大。隧道开挖的不同工法、开挖断面面积对围岩的扰动和破坏较大时会加剧地质灾害发生,引起的负效应影响也随之增大。
1.2 等级划分标准
参照国内外现有关于地下水环境负效应等级划分的标准[4],将评价等级分别划分Ⅰ(弱)、Ⅱ(较弱)、Ⅲ(中等)、Ⅳ(较强)、Ⅴ(强)5个等级(在SVR模型中为方便运算以数字1~5量化代表各负效应等级),各指标负效应等级划分标准如表1所示。评价结果等级负效应形式如表2所示。
表1 隧道地下水环境负效应评价指标体系等级划分标准
表2 评价结果等级负效应形式
2 支持向量回归
支持向量回归(Support Vector Regression, SVR)是一种基于统计学习理论提出的机器学习方法,是在支持向量机(Support Vector Machine, SVM)的基础上发展起来的回归问题。回归函数为训练样本通过机器学习将学习机训练为回归机,使回归机与函数逼近,进行样本点的回归拟合。支持向量回归原理如图2所示。
图2 回归机原理
给定一个训练样本,表示为
D={(x1,y1),(x2,y2),…,(xm,ym)},yi∈R,希望得到一个回归模型,使得预测值f(x)与真实值y尽可能接近。一般的线性回归模型表示为
f(x)=ωTx+b
(1)
式中,ω为输入向量的法向量;b为偏差量。
为使预测值f(x)与真实值y之间损失最小甚至为0,f(x)与y应尽可能接近。但在实际预测情况中,由于外界条件变化,真实值与预测值之间不可能完全相同,势必存在一定误差。假设f(x)与y之间存在误差ε,即当f(x)与y之间差别的绝对值大于ε时才计算损失。当预测值和真实值之间的误差在ε以内时视作预测正确,损失为0。与此同时,距离误差范围最近的训练样本输入向量构成“支持向量”。预测结果仅与支持向量有关。因此,SVR问题可转化为
(2)
(3)
式中,xi为第i个输入向量;yi为真实值;f(xi) 为模型预测值;C为正则化常数;lε为不敏感损失函数。正则化常数C起到平衡的作用,对损失进行惩罚。若C=0,那么式(2)中后项为0,损失即为0;若C→∞,lε不为0,后项值趋近于无穷,会出现过拟合的现象。
(4)
(5)
(6)
根据KKT条件可得
(7)
根据以上优化过程可得到最优解,最终线性可分的SVR回归函数为
(8)
对于线性不可分训练样本,需用SVR模型将线性不可分问题从低维空间通过映射函数φ(x)映射到高维特征空间,将向量内积φ(x)·φ(x)用核函数K(xi,xj)替换,一般的核函数[11]有:①多项式核函数;②双曲正切Sigmoid函数;③高斯径向基函数;④指数径向基函数;⑤张量积核函数;⑥傅里叶级数核函数。与其他函数相比,高斯径向基函数具有效率高、难度小、易实现和预测精度高等优点,因此,常用高斯径向基函数(RBF)为核函数。
(9)
由此得到SVR的非线性回归函数为
(10)
3 实例验证
渝怀铁路歌乐山隧道位于重庆市沙坪坝区,全长4 050 m,隧道对应里程为DK1+560~DK5+610。隧道设计最大埋深280 m,最大洞高7.25 m,最大涌水量53 000 m3/d。当地属亚热带季风湿润气候区,多年平均降雨量1 082 mm。隧道施工对地下水影响较大,自开工以来,发生多次探孔出水,引发水位下降、井泉枯竭等现象,严重影响了当地居民的居住环境。根据歌乐山隧道施工参数,现场情况调查得出各评价指标实测值,如表3所示(为方便计算,各定性指标根据负效应等级由弱至强取Ⅰ级9分、Ⅱ级7分、Ⅲ级5分、Ⅳ级3分、Ⅴ级1分量化处理)。
表3 歌乐山隧道地下水环境负效应指标实测值
各输入向量由于其量纲不同,数据之间存在较大差异,因此,在训练学习样本之前,先将各指标值映射到[0,1]区间,使其具有相同量纲,提高训练精度。
在对隧道地下水环境负效应等级进行评价时,根据文献[12-13]选取红桥关隧道、弓杠岭隧道、黄胜关隧道等25组已知负效应等级的岩溶隧道作为样本值。其中,1~20组作为学习样本训练回归机,21~25组作为测试样本,得到的训练样本值如表4所示。
表4 训练集样本值
借助Matlab工具箱Libsvm,选用RBF为核函数,利用交叉验证法选择最佳参数C=16,gamma=0.062 5,输入向量为各指标值,输出向量为已知各隧道负效应等级。将第1~20组学习样本进行回归拟合,得到一个拟合函数模型f(x)。为验证模型准确性,利用模型f(x)对第21~25组测试样本的负效应等级进行预测,得到训练样本的拟合效果如图3所示。预测结果与实际结果的相对误差如表5所示。
表5 训练样本相对误差
图3 训练样本拟合效果
支持向量回归中均方误差MSE值和相关系数R值[14]分别表示模型的拟合能力和预测能力,MSE值越小,表示该模型拟合能力越强,R值越趋近1,表示该模型预测能力越强。学习样本和训练样本MSE、R值如表6所示。
表6 样本MSE值及R值
最后,在训练好的SVR模型中输入无量纲化后的歌乐山隧道各指标实测值,运行得到输出值为4.179,由表2可得,预测负效应等级为Ⅳ级。根据对歌乐山隧道的现场调查,该隧道开工以来发生多次大的隧道探孔出水,隧道排水严重破坏了原有地下水循环系统,导致地表水流量变小,水位下降,当地居民用水受到影响。调查显示隧道施工已对地下水环境造成了明显的负效应影响,这与支持向量回归评价负效应等级基本一致。
为保证模型评价结果的准确性,选取文献[15-16]中的叙岭关隧道和雪山梁隧道,将文献中给出的实测值量化后应用训练好的模型预测其等级,运行得到输出值3.355、2.296,即负效应等级分别为Ⅲ级、Ⅱ级。文献[15-16]中均采用模糊数学方法得到叙岭关隧道地下水环境负效应等级为Ⅲ级中等,雪梁山隧道负效应等级为Ⅱ级较弱。SVR模型预测结果与已知负效应等级一致。
4 结论
(1)基于隧道地下水“补给—径流—隧道受体”3个子系统,以隧道施工参数、当地水文地质条件为基础,构建隧道地下水环境负效应评价指标体系并划分各指标等级标准。
(2)针对地下水环境负效应等级评价,提出应用SVR模型,输入学习样本将学习机训练为回归机,然后输入测试样本用于测试回归机精度,最后对歌乐山隧道、叙岭关隧道、雪山梁隧道地下水环境负效应等级进行评价,模型输出值为4.179、3.355、2.296,评价等级分别为Ⅳ级、Ⅲ级、Ⅱ级,地下水环境负效应较强、中等、较弱。
(3)SVR模型采用最小化结构风险原则,是机器学习中较常用的一种方法。相比传统评价模型,不需指标权重赋权的过程,减少了模型评价时的主观性和数据间客观联系的影响。但SVR模型的参数选择、核函数选择等均会影响模型拟合度,因此,在实际应用时如何提高模型准确度仍是今后研究的重点。