基于相关性准则和R-ELM模型的岩溶隧道涌水量预测研究
2019-09-10贺华刚
贺华刚
(重庆工商职业学院, 重庆 400052)
0 引言
随着我国交通基础建设的快速发展,隧道工程数量日益增加,受地质环境条件的影响,隧道施工过程中的工程问题日益突出,例如隧道涌水灾害。隧道涌水灾害不仅延误工期,还会带来严重的经济损失,尤其在岩溶地区,该类问题更加突出。因此,开展岩溶隧道涌水灾害研究具有重要意义。目前,国内许多研究者已开展了隧道涌水预测方面的研究。杨卓等[1]利用BP神经网络构建了岩溶隧道突涌水风险评估模型,可为支护方案的选择提供依据;王者鹏等[2]通过分析水文地质特征,构建了岩溶隧道的涌水预测模型,可合理判断施工过程中的涌水区段;张雄文[3]利用储量分类法分析了地下岩溶水的空间分布特征,并在此基础上进一步研究了降雨与地下水储量之间的对应关系。根据上述研究成果可知,岩溶区的隧道涌水灾害极易发生,但研究均未涉及隧道涌水影响因素的筛选。同时,根据黄雄军[4]、许增光等[5]的研究成果可知,隧道涌水受多种因素的共同作用,并不是单一因素的作用结果,且不同因素的影响程度具有一定差异,因此有必要进行筛选分析。本文以通海隧道为工程背景,在对隧道涌水影响因素进行分析的基础上,利用相关系数法和极限学习机构建了隧道涌水预测模型,旨在实现隧道涌水的高精度预测,以期为现场灾害防治提供参考。
1 预测模型的基本原理
隧道涌水预测模型主要包括: 涌水影响因素的筛选和预测模型的构建。在影响因素的筛选过程中,先结合文献[6-7]的研究成果,构建了隧道涌水影响因素体系; 以现场涌水统计结果为基础,利用相关系数法分析不同因素对隧道涌水的影响程度,进而筛选出重要影响因素。在预测模型的构建过程中,将已筛选出的重要影响因素作为输入信息,且为保证预测精度,先利用试算法和经验公式优化极限学习机的模型参数,再利用M估计优化误差序列,进而构建出隧道涌水的优化预测模型,以达到高精度预测的目的。
1.1 影响因素的筛选
在以往隧道涌水影响因素分析中,多从各方面构建隧道涌水影响因素体系,但并未进一步探讨各因素对隧道涌水的影响程度。为实现不同影响因素与隧道涌水灾害间的相关性筛选,本文以相关系数法为理论基础,通过相关系数评价各影响因素对隧道涌水的影响程度。相关系数法是一种统计理论方法,具有操作简单、可信度高等优点,适用于评价相关指标间的紧密程度。在该方法的应用过程中,若评价指标为xi和yi,i=1,2,…,n,则两者的相关系数
(1)
式中x′、y′为对应评价对象的平均值。
根据相关系数r的正负及其绝对值大小即可判断评价指标间的相关性程度。当r<0时,说明两评价指标呈负相关,两者的变化关系呈相反趋势;反之,两评价指标呈正相关,两者的变化关系具有一致性。另外,评价指标间的相关性程度可由r值的绝对值大小来评价,具体标准如表1所示。
表1 相关性程度划分标准
1.2 预测模型的构建
隧道涌水的影响因素较多,因此,隧道涌水预测具有较强的不确定性和复杂性。传统预测模型(如BP神经网络、RBF神经网络和SVM模型等)难以实现隧道涌水的准确预测,并且具有如下缺点:
1)BP神经网络的收敛速度较慢,造成训练时间较长,且易出现局部极值的问题;
2)RBF神经网络对大样本预测具有训练时间长及易出现局部极值的问题;
3)SVM模型对惩罚函数的要求较高,当该值选择不当时,易出现过拟合现象。
极限学习机是近些年新兴起的一种新型智能预测算法,具有学习速度快、泛化能力强等优点,可有效克服局部极值等问题。因此,本文将其作为隧道涌水预测模型的理论基础。极限学习机(extreme learning machine,ELM)是一种单层前馈神经网络,包含3层网络结构,若样本表示为(xi,ti,i=1,2,…,N),N为样本总数,则ELM模型的训练过程可表示为
(2)
式中:yj为预测值;L为隐层节点数;βi为隐层与输出层间的连接权值;g(x)为激励函数;wi为输入层与隐层间的连接权值;xj为输入值;bi为隐层神经元阈值。
通过ELM模型的不断训练,可实现误差的零逼近,即
(3)
进而可将ELM模型的训练过程表示为
(4)
将式(4)转变为矩阵形式,即为
T=Hβ。
(5)
式中:T为输出矩阵;H为隐层矩阵;β为权值矩阵。
值得指出的是,受各种误差因素的综合影响,任一模型均不可能完全刻画预测对象,即式(5)在应用过程中是不严格相等的,会存在一定误差。误差矩阵的表达形式为
V=T-Hβ。
(6)
式中V为误差矩阵。
1.3 ELM模型相关问题优化
根据相关系数法的影响因素筛选,可有效保证输入层信息的有效性。但通过ELM模型原理分析可知,ELM模型在应用过程中仍存在3个问题: 1)激励函数的选择问题; 2)隐层神经元的个数问题; 3)误差矩阵的弱化问题。
为取得隧道涌水的高精度预测,仍需进一步优化上述3个问题。结合相关文献[8-9]的研究成果,上述3个问题的优化方法如下。
1.3.1 激励函数的优化
ELM模型共有3种激励函数,分别为Hardlim型、Sine型和Sigmiod型。各类激励函数的适用性存在一定差异,难以直接判断其在工程应用中的有效性。因此,本文提出采用全试算的方法来确定最优激励函数,即对3种激励函数的预测效果进行试算,将预测效果最优者作为最优激励函数。
1.3.2 隐层节点数的优化
隐层节点数对ELM模型的预测精度具有较大影响,主要表现为: 节点数较少时难以保证预测精度,反之,又有可能出现过拟合现象。目前,并没有隐层节点数的直接确定方法,多是根据一定的经验公式综合确定。为解决隐层节点数的优化问题,本文先利用经验公式确定隐层节点数的经验值,再对其进行区间扩展,验算不同节点数的预测效果,进而确定出最优隐层节点数。根据文献[10]的研究成果,隐层节点数的经验公式可由式(7)进行求解,即
(7)
式中:m、n分别为输入层和输出层的节点数;a为调节常数,一般取10。
上述激励函数和隐层节点数的优化均属于ELM模型的参数优化。结合两者的优化方法及预测过程,将两者的优化顺序设计为: 先利用经验公式确定隐层节点数的经验值,然后以经验值作为初步隐层节点数,并对3类激励函数进行预测试算,以确定最优激励函数,最后再对最优隐层节点数进行筛选求解。为便于后期描述,将该阶段优化后的模型命名为参数优化ELM模型。
1.3.3 误差值的弱化
预测结果的误差值是不可避免的,但可对其进行一定程度的弱化,以提高预测精度。为实现该目的,本文利用M估计弱化误差值,其准则为
(8)
通过求导及最小二乘估计可实现式(8)的转换,即将误差值的弱化问题转变为权值矩阵β的求解问题,进而得到M估计条件下ELM模型的权值矩阵
β=(HTPH)-1HTPT。
(9)
式中P为权函数矩阵。
在式(9)的求解过程中,M估计是通过迭代计算实现的。其过程为: 根据误差值的大小,对不同观测值赋予不同的权重,再通过反复迭代计算弱化观测值的权重,进而达到弱化误差的目的。
M估计的优化过程主要是对预测误差进行弱化。因此,该优化过程是位于激励函数和隐层节点数优化之后,且为便于后期描述,将该阶段的优化模型命名为R-ELM优化模型。
2 工程实例分析
2.1 工程概况
通海隧道为玉蒙线的重点工程,起始里程DK27+060,出口里程DK37+362,长度为10.302 km,最大埋深约467 m,属于特长深埋铁路隧道。该隧道位于高原构造剥蚀溶蚀低中山地貌,多为北东向山脉,高程为1 560~2 203 m,高差一般为100~643 m,相对起伏较大;同时,斜坡地带植被以松林为主,局部为灌木,总体植被较为发育,而沟谷平缓地带则多为旱地,局部为水田。根据野外调查及钻孔勘探可知,隧址区地层岩性较为复杂,其中,第四系覆土以粉质黏土、块石土和泥炭质土为主,共分为8类土层,但各类土层对隧道涌水灾害的影响较小。
结合区域地质资料和钻孔成果,隧址区基岩以D3zg、Zbd、C1、C2+3灰岩和白云岩为主,且各类可溶性岩石隧道长度占隧道全长的90%,多呈灰色、灰白色,厚层—中厚层状,质坚性脆,完整性较差。受场区内大构造背景影响,区内褶皱及断裂构造较为发育,共计有4处褶皱和4条断裂带,造成岩体松动,且地下水补给径流条件较好,使得隧道发生涌水灾害的可能性较大。因此,开展该隧道的涌水灾害研究具有较强的必要性[11-12]。
2.2 隧道涌水灾害影响因素分析
通海隧道所处地质条件较为复杂,隧道涌水灾害受多种因素综合作用影响。由工程实际及文献[6-7]可知,隧道涌水发生需要岩性条件、构造条件及地下水循环条件等共同作用。因此,可将隧道涌水影响因素细分为岩石可溶性影响因素、地表汇水影响因素、地质构造影响因素、地下水循环影响因素和隧道空间位置影响因素等。为实现隧道涌水的高精度预测,结合通海隧道的工程实际,将上述5类因素的选取标准和量化标准分述如下。
2.2.1 岩石可溶性因素
岩石可溶性是岩溶发育的必要条件之一,其决定了后期溶穴的储水能力。结合以往的研究成果可知,可溶性影响因素主要包含2个方面: 1)可溶盐的矿物成分因素,一般条件下,碳酸岩的不溶物含量不应超过10%,因此可利用可溶盐(CaCO3)的含量来评价岩溶的发育程度,即CaCO3的含量越高,岩溶的发育程度越高,富水性也越强。2)岩石结构因素,该影响因素可控制地下水的径流条件,且结合工程实际,可进一步将该因素细分为微观结构因素和宏观结构因素,其中,微观结构因素可由岩石结构类型进行划分,而宏观结构因素可由隧道围岩级别进行划分。
为便于后续预测分析,有必要将上述各因素进行量化处理。结合工程实际,将岩石可溶性因素的量化标准划分,如表2所示。
表2岩石可溶性因素的量化划分标准
Table 2 Quantitative classification criteria for rock solubility factors
CaCO3含量/%岩石结构围岩级别量化评分 <5粗晶结构Ⅰ0~525~5亮晶结构Ⅱ5~1050~25粒屑结构Ⅲ10~1575~50泥晶结构Ⅳ15~20 >75生物碎屑结构Ⅴ20~25
2.2.2 地表汇水影响因素
地表水的汇集是隧道涌水灾害发生的补给条件,即地表水的汇水条件越好,隧址区地下水的补给条件相对也越好,进而发生涌水灾害的可能性也越大。因此,隧道涌水灾害的发生与地表汇水影响因素具有较大的联系。结合工程实际,将地表汇水影响因素划分为3类,即降雨量、地形地貌及渗透系数。其中,降雨量是地下水的直接来源;地形地貌则决定了地表水的汇聚能力,即地形坡度越陡,降雨越易形成地表径流,地下水的补给条件相对越差,反之,地下水的补给条件相对越好;渗透系数直接关系地表水的下渗能力。类比岩石可溶性因素的量化过程,将地表汇水影响因素也进行量化处理,其中,降雨量因素可直接由降雨量进行归一化处理得到量化值,渗透系数以可用类比的统计方法进行量化处理。地形地貌因素的量化划分标准如表3所示。
表3地形地貌因素的量化划分标准
Table 3 Quantitative classification criteria for topographic and geomorphic factors
地形坡度/(°)量化评分>450~430~454~820~308~1210~2012~16<1016~20
2.2.3 地质构造因素
地质构造直接控制着地下水的水力联系,进而影响涌水灾害发生时的水量补给。因此,地质构造是涌水灾害发生的另一重要影响因素。结合区域地质构造可知,隧址区主要位于单斜构造中,其岩层组合关系、岩层厚度和岩层倾角会对涌水灾害产生直接影响。因此,将上述3个指标作为地质构造因素的二级指标。在实际量化过程中,3个指标均是通过统计位置掌子面的具体参数进行量化。地质构造因素的量化划分标准见表4。
表4地质构造因素的量化划分标准
Table 4 Quantitative classification criteria for geological structural factors
地质构造因素分类量化评分岩层组合关系孔隙-裂隙岩溶含水组0~4夹层裂隙含水组4~10厚层脉状-裂隙含水组10~16厚层裂隙-岩溶含水组16~20岩层厚度薄层状 0~2中厚层状2~6厚层状6~10巨厚层状10~12岩层倾角>60°0~660°~45°6~1045°~30°10~14<30°14~20
2.2.4 地下水循环影响因素
地下水的循环运动是岩溶发育的必要条件之一,其循环过程具有多种运动特征。地下水循环程度一般可由Ca+含量来决定,即利用该离子在水中的饱和指数SIC来确定,SIC值越小,说明地下水的溶蚀能力越强,反之,溶蚀能力越弱。同时,涌水段的长度也可反映地下水的循环强度,涌水段长度越大,地下水循环条件相对越好。在量化过程中,涌水段长度指标可由现场施工直接测得,因此,以其现场监测值作为统计指标;饱和指数则是基于现场取样后的室内试验求得,且在工程实际应用过程中,若未取得研究断面的水样,可将距离其最近的饱和指数SIC试验结果作为指标进行预测研究。饱和指数SIC的量化划分标准如表5所示。
2.2.5 隧道空间位置影响因素
由于隧道洞身位置的埋深不一致,因此,其所处位置的垂直向分带也具有一定差异,且由于不同垂向分带对岩溶发育具有较大的影响,因此,以隧道所处的循环带类型来评价隧道空间位置对涌水灾害的影响。隧道所处循环带指标的量化划分标准如表6所示。在具体量化过程中,以隧道勘察成果为基础,通过统计断面的里程进行位置确定,再以现场涌水条件作为校核依据,以确定隧道所处循环带的量化评分。
表5饱和指数SIC的量化划分标准
Table 5 Quantitative classification criteria for saturation index SIC
饱和指数SIC量化评分 >1.20~41.2~0.84~80.8~0.48~120.4~0 12~16<016~20
表6隧道所处循环带指标的量化划分标准
Table 6 Quantitative classification criteria for cyclic zones index in tunnels
隧道所处循环带量化评分水平径流带18~14深部径流带12~8交替带12~6垂直渗流带6~0
通过上述总结分析,将通海隧道的涌水影响因素共分为5大类12小类,具体如表7所示。
表7通海隧道涌水影响因素统计
Table 7 Statistics of influencing factors of water inflow in Tonghai Tunnel
前述各评价指标的量化评分有一定差异,不利于后续预测模型的构建,因而有必要利用式(10)进行无量纲处理,以提高数据的均衡性。
(10)
本文以DK29+203断面为例,详述各影响因素的量化过程。围岩CaCO3含量为30%,根据表2得其评分为11分;围岩为粒屑结构,评分为12分;围岩级别为Ⅳ级,评分为20分;对应地形坡度为30°~45°,评分为7分;岩层组合关系为厚层脉状-裂隙含水组地下水,评分为15分;岩层厚度为中厚层状,评分为5分;岩层倾角为35°,评分为12分;Ca+的饱和指数SIC为0.6,评分为10分;隧道所处循环带为深部径流带,评分为10分。根据上述评分量化,再利用式(10)进行归一化处理,得到隧道涌水灾害样本量化评分如表8所示。
通海隧道在施工过程中发生了多起涌水灾害事故,为更好地指导类似工程,基于前述影响因素分析,统计了17处现场涌水灾害样本,如表8所示。
2.3 隧道涌水影响因素的筛选
隧道涌水影响因素较多,共有5个一级影响因素和12个二级影响因素,不同影响因素对隧道涌水灾害的作用程度存在一定差异。为保证后续预测模型输入层的可靠性,有必要对影响因素进行筛选处理。本文利用相关系数法筛选各影响因素对隧道涌水灾害的影响程度,筛选结果如表9所示。各影响因素与涌水量间的相关系数存在不同,因此,各影响因素对隧道涌水灾害的影响程度也有差异。根据筛选结果统计,呈负相关的影响因素共计有4个,所占比例为33.33%,说明各影响因素多以正相关为主;地形地貌因素、岩层倾角因素和涌水段长度的相关程度相对较低,所占比例为25%;Ⅱ级影响因素共有7个,所占比例为58.33%,而Ⅲ级影响因素仅2个,所占比例为16.66%,说明影响因素的相关性等级以Ⅱ级为主。
值得指出的是,在分析结果中,降雨量、涌水段长度与涌水量间存在负相关,这与工程实际存在一定差异。
降雨量与涌水量呈负相关原因: 1)降雨入渗至隧道所处位置需要一定的时间,造成降雨入渗的效果存在一定差异; 2)降雨不仅影响地下水系统,还与地表水系统相关,且两系统间也存在着复杂的水力联系,因此其影响规律存在一定差异。
表8 隧道涌水灾害影响因素归一化处理后的样本统计
表9隧道涌水影响因素筛选统计
Table 9 Screening statistics of influencing factors of tunnel water inflow
序号影响因素相关系数相关性相关程度相关等级1岩性化学成分-0.258负相关中度相关Ⅱ2岩石结构0.326正相关中度相关Ⅱ3围岩级别0.363正相关中度相关Ⅱ4降雨量-0.345负相关中度相关Ⅱ5地形地貌0.132正相关低度相关Ⅰ6渗透系数0.533正相关高度相关Ⅲ7岩层组合类型0.275正相关中度相关Ⅱ8岩层厚度-0.239负相关中度相关Ⅱ9岩层倾角0.124正相关低度相关Ⅰ10涌水段长度-0.096负相关低度相关Ⅰ11方解石0.360正相关中度相关Ⅱ12隧道所处循环带0.461正相关高度相关Ⅲ
涌水段长度与涌水量呈负相关原因: 从某种程度上讲涌水段越长,对应的涌水量应越高,但这忽略了每延米上是平均涌水速率的影响,即涌水可能存在于短距离上的集中涌水,也可能存在于长距离上的少量渗水等;同时,该因素与涌水量间的相关性也较弱,不仅说明了该因素对隧道涌水的影响程度有限,也验证了该文影响因素筛选的必要性。
虽然上述两影响因素与工程实际存在一定差异,但本文仅是以影响因素相关性程度来确定预测模型的输入层信息,因此,影响因素的相关性对预测模型的影响有限,其相关性程度才是预测模型输入层信息构建的决定因素。
根据上述影响因素的筛选结果,本文以相关等级为Ⅱ级和Ⅲ级的影响因素作为后续预测模型的输入层,即输入层共计有9个神经网络节点。
2.4 隧道涌水的预测分析
根据前述预测模型的构建过程,以1—12号样本作为训练样本,13—17号样本作为验证样本,并将参数优化过程和误差值弱化过程分述如下。
2.4.1 参数优化过程
根据前述影响因素筛选,得出涌水预测模型的输入层共计有9个网络节点,而输出层为涌水量,具有1个网络节点,进而确定初步隐层节点数为13,并以该隐层节点数进行初步设置,试算得到各激励函数的预测效果如表10所示。在训练时间方面,Hardlim型激励函数的训练时间相对最长,其次是Sine型激励函数和Sigmiod型激励函数;而在预测精度方面,Sigmiod型激励函数的平均相对误差最小,预测精度最优,其次是Hardlim型激励函数和Sine型激励函数。因此,不同激励函数在该文实例中的适用性具有明显差异,在对比训练时间和预测精度的基础上,确定Sigmiod型激励函数的预测效果相对最优。
表10不同激励函数的预测效果
Table 10 Statistics of predicted effects of different excitation functions
激励函数类型训练时间/ms平均相对误差/%Hardlim8.723.51Sine4.174.22Sigmiod3.462.65
在最优激励函数的基础上,再对隐层节点数进行优化筛选,筛选区间为9—17,结果如表11所示。根据隐层节点数的优化筛选可知,随隐层节点数的增加,训练时间也会有一定程度的增加,说明隐层节点数并非越多越好; 同时,随隐层节点数的增加,样本的平均累计误差和平均相对误差均呈现先减小再增加的趋势,且当隐层节点数为14时,平均相对误差仅为2.28%,预测结果相对最优。
根据上述参数优化,综合确定ELM模型的最优激励函数为Sigmiod型,隐层节点数为14。
2.4.2 误差值弱化
在参数优化的基础上,再利用M估计进一步弱化预测误差。为验证本文预测模型及M估计的有效性,同步利用传统BP神经网络进行预测,并将参数优化和M估计优化后的预测结果进行对比分析,结果如表12所示。
表11不同隐层节点数的预测结果统计
Table 11 Statistics of predicted results for number of nodes in different hidden layers
隐层节点数训练时间/ms平均累计误差/(m3/d)平均相对误差/%91.21326.953.95102.43281.543.73112.81261.293.53123.02248.133.12133.46202.152.65143.83174.162.28154.92199.122.55167.66247.782.821710.24255.453.04
对比不同预测模型在相应验证样本处的预测结果可知,ELM模型的预测精度均不同程度地高于传统BP神经网络模型,验证了ELM模型作为新型智能算法的优越性。同时,对比M估计优化前后的预测结果可知,通过M估计的误差弱化,各验证样本的相对误差均出现不同程度减小,说明M估计能达到弱化预测误差的目的。R-ELM模型的相对误差均值为1.12%,说明该模型具较高的预测精度,适用于隧道涌水预测。
表12 不同预测模型的隧道涌水预测结果统计
综上所述,R-ELM模型具有较快的运算速度和精度,对隧道涌水预测的适用性较好,值得在类似工程项目中的推广应用研究。
3 结论与讨论
通过相关系数法和R-ELM模型在通海隧道涌水预测中的综合应用研究,主要获得了如下结论。
1)岩溶隧道的涌水影响因素较多,共有5个一级影响因素和12个二级影响因素,且不同影响因素与涌水量之间的相关性多以中度相关为主。
2)在预测模型的构建过程中,激励函数类型和隐层节点数对预测效果具有较大的影响,利用试算法可有效实现参数优化,对保证预测精度具有重要意义;同时,M估计可有效弱化误差值,可进一步提高预测精度。
3)本文构建的R-ELM模型具有较高的预测精度,且其泛化能力较强,适用于隧道涌水预测。本文的隧道涌水量预测思路也可应用于类似工程的涌水灾害防治。
4)由于隧道所处环境具有明显的区域性特征,隧道涌水灾害的影响因素也存在一定差异,因此,在R-ELM模型的推广应用中,应充分结合工程实际,构建合适的隧道涌水影响因素评价体系,以保证预测模型输入层信息的准确性。