APP下载

大坝监测量最佳统计模型优选方法

2022-03-17黄耀英何一洋沈振中李春光

水利学报 2022年2期
关键词:梅山大坝分量

黄耀英,何一洋,沈振中,李春光

(1.三峡大学 水利与环境学院,湖北 宜昌 443002;2.河海大学 水利水电学院,江苏 南京 210098;3.中国科学院 武汉岩土力学研究所 岩土力学与工程国家重点实验室,湖北 武汉 430071)

1 研究背景

自1950年代以来,我国已修建水库大坝约9.8 万余座,它们在防洪、灌溉、供水和发电等方面产生了巨大的经济效益与社会效益。然而,由于目前服役中的水库大坝95%以上是1980年代以前修建的[1],受老化和病害等多种原因影响,约有1/3 的水库大坝存在不同程度的病险问题[2],因此,水库大坝安全性态合理评价十分迫切。在水库大坝修建时通常会安装埋设不同类型的监测仪器对大坝的变形、渗流和应力应变等工作性态进行实时监测,这些实时监测资料是大坝真实性态最直接反映。分析这些监测数据,有效预测大坝发展趋势,对大坝的长效服役以及除险加固具有重要指导意义。

数学模型法是大坝安全监测资料分析的一种重要分析方法[3-6],是对大坝效应量监测值建立起具有一定形式和构造的数学式。这种数学方程式能够反映大坝效应量监测值的定量变化规律,并在此基础上判断各监测物理量的变化和趋势是否正常、是否符合技术要求,从而揭示大坝的异常情况和不安全因素,评估大坝的工作状态。迄今,广大科技工作者采用数学模型法开展了大量的大坝安全监测资料分析研究。这些研究归纳起来,主要分为两大类数学模型。一类是传统的统计模型、确定性模型及混合模型,此类数学模型是大坝安全监测资料分析中最常用的模型[6]。自1955年Fanelli 等应用统计回归方法定量分析大坝变形监测资料以来,国内外学者结合实际大坝工程,系统建立了变形、裂缝开合度、应力应变和渗流(扬压力、渗压系数、测压管水位和渗流量)等统计模型、确定性模型和混合模型[3-4]。从分析方法上看,该类数学模型以环境量作为自变量,将效应量作为因变量,利用数理统计方法建立起效应量和环境量之间的依赖关系。采用回归分析或优化方法,确立模型各因子的系数,并对模型中的各分量进行物理解释,借以分析大坝的工作性态。这些数学模型的建立需借助于先验知识,通常以模型拟合精确性为目标,有时兼顾模型检验有效性,但是迄今鲜有综合考虑模型拟合良好性、检验有效性以及模型简单性的数学模型优选研究报导。

随着计算技术与人工智能的发展,另一类以仿生算法为主的数学模型逐渐应用到大坝安全监测资料分析中。其主要包括模糊数学、灰色系统理论、神经网络、随机森林、logistics 回归等建立的数学模型。如赵斌等[7]提出应用神经网络的BP 模型进行大坝安全监测数据的预报。徐洪钟等[8]将混沌理论和神经网络理论相结合,结合某混凝土重力坝水平位移实测值建立了相空间模糊神经网络预报模型。苏怀智等[9]基于遗传算法思想,在遗传算法的进化过程中加入一定约束条件,探讨了神经网络结构的设计和学习。齐银峰等[10]基于改进粒子群优化算法的BP 神经网络对丰满大坝变形进行了分析。田菊飞等[11]提出了一种基于随机森林算法的大坝应力预测模型,将其运用于某混凝土重力坝的应力监测数据处理、分析和预测。李明军等[12]提出了一种基于改进型粒子群优化算法选取极限学习机(ELM-IPSO)最优参数的大坝变形预测模型。丁倩等[13]建立了BP 神经网络-加权马尔科夫模型,对王甫洲水利枢纽泄水闸11#闸墩测点水平位移进行分析预测。任秋兵等[14]引入长短期记忆深层网络,提出了适用于不同类型水工建筑物的安全监控深度分析模型。总体来看,仿生算法的引入丰富了大坝安全监测资料分析方法,由此建立的数学模型也一定程度提高了大坝监测量的拟合精度和预测效果。虽然目前已有一些关于神经网络结构等的优化研究,但该类数学模型的获取仍然主要着眼于模型的拟合精度,少有关于模型简单性的定量分析,而且由于通常是黑箱模型或灰色模型,导致这类模型一般较复杂,不易于工程师对监测量物理成因的把握,也不方便推广应用。

从系统论角度来看,大坝工程的研究对象是一个复杂的巨系统,外界环境因素均可看作系统的输入,而可监测的变形、渗流和应力应变等均可看作系统的输入响应,即输出。在复杂条件下,要获得真实反映实际大坝工程系统变形规律的最佳等价数学描述模型,本质上是一个复杂多因素系统优选问题,包括模型优选和参数识别等。目前,关于系统模型优选已被广泛研究并应用于涉及控制、预测等领域,在水利和岩土工程本构模型辨识等方面也有一些文献报导[15-18]。如袁勇等[19]提出了岩体系统模型应遵循物理性、简单性、拟合性、可辨识性和综合精度等五项原则,并利用最优估计原理和信息论的观点建立了最佳模型的决策准则和决策方法。成枢[20]归纳了优选最佳力学模型的3 个最基本原则:拟合的良好性、模拟的简单性和精度的综合性。高玮等[21]提出了基于遗传算法的岩土本构模型辨识方法。程马遥等[22]提出了一种基于改进的DE-TMCMC 的贝叶斯参数识别法,并应用于高级土体本构模型的参数识别。这些探索推进了岩土本构模型的深入研究,但仍旧着眼于拟合精度,而忽略了简单性原则的定量分析。

鉴于大坝安全监测资料分析的最佳数学模型优选与岩土材料最佳本构模型辨识本质上相似,而统计模型是大坝安全监测资料分析中最常用的模型,虽然目前关于监测量统计模型因子的选择已有一些文献报导[23-26],但关于大坝监测量统计模型的优选尚未见有关文献报导。为此,本文从系统论角度出发,在现有大坝监测量数学模型分析考虑了回归拟合和检验分析的基础上,综合岩土材料最佳本构模型辨识原则,探讨以模型拟合良好性、检验有效性以及模型简单性三方面为优选原则的大坝监测量最佳统计模型优选方法,并结合梅山大坝11#坝垛水平位移实测资料进行应用。

2 大坝监测量最佳统计模型优选原理

根据工程经验和监测量物理成因,首先确定统计模型组成分量,进而由输入响应(变形、渗流或应力应变等) 的统计模型各分量的因子可选域,组合得到模型类属集合M,将这些模型记为M1,M2,…,Mi,…,Ml(1≤i≤l),则有M={M1,M2,…,Mi,…,Ml}。模型优选即是从模型类属集合M 中选择一个最能反映“真实”大坝工程系统性态的模型Mk,即最佳统计模型为Mopt=Mk=max{Odci}(1≤i≤l)。其中,Odci为决策量,它一般包含统计模型特征参数向量和统计模型与大坝工程真实系统之间的差异等信息。

2.1 最佳统计模型优选基本原则如何在统计模型因子可选域中选出合理的因子组建成最佳统计模型是解决问题的关键,这与模型优选的原则(决策量)关系密切。综合有关文献关于模型优选的原则[19-20],拟选择拟合的良好性、模型的简单性和检验的有效性为最佳统计模型优选原则。

(1)拟合的良好性:在备选统计模型集合中选出的最佳统计模型必然要求与实测值具有良好的拟合精度,即最佳统计模型回归分析的复相关系数必须越大越好,反之越差。

(2)模型的简单性:又称最小自由度原则,即优选出的最佳统计模型,不仅要求能较好地描述大坝工程系统的工作性态,而且还应具有统计模型的因子数较少,以简化计算。即统计模型的因子数越少越优,反之越差。

(3)检验的有效性:优选得到的最佳统计模型除了拟合效果良好外,还必须满足对大坝工程系统检验数据系列的预测精度(均方根误差或复相关系数等)能被工程界接受,即是预测实际大坝工程问题的实用有效模型。

2.2 最佳统计模型优选原则标准化为了进行统计模型优选,需要将上述3 个模型优选原则进行无量纲化及标准化。由于复相关系数、模型因子数和均方根误差不属于同一量级,因此在对回归拟合、模型因子数和检验效果标准化前,首先需要进行归一化处理。对于拟合的良好性原则,采用式(1)对复相关系数进行归一化处理;对于模型的简单性和检验的有效性原则,采用式(2)对模型因子数与均方根误差进行归一化处理。

式中:xi为复相关系数归一化后的无量纲数值;xj为模型因子数和均方根误差归一化后的无量纲数值;xmax、xmin分别为复相关系数、模型因子数和均方根误差的最大值和最小值。

归一化处理后需对回归拟合、模型因子数和检验效果进行标准化,本文采用的标准化公式为:

式中:ym为回归拟合、模型因子数和检验效果进行标准化后的无量纲数值;xm为回归拟合、模型因子数和检验效果归一化后的无量纲数值。

上述3 个模型优选原则进行无量纲化及标准化后,如图1所示。

图1 统计模型优选原则无量纲化及标准化示意

2.3 最佳统计模型优选决策量综合上述统计模型优选原理、原则及标准化处理,获得统计模型优选决策量为

式中:Fi、Si、Vi分别为回归拟合、模型因子数和检验效果的标准化值;λ1、λ2、λ3分别为相应的权重。

3 大坝监测量最佳统计模型优选步骤

为了在模型类属集合M 中选择一个最能反映“真实”大坝工程系统性态的模型Mopt,遵循拟合的良好性、模型的简单性和检验的有效性优选原则,一个完整的大坝工程系统监测量最佳统计模型优选过程主要包括如下5 个步骤:

步骤1:输入输出数据的准备。由实际大坝工程获得环境量和变形、渗流或应力应变等监测数据,并对监测数据进行预处理,剔除粗大误差或异常测值;接着按模型优选要求,准备好回归分析数据系列和检验数据系列。

步骤2:统计模型类属确定。统计模型类属的确定是统计模型优选最重要的阶段,同时也是最复杂的一项工作,因为确定一个大坝工程系统的统计模型类属不存在可遵循的固定推理方法,只能根据建模的目的,对大坝工程系统验前知识的掌握程度等进行定性的判定。为此,首先根据工程经验和监测量物理成因确定统计模型组成分量,然后在不同效应量统计模型各分量的因子可选域中选择合适的因子进行组合,得到l个统计模型Mi(1≤i≤l)。

步骤3:模型参数识别。基于回归数据系列,对于集合M 中的不同模型,采用回归分析或优化方法辨识统计模型因子系数,并获得相应的复相关系数Ri及拟合良好性Fi等。

步骤4:模型检验。采用检验数据系列,对参数辨识的统计模型进行检验分析,获得相对于检验数据系列的均方根误差RMSEi及检验有效性Vi等。

步骤5:最佳统计模型决策。将回归拟合精度、模型因子数和检验效果进行标准化,进而计算决策量,最大决策量对应的统计模型即为最佳统计模型。

综上,最佳统计模型优选具体流程如图2所示。

图2 最佳统计模型优选流程

4 实例分析

4.1 工程概况梅山水库位于淮河支流,是以防洪为主、结合灌溉、发电、航运、水产养殖等综合利用工程。1958年初水库正式蓄水,水库总库容为23.63 亿m3,汛期限制水位为125.27 m,水库正常蓄水位128.0 m,设计洪水位137.66 m。主要水工建筑物有拦河坝、溢洪道、泄水底孔、泄洪隧洞、发电厂、坝后桥等。其中,拦河坝为钢筋混凝土连拱坝,坝轴线近东西向,由15 个垛和16 个拱组成,两端各接重力坝和空心重力坝段,坝顶总长443.5 m(其中连拱坝段轴线长311.5 m),坝顶高程140.17 m,防浪墙顶高程141.27 m,坝顶宽2.1 m,最大坝高88.24 m。

为确保梅山大坝的安全运行,在主要建筑物布置了水平位移、垂直位移、坝基地下水位、渗流量、温度、裂缝开度以及钢筋应力等监测项目。水平位移正倒垂线测点图如图3所示。

图3 梅山大坝正倒垂线测点布置

4.2 典型测点变形监测量定性分析梅山大坝变形监测系统包含水平位移和垂直位移监测,采用自动化采集。其中,水平位移监测采用垂线法,正垂线14 条,倒垂线6 条,共20 个测点。垂直位移观测包括坝顶、坝下、东岸、西岸和拱的垂直位移,共设有56 个测点,采用N3 水准仪进行观测。

选取梅山大坝监测数据系列相对完整且具有代表性的11#垛坝轴线处水平位移进行监测数据分析。该坝垛水平位移包括顺河向(Y向)与横河向(X向)位移,监测时间段为2015/1/1—2020/7/23 的水平位移与库水位和气温相关过程线如图4所示。图中,顺河向(Y向)位移以向下游为正,向上游为负;横河向(X向)位移以向左岸为正,向右岸为负。

图4 11#坝垛水平位移过程线

从图4 可以看出:(1)顺河向(Y向)位移的变化受库水位变化较为明显。库水位较高时,坝体向下游位移增大,反之则减少;同时,库水位对大坝横河向(X向)水平位移也有一定影响,但其影响较小。(2)水平位移受温度影响较大,总体上呈年周期变化。温升时,坝顶向下游位移增大,反之向上游位移增大,且位移变化通常滞后于气温变化3~4 个月。

为了进一步定量分析坝体水平位移的变化规律,需要建立统计模型对各个分量进行分离和物理解释。因此,下面基于统计模型拟合良好性、检测有效性以及模型简单性三方面模型优选原则对梅山大坝11#垛坝轴线处水平位移进行分析。

4.3 大坝变形最佳统计模型优选依据第3 节的模型优选步骤进行大坝变形最佳统计模型优选。

4.3.1 输入输出数据准备 根据正倒垂线测量获得梅山大坝11#垛水平位移监测数据,按照3σ法则[27]对监测数据进行预处理,剔除粗大误差或异常测值。接着将数据系列划分为回归分析数据系列和检验数据系列。本文回归分析数据系列对应2015/1/1—2019/12/31,检验数据系列对应2020/1/1/—2020/7/23。

4.3.2 统计模型类属确定 根据工程经验和监测量物理成因,混凝土坝变形统计模型组成分量包含水压分量、温度分量、时效分量、裂缝分量、冻胀分量和施工期自重分量等。由于梅山大坝已服役运行60 余年,坝址环境气温温和,坝体没有出现较大规模的裂缝,为此,将坝体变形δ分为水压分量δH、温度分量δT和时效分量δθ,即[3-4]

式中:δ为坝体位移;δH、δT、δθ分别为水压分量、温度分量和时效分量。

根据大坝工程系统验前知识,不同分量对应的可选因子域不同。(1)对于水压分量,梅山大坝为连拱坝,其为高次超静定结构,由先验信息确定水压分量的可选域为上游水深的一次、二次、三次和四次;(2)对于温度分量,由于梅山大坝已服役运行60 余年,坝体内部埋设的温度计大部分已失效,考虑到坝体温度场已处于准稳定温度场状态,为此确定温度分量的可选域为多周期(一年、半年、4 个月和3 个月周期)的谐波函数作为因子集合;(3)对于时效分量,同样地,由于梅山大坝已服役运行数十年,坝体混凝土和岩体的时效变形以不可逆徐变为主,可恢复徐变小,因此不考虑水位消涨引起的坝体混凝土和岩体滞后的可恢复徐变因子[3-4],为此确定时效分量的可选域为时间一次式、时间对数式和时间的e指数式。由此,获得统计模型各分量可选因子域见表1。

在进行因子组合获得统计模型集合时,借鉴3 因素4 水平的正交设计表[28](L16(43)),对于某因素的水平1,则因子采用表1 中相应因素的第一个因子,对于某因素水平2,则因子采用表1 中相应因素的第一和第二个因子累加,依次类推。依据这个组合原则,由表1 中水压分量、温度分量和时效分量的因子可选域进行组合得到16 个统计模型集合,如表2所示。

表1 变形统计模型因子可选域

4.3.3 统计模型参数识别与模型检验 基于经过粗差处理后的回归数据系列(即2015/1/1—2019/12/31数据系列,共255 组),对于表2 中不同统计模型集合,采用逐步回归分析法辨识统计模型因子系数,得到不同模型的复相关系数(Ri)。经逐步回归获取不同模型各分量因子系数及复相关系数后,将检验数据系列(即2020/1/1—2020/7/23 数据系列,共32 组)输入已回归确定的统计模型中,对统计模型进行检验分析,并获得相对于检验数据系列的均方根误差(RMSEi)。各测点统计模型的复相关系数(Ri)与均方根误差(RMSEi)如表3所示。

表2 变形统计模型表达式集合

表3 典型测点回归数据统计模型复相关系数Ri与检验数据均方根误差RMSEi

4.3.4 最佳统计模型优选 由2.2 节的原理,对回归拟合、模型因子数和检验效果进行归一化处理。对于复相关系数,采用式(1)进行归一化处理;对于模型因子数与均方根误差,采用式(2)进行归一化处理。归一化结果如表4所示。

表4 回归拟合、模型因子数和检验效果归一化处理

归一化处理后,按式(3)对回归拟合精度、模型因子数和检验效果进行标准化处理,假设回归拟合精度、模型因子数和检验效果同等重要,即权重λ1、λ2、λ3均取1,进而按照式(4)逐一计算决策量Odci(i=1,2,…,16)。最大决策量max{Odci}(i=1,2,…,16)对应的统计模型即为最佳统计模型Mopt。各统计模型标准化结果及对应的决策量如表5所示。

由表5 可见,梅山大坝11#垛水平位移测点PL11-1(X向)最佳统计模型Mopt为

表5 回归拟合、模型因子数和检验效果标准化结果及对应的决策量

水平位移测点PL11-1(Y 向)最佳统计模型Mopt为

由优选获得的最佳统计模型可见,顺河向(Y向)和横河向(X向)位移虽然都是水平向位移,但统计模型表达式不完全相同。由前述定性分析可知,由于库水位对顺河向(Y向)位移的影响更大,因此其对应的统计模型水压分量需要的因子更多;虽然顺河向(Y向)和横河向(X向)位移均受温度影响,由于顺河向(Y向)位移受温度影响的规律更简单,因此其对应的统计模型温度分量需要的因子更少;由于库水推力以顺河向(Y向)为主,因此需要更多的时效分量因子来描述顺河向(Y向)时效变形规律。究其原因为混凝土坝变形统计模型的水压分量、温度分量和时效分量隐含了基于“基频”变形叠加来描述复杂的变形。当大坝变形规律越简单,需要的“基频”变形或因子数就越少;当大坝变形规律越复杂,则需要越多的“基频”变形或因子数来描述其变化特征。总体来看,经监测量统计模型优选原理所得到的最佳统计模型在具备模型简单性的同时兼具良好的拟合性与检验有效性。

4.4 最佳统计模型拟合及检验效果以下分别给出4.3 节优选获得的不同测点最佳统计模型计算值与实测值对比,如图5所示。

图5 11#垛水平位移最佳统计模型拟合过程线

由图5 可见:(1)无论是回归拟合段(2015/1/1—2019/12/31)还是检验段(2020/1/1/—2020/7/23),典型测点横河向(X向)和顺河向(Y向)水平位移优选获得的最佳统计模型计算值与实测值均吻合效果良好,回归拟合段对应的复相关系数分别为0.951、0.892,在检验段对应的均方根误差分别为0.616、1.009。(2)从典型年份(2019年)分离出的各分量占比来看,PL11-1(X向)测点水压分量约占20%,温度分量约占75%,时效分量占5%以内;PL11-1(Y向)测点水压分量约占15%,温度分量约占80%,时效分量占5%以内。因此,梅山大坝的坝顶水平位移主要受温度影响,水压次之,时效最小。

4.5 与常用统计模型对比作为对比,采用4.3.1 节同样的回归分析数据系列和检验数据系列,对常用的连拱坝变形统计模型[29]进行了分析,即

分析表明,PL11-1(X向)和PL11-1(Y向)回归拟合段对应的复相关系数分别为0.952、0.892,检验段对应的均方根误差分别为0.744、1.025。虽然采用本文方法优选获得的最佳统计模型的拟合和检验效果与常用的连拱坝变形统计模型的拟合和检验效果基本相当,但本文优选获得的最佳统计模型因子数明显少于常用的连拱坝变形统计模型因子数。

5 结论

数学模型法是大坝安全监测资料分析的一种重要分析方法,针对现有报导的大坝监测量数学模型主要以拟合精确性为目标,忽略模型简单性原则的定量分析,本文从系统论角度出发,基于模型优选原则探讨大坝监测量最佳统计模型优选,并结合梅山大坝11#坝垛水平位移实测资料,对典型测点进行变形统计模型优选应用,通过分析得到如下结论:(1)提出了拟合良好性、模型简单性和检验有效性的大坝监测量统计模型优选原则,并给出了3 个优选原则和决策量的定量标准化计算方法,提出了基于3个优选原则的大坝监测量统计模型优选步骤。(2)结合梅山大坝典型坝垛水平位移实测资料,详细展示了本文提出的大坝监测量统计模型优选方法,分析表明,不同测点监测数据对应不同的统计模型,经模型优选所得出的最佳统计模型不仅具有良好的拟合性与检验有效性,而且具备模型简单性。

猜你喜欢

梅山大坝分量
处方分析在中药房药学服务中的应用
梅山民歌的地域文化简析*
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
梅山
论《哈姆雷特》中良心的分量
大坝:力与美的展现
大坝利还是弊?
论梅山道教文化中的“巫”特质