信息扩散方法在大坝监测效应量预测中的应用
2016-12-16李小奇郑东健曹连朋曹其光
李小奇,郑东健,曹连朋,曹其光
(1. 河海大学水文水资源与水利工程科学国家重点实验室,江苏 南京 210098;2. 河海大学水资源高效利用与工程安全国家工程研究中心,江苏 南京 210098;3. 潍坊市水利建筑设计研究院,山东 潍坊 261205; 4. 中钢集团马鞍山矿山研究院有限公司,安徽 马鞍山 243000)
信息扩散方法在大坝监测效应量预测中的应用
李小奇1,2,郑东健1,2,曹连朋3,曹其光4
(1. 河海大学水文水资源与水利工程科学国家重点实验室,江苏 南京 210098;2. 河海大学水资源高效利用与工程安全国家工程研究中心,江苏 南京 210098;3. 潍坊市水利建筑设计研究院,山东 潍坊 261205; 4. 中钢集团马鞍山矿山研究院有限公司,安徽 马鞍山 243000)
在大坝安全监测中,为了解决小样本导致的效应量预测误差较大的问题,在考虑增加样本信息的基础上,建立基于二维正态信息扩散离散回归的效应量预测方法。利用模糊推理和信息集中的基本理论,结合灰色关联度法,对大坝安全监测效应量进行分析和预测,应用综合有效度指标评价该预测方法的效果。结果表明,基于信息扩散的预测方法避免了多种不确定因素影响下小样本预测的困难,提高了拟合和预测精度。
信息扩散;大坝监测;效应量预测;模糊推理;综合有效度
在大坝安全监测领域,针对包含多种不确定性影响因素的小样本进行拟合、预测是建模分析的难点,常规模型往往拟合精度不高。如果监测样本包含多种不确定性,它与影响因素之间的关系就没有确定的解析式来表达;如果样本信息贫乏,不足以用确定性模型来定量分析,或者数据的连续性不佳,那么它就具备了模糊和灰色不确定性[1-2];如果决策者无法根据经验选取拟合方法或解析式,那么它又具备了未确知不确定性[3]。因此,建立一种不需要预设解析式针对小样本进行分析并考虑多种不确定性影响的计算模型,来弥补客观信息和主观认识的不足就显得尤为必要。
目前,针对小样本和不确定性影响因素进行建模的方法主要有灰模型、模糊推理、粗糙集、支持向量机和集对分析[4]等。这些方法大都注重对单一不确定性信息建模,尚没有考虑多种不确定性信息的小样本分析模型。为了解决这一问题,研究利用信息扩散理论对小样本信息进行扩展,然后结合模糊理论和灰色理论进行建模,以考虑小样本以及多种不确定性因素的影响。对于信息扩散理论,Li等[5]应用信息扩散法对强震下的地表裂度和不同震级下的裂缝宽度进行了预测;Feng等[6]依据信息扩散原理建立了蓄水期的风险评估模型,用来对库容和水资源短缺状况进行预测;Chen等[7]将信息扩散理论和BP神经网络结合,建立了流域洪峰风险评估模型,用来对洪峰进行预测。类似的研究大都停留在隶属度的计算上[8-11],只对风险进行评估,没有对不确定因素的效应量进行精确的拟合和预测。为了弥补这一不足,本文利用信息扩散理论,针对大坝安全受多种因素影响的特点,结合多因素模糊推理、格贴近度和灰色关联度计算,建立基于信息扩散理论的大坝安全监测效应量预测模型。
1 建 模 原 理
1.1 模糊关系矩阵的建立
信息扩散是为了弥补原始信息的不足,将一个传统的数据样本点变成一个模糊集合,从而优化利用数据资料隐藏信息的模糊数学处理方法[12]。由于大坝安全监测大都是二元变量的情形,因此以二维情况进行计算。
建模的第一步,要对原始信息进行处理。假设大坝安全监测效应量和影响量的离散论域分别为
(1)
式中:ui(i=1,2,…,n)——影响量U论域中的离散控制点;vj(j=1,2,…,m)——效应量V论域中的离散控制点。
各变量的原始信息按照一定的扩散规律向论域的所有控制点扩散,然后将域内各点自身所得信息量叠加,形成原始信息矩阵。将原始信息矩阵做正规化处理后可以得到代表原始信息隶属度的模糊关系矩阵R。采用二维正态信息扩散的离散回归模型建立模糊关系矩阵[12]。假设:
(2)
式中:p——样本中数据个数。
则二维正态信息扩散离散回归方程为
(3)
其中
为了计算方便,对样本观测值进行预处理,即对h1和h2进行归一化,式(3)简化为
(4)
其中
1.2 模糊推理
对原始信息的权重分配计算完毕之后,开始计算论域各控制点的权重。对于效应量论域V={v1,v2,…,vm}和影响量论域U={u1,u2,…,un},设A、B分别为论域U、V上的模糊隶属度集,其模糊关系矩阵为R[13],则
(5)
式中:“·”——运算规则,目前常采用简单的矩阵乘法或Max-Min运算。
模糊推理的过程分为两级,一级模糊推理主要用来针对原始数据进行隶属度计算,得到效应量论域中各元素的影响权重B(1);二级模糊推理主要用来针对单影响因素的权重进行计算,得到最终的权重矩阵B(2)。
在进行一级模糊推理时,矩阵乘法或Max-Min运算适用于对原始信息模糊矩阵和评价量的诊断要求不高的情况。格贴近度可以用来表示模糊集的贴近程度,考虑到坝体监测数据随影响因素呈一定的规律性(正态)变化,本文采用格贴近度推理的方法计算隶属度集B:
(6)
式中:i′——矩阵B中数组的位数;j′——模糊推理的级别;f——矩阵R的列标。
首先进行一级模糊推理,形成二级模糊推理的模糊关系矩阵R(2)。一级推理的模糊关系矩阵R(1)已经由原始信息经过分配和正规化形成。原始信息在影响量论域U上的隶属度为A(1),考虑边界的情况下,A(1)可以采用如下方法求解[12]:
(7)
其中
Δ=ui+1-ui
式中:Δ——步距;ui——论域第i控制点值。
大坝监测效应量受多种因素影响,需要对每个影响因素的权重进行计算,即进行二级推理B(2)=A(2)·R(2),得到实测值的综合隶属度信息B(2),其中A(2)为单因素权重矩阵。考虑到蓄水期大坝安全监测数据样本少,具有灰色不确定性,因此采用灰色关联度法求解A(2)[14],灰色关联度μ的计算方式为
(8)
其中
(9)
求得分辨系数ρ后,根据式(9)计算关联系数。因为影响量和效应量量纲的不同,需要对关联系数矩阵作无量纲处理。
1.3 信息集中处理
求得综合隶属度信息Bi之后,通常采用的是“最大可能性判别准则”。一些非模糊的数据经过信息扩散后,变成了模糊信息。为了消除信息扩散带来的影响,同时也为了求取最佳预测值,需要利用信息集中公式进行处理[12]:
(10)
式中:δ——要求解的变量预测的增加值;B——Bj中第δj点的隶属度信息;ξ——常数,一般取2。
1.4 有效度计算
基于信息扩散理论的预测方法,采用了迭代计算,拟合效果对预测影响较大。因此,为了验证模型结果在各点的预测精度,采用离散情况下的综合有效度指标[16],综合考虑了拟合精度ε1和预测精度ε2,来判别模型预测的效果。综合有效度表达式如下:
(11)
式中:ε——综合有效度,取值范围[0,1];α——参数,一般取0.5。
假设预测模型在某点的预测精度为At,并且将其看作随机变量,则有效度函数就是在区间上对预测精度的积分。设[0,T0]为样本区间,[T0+1,T0+L]为预测区间,Q1(t)和Q2(t)为分别At的样本拟合值和预测值的密度函数,则拟合有效度ε1和预测有效度ε2可分别由式(12)和式(13)计算。
(12)
(13)
其中
(14)
式中:et——残差。
2 实 例 分 析
2.1 工程概况
为了研究信息扩散方法在大坝安全监测中的应用效果,取云南糯扎渡黏土心墙堆石坝心墙的蓄水期渗流为例进行分析。糯扎渡大坝位于中国云南省澜沧江上,最大坝高261.5m,坝顶长度627.87m,坝顶宽度18m,水库正常蓄水位812m。大坝于2008年11月开始填筑,2012年12月21日填筑到坝顶。
表1 模型拟合与预测时段划分
心墙渗流是糯扎渡大坝蓄水期监控的重点,受到上游蓄水和坝体填筑等多种不确定因素的影响,常规模型预测效果不尽人意,因此采用信息扩散方法进行计算。为了尽可能验证各蓄水阶段的预测效果,取主断面心墙626.1 m高程的DB-C-P-14~17渗压计测点为例进行计算。蓄水阶段划分见表1,测点所在的坝体主断面如图1所示。
2.2 蓄水2阶段预测
2.2.1 影响因素选择
大坝安全受众多因素影响,由于信息扩散方法基于的是隶属度概念,考虑的是影响因素与评价因素的相关性,因此可以引入除环境量之外的其他常规变量。根据定性分析,蓄水初期的心墙填筑高度与渗压计测值存在相关性,故将其列入备选因子进行筛选。
在传统相关性分析中,单纯的相关系数来确定影响因素,缺乏相关性的显著性检验和因素内部相关性的分析,会影响预报精度。Pearson相关要求变量间必须满足线性相关,变量需满足正态分布,因而也不适用。秩相关系数可以用来估计变量间的非线性相关性,且对变量分布没有要求,因此,在定性分析确定备选因子的基础上,采用秩相关系数中常用的Spearson相关系数r和Kendall秩相关系数τ来进行计算,对入选的影响因子进行相关分析,结果见表2。通过显著性检验,最终确定影响因子为上游水位W、时间t和心墙填筑高度HC。
图1 糯扎渡大坝C-C主断面示意图Fig. 1 C-C main section of Nuozhadu Dam
表2 各影响量和效应量间的秩相关系数
表3 评价因素和影响因素论域划分
2.2.2 形成模糊关系矩阵
计算过程以DB-C-P-14渗压计测点为例进行介绍。首先对样本数据进行预处理,利用3σ准则等剔除较大的突变值。为了使研究区域能尽量多的吸收样本信息,根据延长边界和信息集中处分段适度的原则,对DB-C-P-14测点的评价因素论域和影响因素的论域进行划分。根据测点的原始信息,评价因素V的范围为0~174 m,影响因素水位W的变化范围在605.0~665.8 m,心墙填筑高度HC的变化范围为587.8~759.1 m,时间t范围按年份计算为0.02~2.75,据此对评价因素和影响因素论域进行分段,结果见表3。对(W,V)、(HC,V)和(t,V)进行一级模糊推理。根据式(4),计算得到W-V,HC-V和t-V的原始信息矩阵,经过正规化,得到模糊关系矩阵R(1)(w,v),R(1)(HC,v)和R(1)(t,v)。
2.2.3 模糊推理和信息集中
在2.2.2节中,对论域进行分段时已经考虑了延长边界,所以满足了603 m≤W≤669 m,586 m≤HC≤760 m,0≤t≤2.75 a,为了预测2011年12月15日的水头,将样本序列代入,得到了2011年11月29日样本点的预测结果δ=33.98。
在得到29日预测值后,将其代入进行迭代计算,得到蓄水2阶段其他预测日期的效应量值。蓄水2阶段的预测效果对比见表4,统计模型的输入因子与信息扩散方法相同,对比可知信息扩散方法的预测相对误差小于统计模型和BP模型。
2.2.4 计算综合有效度
为了验证信息扩散方法的预测结果是否准确,对其综合有效度进行了计算。蓄水1阶段样本有181组数据,蓄水2阶段有15组预测数据,取样本拟合区间为[0,181],预测区间为[182,196]。对总共196组数据进行计算得到蓄水1阶段拟合精度ε1=0.992,蓄水2阶段的预测精度ε2=0.988,根据ε1和ε2计算得到蓄水2阶段的综合有效度为ε=0.5(ε1+ε2)=0.990,可见蓄水2阶段的预测效果较好。
2.3 蓄水3~6阶段预测
由于各蓄水阶段的监测样本大小不同,需要对各蓄水阶段进行预测。为了验证扩散信息方法的优势,将
计算结果与常规统计模型和BP网络模型进行了对比(图2、图3)。这里的常规统计模型采用逐步回归计算,输入因子与信息扩散方法相同,水位因子取到二次方。BP网络模型输入因子同前。
表4 蓄水2阶段典型日期效应量预测值对比
图2 相对残差对比Fig. 2 Comparison of relative residuals
图3 各蓄水阶段模型综合有效度对比Fig. 3 Comparison of comprehensive effectiveness of model in impoundment stages 2 through 6
由图2可知,信息扩散方法在蓄水2~6阶段的拟合相对误差低于常规统计模型和BP网络模型。信息扩散方法的相对误差范围在0.58%~1.16%,常规统计模型的相对误差在0.87%~2.74%,BP网络模型的相对误差在1.67%~2.58%。
由图3可见,在综合考虑样本拟合精度和预测精度的情况下,信息扩散方法的综合有效度基本位于0.98以上,优于常规统计模型和BP网络模型。
表5 蓄水2~6阶段测点DB-C-P-15~17综合有效度对比
注:DB-C-P-16测点在蓄水6阶段无实测数据,因此无有效度值。
2.4 其他测点预测
为了验证信息扩散方法的有效性,还需要对同高程的DB-C-P-15~17测点进行计算,得到的综合有效度见表5,DB-C-P-14~17的拟合过程线如图4所示。
从有效度来看,由高到低依次为信息扩散方法、统计模型、BP网络模型,由于蓄水2、4、6阶段水位处于上升期,导致水头变化比较大,因此有效度稍低是正常的。BP网络模型效果不佳的原因可能是因为训练样本较少,难以得到准确的拟合值。
从拟合过程线来看,信息扩散方法与实测值最为接近,3种方法模型的拟合值在水位上升期波动较大,这也与影响因素的不确定性变化有关,基本上真实反映了4个渗压计测点的水头变化情况。就精度来看,信息扩散方法优于统计模型和BP网络模型。
图4 模型拟合值对比Fig. 4 Comparison of fitted values of model
3 结 论
针对大坝安全监测资料小样本,效应量和影响因素关系知识不完备的情况,应用信息扩散理论,结合模糊推理方法,建立了基于信息扩散理论的大坝安全监测效应量预测模型。应用实例表明该模型是可行和有效的,其对序列突变区域的拟合更为合理。
a. 格贴近度推理和灰色关联度法清晰易用,能使更多影响大坝安全的因素真实地参与评价。
b. 应用综合有效度方法评价预测结果,兼顾了离散样本的拟合精度和预测精度,有助于充分利用样本信息来判断拟合和预测的效果。结果也证明,信息扩散方法的预测精度比常规统计模型和BP网络模型更高。
信息扩散方法在提高预测质量的同时,也存在几点不足:(a)因子间如果存在过高的互相关性,会导致隶属度函数的值过于贴近;(b)影响量和效应量论域的选取有赖于知识经验,暂时无法给出准确的识别条件和分割公式;(c)模糊推理的矩阵运算规则需要根据实际情形选取,格贴近度适用于样本满足规律性分布的情形,对于离散分布的样本需要选取其他精度更高的运算方式。这几点不足同时也是信息扩散方法未来改进的主要方向。
[1] 郑付刚, 游强强. 基于安全监测系统的大坝安全多层次模糊综合评判方法[J]. 河海大学学报(自然科学版), 2011, 39(4):407-414.(ZHENG Fugang, YOU Qiangqiang. Multi-level fuzzy comprehensive dam safety evaluation method based on dam safety monitoring systems[J]. Journal of Hohai University(Natural Sciences), 2011, 39(4):407-414.(in Chinese))
[2] 周晓贤. 大坝安全监控的灰色综合评价模型研究[D]. 南京:河海大学, 2001.
[3] SHI Huawang. Integration of unascertained method with neural networks and its application[J]. Journal of Networks, 2011, 6(11): 1631-1638.
[4] 李文君, 邱林, 陈晓楠, 等. 基于集对分析与可变模糊集的河流生态健康评价模型[J]. 水利学报, 2011, 42(7): 775-782.(LI Wenjun, QIU Lin, CHEN Xiaonan, et al. Assessment model for river ecology health based on Set Pair Analysis and Variable Fuzzy Set[J]. Journal of Hydraulic Engineering, 2011, 42(7):775-782.(in Chinese))
[5] LI Bo, SU Jingyu, MA Donghui, et al. The study on forecasting the surface rupture width under strong earthquake based on information diffusion methodology [J]. Natural Hazards, 2015, 75(2):1871-1882.
[6] FENG Lihua, HUANG Chongfu. A risk assessment model of water shortage based on information diffusion technology and its application in analyzing carrying capacity of water resources [J]. Water Resources Management, 2008, 22(5): 621-633.
[7] CHEN Junfei, JIN Qiongji, WANG Huimin, et al. A risk assessment model of flood based on information diffusion method and BP neural network [J]. Electrical Review, 2012, 9B:33-36.
[8] WU Meihua, CHEN Yaning, XU Changchun. Assessment of meteorological disasters based on information diffusion theory in Xinjiang, Northwest China [J]. Journal of Geographical Sciences, 2015, 25(1): 69-84.
[9] LI Qiong, ZHOU Jianzhong, LIU Donghan, et al. Research on flood risk analysis and evaluation method based on variable fuzzy sets and information diffusion [J]. Safety Science, 2012, 50(5): 1275-1283.
[10] 胡江, 苏怀智, 马福恒,等. MF-DFA在大坝安全监测序列分析和整体性态识别中的应用[J]. 水利水电科技进展, 2014, 34(3):50-55.(HU Jiang, SU Huaizhi, MA Fuheng, et al. The application of MF-DFA in time series analysis and global state recognition of dam safety monitoring[J]. Advances in Science & Technology of Water Resources, 2014, 34(3):50-55.(in Chinese))
[11] 龚晓雯, 范磊. 非线性分位点回归方法在大坝安全监测中的应用[J]. 河海大学学报(自然科学版), 2011, 39(1):99-103.(GONG Xiaowen, FAN Lei. Application of nonlinear quantile regression in dam safety monitoring[J]. Journal of Hohai University(Natural Sciences), 2011, 39(1):99-103.(in Chinese))
[12] 黄崇福, 王家鼎. 模糊信息优化处理技术及其应用[M]. 北京:北京航空航天大学出版社, 1995.
[13] 陈红梅. 混凝土坝裂缝性态分析评价方法研究[D]. 南京:河海大学, 2008.
[14] 邓聚龙. 灰理论基础[M]. 武汉:华中科技大学出版社, 2002.
[15] 吕锋. 灰色系统关联度之分辨系数的研究[J]. 系统工程理论与实践, 1997, 17(6):49-54.(LYU Feng. Research on the identification coefficient of relational grade for grey system[J]. Systems Engineering Theory & Practice, 1997, 17(6):49-54.(in Chinese))
[16] 王明涛, 李文华. 预测方法有效度指标的估计方法探讨[J]. 统计与预测, 1998(2):31-34.(WANG Mingtao, LI Wenhua. The discussion on the methods of estimating of effective index for forecasting [J]. Statistics and Forecasting, 1998(2):31-34(in Chinese))
Application of information diffusion approach to effect quantity prediction in dam monitoring
LI Xiaoqi1, 2, ZHENG Dongjian1,2, CAO Lianpeng3, CAO Qiguang4
(1.StateKeyLaboratoryofHydrology-WaterResourcesandHydraulicEngineering,HohaiUniversity,Nanjing210098,China;2.NationalEngineeringResearchCenterofWaterResourcesEfficientUtilizationandEngineeringSafety,HohaiUniversity,Nanjing210098,China;3.WeifangWaterConservancyandArchitectureDesignInstitute,Weifang261205,China;4.SinosteelMaanshanInstituteofMiningResearchCo.,Ltd.,Maanshan243000,China)
In order to solve the problem of large errors in effect quantity prediction caused by small samples in dam safety monitoring, a new approach for prediction of effect quantity, through increasing sample information, was established based on discrete and regression analysis of two-dimensional normal information diffusion. The effect quantity of dam safety monitoring was analyzed and predicted using the basic theory of fuzzy reasoning and information concentration, as well as the grey correlation degree method. The comprehensive effectiveness index was used to evaluate the effect of the information diffusion approach. The results show that the information diffusion approach avoids the difficulties in effect quantity prediction using small samples under the influence of some uncertain factors, and improves the fitting and forecast accuracies.
information diffusion; dam monitoring; effect quantity prediction; fuzzy reasoning; comprehensive effectiveness
10.3876/j.issn.1000-1980.2016.06.011
2016-03-05
国家自然科学基金(51279052,51579085)
李小奇(1986—),男,山东青州人,博士研究生,主要从事大坝安全监控及健康诊断研究。 E-mail:lxq0920@gmail.com
TV64;TV698
A
1000-1980(2016)06-0536-08