基于神经网络的核电厂设备易损性分析1)
2022-08-26刘鸿泉陈少林孙晓颖吴绍恒
刘鸿泉 陈少林 , 孙晓颖 吴绍恒
* (南京航空航天大学航空学院,南京 211106)
† (中国地震局工程力学研究所,哈尔滨 150080)
** (中国核电工程有限公司,北京 100840)
引言
核电工程结构的安全运行能力是国家极度重视的设计环节,尤其是在地震等自然灾害作用下,各类设备的运行能力和核电厂的安全停堆能力是必须要考虑和量化的设计重点.经过多年的发展,概率地震风险评价PSRA 已经成为核电工程结构评价地震安全性的主要分析方法之一,其中核电厂的堆芯失效率是在故障树和事件树分析中由易损性曲线和地震危险曲线卷积得到,结构和设备的易损性分析是其中至关重要的一环.在SPRA 理论框架中,地震易损性曲线定义为结构或者设备在给定的地震动强度指标下的条件失效概率,需要通过对结构和土层材料特性以及地震动的不确定性进行量化和传播,对结构的抗震性能做出真实估计.
计算易损性曲线有多种可行的方法,Kennedy等[1-2]根据已存在的核电设计结构,提出了基于性能的安全系数法,该方法运用对数正态分布模型进行易损性分析,无需重复多次耗时的数值模拟,但是该方法依赖于经验数据和专家判断,具有较大的不确定性.通过精细化数值计算可以大大减小结果的不确定性,Cornell 等[3-4]基于数值模拟提出了IDA 增量法,通过调幅一系列地震动直至结构破坏或设备失效来确定易损性曲线,该方法需要进行大量重复数值计算,通常应用在一般建筑的易损性评估中,应用在核工程上比较少.为了减少数值模拟次数,一些基于参数模型的易损性分析方法被提出来,具有代表性的有最大似然函数法[5-6]和对数空间内的线性回归法[7-8],这两种方法不用调幅地震动到结构失效破坏,更多的应用于核工程结构的易损性分析中.
美国规范ASCE4-16[9]中指出当核电厂地基不是硬基岩时,评估其地震危险性需要考虑土-结相互作用,同时应该从概率的角度进行评估.这需要同时考虑结构和土层材料特性的不确定性,即使采用拉丁立方采样降低样本数量,巨大的土-结模型也会带来昂贵的计算代价.一种有效的降低计算成本的方法是建立一个元模型来表达地震输入与结构输出之间的统计关系.众多学者基于元模型的思想展开了易损性分析的研究工作,产生了不同的建立元模型的方法.Unnikrishnan 等[10]采用高维模型表达HDMR 的响应面法计算了钢筋混凝土框架结构的易损性曲线,极大提高计算效率;Mangalathu 等[11]利用不同的回归手段,确定出了对桥梁构件的抗震需求参数影响最大的不确定变量,并对比发现Lasso回归法是最有效的回归手段;Calabrese 和Lai 等[12]采用神经网络模型模拟地震动输入与砖砌码头设施预期性能之间的非线性关系,并基于此非线性模型采用蒙特卡洛法计算了易损性曲线.这些元模型构建方法都从提高计算效率的角度出发计算易损性曲线,大多没有对地震动特征代表值进行系统性的选择,同时缺乏对元模型的预测不确定性的量化评估.Wang 等[13-14]基于神经网络建立了神经元模型AAN(artificial neural network)模型,对地震动特征选择以及元模型的不确定性量化进行了相关研究,但是在易损性曲线中仅仅凸显了地震动的随机性,没有考虑土层材料的不确定性.
本文考虑结构和土层材料的不确定性,基于拉丁立方采样建立了土-结三维有限元模型,采用高效的分区计算方法进行核电结构土-结相互作用分析,利用有限的SSI (soil-structure interaction)分析结果建立神经元模型代替有限元模型FEM,并对神经网络预测值的不确定性做了量化分析,最后基于神经网络的预测值进行了设备的易损性分析.
1 数值模拟流程
基于数值模拟的设备易损性分析依赖于大量随机模型的准确数值模拟,该过程需要提供足够的模拟结果以提高易损性曲线的精确度.本文采用拉丁立方采样[15]建立随机有限元模型,使用高效SSI 分析方法进行结构的地震响应分析,并对计算结果进行后处理得到所需数据,用于设备易损性曲线的计算.有限元模拟的具体步骤如图1 (a)所示.
图1 (a)工作流程图和 (b)SSI 分析方法Fig.1 (a)Work flow of FEM and (b)SSI analysis method
(1)选取基岩表面强震运动.该步骤一般依据结构的目标设计反应谱进行,其目的是体现结构的极限能力,尽可能让设备达到失效状态,同时便于和地震危险性分析相结合,进行下一步的风险评估.本文依据规范ASCE 43-05[16]推荐的一致危险谱选取强震记录,同时提取地震动特征值进行易损性分析.
(2)建立地震动-结构-土层系统的随机模型.选取结构和土层材料的主要随机变量采用拉丁立方采样,将生成的结构-土层样本与地震动样本随机组合形成地震动-结构-土层随机模型,可大大减少计算样本数目.
(3)采用等效线性化方法ELM 考虑土层的非线性效应.本文采用SHAKE91[17]进行一维土柱的等效线性化,迭代生成与地震动强度水平相匹配的土层模型.
(4)采用等效线性化后的土层参数计算自由场,作为SSI 分析的输入.
(5)进行核电工程结构的SSI 分析.本文采用一种高效的时域SSI 分析方法[18-21],如图1(b)所示,该方法基于显-隐式积分格式,采用分区并行算法减小计算规模,可显著提高计算效率.其中人工边界选用透射人工边界.
(6)对结构地震响应进行后处理得到地震需求参数.
2 易损性分析的理论及方法
工程中一般将关心的结构或设备响应以地震需求参数DM表示,而将结构遭受的实际地震动水平用一个主要地震动强度特征值IM0 表示,易损性曲线主要目的就是刻画IM0 和DM之间的概率相关关系.它给出了在指定的地震动水平下,结构或者设备的地震需求值超过其阈值的条件失效概率
式中,α 表示特定的地震动水平,y表示地震需求值,ycrit为结构或者设备的失效阈值.其中地震需求值y与地震动输入a(t)相关,同时受到结构和土层材料属性中可变因素vmat的影响.易损性分析的主要目标是确定IM0-DM的函数关系,同时量化其他可变因素带来的不确定性,本文简单介绍两种传统易损性曲线计算方法.
2.1 基于对数正态假定的回归法
对数线性回归法普遍应用于设备易损性曲线的计算,该方法假定结构的输入-输出关系满足对数线性回归模型,则可基于数值模拟或试验资料获得的数据 (α,y)进行线性回归
式中,b,c为回归参数,ε 为回归残差,服从的正态分布,βDM|IM可通过下式计算
2.2 基于MC 的增量分析法
基于MC 的增量分析法需要在相同的地震动水平 α 选取N条地震动进行结构的地震响应分析,同时考虑材料特性等不确定性因素,计算结构或设备的失效频率作为该地震水平下的条件失效概率
式中,函数 1[ycirt-yi(α)<0] 表示当括号中关系式成立时为1,反之为0.
MC 增量法没有指定IM0-DM的分布模型,相比回归法更能体现它们复杂的函数关系,适用于任何复杂的线性及非线性系统,但是需要大量的数值模拟来提高计算精度,一般应用于普通工程结构,对于核电厂等大型结构,会带来巨大的计算负担,因此该方法适合采用基于元模型的方法进行地震易损性分析.
3 基于神经网络的易损性曲线计算
由于回归法及MC 增量法都需要大量数值模拟结果作为支撑,若仍然采用地震时程a(t)求解DM值,计算过程将十分耗时,因此涌现了许多利用高效的元模型代替有限元模型的方法,其基本思路是:用多个地震动特征值代表实际地震动作为输入,基于已有试验数据或FEM 模拟数据,建立结构输入与输出的复杂函数模型.元模型的输出预测值可以表示为
结构的真实反应与预测值存在一定的误差
式中,IM0 为主要的地震动特征值;IMs 为其他对结构输出影响较大的地震动特征值;ε 为结构真实反应与预测值的误差,来源于对训练数据的欠拟合,反映了元模型不能充分体现物理模型的非线性关系,同时误差项还具有其他解释意义:(1)由于采用了地震动特征值代替地震动时程,并不能完全反映真实的随机地震动,一定程度上降低了地震动的随机性;(2)忽略了材料属性带来的可变影响,在模型建立过程中没有直接建立材料属性与输出结果的关系,而将其解释为地震动特征值的影响;(3)训练数据的不足导致建立的元模型存在一定的置信范围,尤其在训练数据较为稀疏处,模型的预测值缺乏与真实值的比较,具有较低的置信度.
ANN[22]具有其强大的学习能力,可以适应各种复杂的函数关系,同时ANN 模型的训练及预测过程比FEM 数值模拟过程高效得多,因此可以方便地将MC 增量法应用到核电设备的易损性分析中.基于ANN 的核电设备易损性分析没有像传统回归法一样进行参数模型假定,适用于任意复杂的线性或非线性工程结构系统,同时规避了MC 增量法中的大量数值模拟过程,极大地提高了计算效率,其主要步骤包含:(1)数据准备;(2)模型选择;(3)ANN 模型的训练及验证;(4)ANN 模型不确定性的量化;(5)基于ANN 模型计算易损性曲线.
3.1 数据准备
根据上文描述,训练ANN 模型需要获取结构的输入-输出数据(数据来源可以是实测的地震记录、振动台试验或精细化结构模型的数值模拟等).本文采用第1 节描述的数值模拟方法进行SSI 响应分析,并进行后处理获取所需数据.其中地震动特征值对ANN 模型的建立和易损性曲线的计算有很大影响,因此建议在选取地震动特征值时考虑以下几点:(1)输入特征值应尽量与地震需求参数相关,足以表达结构输入与输出之间的关系;(2)选取多个地震动特征值训练ANN 模型更能反映地震动特性,但是过多的地震动特征值又容易造成神经网络的过拟合,降低网络的计算效率和泛化能力,因此特征值的选取并不是越多越好.本文通过计算不同特征值的输入向量与输出向量之间的半偏相关系数[23]选择合适的特征值.
3.2 模型选择
理论上,一个三层的BP 网络可以完成任意M维到N维的非线性映射.由于在求解设备易损性曲线时,普遍假定系统的输入与输出近似服从对数线性回归模型,因此三层BP 神经网络足够模拟出结构的地震输入-输出函数关系,同时为了提高训练神经网络以及神经网络预测过程的效率,本文选择三层的BP 神经网络结构进行训练建立ANN 模型,网络结构如图2 所示.
图2 三层BP 网络示意图Fig.2 Schematic diagram of three-layer BP network
其中隐藏层的神经元数目(h)往往需要设计者结合经验经过多次试验确定,数目太少可能会引起网络的欠拟合,若数目太多又会增加训练时间,同时带来过度拟合的问题.本文采用10 折交叉检验进行验证,选择泛化能力最好、模型最稳定的h作为模型参数进行ANN 训练.
3.3 ANN 模型的训练及验证
BP 神经网络主要包含输入层、隐藏层和输出层,通过选择的激活函数及权重参数模拟输入与输出的非线性关系,具体学习算法包括两大过程:其一是输入信号的正向传播过程,其二是输出误差信号的反向传播过程.在神经网络训练过程中定义网络的误差函数为
式中,E(x;w)为误差函数,为ANN 模型预测值,它是输入变量x与参数向量w的函数,这里参数向量包含了神经元的权值向量和偏置向量.BP 学习算法的实质是求解网络误差函数的最小值,其方法是按误差函数的负梯度方向进行权系数修正,直到网络误差函数达到要求为止,其中误差函数关于参数变量的梯度向量可表示为
在建立ANN 模型过程中通常不将全部数据用来训练网络,而是将可用的数据分为三个部分.(1)训练集:用来训练神经网络,最小化误差函数,寻找最优的参数值;(2)验证集:监视训练过程,避免出现网络过拟合;(3)测试集:不用于神经网络训练过程,用来评价网络的泛化性能.ANN 模型的网络性能通过网络性能函数来量化,通常测试集的网络性能需要小于训练集的网络性能,保证神经网络具有一定的泛化能力.
3.4 ANN 模型不确定性的量化
经过训练往往并不能获得理想的神经网络参数模型,因此需要对训练得到的ANN 模型进行误差量化分析.对于给定的系统输入x与输出观测值y,假设ANN 网络的参数真值为w*,则神经网络预测值与观测值的误差ε 应服从正态分布N(0,σ2),观测值可用ANN 模型计算得到
通过训练网络,采用反向传播算法最小化误差性能函数,可确定出参数真值的估计值,如果利用此模型进行的预测值足够精确,则可以使用泰勒展开式得出以下关系式
其中,hi为神经网络预测值关于权重系数的梯度向量,则整个训练集的雅可比矩阵可以定义为
其中,雅可比矩阵J为p×N的矩阵,p为神经网络权重系数及偏置系数总数,N为训练集样本总数.由此神经网络模型的预测值和观测值的误差可以表示为
其中,εi=yi-f(xi;w*)表示真值参数模型与观测值的误差;代表由模型参数不准确引起的误差.经过论证[24-25],二者相互独立且都服从标准正态分布
其中
因此,神经网络计算误差的不确定性主要包含了以上两项,其中估计了FEM 模拟结果与ANN 预测值误差之间的不确定性,可采用神经网络残差方差的无偏估计来近似,它反映了元模型误差来源的第(1)项和第(2)项,本质上属于随机不确定性;估计了模型参数导致的不确定性,主要由于训练数据的不足所导致,反映了元模型误差来源的第(3)项,本质上属于认知不确定性,为易损性曲线提供了置信区间.
3.5 基于ANN 模型计算易损性曲线
若已知地震动特征值的分布模型及边际范围,则可生成随机的地震动特征值进行ANN 模拟,其输出值可作为DM进行设备易损性的计算,取代了高耗时的FEM 模拟过程,大大提高了计算效率.基于ANN 模型产生的输入-输出数据同样可以利用回归法或IDA 增量法进行设备易损性分析,在此过程中需要将ANN 模型的误差整合到易损性曲线中.
采用回归法进行分析时,需要量化回归模型的残差不确定性,此不确定性由地震动的随机性及材料特性的随机性导致,而ANN 输出值的不确定性含有相同的信息,因此设备易损性计算可根据式(5)改写为
采用MC 增量法进行易损性分析时,考虑ANN 模型的预测误差,可根据式(6)得到基于ANN 的增量法的易损性曲线计算式(21)以及其置信区间的计算式(22)
4 实例分析
4.1 地震动-土-结构样本
本文采用由文献[26]建立的核岛结构的精细化模型进行数值模拟,模型主要由辅助厂房(NAB)、屏蔽厂房(NSB)以及钢制安全壳(SCV)等构成,模型内部设备采用集中质量进行简化处理.根据核电模型规模,建立了三层水平成层的场地模型,总体尺寸为640 m×360 m×60 m,核电结构的基础假设为刚性,尺寸为90 m×60 m×16 m,核电及土体模型如图3 所示.
图3 土-结有限元模型Fig.3 FEM of soil-structure
以概率的角度进行设备的易损性分析应该考虑材料属性的不确定性,当随机变量过多时,采用简单随机抽样会造成样本数量过多的问题,为减小计算样本,本文采用有界的拉丁立方法进行抽样.考虑结构弹性模量以及土层剪切波速的变异性进行抽样建模,按照文献[27-28]建议,假设材料的分布类型为对数正态分布,根据其变异系数(C.V)对各随机变量在其95%的置信区间内进行拉丁立方采样(即随机变量分布范围为u±3σ),生成30 个结构-土体样本,并与随机地震动组合,产生30 个地震动-结构-土体样本,结构及土层材料属性见表1 及表2.
表1 核电材料不确定性Table 1 Uncertainties in material parameters of NPP
表2 土层材料不确定性Table 2 Uncertainties in material parameters of soil
4.2 设备极限能力
对于按照设计地震反应谱进行设计的核电厂,当发生设计地震动强度的地震时,一般认为内部设备具有95%的概率不破坏.因此对于缺乏设备极限能力值试验资料的情况下,可理想化地假定设备的极限能力为设计地震动强度下具有95%保证率不损坏的DM[29].选择满足设计地震动强度的地震波作为结构输入(不考虑SSI 效应),则可通过概率分析确定出目标设备的极限能力值.本文基于CPSHA 理论[30-32]求解核电场地的地震危险性曲线,结合规范ASCE 43-05,计算一致风险谱(URS)作为设计地震反应谱,根据URS 在PEER 数据库中选取了30 条实测强震记录作为输入,分析目标设备在设计地震水平下的概率响应,其中URS 和调幅后的地震动反应谱如图4 所示.
图4 URS 及地震反应谱Fig.4 URS and the spectra of strong motions
由于内部设备的频率主要集中在5~33 Hz,因此本文选取目标设备所在节点处5~33 Hz 的平均楼板加速度反应谱AFSA 作为地震需求参数.经过正态检验,结构的响应近似服从对数正态分布,经过统计分析,本文目标设备的极限能力值用AFSA 衡量为0.5 g.
4.3 神经网络模型建立及验证
4.3.1 数据准备
本文基于第1 节的数值模拟流程对生成的30 个地震动-土-结构样本进行SSI 分析,其中土层的等效线性化采用李小军论文[33]中提出的G/G0-γ和 λ-γ 非线性特性曲线进行,为了进一步提高计算效率,结构的材料本构选取为线性本构,这样整个系统就变成了线性系统,可以通过传递函数减少不必要的计算(对于结构的非线性效应,基于ANN 的易损性分析方法同样适用,事实上,ANN 在捕捉这些非线性因素时将更有优势).
对数值模拟结果进行后处理即可获取结构的输入-输出数据,其中结构的输出,即地震需求参数DM选取为设备所在位置处的平均楼板加速度反应谱(AFSA),和表征设备极限能力值的参数一致.而结构的输入(地震动特征值IMs)代表了结构遭受的地震动水平,对神经网络的训练影响较大,宜通过敏感性分析进行确定.本文初步选择表3 中的地震特征值作为候选,并采用文献[23]中的方法计算特征值与需求参数的相关系数及半偏相关系数.其中ASA与DM的半偏相关系数最大,选择为主要的地震动特征值IM0,其他影响比较大的地震动特征值有PGA,Tp,理论上和DM具有一定的相关关系,应该在ANN 模型建立过程中考虑它们的影响.为探究不同输入情况建立的ANN 模型对易损性曲线的影响,本文构建以下四种工况作为输入训练神经网络:
表3 地震动特征值Table 3 Seismic intensity measures
(1)Case1,以ASA作为输入;
(2)Case2,以ASA,PGA作为输入;
(3)Case3,以ASA,PGA,Tp作为输入;
(4)Case4,全部特征值作为输入.
在训练ANN 模型时,为避免过拟合,往往不将全部数据用于训练,因此本文将输入-输出数据按照8:1:1 的比例分为训练集、验证集、测试集,只将训练集用于训练ANN 模型.
4.3.2 神经网络模型参数确定
选用三层BP 神经网络最重要的参数是隐藏层的单元数目,采用10 折交叉检验进行模型验证,选择最佳的神经网络隐藏层单元数目,其中h的变化范围为1~8.分别以上面四种工况进行验证,各工况的误差箱型图如图5 所示,计算结果表明,无论是哪种工况,当h=1 时网络模型最稳定,因此本文选择h=1 进行ANN 训练.
图5 交叉验证Fig.5 Cross validation
经过交叉验证可以看出特征值的选择对网络稳定性具有一定的影响,过多的特征值输入未必使网络更加趋于稳定,也从另一方面说明了地震特征值选择的重要性.
4.3.3 ANN 模型的训练及其预测误差验证
本文以Case2 为例说明神经网络的建立过程,训练结果如图6(a)所示,其中蓝色为训练数据,绿色为验证数据,红色为测试数据,从总体看,神经网络反映了输入-输出之间的非线性关系,相比线性回归更加真实.网络的性能采用目标值与神经网络输出值的均方误差MSE 进行评估.该神经网络总性能为0.009 5,其中训练集的网络性能为0.011 1,验证集的网络性能为0.001 8,测试集的网络性能为0.004 5,测试集的误差性能指标小于训练集,证明了网络具有一定程度的精确性和泛化能力.
图6 Case2 工况下ANN 训练过程Fig.6 ANN training process under Case2 conditions
ANN 训练的结果需要量化其不确定性,其不确定性的来源在第3.4 节中论述过,主要包含了:(1)由地震动随机性以及材料不确定性引起的偶然不确定性;(2)由于训练样本不足而引起的认知不确定,分别由式(18)和式(19)计算得到.图6(b)为模型训练残差的分布图,其结果体现了模型训练残差的正态性,图6(c)为神经网络认知不确定性的计算值,从图中可以看出,当ANN 模型输入值集中在训练数据的边际范围附近时,认知不确定性具有较大值,这是由于FEM 的输入-输出数据在这个范围内比较稀缺所导致的.
为了进一步验证ANN 预测误差修正的合理性,训练好神经网络模型后,基于总数据量80%的训练数据,利用回归法分别建立了基于FEM 数据和基于ANN 预测数据的易损性曲线.如图7 所示,分别为Case1~Case4 这四种工况的目标设备易损性曲线,从图中可以看出以下两个规律.
图7 回归法计算易损性曲线Fig.7 Fragility curves by REG
(1)不进行修正时,基于ANN 的易损性曲线比基于FEM 的易损性曲线更加陡峭,意味着基于ANN 的易损性曲线具有更小的不确定性,这种现象随着选取地震动特征参数数目的增加而逐渐减弱.造成该现象的主要原因是神经网络在训练时为了防止过度拟合,控制了数据的离散性,使ANN 的预测值具有更小的不确定性,从而使易损性曲线更加陡峭.这个现象也可以从另一个角度解释:由于ANN训练过程中采用了有限的地震动特征参数代替地震动,会在一定程度上丧失地震动的随机性,从而减小了结构输入与输出的不确定性,使得易损性曲线更陡峭.从图中可以看出选取越多的地震动参数作为输入训练ANN 模型,计算的易损性曲线越接近FEM 计算结果,即训练的ANN 模型更加接近于FEM 模型.
(2)从理论上分析,若基于ANN 的易损性分析数据全部由训练样本生成,则修正ANN 模型误差后的易损性曲线应该和基于FEM 的易损性曲线一致.从图中可以看出,采用式(20)修正ANN 的易损性曲线后,其结果和FEM 的计算结果基本保持一致,与理论相符合,由此验证了本文对神经网络模型不确定性的量化方法的正确性.
4.4 易损性曲线计算
本文利用训练好的ANN 模型进行易损性曲线的计算,可快速生成计算数据,适合利用MC 增量法逐点计算失效概率,相较于FEM 法可大大提高计算效率,其具体计算过程如下.
(1)选取ASA特征值为主要特征值IM0,逐点生成计算点,本文根据设备抗震能力在[1.8,6.0]的变化区间内线性抽取了100 个ASA特征值作为计算点,逐点计算失效概率.
(2)生成其他特征值IMs 的随机数,代表地震动的随机性.本文根据其他特征值的分布类型(根据统计分析为对数正态分布)进行概率抽样,若其他特征值不止一个则采用拉丁立方抽样,随机组合成1000 个特征样本,即针对每一个IM0,生成1000 个IMs 样本计算设备的失效概率.由于未知特征值的边际分布,本文根据特征值的分布类型在其95%置信区间内进行采样,暂不考虑各特征值之间的相关系数.
(3)逐点计算核电设备在IM0 水平下的失效概率,根据式(18)和式(19)量化ANN 模型的不确定性,结合式(21)和式(22)计算易损性曲线.
4.4.1 不同输入特征值对结果的影响
为了探讨不同特征值作为输入对易损性曲线的影响,首先基于Case1~Case4 这四种输入工况训练了ANN 模型,然后基于ANN 模型的预测数据,分别采用回归法和MC 增量法计算设备易损性曲线.由4.3.3 节的验证过程可知:采用回归法计算时,基于ANN 的易损性曲线经过修正后和基于FEM 的易损性曲线保持一致,各工况所得易损性曲线相同(采用ANN 模型不会改变回归法中的对数线性回归结构),因此以回归法得到的曲线为基准对比不同工况下采用MC 法计算的曲线.对比结果如图8 所示,通过观察分析可以得到以下结论.
图8 不同输入下基于ANN 的易损性曲线Fig.8 Fragility curves based on ANN under different inputs
(1)易损性曲线形状与结构输入-输出关系模型息息相关,其中输入-输出模型会影响曲线的位置,输入-输出关系的不确定性会影响曲线的陡峭程度.对比不同输入工况下MC 法和回归法得到的易损性曲线,其差异性主要体现在曲线的陡峭程度上,代表了ANN 模型基本符合回归法中的对数回归模型,只是在预测结果的不确定性上有所不同,从而验证了回归法中对数线性回归模型假定的基本合理性.
(2)过多的地震动特征值输入(Case4)会导致建立的ANN 模型效果变差.其原因是建立ANN 模型时引入了太多与地震需求参数相关性不大的特征值,导致了ANN 模型的过度拟合,使结构输入-输出关系具有很大的不确定性,最终导致计算的易损性曲线过于平缓.
(3)关注各工况MC 增量法的置信区间,置信区间的大小由ANN 模型中的认知不确定性决定,主要来源自于样本的不足与缺失.Case1~Case3 输入工况下,当主要特征参数集中在极小或极大区域(0~2,5.5~6)附近时,置信曲线明显变宽,原因是这一段的采样特征值在训练数据库中比较稀疏.因此在训练ANN 模型前应该注意准备数据的宽度和密度,良好的数据宽度和密度有利于提高易损性曲线的可信度.
4.4.2 土层材料变异性对结果的影响
上节论述了不同地震动特征值作为输入对ANN 模型的影响,并未考虑材料不确定性的影响.材料的不确定性对FEM 计算结果也有一定程度的影响,因此将FEM 输入-输出关系仅由地震动特征值表示并不符合实际情况.本节在Case3 的输入变量中增加了土层材料的不确定性用于ANN 模型的建立,并将该工况定义为Case5,对比探讨了将材料不确定性作为ANN 输入对计算易损性曲线的影响.其中增加的具体输入值为相邻土层的波阻抗比
其中,αij为第i层和第j层土层的波阻抗比,ρ和c分别为各层的密度和波速.
采用MC 法时的采样过程仍然使用拉丁立方采样,计算结果如图9 所示.从图中可以看出增加了土层材料不确定性的影响后(Case5),计算的易损性曲线和Case3 工况下得到的易损性曲线差别不大.但是值得一提的是,引入材料不确定性因素的影响后,ANN 的预测结果在训练数据较稀疏处(如IM0 在区间[5.5,6.5])的置信度得到了提高,使得易损性曲线具有更高的可靠度.因此考虑材料的不确定性有一定的意义.
图9 不考虑土层材料不确定性(Case3)和考虑土层材料不确定性(Case5)的易损性曲线Fig.9 Fragility curves without considering soil material uncertainty(Case3)and considering soil material uncertainty (Case5)
5 结论
本文通过FEM 模拟结果建立ANN 模型,并基于ANN 模型进行设备易损性分析,探讨了以不同特征值作为输入训练ANN 模型对结果的影响以及土层材料不确定性对结果的影响,得出以下结论.
(1)地震动特征值的选择对ANN 模型训练以及易损性曲线计算有很大影响,过少的特征值会损失地震动一定的随机性,过多的特征值会造成模型过度拟合,使计算结果容易受到不相关因素的影响.
(2)利用MC 法验证了回归法中对数回归模型假定的基本合理性.
(3)土层材料的不确定性对易损性曲线计算影响不大,但是有助于改善ANN 模型预测值的置信度,提高易损性曲线的可靠度.
基于ANN 模型的易损性分析充分利用了FEM模拟结果,将MC 增量法应用于核电工程结构中,并尽可能地减少了计算样本,极大提高了计算效率,为发展重大工程结构的设备易损性分析提供了可能的方向.