经验知识监督的RC墩柱力学性能神经网络分析方法
2024-02-02刘振亮李素超赵存宝
刘振亮,李素超,赵存宝
(1.石家庄铁道大学安全工程与应急管理学院,河北石家庄 0 5 0 0 4 3;2.河北省大型结构健康诊断与控制重点实验室,河北石家庄 050043;3.哈尔滨工业大学(威海)土木工程系,山东威海 264209)
钢筋混凝土(RC)墩柱可以综合利用钢筋和混凝土的材料力学特性,是建筑、桥梁等现代结构的主要支撑构件。然而,灾后调查表明:在地震等自然灾害作用下墩柱容易受到损伤,这可能导致严重后果[1–2]。例如,1995年日本神户地震导致25%的桥梁墩柱完全损坏,严重阻碍震后抢险救灾和恢复重建工作的开展,直接经济损失达268亿美元[3]。为了确保结构安全,需要进行合理的抗震设计和分析,即能够快速准确地获得RC墩柱力学性能[4–5]。
国内外学者已经对RC墩柱性能进行了大量的试验和理论研究,并据此发展了许多力学性能计算公式,广泛应用于抗震设计和评估中。代旷宇等[6]对混凝土构件的试验数据进行了研究,提出了改进Ibarra–Medina–Kraw inkler材料模型的RC圆柱恢复力模型参数分析公式;吕西林等[7]对9根足尺高强混凝土柱模型进行了试验研究,分析了轴压比、箍筋形式等因素对位移延性的影响。然而,此类方法大多基于专家经验和少量试验数据,不同专家建立的公式所考虑的影响因素和关系并不一致。这种方法通常比较保守,具有较大的局限性[8–9]。
近年发展的机器学习方法是数据驱动的,具有强非线性学习能力,在许多领域取得了重要进展[10–11]。M iao等[12]采用卷积神经网络算法对RC构件的力学性能进行分析,并将其与传统的半经验模型进行对比,证明了该方法在构件性能预测方面的优势;Oreta等[13]建立了基于神经网络的RC梁尺寸效应分析方法,效果较好。但是,纯数据驱动的机器学习方法仍然存在可解释性差、理论基础薄弱、对训练样本数量和质量依赖性高等问题[14–15]。而RC墩柱试验成本高昂,不同学者所开展试验的研究对象、年代和设备均有所差异,常用的试验数据库包含的样本数量较少,且特征分布不均匀[16–17]。例如:美国太平洋工程地震研究中心(PEER)墩柱试验数据库包含292组矩形墩柱样本,其中仅有两个样本纵筋配筋率小于1%[18]。因此,粗略地将不同学者的试验数据收集到一起难以为机器学习方法提供足够可靠的训练数据。
基于以上问题,以机器学习算法为基础,将已有领域知识、训练规则及学习过程有效融合,建立一套适用范围更广、泛化性能更好、对训练数据要求更低的数学–物理融合方法体系,成为分析RC墩柱性能的迫切需求。近年来,嵌入领域知识的机器学习方法在解决纯数据驱动机器学习的“黑箱”缺陷方面取得了重大进展[19]。例如,Jin等[20]通过自微分技术将Navier–Stokes控制方程直接编码到卷积神经网络架构中,克服了不可压缩层流和湍流流动的限制;Zhang等[21]发展了动力学定律约束的损失函数建立方法,据此建立了能够准确预测建筑物在地震作用下时程响应的替代模型;Liu等[22]提出了将领域知识融入支持向量机训练过程的方法,建立了校准的RC墩柱集中塑性模型。然而,许多RC墩柱力学性能的规律是定性的,难以直接嵌入到机器学习框架中,而基于经验的公式本身存在较大的主观性,直接融入到机器学习中可能会出现误差。
综上,本文旨在解决基于经验的RC墩柱定性规律的数学表征和经验知识监督的神经网络(KGNN)训练两个问题。为此,本文首先建立了包含761组RC墩柱拟静力试验的标准数据库;然后,总结了RC墩柱力学特性的经验规律,并提出了数学表征方法;最后,建立了经验知识监督的神经网络模型,经过验证,该模型可以快速、准确评估RC墩柱力学特性。本研究将强化机器学习方法的理论基础,为促进数物融合方法在土木工程领域的创新应用奠定基础。
1 经验知识监督的神经网络
典型人工神经网络(ANN)模型主要由输入层、隐含层和输出层组成,每层包含多个与相邻层连接的神经元,通过网络连接和阈值建立输入与输出的映射关系[23–24]。ANN的学习过程是根据学习规则(如最速下降法)对模型输出与实际值之间的误差进行分析,不断调整网络各层之间连接权重和阈值,从而使网络的损失函数(如误差平方和)最小的过程[25]。因此,ANN算法可能训练出多个分析效果相似的模型。此外,纯数据驱动的ANN无法甄别数据中存在的误差,而且在训练样本误差存在不均匀分布的情况下可能致使训练模型过拟合。因此,纯数据驱动的ANN模型的性能并不是衡量墩柱性能分析模型有效性的唯一标准,还需要引入领域经验知识监督ANN训练过程。
根据机器学习模型架构和训练过程,领域知识可以通过5种方式与其融合:1)基于领域知识的模型预训练、初始化或正则化;2)明确部分或全部节点之间的物理或经验关系;3)根据领域知识限制搜索策略或连接权重范围;4)将领域知识融入损失函数;5)将理论或半经验模型融入ANN输入层和输出层。以上方法均需明确领域知识的数学表征,然而,由于钢筋和混凝土材料性能的复杂性,许多RC墩柱特征对其力学性能的经验影响规律是定性的,难以直接用数学公式定量表征。例如:RC墩柱承载力随纵筋配筋率的增大而增大,但具体数学表征公式往往基于根据专家经验作出的假设,存在一定的主观性偏差,无法直接嵌入ANN架构。
因此,本文提出了经验知识监督神经网络的KGNN方法,其主要架构如图1所示。该方法通过在损失函数之前引入经验知识监督层,来监督其训练过程。建立墩柱力学性能KGNN分析模型的过程主要包括3个部分。
1)试验数据与经验知识:通过对RC墩柱结构与加载条件等特征的分析确定其力学性能主要影响特征X i={Xij}(Xij为RC构件i的第j个特征),同时确定其力学特性Y i={Yik}(Yik为RC构件i的第k个力学特性参数);收集RC墩柱拟静力试验数据,并提取各样本的特征参数和力学性能参数,为KGNN模型训练提供数据支持;基于试验数据和公开发表的研究结果,总结经验知识,为KGNN模型训练提供领域知识支撑。本文提出采用偏微分形式表示输入特征参数与输出力学特性参数的关系,即∂Yik/∂Xij。
2)KGNN模型架构设计:将建立RC墩柱试验数据随机划分为训练集和测试集。为了克服特征参数单位不一致带来的误差,将X和Y标准化至[0,1]范围内。将X和Y分别作为KGNN的输入和输出:
式中,xij和yik分别为RC构件i的第j个特征标准值和第k个力学特性参数标准值,X j和Y k分别为所有RC构件第j个特征和第k个力学特性参数。根据经验确定潜在的最优隐含层架构(目前不存在确定的理论解析方法,本文通过比较确定最优隐含层神经元数量),同时确定神经网络激活函数O=f(x,w,q)(x,w,q分别为输入向量、权重向量和阈值)、预测值与试验值yik误差损失函数Loss(yik,)、误差传递函数和收敛条件(收敛误差和最大迭代次数)等。
此外,研究RC墩柱力学性能相关经验知识的数学表征方法,并分析KGNN模型预测的规律/∂Xij(为RC构件i的第k个力学特性参数预测值),据此建立经验知识一致性判断函数L(/∂X)(/∂X为所有预测值对输入X的偏导数,=),将其嵌入神经网络架构以监督其训练过程,从而筛选出符合经验知识的训练模型,且剔除不符合经验知识的模型,如下所示:
式中,Ns、m和n为样本数量、输入特征数量和输出特征数量,P(∂Yˆik/∂Xij)为基于经验知识的判断函数,计算方程如下所示:
式中, ∆ ( ∆>0)为输入参数增量。当KGNN模型预测规律与经验知识一致时,即∂Yik/∂Xij×/∂Xi j>0,且L(/∂X)=0,说明KGNN模型能够正确反映各参数影响,模型进入最优模型候选区;否则将其剔除。
3)模型训练与验证:将训练集数据输入到训练模型中反复训练不同架构的KGNN模型,将所有符合经验知识的模型收入最优模型优选区;并通过各模型的性能比较确定最优的模型。为了验证训练结果的有效性,本文采用均方根误差(E)与拟合系数(R2)来评估各模型的误差和拟合度:
式中,Ek为对第k个力学特性参数预测的均方根误差,为对第k个力学特性参数预测的拟合度,为所有样本的第k个力学特性参数平均值,Ns为数据集样本的数量。可以看出,Ek越小、越大,则模型预测结果越好。据此可确定最优模型架构及连接权重,得到RC墩柱力学性能KGNN分析模型。
2 RC墩柱特征与试验力学特性
常用RC墩柱拟静力试验如图2所示。RC墩柱的力学性能与其几何尺寸、材料特性、配筋状况和荷载情况等诸多因素相关,可以采用许多参数表示其影响。然而,考虑到神经网络模型的科学性和有效性,作为输入层的特征参数既要有较大的影响,也要方便收集。例如,采用截面边长(b和d)和剪跨比( λ)代表几何尺寸的影响;尽管保护层厚度对墩柱力学性能也有较大影响,但是实际工程中保护层厚度变化范围较小,多数试验样本的保护层厚度在20~30mm范围内,因此,不考虑为输入特征参数。参考相关文献确定特征参数[26],本文确定主要影响特征参数为:
式中,b和d分别为垂直和平行于往复水平力的截面尺寸, λ为剪跨比,、fyl和fyt分别为混凝土轴心抗压强度、纵筋和箍筋屈服强度, ρl和 ρsv分别为纵筋配筋率和箍筋体积配箍率,s为箍筋间距,nc为轴压比。
图2 RC墩柱拟静力试验示意图Fig.2 Schematic of quasi-static test of RC columns
RC墩柱力学特性的准确评估是基于性能的抗震设计和结构分析的基础。图3为RC墩柱的水平恢复力–变形滞回曲线及力学特性参数。由图3可以看出:在水平往复荷载作用下,RC墩柱首先保持弹性状态;到达屈服点之后刚度降低,进入塑性强化阶段;当恢复力超过峰值承载力之后进入下降阶段。
图3 滞回曲线与力学特性参数Fig.3 Hysteretic curves and mechanical parameters
各阶段的关键力学性能参数是力学性能分析的关键。本文提出KGNN方法预测墩柱关键力学性能值。考虑到在试验过程中正负方向的响应值会存在差异,取正负方向力学性能试验值的平均值作为墩柱真实性能,如下所示:
式中,Vy和Vmax分别为屈服恢复力和峰值承载力, ∆y、∆s和 ∆u分别为屈服位移、峰值承载力位移和极限位移。 ∆y取为图3中区域Ⅰ和Ⅱ面积相等(SⅠ=SⅡ)时构件的水平位移, ∆u取为当水平承载力V下降到0.8Vmax时构件的水平位移[27]。
3 经验知识及数学表征
各国学者对RC墩柱特征与其力学特性的关系进行了大量的试验、理论和数值模拟研究,得到了许多重要的规律。本文总结了近年来该领域的部分代表性结论[28],如下:
1)截面尺寸b和d、混凝土强度、纵筋强度fyl和配筋率 ρl对墩柱最大承载力Vmax有很大的正面影响,即∂Yik/∂Xij>0;
2)剪跨比 λ对水平承载力Vy和Vmax有影响,剪跨比增大会导致水平承载力降低,即∂Yik/∂Xij<0;
3)轴压比nc对RC墩柱变形能力Δy、Δs和Δu的影响很大,当轴压提高时,变形能力下降,即∂Yik/∂Xij<0;
4)箍筋配箍率 ρsv的提高可以改善截面承载力、变形能力和延性,即∂Yik/∂Xij>0;
5)混凝土强度fc′对墩柱水平变形能力有一定影响,变形能力下降,即相应的∂Yik/∂Xij<0。
根据以上经验知识可建立表征为∂Yik/∂Xij,在建立RC墩柱力学性能KGNN模型过程中可以将其用于监督训练过程。另有一些参数的影响为非单调的,例如:轴压比较小时,轴压比增加可以提高水平承载力;当轴压比较大时,轴压比增加会使水平承载力降低。此外,还有一些结论存在争议,如关于纵向钢筋对变形能力和延性的影响,部分学者认为纵筋配筋率和强度的增加会降低约束区混凝土极限压应变,从而降低其变形能力;但另一部分专家却提出了相反的结论。此类经验知识不在本文考虑范围内,在建立经验知识表征时,P(∂Yik/∂Xij)=0。
4 RC墩柱试验数据库
首先需要收集足够数量且可靠的RC墩柱拟静力试验数据建立数据库。将80%的样本随机划分为训练集,剩余20%样本用作测试集。本文收集和整理了公开的试验数据库和文献中的RC墩柱拟静力试验数据建立数据库,详见文献[26]。由于不同学者的研究目标不同,所开展试验的结构和技术细节均有所差异,为保证试验样本的质量,在收集试验样本时按如下要求进行严格筛选:
1)试件截面为实心矩形,不包含空心墩柱、异形柱等截面型式;
2)试验过程中只有恒定轴向荷载和往复水平荷载;
3)试验原始文献提供完整的试验特征介绍和试验结果;
4)试验构件只由钢筋和混凝土组成(不考虑水灰比、石子粒径等影响);
5)试验对象仅包括RC墩柱力学性能,不包括研究腐蚀、老化等效应的构件;
6)考虑到试验装置和边界条件的差异性,试验数据能够标准化为等效悬臂柱;
7)RC墩柱截面尺寸不小于300mm。
经过筛选,本文共收集到761组RC墩柱试验数据,每个墩柱样本由其墩柱特征X及其试验力学特性参数Y组成。数据库样本主要参数分布如图4所示。可以看出,本文收集到的数据中构件截面尺寸主要为0.30~0.60m,剪跨比分布范围主要为1.5~6.5,其他构件参数(如几何尺寸、材料强度等)分布也较为广泛,能够覆盖常见RC柱试验模型的参数范围。但是各参数分布并不均匀,例如,仅包含一组截面尺寸为2.0 m的构件。这使得基于该数据库的模型可能无法准确反映在部分工况下RC墩柱的性能,据此建立的模型可能缺乏泛化性能。进一步证明了发展KGNN方法的必要性。
图4 试验数据集中主要参数分布箱型图Fig.4 Boxplot of the main parameter distribution of test dataset
5 KGNN模型训练与验证
采用本文提出的KGNN方法、建立的试验数据库和经验知识表征方法,可以对RC墩柱力学性能进行分析,图5为建立KGNN模型的流程图。首先,将80%和20%的试验数据分别随机划分为训练集和测试集;随后,确定KGNN架构:输入层为10个RC墩柱特征X,输出层为力学特性Y,隐含神经元数量为8~30(经过比较不同隐含层神经元数量的模型性能选择最优隐含层神经元数量),激活函数为sigmoid函数,终止条件为最大循环次数104或误差容错10–3,学习率为0.15,动量因子为0.05,噪声为0.01;最后,用训练集数据和领域经验知识训练KGNN模型,并通过比较得到RC墩柱力学性能最优分析模型。这里通过采用K–折交叉验证方法以进一步保证模型的泛化性能,即将训练集数据随机分为K份(本文K取10),每次取1份作为验证集,将其他K–1份数据作为训练集,训练得到的模型都要经过筛选;之后,将与经验知识相符的模型划入最优模型候选区,并采用验证集数据进行循环验证;最后,采用测试集数据即可验证该KGNN模型。
RC墩柱主要力学特性包括承载力和变形能力,这些特性可以用于RC结构有限元模拟和抗震分析及设计。本节以峰值承载力Vmax和极限变形能力 ∆u为预测指标,验证本文提出的KGNN方法的有效性。该方法也可以无缝学习其他力学特性。为了比较本文方法与传统机器学习方法的有效性,本文采用常用的反向传播神经网络(BPNN)算法学习试验数据,建 立纯数据驱动的RC墩柱力学特性分析模型。
图5 RC墩柱力学性能KGNN模型训练过程Fig.5 Training procedure for KGNN model of mechanical property analysis of RC columns
5.1 承载力分析
经过比较不同隐含层神经元数量的模型性能,本文选择12为最优KGNN和BPNN隐含层神经元数量,建立RC墩柱峰值承载力KGNN和BPNN模型。图6为各模型在训练集和测试集上的预测结果与试验值比较。由图6可以看出,KGNN和BPNN模型在训练集和测试集数据样本分析中均取得了较可靠的分析结果,与试验结果吻合较好。其中,BPNN模型在训练集和测试集数据的分析指标E分别为0.106和0.070,R2分别为0.963和0.978;而KGNN模型在训练集和测试集数据上的分析指标E分别为0.110和0.108,R2分别为0.936和0.942。因此,仅以分析精度而言,BPNN模型分析结果比KGNN模型结果更为准确。
图6 V max模型预测与试验结果对比Fig.6 V max comparisons of predictive and test results
然而,BPNN模型和KGNN模型预测的输入参数对输出参数的影响却并不一致。以截面尺寸b(b=d)为例说明,图7为在其他参数确定时(ρl=2.0%,=420MPa, ρsv=2.0%,fyt=500MPa,=40MPa,λ=3.0),截面尺寸b对峰值承载力Vmax预测值的影响。由图7可以看出,BPNN模型中,RC墩柱峰值承载力预测值随截面尺寸的增大而先增大后减小,这与经验知识不符。根据领域经验知识,峰值承载力随截面尺寸增大而增大,这与KGNN模型预测结果一致。这是由于目前收集到的RC墩柱试验数据比较有限且构件离散性较大。纯数据驱动的BPNN方法仅会根据误差调整模型,该方法一般对于训练集特征范围内样本的预测精度较高,但较难准确反映训练集特征范围以外的参数对RC墩柱峰值承载力的影响;而KGNN方法在训练过程中会剔除与经验知识不符的模型,然后再比较各模型的准确性。因此,基于此方法建立的模型可以更准确地反映RC墩柱特性中蕴含的内在规律。
图7 截面尺寸b对峰值承载力V max影响分析Fig.7 Effect analysis of dimension b on V m ax
5.2 变形能力分析
采用本文提出的KGNN方法和传统的BPNN方法分别建立模型预测RC墩柱极限变形能力 ∆u。选择20作为最优隐含层神经元数量。图8为建立的KGNN和BPNN模型在训练集和测试集上的分析结果。BPNN模型在训练集和测试集数据上的分析指标E分别为0.145和0.168,R2分别为0.825和0.783;而KGNN模型在训练集和测试集数据上的分析指标E分别为0.153和0.178,R2分别为0.801和0.732。由图6和图8可以看出,与峰值承载力模型相比,建立的极限变形分析模型精确度较低。这是由于试验数据中RC墩柱变形能力较承载力存在更多的不确定因素,更加凸显了加入领域经验知识的必要。此外,依然可以看出KGNN和BPNN模型对训练集和测试集数据样本的分析较为准确,与试验结果吻合较好。仅以分析精度而言,BPNN模型分析结果比KGNN模型结果更为准确。
图8 Δu模型预测与试验结果对比Fig.8 Δu comparisons of predictive and test results
采用建立的BPNN和KGNN模型对截面尺寸为300mm×300mm的RC墩柱进行分析,研究各参数对RC墩柱极限变形能力的影响规律。结果表明,BPNN与KGNN对于各参数的影响分析结果并不完全一致。以体积配箍率ρsv为例,图9为在其他参数确定时(nc=0.2 , ρl= 2.0%,fyl= 420MPa,fyt=500MPa,fc′=40MPa,λ=3.0 ), ρsv对 ∆u的影响。BPNN模型中,RC墩柱极限变形能力 ∆u预测值随 ρsv的增加先增加后降低。这与经验规律并不一致,随着体积配箍率的增加,箍筋对于核心区混凝土的约束作用也会提高,RC墩柱的极限变形能力也应逐步增加[29–30],KGNN模型预测结果与实际规律一致。这是因为训练集中部分特征分布不均匀,纯数据驱动的BPNN模型在训练过程中会更多地倾向于与数据分布密集的特征区间结果相一致,而本文建立的KGNN模型可以克服该缺陷。
综上,本文建立的KGNN方法具有较强的泛化能力,可以准确分析RC墩柱承载力和变形能力,且各种参数对RC构件延性影响规律与经验知识相符。由于RC墩柱力学性能受到多参数的综合影响,采用本文提出的预测模型可以通过初期的分析结果来减少试验工况和降低试验成本,还可以研究各特征参数对其力学特性的影响,对RC墩柱的抗震设计和评估均有一定借鉴意义。
图9 体积配箍率 ρsv 对Δu的影响分析Fig.9 Effect analysis of stirrup ratio ρsv on Δu
6 结 论
本文针对RC墩柱力学性能提出了一种领域经验知识监督的神经网络方法,并利用试验数据和经验知识建立更为高效、准确、稳定的RC墩柱性能分析模型。通过收集与分析761组RC墩柱试验数据,建立了试验数据库,并确定了各特征参数及对RC墩柱性能的影响机理,为RC墩柱力学性能KGNN模型提供数据和经验知识支持。主要研究结论如下:
1)纯数据驱动的机器学习方法难以克服RC墩柱试验数据的误差和分布不均匀问题,即使在训练集和测试集均表现良好依然不能保证其泛化性能;
2)本文提出的经验知识表征方法可以方便地用于监督KGNN模型的训练过程,保证训练模型不仅具有较高的模拟精度,还能符合经验知识,克服神经网络过分依赖训练数据质量和数量的缺点;
3)本文建立的KGNN方法可以同时利用已获得的RC墩柱试验数据和经验知识,能够准确预测RC墩柱的力学性能,可为基于性能的结构抗震设计和评估提供更为科学的依据。
然而,由于所收集的试验数据参数的限制,本文在分析过程中对箍筋形式、钢筋直径等因素进行了简化考虑,在后续研究中仍需要对试验数据库进行丰富和完善,以提高KGNN模型的泛化性和准确性。