基于主成分分析与BP神经网络相融合的云南砖木结构房屋地震破坏评估方法
2023-07-21徐俊祖曹彦波李黎张方浩徐小坤赵正贤
徐俊祖 曹彦波 李黎 张方浩 徐小坤 赵正贤
摘要:针对如何选取合适的影响因素进行砖木结构房屋地震破坏合理评估的问题,提出了一种基于主成分分析与BP神经网络相融合的云南砖木结构房屋地震破坏评估方法,通过灰色关联度模型剔除对砖木结构房屋发生地震破坏影响较小的因素得到关键因子,采用主成分分析法从关键因子中提取主要成分,最后利用BP神经网络模型对处理后的主要成分进行训练,建立砖木结构房屋地震破坏比例预测模型,并利用实际震例进行验证。结果表明:本文方法相较于传统脆弱性曲线拟合方法和BP神经网络模型,其预测的砖木结构房屋地震破坏比例的预测精度更高、普适性更好。
关键词:主成分分析;神经网络模型;砖木房屋;地震破坏评估;云南
中图分类号:P315.94文献标识码:A文章编号:1000-0666(2023)03-0430-10
doi:10.20015/j.cnki.ISSN1000-0666.2023.0058
0引言
以往震害经验表明,地震灾害主要源于地震释放的巨大能量引发的建筑物和各类设施的破坏以及次生灾害,进而导致人员伤亡和财产损失(侯林锋等,2020)。当前,应对地震灾害的主要措施是震前预测预防和震后应急,然而由于人们对地震的短临预报能力有限,地震后快速高效的应急救援、灾情信息的迅速获取成为减轻地震灾害损失的主要手段(张雪华,2017)。地震时建筑物倒塌是造成人员伤亡的主要原因(刘晶晶等,2017),震后高效准确地开展建筑物受损程度评估工作有助于震后搜救资源分配,加快灾后救援进程,减轻地震灾害损失,降低人员伤亡,对震后灾情分析与应急救援决策具有重要的指导意义。
目前,应用于建筑物地震破壞群体评估的方法大致可分为3种:基于历史灾情数据的统计分析法、基于地震动参数的震害模拟分析法和基于机器学习的评估方法。其中基于历史灾情数据的统计分析法因易于操作,可快速评估预测地震灾害影响等优点,得到了广泛应用。孙柏涛和张桂欣(2012)通过收集汶川地震实际灾情数据获得了各类房屋结构的破坏情况,统计分析了各类结构在不同地震烈度区的破坏比例;刘毅等(2011)以历史地震灾情数据为依据,建立了砖木等4类房屋在不同地震等级的震害破坏率模型;臧石磊等(2019)基于辽宁省房屋建筑数据,采用模糊综合评价法计算分析得到地震易损性矩阵;赵东升等(2022)基于历史灾情数据,利用数据拟合方法构建了房屋脆弱性曲线,对不同地震等级下的房屋毁坏比例进行预测,为不同尺度地震灾害建筑物风险评估提供了参考与支撑;黄文涛等(2022)从川南历史地震建筑物震害相关资料中,提取并统计了4类建筑物破坏比,得到各类结构的经验易损性矩阵及易损性曲线。虽然基于历史灾情数据的统计分析法能直接反映地震对建筑物造成的破坏程度,但在实际应用中也存在一定局限性。由于影响建筑物发生地震破坏的因素众多,如何选择相应因素进行分析是一个关键问题,仅仅选取单一的因素构建易损性矩阵或拟合易损性曲线、脆弱性曲线并不能全面地反映建筑物的破坏状态,难以对建筑物受灾程度进行准确预测评估。
随着计算机技术的快速发展,建筑物三维震害模拟方法被逐步应用于建筑物地震破坏评估中,如杜浩国等(2019)采用无人机航拍技术、地理空间信息和三维仿真建模技术对云南省红河县城区房屋进行地震灾害三维仿真模拟评估,得到了不同烈度下城区房屋的破坏程度和分布情况;张灿等(2022)采用结构弹塑性时程分析方法对兰州市城关区建筑物进行三维震害模拟,得到了不同烈度下建筑物的破坏程度及不同破坏程度的面积占比。虽然有关建筑物震害模拟的研究已经相对成熟,但大多是通过设定固定的地震加速度值或地震烈度来模拟建筑物的破坏情况,未曾考虑到同一地震所产生的地震动参数分布是不同的,且受地理环境等因素影响,难以保证震害模拟的准确性和普适性。
近年来,随着机器学习技术的兴起,许多学者利用机器学习方法强大的自学习能力对建筑物进行地震破坏评估,如成小平等(2000)提出了一种基于神经网络模型的房屋震害易损性估计方法,选取了楼层数等10个影响房屋结构抗震性能的指标作为神经网络模型的输入,以建筑物在某一烈度下破坏状况的概率为输出,并以唐山大地震中的实际震例为样本构建了震害易损性矩阵进行建筑物易损性估计;金赟赟和李杰(2020)选择设防烈度、结构类型等9个抗震性能影响因子作为模型输入,将房屋破坏等级作为输出,利用基于易损性贝叶斯网络方法对上海市浦东地区的部分砌体房屋进行了地震易损性评估;施唯和王东明(2022)利用BP神经网络模型对北京市海淀区部分砌体结构房屋在不同地震烈度下的破坏状态进行推演预测。虽然机器学习方法在建筑物地震破坏评估中被广泛应用,但仍然存在一些问题,首先因造成房屋发生地震破坏的因素众多,除了房屋本身的抗震性能因素外还有地震动破坏性等因素,应综合考虑以上因素;其次对于神经网络模型来说,合适的输入因素是保证模型优越性能的关键,输入因素过多将会增加模型的复杂程度,输入因素过少又无法保证模型精度,因此输入因素应该尽量简洁而又能充分表达输入输出之间的映射关系。
基于以上分析,本文提出了一种基于主成分分析与BP神经网络相融合的砖木房屋地震破坏群体评估方法,通过灰色关联度(GRA)模型剔除对建筑物发生地震破坏影响较小的因素得到关键因子,采用主成分分析法(PCA)从关键因子中提取出主要成分,最后利用BP神经网络模型对处理后的主要成分进行训练,建立砖木结构房屋地震破坏比预测模型,并利用云南实际震例验证了本方法的有效性和适用性。
1数据与方法
1.1数据来源
云南省地质构造复杂,是一个地震灾害频发,受灾严重,损失巨大的省份(周光全等,2006),同时也是全国少数民族最多的省份,由于其多民族聚居的特点致使其民居建筑物结构类型呈现出多元化和地域化,但砖木结构房屋结构类型大体上相类似。本文选取2000—2022年云南省47次5.0级以上破坏性地震为研究对象,数据包含发震时间、震级、震源深度、烈度、房屋破坏比等,主要来源于云南省地震局2000—2022年地震灾害损失评估报告和地震灾害风险普查专题任务三——“地震灾害事件调查”,同时参考了《云南地震灾害损失评估及研究(1992—2010)》(周光全,2012)等资料。
本文主要对云南砖木结构房屋地震破坏进行评估研究,砖木结构房屋破坏等级可分为基本完好、破坏和毁坏3个等级。其中,破坏指砖木结构房屋的非承重构件如围护墙体明显裂缝或严重开裂、甚至局部垮塌,普遍梭瓦或明显掉瓦,可修理后使用。破坏比是指每一种结构的破坏面积在该类结构总面积中所占比例(施伟华等,2011)。本文基于相关研究(黄佩蒂,2018;张方浩等,2020;钟江荣,2021;杨钦杰等,2021),综合发震时间(S1)、震级(S2)、震源深度(S3)、地震烈度(S4)、房屋造价(S5)、人均GDP(S6)、受灾面积(S7)、经济损失(S8)、震中经度(S9)和纬度(S10)共10个影响因子作为砖木结构房屋地震破坏(破坏比(S11))的初始评估因子,其中发震时间(S1)选择发震年份主要是考虑到该参数与砖木结构房屋数量占比有一定关联,受灾面积(S7)指的是相应烈度区面积,而经济损失(S8)指的是整个灾区的经济损失。本文选择2000—2020年的42次5.0级以上地震数据共90组作为初始训练样本(表1),2021、2022年的5次5.0级以上地震数据共8组作为测试样本(表2)以验证评估模型的准确性。
1.2研究方法
1.2.1灰色关联度
灰色关联度分析(GreyRelationAnalysis,GRA)是一种多因素统计分析方法,被广泛应用于评价指标的权重计算(Tien,2017;蒋复量等,2020)。其原理为:通过关联度来描述两个事物的相关程度,相关程度越高,两者间的变化趋势越相近,反之亦然,这种变化趋势主要通过两者的序列曲线相似度来呈现。其计算步骤如下(贾婧等,2020):
1.2.3BP神经网络
BP神经网络是一种误差逆向传播的多层前馈神经网络,是目前应用最广泛的神经网络之一。神经网络作为一种智能信息处理手段,它不需要事先确定输入向量与输出向量之间繁杂的映射关系,而是通过自身的训练不断地调整权值和阈值使模型预测值接近期望值(Xuetal,2019)。当BP神经网络模型充分学习了这种复杂的非线性映射关系后,就能够处理具有相似信息的样本,达到有效预测的目的,因此BP神经网络模型被广泛应用于房屋震害预测领域(汤皓,陈国兴,2006;施唯,王东明,2022)。
1.3技术路线
根据上述理论分析,本文提出了基于主成分分析与神经网络相融合的云南砖木结构房屋地震破坏评估方法,其技术路线如图1所示。
从图1可见,本文方法首先对建筑物地震破坏的初始因子进行分析求其灰色关联度,根据灰色关联度剔除对砖木结构房屋地震破坏性影响较小的评价指标,得到关键因子;其次对关键因子进行主成分分析,在减少因子数量的同时保留主要影响因素,提取出主要成分;最后将主成分作为BP神经网络模型输入进行训练,建立砖木结构房屋地震破坏比预测评估模型。
2研究结果
2.1评价指标处理
造成砖木结构房屋地震破坏的因素很多,选取合适的影响因素是对砖木结构房屋地震破坏进行准确合理评估的重要保障。为了筛选出与砖木结构房屋破坏比相关程度较高的影响因子,本文采用灰色关联度模型对表1中破坏比与影响因子的相关程度进行分析,求得各因子之间的灰色关联度矩阵,如图2所示。
将各因子的灰色关联度做降序排列,排列结果如图3所示。图中关联度曲线在震级(S2)处出现了突变,这意味着相比于S2之前的因子,S2之后的因子关联度要小的多,此时以突变点作为阈值既能够有效剔除与砖木结构房屋破坏比相关程度较小的影响因子,又不损失样本中过多的数据信息,故选取关联度≥0.7的地震烈度(S4)、人均GDP(S6)、经济损失(S8)、震源深度(S3)、房屋造价(S5)、受灾面积(S7)、发震时间(S1)、震级(S2)共8个影响因子作为关键因子。
2.2关键因子的主成分分析
由于灰色关联度分析仅完成了影响因子的约简,对于影响因子间存在的重叠信息未进行有效处理,因此有必要对这些关键因子进行主成分分析,通过对关键因子进行降维处理,提取各因子所包含的特征信息形成一组线性无关的主成分,降低后续BP神经网络模型的建立难度和复杂程度。对8个关键因子进行主成分分析,计算各主成分贡献率和累计贡献率(表3),并确定主成分个数,最后计算出各因子得分系数(图4),确定各主成分表达式。
由表3可知,主成分F5~F8的特征值相对较小且其贡献率也相对较低,而F1~F4特征值和贡献率较高且累计贡献率为87.9%,大于85%,故采用能够反映关键因子集中所包含的信息的前4个主成分,代替关键因子。
由图4可见,主成分F1中主要体现了关键指标发震时间(S1)、房屋造价(S5)、人均GDP(S6)的影响,而F2主要体现震级(S2)、地震烈度(S4)、经济损失(S8)的影响,同理,主成分F3体现了地震烈度(S4)和受灾面积(S7)的影响,F4体现了震源深度(S3)的影响,将矩阵中的得分系数与关键因子进行线性组合:
2.3砖木结构房屋破坏比预测
将得到的4个主成分作为BP神经网络模型输入变量,砖木结构房屋地震破坏比作为输出变量,故BP神经网络输入节点为4,输出节点为1。本文使用刘育林等(2022)的经验公式n=n0+ni+a,其中n0表示输出节点数;ni为输入节点数;a为1~10之间的常数,结合试凑法确定隐含层最优解节点数为12,最终预测模型网络结构为(4,12,1)型,如图5所示。
采用本文方法、磚木结构房屋地震破坏脆弱性拟合曲线(图6)以及BP神经网络模型分别对2021年漾濞6.4级、盈江5.0级、双柏5.1级、2022年宁蒗5.5级以及红河5.0级地震时砖木结构房屋破坏比进行预测(图7),并对预测结果进行对比分析。为了更好地评价模型的有效性和普适性,运用均方根误差(RMSE)、决定系数(R2)、均方相对误差(MSRE)以及平均绝对误差(MAE)对模型预测结果进行误差分析,结果见表4。
綜合图7和表4可以看出,3种方法得到的砖木结构房屋破坏比的预测结果整体上与实际调查结果趋势一致,且本文方法的预测结果与实际调查结果更加吻合,普适性较好,精度较高。但本文方法对宁蒗地震Ⅶ度区砖木结构房屋破坏比的预测结果与实际调查结果误差较大,其原因主要为震中为农村地区,砖木结构房屋较为老旧,抗震性能较差的房屋占比较高,导致破坏比例较高,而本文预测模型未考虑到这一因素,导致预测房屋破坏比例与实际情况存在较大误差。图6通过对样本数据的Logistic函数拟合得到了砖木结构房屋的脆弱性曲线,从而得出不同烈度下的房屋破坏比,但该方法仅考虑地震烈度单一因素的影响,而房屋在不同烈度下的破坏比是固定的,故图7中房屋脆弱性曲线拟合的预测结果与真实调查结果吻合程度最低,普适性最差、预测精度低。传统的BP神经网络未对影响因子进行处理,预测结果主要受训练样本的影响,在训练样本中烈度为Ⅵ度的样本数量为42,Ⅶ度为34,Ⅷ度为14,故对Ⅷ度烈度区的预测结果误差较大,对比不同地震的Ⅶ度和Ⅵ度区预测结果基本相同,普适性较差。综上得出,本文方法对砖木结构房屋地震破坏比预测的普适性最优,传统的BP神经网络模型其次,脆弱性曲线拟合方法最差。
3结论
本文以2000—2022年云南省47次5.0级以上破坏性地震为研究对象,提出一种基于主成分分析与BP神经网络相融合的云南砖木结构房屋地震破坏评估方法。采用砖木结构房屋脆弱性曲线拟合、BP神经网络以及主成分分析与BP神经网络相融合3种方法对云南5次5.0级以上地震中砖木结构房屋地震破坏比例进行对比预测评估,得出以下主要结论:
(1)本文方法通过灰色关联度(GRA)模型进行因子约简,确定了与砖木结构房屋地震破坏比例相关程度较高的8个关键因子,并采用主成分分析法(PCA)对8个关键因子进行主成分分析,消除了关键因子间的重叠信息,提取出主要成分,并将主成分作为BP神经网络模型的输入,进行砖木房屋破坏比预测,获得了优于其它2种方法的砖木结构房屋地震破坏比例的预测精度和普适性。
(2)对2021年以来的震例验证表明,本文方法通过对砖木结构房屋地震破坏影响因素的综合考量和处理,有效提升了砖木结构房屋地震破坏比预测精度,且具有更好的适用性,为云南砖木结构房屋地震破坏评估提供了一种新的思路和方法。
参考文献:
成小平,胡聿贤,帅向华.2000.基于神经网络模型的房屋震害易损性估计方法[J].自然灾害学报,9(2):68-73.
杜浩国,余庆坤,陈亮,等.2019.云南红河县城区房屋地震灾害三维仿真模拟方法[J].地震研究,42(2):218-229.
侯林锋,徐超,石树中,等.2020.城市建筑群地震灾害风险评估技术探索及应用[J].华北地震科学,38(3):69-73.
胡进军,张辉,靳超越,等.2021.基于PCA及PSO智能算法的地震动合成方法——以中国西部中强地震为例[J].工程力学,38(3):159-168.
黄佩蒂.2018.境外地震人员伤亡影响因素研究[D].哈尔滨:中国地震局工程力学研究所.
黄文涛,熊永良,张莹,等.2022.川南地区民居建筑地震易损性研究[J].华北地震科学,40(4):40-49.
贾婧,窦圣宇,范国玺,等.2020.基于熵权法和灰色关联分析法的海岛地震应急能力评价研究[J].世界地震工程,36(3):233-241.
蒋复量,吴浩楠,刘永,等.2020.基于灰色关联度和变权理论的地震条件下铀尾矿库群坝安全评价研究[J].南华大学学报:自然科学版,34(1):22-28.
金赟赟,李杰.2020.基于易损性贝叶斯网络的群体建筑快速震害预测[J].自然灾害学报,29(5):64-72.
李桥,巨能攀,黄健,等.2020.基于主成分分析的PSO-ELMAdaboost算法耦合模型在极震区泥石流物源动储量计算中的应用[J].科学技术与工程,20(15):5961-5970.
刘晶晶,宁宝坤,吕瑞瑞,等.2017.震后典型建筑物倒塌分类及救援特点分析[J].震灾防御技术,12(1):220-229.
刘毅,吴绍洪,徐中春,等.2011.自然灾害风险评估与分级方法论探研——以山西省地震灾害风险为例[J].地理研究,30(2):195-208.
刘育林,周爱红,袁颖.2022.基于GRA-PCA-BP神经网络模型的单沟泥石流危险性预测[J].河北地质大学学报,45(4):44-51.
施唯,王东明.2022.基于BP神经网络的有限特征参数砌体结构震害等级推演[J].世界地震工程,38(2):160-168.
施伟华,陈坤华,杨树明,等.2011.盈江2011年MS5.8与2008年MS5.9地震的震害差异及原因[J].地震研究,34(4):518-524.
孙柏涛,张桂欣.2012.汶川8.0级地震中各类建筑结构地震易损性统计分析[J].土木工程学报,45(5):26-30.
汤皓,陈国兴.2006.基于灰关联与人工神经网络综合评价模型的多层砖房震害预测[J].世界地震工程,22(4):133-139.
王晨晖,袁颖,刘立申,等.2022.基于主成分分析法优化广义回归神经网络的地震震级预测[J].科学技术与工程,22(29):12733-12738.
杨钦杰,李蕾,梁结,等.2021.钦州市建筑物抗震性能普查及震害预测分析[J].华南地震,41(2):76-82.
臧石磊,冯石,李玉森,等.2019.基于模糊综合评判法的辽宁省老旧砌体房屋震害预测[J].地震研究,42(2):166-172.
张灿,陈文凯,林旭川.2022.基于地震动参数的城市建筑物震害模拟——以兰州市城关区为例[J].地震工程学报,44(1):172-182.
张方浩,卢永坤,邓树荣,等.2020.云南地区区域地震灾害特征[J].地震研究,43(1):134-143.
张雪华.2017.基于无人机影像的面向对象建筑物震害提取研究[D].哈尔滨:中国地震局地震预测研究所.
赵东升,靳京,吴绍洪.2022.区域地震灾害房屋脆弱性曲线构建研究[J].自然灾害学报,31(1):127-136.
钟江荣,张令心,沈俊凯.2021.基于震害资料的云南地区砌体结构易损性研究[J].华南地震,41(1):108-116.
周光全,非明伦,施伟华.2006.1992—2005年云南地震灾害损失与主要经济指标研究[J].地震研究,29(2):198-202.
周光全.2012.云南地震灾害损失评估及研究[M].昆明:云南科技出版社.
TienJM.2017.Bookreview:Greydataanalysis:Methods,modelsandapplications[J].TheJournalofGreySystem,29(1):151-152.
XuJ,ChenY,XieT,etal.2019.Predictionoftriaxialbehaviorofrecycledaggregateconcreteusingmultivariableregressionandartificialneuralnetworktechniques[J].ConstructionandBuildingMaterials,226(30):534-554.