针对网级评估的区域桥梁信息集成与数据挖掘
2021-03-17雷晓鸣刘国明孙利民
夏 烨, 雷晓鸣, 王 鹏, 刘国明, 孙利民
(1. 同济大学 土木工程学院,上海 200092;2. 上海临港经济发展(集团)有限公司,上海 201306;3. 河北省交通规划设计院,石家庄 050011;4. 土木工程防灾国家重点实验室(同济大学),上海 200092)
桥梁定期常规检测是桥梁技术评定有效依据,也是桥梁状态较为直接和完整的记录,重点桥梁的监测对区域桥梁状态信息予以补充. 现有的桥梁评价体系本质上为“一桥一档”单体评估方法,从单体桥梁获取的数据,仅能有限用于该桥梁的评价和改善. 一方面,极大浪费了数据的潜在规律和价值;另一方面,繁复的工作增加了桥梁管理的难度和成本. 从区域路网的角度来看,区域内分布的众多桥梁是一个彼此联系的群体,若能对多年累积的区域桥梁群海量信息实现集成与规整,形成路网桥梁数据库,将明显提升管理工作的效率,并有助于发现数据中隐藏的模式[1-2].
近年来,区域桥梁的管理与信息利用吸引了国内外学者的关注,通常既有桥梁的管理可以划分为项目级和网络级(本文称“单体和网级”)两个层次. 面对中小跨径桥梁庞大的基数,若仅依靠单体管理模式,即将不同的桥梁视为单独的个体,对检测、监测等方式获得的结论进行“点对点”的应用,显然会事倍功半[3]. 考虑该桥梁群体的共性特征和路网相关性,开展网级层次的评估和管理是必要的. 事实上,目前国内外已存在针对广泛桥梁群体的信息化管理手段,即桥梁管理系统(BMS). 该系统源于美国联邦高速公路局(FHWA)在1968年开发的NBI数据库(National Bridge Inventory)[4],当时仅具有数据管理功能. 随着不断增加的管养需求和有限的资金之间的矛盾日益凸显,研究者在NBI的基础上又添加了评价、预测、分析、决策等功能形成了BMS. 现有的典型BMS例如美国的PONTIS和BRIDGIT[5]. 前者是运行最久、用户最多的网级管理系统,而后者的主要功能与之接近,相当于对应的单体管理版本. 类似地,还有英国的NATS[6]、日本的J-BMS[7]、丹麦的DANBRO[8]等;中国在这方面起步稍晚,主要应用有中国公路桥梁管理系统(CBMS)、上海市桥梁管理系统等.
BMS的出现有效地提高了桥梁管理水平,但其具体功能尚不完善,在实际运用中仍有较多不足. 具体而言:1)现有BMS都是基于检测信息的,未实现监测信息的集成和利用,导致数据样本不够全面和可靠;2)采用的桥梁退化模型存在较明显的局限性,其评估和预测效果并不理想;3)决策辅助功能较为简单,有待进一步优化和改进.
桥梁退化的模式识别是BMS将桥梁路网原始数据转化为领域知识的必要工具,亦是实现网级评估的关键[9]. 文献[10]将其定义为“结构状态与一系列自变量之间的联系”. 主要存在两种实现方式:一种是基于结构退化的历史数据来预测将来的行为及状态;另一种则试图通过研究影响结构退化的各种时变因素(钢筋锈蚀、氯离子侵入等),预测结构的退化规律. 本文主要利用前者思想,挖掘区域桥梁信息,寻找结构退化模式. 应用数据的统计与分析,可以有效地得到桥梁退化的影响因子和结构状态关系模型. 该模型在对大规模路网的预测与评估上具有出色的效率.
目前,对于区域内桥梁群的多源信息,尚无研究阐明信息的存在形式和获取方式、集成规则及数据结构. 现有的BMS仅对检测信息进行存储和管理,未实现对监测信息的良好协同. 若考虑到网级评估的需要,则还有较多细节需要改进.
本文首先对单体桥梁的多源信息及综合评价方法进行了讨论. 其次,考虑区域内桥梁原始资料的存在形式及后续研究分析的需求,提出了路网桥梁数据库的集成规则和数据结构. 最后,以河北省部分交通路网为例,建立数据库并进行了特征参数的研究和挖掘,为区域内的桥梁网级评估和结论演绎奠定基础.
1 单体桥梁状态评估
1.1 桥梁状态信息源
尽管近年来桥梁健康监测系统的布置数量有所增加,但通常布置于重点桥梁之上. 对于监测系统在路网上的大量普及,其建设成本和周期仍制约着区域性应用.
检测作为管养部门的主要手段,能够广泛地、定期地获取区域内各桥梁在运营中的结构变化信息. 在中国现行的桥梁管理制度中,根据《公路桥梁技术状况评定标准》[11],检测信息主要有以下两类:1)由检查直接获取的关于各构件的病害描述和标度;2)由分层加权间接导出的构件(如一片梁,一个桥墩等)、部件(如梁、桥墩、支座、伸缩缝等)、部位(上部结构、下部结构、桥面系)及总体(整体结构)的技术状况评分. 按其总体评分桥梁可划分为一至五类. 管理者将根据桥梁整体及其构件的评定情况制定区域桥梁维修管养计划.
综上,对于区域交通网络中的大量桥梁,应利用其长年运营养护期累计的丰富检测数据和现有的评估方式,考虑区域环境气候变化和交通荷载变化,结合区域各单体桥梁的基本属性等信息,挖掘区域桥梁技术状态与各属性之间的相关性联系. 借助区域内布设有监测系统的重点桥梁,还可获取此类桥梁的精细化时空状态信息,以辅助判断此类桥梁的技术状态. 由此建立的基于多源信息的区域桥梁技术状态退化模型和评估体系可以对区域桥梁的管养决策形成有效反馈.
1.2 桥梁状态综合评估
目前,桥梁的综合评估主要分为两种模式[12]. 第1种采用层次分析、模糊数学等方法对桥梁状态进行评估,并建立考虑结构安全性、使用性和耐久性的评估模型. 文献[13]以系杆拱桥为背景,在层次分析法中引入变权理论,提出了由指标层、准则层、目标层组成的多级指标体系,完善了系杆拱桥的综合评估方法. 文献[14-15]根据现行规范和实际需求,分别使用层次分析和模糊理论建立了斜拉桥的综合评估模型. 此种模型还可以一定程度上融合监测数据,较适用于大跨度或复杂桥梁. 然而,不同桥型适用的综合评估体系不一,彼此间难以确立统一标准,限制了历史数据和共性数据的继承和转化,不利于在区域级路网的普及.
第2种可称为并行评估模式,即并行保留基于检测和基于监测的评估体系,使其成为桥梁的两个评判维度. 文献[16]提出了结构的检测性能指标(condition index)和监测性能指标(safety index),结合二者对桥梁的退化进行了评估. 此模式在延续现有检测评估制度的同时利用监测数据对其进行了适当的补充和完善,兼顾了区域桥梁群和重点桥梁的评估需求,突出了检测信息和监测信息各自的特点,有益于实现从单体向网级评估的拓展.
因此,本文按并行评估模式开展后续的桥梁信息集成工作. 当区域内重点桥梁安装有监测系统时,同时保留基于检测和基于监测的评估体系,将单体桥梁的监测评估作为区域检测评估的一种补充和完善. 当没有监测信息时,由于从单桥获得信息量很少,难以挖掘出特定的退化模式,利用区域桥梁群的数量优势和单体之间必然存在的相关性,可以从区域总体层面获得较稳定的退化模式.
2 区域桥梁群信息集成
区域内海量桥梁状态数据的集成和处理,是数据挖掘和模式识别的首要步骤. 桥梁群检测数据预处理的好坏也直接影响桥梁退化模式识别的精度,本章将从信息集成技术角度对海量检测数据进行集成、分类和清洗,从而建立路网数据库,为后续模式识别提供有效的数据支撑.
2.1 桥梁群信息集成特征
用于网级评估的桥梁群信息来源与集成有其固有特征:1)多层次分解. 桥梁乃至路网均由多种子结构组成的复杂体系. 数据库应实现对路网按路线—桥梁—构件的多层次分解和追溯,保证不同层次间的检索可行性,为网级评估提供数据逻辑基础. 2)相互作用. 桥梁各构件的退化相互影响,例如,桥面开裂会加速主梁退化;受损支座亦会引发桥面损伤. 因此,数据库应提供各构件的相互作用,以揭示结构性能与状态的变化的内在联系. 3)通用性与拓展性. 数据库应在满足当前分析的条件下,保证其后续拓展和更新的能力,可适应对新数据的补充或新分析方法的融合. 4)时变数据的表达. 常见的桥梁数据可分为静态数据(如跨径、材料等),和时变动态数据(如桥龄、交通量等). 动态数据通常和结构特性变化相关. 因此,数据库应支持动态表达,以揭示数据时空关系.
2.2 数据来源
检测信息是承载区域内桥梁数据的绝对主体. 而检测报告是该信息最直接、相对最完整的历史资料,通常以技术状况评定表的形式存档. 典型的评定表由3部分组成:1)桥梁基本参数,主要字段有所属路段、桥位桩号、桥长、主跨结构、跨径组合、建成年月、检查日期等;2)各组成部位,即上部结构、下部结构、桥面系及对应的评级;3)桥梁总体评级和管养情况. 以上数据表征了桥梁的结构特征、服役年限、区位分布、环境作用、状态评价等关键信息,对于把握被测结构的退化过程具有重要意义. 监测信息可作为补充,获取区域重点桥梁的精细化时空状态信息.
同时,交通路网承担着通行及运载的功能. 从服役期桥梁受力角度来看,交通荷载也是其最主要的外部作用. 鉴于评定表中未记录被测桥梁所处路段的交通流信息,需引入其他数据源. 采集公路沿线各交调站记录的路段年平均日交通量数据,选取机动车自然当量,用于表征被测桥梁的交通流平均效应;或可结合动态称重系统或视频监测,获取主干道车流信息. 特别地,车辆分类统计中,重型车辆的数量和比例对结构的影响更为明显,需额外关注.
此外,桥梁的设计施工图纸可补充和校核数据库中桥梁的基本信息,如结构设计参数、公路等级、车道数量等.
2.3 多源数据逻辑表达
对于上述集成的多源数据,应采用“属性”的形式进行存储和表达. 属性由属性名和属性值组成,前者指定某个具体特征,后者为该特征的相关数据. 不同属性可能有不同的数据格式,例如数值型、序数型、标称型等. 其中,数值型最为直观,可进行定量比较. 其他格式均是定性表达,序数型虽同样具有比较意义,但相继值之间的差却难以明确量化;标称型,即与名称相关的属性,仅用于表征类别. 针对路网数据库,典型属性及其格式定义如下:
1)地区、路线编码、桥梁编码、构件编码、桥梁桩号,均为标称型属性,表示桥梁对象的空间分布. 地区宜根据路网的具体情况,结合地理位置、温湿度分布等进行划分.
2)建成年月、检查日期、桥龄,均为数值型属性,表示桥梁的时间信息. 桥龄由检测日期和建成年月相减导出.
3)桥型、桥长、最大跨径、截面尺寸、配筋率,其中桥型为标称型属性,其他均为数值型,表示桥梁对象的结构特征.
4)年平均日交通量(ADT)、年平均日重车量(ADTT),均为数值型属性,表示桥梁承载交通流情况. 前者采用机动车合计自然数,后者采用大型货车、大客车的数量之和.
5)公路等级、设计荷载、路基宽度、车道数,其中公路等级和设计荷载为序数属性,其他均为数值型属性,表示桥梁的通行能力.
6)总体评分、总体评级、上部评级、下部评级、桥面评级等各部件技术状况等级中,总体评分为数值型属性,其他均为序数型,表示桥梁的结构状态.
其中,大部分属性为静态的,但检测日期、桥龄、ADT、ADTT,结构评级、评分等为动态数据. 这些动态数据是与时间跨度等维的键值对,每个键代表对应的时间坐标,键值为该坐标下的属性取值,且需按各自格式存储. 如对于“建成年份=2015”的桥梁,有“桥龄={2016: 1, 2017: 2}”及“总体评分={2016:99, 2017:98}”.
2.4 数据集成与清洗
区域内不同层次信息的具体组织形式和数据结构各有特点. 参考面向对象的程序思想,引入“类”与“实例”的概念,类是对具体事物的抽象,表达一种特定概念. 在区域级的桥梁路网中,类涉及3种级别,分别为构件类、桥梁类和路线类. 不同级别之间存在隶属关系,如:路线类包含桥梁类,桥梁类包含众多构件类. 各类之间可通过类名区分,如“主梁”类和“支座”类,其存储不同信息. 前文定义的属性按其适用对象和范围在上述类中有序集成,得到各构件、桥梁、路线对应的模板. 相应地,实例是事物在数据库中的载体,可根据类指定的模板创建路网中存在的实例,即构件实例、桥梁实例及路线实例,并按实体的特征和性质填充属性数据. 例如,桥A与桥B均基于“梁桥”类别创建,但两者是相互独立的桥梁实例,前者桥长属性值为15 m,后者为30 m. 图1对上述数据集成规则进行了总结.
图1 数据集成规则和结构
然而,集成的结果不能直接用于后续分析和处理,主要是由各数据源的原始数据质量差异导致,具体为:1)纸质资料,保存时间有限,存在丢失、污损等现象,影响数据的连续性和准确性;2)电子资料,受制于管理水平和执行,导致格式、标准难以统一;3)资料录入时难免出错,易存在信息缺失或不一致的问题. 因此,有必要对集成数据进行清洗,以便消除噪点便于后期模式识别. 例如,利用不同数据源中的同一信息进行交叉验证;或校正数据随时间推移的动、静态数据的异常变化. 常用的清洗操作有删除法、均值填充法、众数填充法等,需视具体情况而定. 完整的路网数据库流程如图2所示.
图2 路网数据库流程图
有些时候,用户需导出指定年份下区域桥梁路网数据,以便进一步考察其特征. 为此,定义数据库的“切片”操作,即对各实例的动态数据按给定的时间坐标进行截取,而静态数据保留,导出的结果即为数据库在该年的切片. 对某路网按2018年切片后可生成表1的数据.
表1 某桥梁路网导出数据示例
3 区域桥梁数据挖掘及应用
本文收集了河北省内若干主线高速公路2011—2018年的6 707座桥梁的检测报告、设计图纸、维修记录等,经清洗和集成,形成路网数据库案例. 选取数据库中典型字段,采用统计方法进行数据挖掘,以评估区域桥梁特征,并从中提炼区域桥梁群的共性和退化模式,为网级评估工作提供指导.
3.1 路网变量特征
河北省地处华北平原,是中国唯一兼有高原、山地、丘陵、平原、湖泊和海滨的省份. 考虑到该省空间跨度大且地貌复杂,按其气候特征进一步划分子区域. 参考2010年气象观测数据[17],如图3所示. 全省年平均气温呈现南高北低的分布特点;而年降雨量分布表现为东南多西北少的特点. 据此,将河北省划分为3个地区,如图4所示. 各区域内的公路及桥梁数量参见表2.
(a)年平均温度
(b)年降水量
根据图4及表2可知,不同区域的桥梁分布在时空上并不均匀. 主要原因为河北省地形地貌的复杂性,以及有限的数据源. 其中,区域3内交通路网最为密集,有效记录最完备,时间区间也最完整,单一年份数据最多可达2 086条. 对于区域1和区域2,则在时间连续性上稍有欠缺. 同时,这两区域的记录数量也比区域3少. 但是,上述数据分布特征并不会对本节的分析和研究造成显著影响.
图4 基于气候特征的河北省子区域划分
表2 路网数据库案例概览
图5为区域桥梁群建成年份统计,可看出2014年为集中建设的分水岭,2014年以前为省内高速公路集中建设期,之后新增桥梁速度开始减缓,表明主干路网逐渐进入运营和维护阶段. 各地区桥型构成见表3. 板梁桥在路网中占绝对主体地位,各区域占比均明显超过60%;箱梁桥其次,占比在20%左右;T梁桥再次;仅区域1的T梁桥数目明显增加,且超过同区的箱梁桥数. 而其他形式桥型(多为拱式桥、刚构桥),在各地区所占比例极小.
图5 区域桥梁群建成年份统计
表3 区域桥梁群桥型比例
区域内桥长分布参见表4. 鉴于近97%的桥长(L)都处于[0 m,500 m],在此仅对该区间中的桥梁进行展示. 各区域内超过半数的桥梁桥长均位于[0 m,30 m];而随桥长的增加,对应区间的桥梁数量锐减. 结合表5所示的桥梁最大跨径分布,可见98%以上的桥梁结构的最大跨径(l)都在50 m以下,并显著集中在[5 m,15 m],这更有力地说明了中小跨径桥梁在河北省干线路网内的广泛分布,考虑到各桥型的适用跨径,此结论亦与表4的分析结果相符.
表4 区域桥梁群桥长分布比例
表5 区域桥梁群最大跨径分布比例
3.2 时空分布特征及演变规律
以2015年的数据记录切片为例,研究桥梁总体评分在区域内的分布规律,如图6所示. 根据《公路桥梁技术状况评定标准》[11],评分高于95为一类桥,未达到95但高于80的为二类桥,再次之的分别为三、四、五类桥. 在案例主线路网桥梁的2 947条记录中,未出现评分低于80的桥梁,即结构保持完好或轻微缺损,属一、二类桥,不存在损伤较大的三至五类桥. 这一现象归因于道路管理的要求和长年维修养护的成果. 结合4条密度曲线,虽然区域1内样本数量相对较少,其密度曲线波动略大,但整体趋势仍与其他地区及总体吻合;各区域统计结果均表现为右偏分布,即向高评分区集中,可见目前全省干线路网桥梁尚处于较健康状态;但对评分低的少数样本,考虑到其正在或即将退化为三类桥梁,仍具有不可忽视的重要性.
进一步考察桥梁各部件评级,如图7所示,则可得到相似结论,即大多数上部结构、下部结构和桥面系保持在一类、二类状态,仅有少数劣化为三类,而四类、五类部件没有出现. 特别地,桥面系相比上部结构和下部结构,其退化程度较为显著,主要原因为桥面系直接承受车轮作用,且暴露在不利环境影响下的可能性更大,故破损速度更快,评级略低.
图7 2015年区域桥梁群部件技术状况评级
本文采用均值拟合方法得到了区域桥梁总体技术状态的时变函数. 图8(a)为各地区内的桥梁总体评分均值与桥龄的线性拟合结果,横轴(x)为桥龄,纵轴(y)为总体或部件技术状况评分. 其中,区域2的对应数据与理论直线吻合得很好;区域3中存在部分点离群现象,主要集中于桥龄在12 a以上的桥梁. 这类桥梁的评分均值呈上偏趋势,原因为运营期中接受了桥梁维护与修缮. 若从原始数据中删去此类离群点,则亦可获取区域拟合直线. 对比不同区域的拟合结果,区域2和区域3高度接近,几乎平行;而区域1的总体趋势相对前两者有较大偏离,表现为初始评分稍低,退化速率较慢. 若在全区域范围内统一进行研究,则全区域退化直线位于图8(a)的3条直线之间,如图8(b)所示,但离群点仍然存在.
(a)各区域
(b)全区域
类似地,可以获取上部评级、下部评级、桥面评级时的变信息量化挖掘,如图9所示. 虽然部件评级为离散分布形式,但转化为连续变量拟合仍可显示出各类部件的趋势变化. 对于上部结构,各地区内的退化模式较为接近;下部结构则有所地区差异,区域3的退化速率最快,区域1的最慢;桥面系的地区差异介于前两者之间. 从全省范围来看,桥面系最容易发生损伤和劣化,而上部结构和下部结构的变化规律相对接近. 表6对桥梁总体及其各部位的拟合结果进行了总结.
(a)桥龄-上部结构评分线性拟合(分区域) (b)桥龄-下部结构评分线性拟合(分区域) (c)桥龄-桥面评分线性拟合(分区域)
(d)桥龄-上部结构评分线性拟合(总区域) (e)桥龄-下部结构评分线性拟合(总区域) (f)桥龄-桥面评分线性拟合(总区域)
表6 拟合结果汇总
3.3 变量组合相关性分析
上一小节中,本文对区域桥梁群整体结构及其部件技术状况的时空分布特性和规律进行了初步的探索,得到了相应评分或评级在平均意义上关于桥龄的回归方程. 然而,表6仅适用于对指定桥梁路网的总体状态及退化趋势进行宏观评价;且随着桥龄的增加,总体评分和部位评级的实测值开始出现明显的偏离. 此外,按区域和按全省的分析结果亦略有出入,后者更为广泛和粗略,而前者在表征路网状况和特征时更具有针对性. 有理由认为,若设定多个分类或约束条件,将原始数据划分为不同的独立子集,例如[地区:区域1;桥长:0~20 m;主跨结构:空心板]、[地区:区域2;桥长:20~40 m;主跨结构:箱梁]等,则可对该子集中的数据实现更精确的建模. 事实上,上述过程存在一个隐式的假定,即路网数据库中的不同属性对评分(评级)的变化具有独特的贡献. 更一般地,考虑地区、ADT、ADTT、桥龄、桥长、主跨结构、最大跨径、上部评级、下部评级、桥面评级、总体评分组成的变量集合,依次对集合内变量进行两两组合并计算其相关性,生成Pearson相关系数矩阵,见表7.
相关性系数绝对值越大,表明对应的变量对相关性越强[18]. 表7中显示,大部分系数绝对值均处于0.3以下. 对于总体评分,与之相关程度最高的依次为下部评级、上部评级及桥面评级,显然,这与桥梁检测评定中采用的加权评估方法是相符的;其次为ADT,系数值为-0.237,即随着ADT的增加会引起总体评分的降低. 并且,桥面评级受ADT的作用更为显著,系数值接近-0.3,这与桥面直接受到车辆荷载作用是相符的. 此外,跨径、桥型、桥长亦对桥面评级存在一定的影响,上部评级、下部评级与之类似. 特别地,对于下部评级,桥长这一因素可以忽略不计. 若比对各组成部位间的相关性,则以[上部评级,桥面评级]较为明显. 对于其他变量,亦存在若干相关性较强的变量对,例如[ADT,ADTT]、[桥长,跨径]等,也均符合变量间的固有联系.
表7 Pearson相关系数汇总
综上,相关性分析揭示了各变量与部件及总体技术状况间的依存关系,也反应了路网数据库的内在模式和规律. 但大部分系数的绝对值均处于低水平,即弱相关关系,原因有二:1)相关性的表达受到了噪声的明显抑制;2)Pearson系数的本质在于线性关系的识别和量化,变量间的非线性相关会导致较低的Pearson值.
4 结 论
1)针对桥梁网级评估,研究了多源信息集成的系统方法,对多关键参数进行了相关性分析和挖掘,探求路网内桥梁群的共性特征和退化规律,建立了适用的网级评估理论.
2)提出了针对网级评估的多源信息集成的系统方法,将描述路网特征的检测信息、监测信息、交通量观测、设计施工图纸等多源数据以“路线—桥梁—构件”的逻辑形式整合构建路网数据库,突破了众多单体桥梁之间的管理壁垒,发挥了海量数据的潜在价值. .
3)通过对河北省主干路网部分桥龄的统计分析,揭示了桥梁总体和部件技术状况在区域层面的内在规律. 由于得到的总区域和分区域的退化模型,依环境和交通状况等地区特征差别呈现合理的相关性和退化趋势,分析中创新性地考虑了桥梁维护与修缮对评分的影响.
4)相关性分析量化了路网特征变量对总体和部件技术状况的影响. 交通量、桥龄与桥梁总体评分以及桥面系评分的相关性较大,桥长对上部结构,及桥型/跨径对下部结构/桥面系影响较大,该方法有助于桥梁管养者制定针对不同部件的目标桥梁维修策略,未来可借助更强的非线性数据分析方法,进一步加深对桥梁路网的认知.