建筑活荷载的大数据调查方法研究
2020-04-07陈隽,李洋,臧笛
陈 隽,李 洋,臧 笛
(1.同济大学土木工程学院,上海200092;2.同济大学土木工程防灾国家重点实验室,上海200092;3.同济大学电子与信息工程学院,上海201804)
荷载指施加在建筑物上使其产生效应的各种直接作用,包括恒荷载、楼面活荷载、屋面活荷载、屋面积灰荷载、车辆荷载、吊车荷载以及地震、风、雪、波浪荷载等[1]。荷载取值的可靠性既是拟建结构安全设计的关键,也是已建结构性能评估的依据。以建筑物楼面活荷载为例,若将其标准值推断过大,势必增大建造工作量,造成人力、物力的浪费;若将其标准值推断过小,则会降低结构的可靠度,导致结构安全性能不足。因此,活荷载的统计与建模是保证建筑结构可靠度的基础性工作。
大量实测数据是建筑物活荷载建模的基础。我国建国后至今6次荷载规范修订均采用人工现场抽样称重的调查方式。受人力、时间成本的限制以及大件物品现场称重的困难,实测样本的数量有限,因此数据统计的显著性与荷载模型的质量严重受制于样本的代表性。同时,由于入户实测采样工作只能阶段性开展,难以及时反映社会经济高速发展所带来的室内物品(活荷载)的动态变化。因此,结构可靠度分析的3个重要基础(荷载统计、结构力学分析与结构抗力分析)中,荷载统计仍是最薄弱的[2]。建筑物活荷载的研究急待通过范式的转变,突破样本数量、人力成本、现场称重、时效性差等关键难题。
20世纪后期,随着具有采集和存储功能的电子设备的全方位普及,各类电子数据资源正在以超出想象的速度累积。2011年,《Science》杂志文章指出[3],“整个人类文明迄今所获得的全部数据中,有90%是在过去2年内产生”,同时预测,到2020年全世界所产生的数据规模将达到当时的44倍。这一看似大胆的预测仍然低估了数据累积的速度:仅2015年一年人类就创造了4.4ZB的数据[4]。在当下万物互联的大数据时代背景下,物理世界的真实物体(如建筑物内的家具、电器设备等)会以各种数字化形式(如照片、视频、商品名、物流单据、商品二维码等)映射存在不同的数据网络中。通过对全面数据资源的深度挖掘来获得各类物体的重量信息,有望实现在不抽样称重的前提下获得建筑内的实际活荷载分布,建立可反映物品动态变化的活荷载模型。
为此,在对我国荷载规范及其研究方法简要回顾的基础上,提出基于大数据技术的建筑物持久活荷载研究的新方式,详述实施步骤和涉及到的分析技术,并进行实例应用。
1 我国荷载规范的发展概述
自建国以来,我国的建筑结构荷载规范共经历了9次修改和完善(图1),包括2次大规模全国性的荷载调查统计工作,研究手段以抽样调查、统计回归为主,相关成果主要体现在各版荷载规范中[5]。
图1 荷载规范的演变Fig.1 Evolution of design load codes
我国荷载规范最初2个版本均参考前苏联荷载规范制订。1954年的《荷载暂行规范》(结规1—1954),主要内容包括四部分:基本规定、使用荷载、雪荷载以及风荷载[1]。4年后,结合我国实际国情颁布了修订版《荷载暂行规范》(结规1—1958),增加了荷载组合、超载系数等内容,同时修改了最大雪深和最大风压分布图。
20世纪60年代末到70年代初,我国开展了第一次全国荷载调查,调查内容包括楼面荷载、吊车荷载、风荷载和雪荷载。以楼面荷载为例,当时曾对北京、兰州、成都和广州的606间住宅以及北京、兰州和广州的258间办公室内的实际荷载进行了现场实测[6]。尽管受条件限制,当时调查的城市和样本数量有限,但该次调查建立了我国荷载研究的早期数据基础,使得荷载规范的整体水平向前迈进了一大步,具有重要的历史意义。结合第一次荷载调查的结果,修订编制了1974版《工业与民用建筑结构荷载规范》(TJ 9—1974)。该规范统一了荷载取值标准,调整了荷载组合方法,其中楼面活荷载则未作太大修订,基本保持原有荷载取值标准。
20世纪70年代末到80年代初,结合建筑可靠度和荷载组合课题的研究任务,在全国六大区开展了第二次荷载调查,重点调查住宅和办公楼的楼面活荷载。共调查了10个城市的566间住宅,总面积为7 014m2,以及25个城市的2 201间办公室,总面积为63 700m2。为了简化调查工作,直接采用房间面积平均荷载来代替等效均布荷载。在此基础上,随后颁布了1987版《建筑结构荷载规范》(GB5J1—1987),改进了荷载效应组合方法,增列了荷载分项系数,在活荷载统计、可靠度设计方法等方面有很大的进步,但是对住宅办公楼楼面活荷载取值标准没有系统性提高。
21世纪初,结合建筑工程界对结构可靠度标准的深入讨论,面向适当提高结构可靠度的需求,修订并颁布了《建筑结构荷载规范》(GB50009—2001)。该版本整体提升了荷载取值水准和建筑结构可靠度,将基本风压和雪压的重现期由30年调整到50年;增加了以永久荷载为主的荷载效应组合;对楼面活荷载作部分的调整和增项,将住宅办公类建筑楼面活荷载最小标准值由1.5kN·m-2提高到2.0kN·m-2。2009年住房和城乡建设部启动了新规范的修订计划,并于2012年颁布了《建筑结构荷载规范》(GB50009—2012)。现行规范扩充了荷载规范的范围,在作用中增加了间接作用;填补了建筑结构设计全国基本气温数据的空白。在楼面活荷载方面,只是对个别活荷载做了提高,如将教室、浴室、卫生间由2.0kN·m-2增加到2.5kN·m-2。
荷载规范的每次调整都与当时的经济发展和认识水平的提高相适应。各版规范的主要变化、数据基础和调查方法如表1所示。从荷载规范的演变历程可见,住宅、办公楼楼面活荷载取值只在2001年调整过,最小标准值在1.5 kN·m-2的基础上直接提升了33%。现行《建筑结构荷载规范》(GB50009—2012)所依据的核心数据基础仍然是1977—1981年的调查结果。伴随社会经济持续高速发展,当前住宅和办公楼的设计理念、功能设置与室内用品等,与二三十年前相比都有了巨大的变化(图2)。显然,荷载的调查方法也需要不断更新、提升。
表1 荷载规范变化Tab.1 Changes of load codes
图2 住宅室内物品对比Fig.2 Comparison of residential interior items
2 建筑物活荷载大数据调查方法
2.1 基本思想与实施步骤
大数据方法是当前科学和技术领域的前沿,其应用和推广已上升到了国家战略的高度,为各学科的研究带来了新的发展机遇[7]。建筑物活荷载大数据调查方法基本思想是:建筑物室内的物体会以多种数字形态(特征)映射于互联网中,可分为直接特征与间接特征,前者指唯一标识信息如条形码、二维码、射频码、产品标识等,后者指非唯一标识信息,如照片、视频等;利用物体特征对海量网络数据资源进行挖掘,可获得物体的重量信息,完成荷载调查。
具体实施步骤如下:①针对采集对象的特点,利用智能携带设备,综合收集室内物体的照片、音频、视频、文本等多类型信息,信息内容需覆盖建筑类别、房间类型、用途、面积、物品形式及数量等。②对采集到的多源、异构信息进行分类处理,采用不同的分析工具,获取各类物体的直接特征或者间接特征。③对含有直接特征的物体,利用基于深度学习的光学字符识别(OCR)等算法进行批量识别,随后利用网络爬虫技术自动检索重量信息,乘以其对应的数量后得到总重量。④含有间接特征的物体,可采用深度学习中的目标检测技术来识别,在去除背景和不相关物体影响后,在网络数据库中进行图像检索,结合网络爬虫技术,得到目标物体的重量信息,最后乘以相应数量得到总重量。
按照上述方案,一般场景下,一位调查者携带一部智能手机或一部调查专用便携设备,即可完成持久活荷载调查工作,大大节省了成本和提高了效率。
2.2 大数据分类处理技术
由于大数据固有的多源异构特点,以上调查过程所采集到的信息类型丰富,需要综合采用多种数据处理技术进行特征提取,主要包括:语音识别、文本识别、图像识别、图像检索等。
2.2.1 直接特征物体的重量获取
办公室内常见的电脑、饮水机、打印机和显示器等物品一般都具有二维码、产品标识、条形码等唯一识别码(图3)。拍摄物体的直接特征图片后,利用智能手机及各类电商网站的数据支持,可迅速便捷地获得各物体的重量。
图3 物品关键特征Fig.3 Key features of objects
由此方法获得的某一办公室各类常见物品的重量和实际称重的对比见表2。由表2可见,基于直接特征获得的总重量(560.0N)比实际称量的总重量(549.0N)略高约2%。
2.2.2 间接特征物体的重量获取
对于不包含直接特征的物体,如室内家具书桌、椅子等,采用基于深度学习的YOLOv3算法[8]来检测图片中的物体 。 YOLOv3 是 在 YOLO[9]和YOLO9000[10]目标检测算法基础上改进的深度模型,共包括252层神经网络层。
表2 重量(直接特征)对比Tab.2 Weight comparison(direct feature)
与2阶段目标检测算法R-CNN系列[11-13]相比,YOLO系列将目标检测问题整体视为回归问题,同时得出目标位置和物体分类,实现端到端训练和检测,极大地提高了检测速度。并且,YOLOv3采用多尺度预测和Darknet-53特征提取器[8]以及适用于多标签分类的Logistic回归,在保证实时检测速度的情况下,进一步提高了检测精度。YOLOv3检测过程如图4所示,分为训练和预测2个部分,依据损失函数对各层网络权重参数进行优化,训练结束后即可利用最优权重参数进行端到端预测。
以某会议室内3个物体(即黑色椅子、蓝色椅子、小桌子)为例,利用智能手机拍摄3个物体共2 457张照片并进行标注处理,标注示例如图5。将标注数据集按照4:1的比例分为训练集和验证集。
图4 YOLOv3检测过程Fig.4 Detecting process of YOLOv3
图5 数据集标注示例Fig.5 Example of object annotation in dataset
以TensorFlow[14]作为深度学习框架的后端,利用预处理后的数据集对YOLOv3进行训练。基于COCO数据集[15]预训练权重的训练可分为2个阶段,第1阶段冻结前185层网络,只训练底层权重参数;第2阶段解冻所有层,在第1阶段权重参数的基础上对252层权重参数进行微调。训练时,每批次输入16张图片,随机且不重复地从训练集中抽取,训练集被取完时记为一轮,2个阶段共循环训练100轮。第1阶段学习率设置为0.001 0,学习率调整方法选择自适应动量估计(Adam)算法[16];第2阶段学习率设置为0.000 1,学习率调整方法同样使用Adam算法,当验证集损失值连续三次不下降时减少学习率,每次减少至10%,当验证损失连续10次未下降时,则终止训练。
训练过程中训练集与验证集损失如图6所示,虚线为模型在训练集上的损失,实线为在验证集上的损失。可以发现,在开始训练时,训练集和验证集损失迅速下降,在10轮之后,损失下降平缓;到第2阶段,即50轮之后,损失继续下降,最终趋向平稳,说明目标检测模型可根据数据集进行有效学习,并对各层网络的权重参数进行了优化。
图6 训练集与验证集损失Fig.6 Loss of training set and verification set
利用最终的模型权重参数,将物体置信度阈值设为0.3,交并比(IoU)阈值设置为0.45,即可对3个物体进行识别。目标检测模型的识别效果如图7。输入一张新图片,模型对图片中目标物进行分类,同时标注出物体在图片中位置,识别精度令人满意。
图7 目标检测结果Fig.7 Result of object detection
在目标检测的基础上,编写了网络爬虫脚本程序将截取的目标物体图片自动上传到某电商数据库,与其中的商品进行图像匹配,并抓取检索出的物品详情。以黑色椅子为例,匹配的结果图像与相应的产品参数如图8所示,可发现匹配图像中的椅子与原黑色椅子相似度很高,匹配效果较好。
图8 黑色椅子匹配结果Fig.8 Matching result of black chair
结合目标检测与网络爬虫技术,最终获得3个目标物体的重量信息。表3列出物体基于目标检测方法获得的重量和直接称量获得的重量,由此可见,3个物品的重量相差不大。
表3 重量(间接特征)对比Tab.3 Weight comparison(indirect feature)
3 实例应用
综合利用前述方法进行了某办公楼内一间会议室的荷载调查,会议室标称使用面积为41.0m2,室内包含多个物体,整体情况如图9所示。
现场调查由一位测试者携带一部智能手机(iPhone XS Max)完成。首先利用手机中“测距仪”(内置App)测量出室内长为6.3m、宽为6.2m,从而得到实测面积为39.1m2。
对具有直接特征的饮水机,直接拍取其产品标识;对于不包含直接特征的椅子(2种)、桌子和讲台,拍取若干张图片进行目标检测;对于各物体的数量,采用语音的方式记录。至此,信息采集工作完毕。
图9 会议室场景Fig.9 Indoor scene of meeting room
对于采集到的信息,采用不同技术进行特征提取。对于饮水机产品标识,得到品牌和型号后,结合爬虫和官方网站自动获取重量信息。对于椅子、桌子和讲台,由于无直接特征,先用YOLOv3算法进行目标检测,识别结果如图10。截取目标物体,去除背景和其他物体影响,利用网络爬虫,在电商网站数据支持下,得到各物体重量。对于记录各物体数量信息的语音,幅值归一化后,音频波形如图11所示,语音识别结果为“调查开始!房间中有桌子6张,讲台1个,小椅子14把,椅子13把,饮水机1个”。
图10 会议室检测结果Fig.10 Detecting result of meeting room
会议室活荷载信息以及获取方式如表4所示。对于室内物品总重量,数据检索结果为5400.0N,实测结果为5 213.0N;室内单位面积持久性活荷载数据检索结果为138.1 N·m-2,实测结果为127.1 N·m-2。基于大数据获得的单位面积上的持久活荷载比实际称重结果偏高8.7%,综合考虑时间与人力成本的显著差异,新方法的调查结果可以接受。
图11 调查语音波形Fig.11 Waveform of speech
4 结语与讨论
4.1 结语
荷载取值是结构设计的基石,也是当前研究的薄弱环节,关键的难题是现场称重的传统调查方式所带来的成本高、时效性差、样本少、代表性弱等问题。互联网、物联网、大数据和深度学习方法的迅猛发展形成了荷载调查研究方法创新的数据基础和计算分析手段,鉴于此,本文尝试提出了大数据支撑下的建筑物活荷载调查的新方法,综合利用照片、语音、文本、手机测量、人机结合等各种前端信息获取方式,得到各类物品的直接或间接特征,再结合网络大数据和网络爬虫技术,最终得到各种物品的重量。以典型小型会议室的实例分析表明,所建议的方法具有可行性,可以在不进行现场称重的前提下获得具有较好精度的重量结果,成本低而效率高。
4.2 局限性讨论
通过单个物品及布置较简单的会议室为例说明大数据荷载调查方法的可行性,过程存如下问题。
(1)建筑物室内物品种类繁多。无论采用直接特征(需要对应于不同类型的直接特征处理器)还是间接特征(需要对应于每一类物品的深度神经网络),都需前端信息采集手段进一步丰富。对此,搭载了具有AI芯片的前端智能硬件设备,因已集成了图像分析、物品分类、语音识别、文字识别等功能,有望用来解决此问题。
(2)视觉不可见物品的重量信息推测技术。建筑物室内存在大量视觉不可见的隐藏物品(比如柜子内部各种物品),需结合非图像处理技术来预测实际重量。通过大量样本深度学习,建立物体特征量(如长、宽等)与其重量的相关关系有望解决此问题,类似工作已经在桥梁车辆荷载预测中取得进展[17]。
(3)由于大数据固有的低价值特征,网络数据资源虽然数量巨大,但是信息纷杂。文中的例子主要依赖于各类网络电商的开放数据库资源,难以包含所有室内常见物体的重量信息。因此,物品重量数据源的确定亦需继续探索,必要时甚至需要构建专用的建筑物物品重量数据库。
表4 会议室活荷载调查方法与结果对比Tab.4 Comparison of live load survey methods and results in meeting room
尽管存在诸多的限制,可以预见的是,伴随互联网与物联网的深度融合,各类前端智能硬件的大量涌现、海量数据的高速累积及网络计算力的快速提升,建筑物活荷载的大数据调查技术将迅速实用化。