APP下载

基于BIM与知识图谱的智能化审图系统设计与实现

2022-09-29李智杰李昌华

计算机测量与控制 2022年9期
关键词:图谱实体规范

唐 锐,李智杰,李昌华,张 颉,2,介 军

(1. 西安建筑科技大学 信息与控制工程学院,西安 710055;2. 西安建筑科技大学 建筑学院,西安 710055)

0 引言

近年来,我国建筑行业逐渐向数字化转型技术演变,各产业以人工智能为起点、技术革新为引领,不断夯实建筑业智能化信息化的数据基础。建筑行业的快速发展使得大型建筑,特别是规模庞大、功能类型复杂的建筑喷涌而出,造成领域知识的蓬勃增长,累积了形式多样、数量繁多的数据。实现针对建筑的智能审图是提高建筑设计水平的重要途经,从源头消除建筑项目可能存在的设计安全隐患,具有广泛的行业应用前景。

智能审图相较人工审图优点突出[1],主要表现在大幅缩短建筑审图时间,有效提高审图工作效率;同时一定程度上保障了审图工作的高准确性,减少人为因素带来的误差影响;此外人工审图对相关审查人员的资历经验据要求较高,对审图内容的结论总结与后期报告撰写标准不一,相较于智能审图的一键导出结论报告或审查文件形式,人工审图方式较为落后,难适用当前数字化建筑审图领域。因此,研究出一款实现智能化建筑审图的产品具有极重要的实际意义。

近年来,国内外学者或相关机构针对建筑审图实现智能化方向演进取得丰富研究成果。文献[2]结合AI技术,实现针对建筑消防的自动审查核验系统的设计与开发工作,进一步健全完善建筑消防信息化、透明化的审图验收标准;文献[3]在实际的医院建筑施工过程中,利用头戴式移动设备扫描现场并与完整建筑模型进行比对,清晰直观地查看项目施工完成度;文献[4]针对建筑施工场所可能存在的安全隐患,提出基于知识图谱技术与机器视觉的危险源识别方法,排除不同环境下建筑工地的安全隐忧;在建筑审图实际应用领域,众多科技公司开发了面向CAD绘图与BIM技术绘图的审图软件,如“小智审图”、“SmartMark软件”[5]等。上述研究内容研究方向单一,审查范围小,多为针对建筑类的消防专业审查,且仅从建筑规范文本中挑选部分条文细则作为审图数据基础,导致审查内容覆盖范围的完整性较低;此外,市面上普遍采用的审图软件多以CAD二维绘图为基础进行开发,缺乏建筑模型及审图内容三维可视化能力,且基于BIM绘图技术的审图工具较少,难以支撑日益增长的现代化建筑智能审图需求。

针对上述问题,本文以多部建筑设计规范和行业建设标准为数据源,构建面向建筑设计规范的知识图谱,保障审图系统的数据完整性;同时结合建筑信息模型BIM(Building Information Modeling)技术[6]的强大数据协作能力,实现全方位、可视化的建筑智能审图工作。最后,通过实例测试,进一步验证了建筑审图智能化系统的准确性与有效性,对保障建筑施工资料审查质量,推进我国建筑行业实现数字化信息化转变具有积极意义。

1 智能化审图系统的结构与原理

1.1 智能化审图系统结构

该系统的总体架构设计分为4层,具体如图1所示。1)基础层:基础层作为系统的数据信息处理层,其主要功能为储存建筑BIM模型数据、所构建的建筑规范知识图谱数据信息;2)功能层:功能层是该系统的最关键环节,起到承接基础层与应用层的作用,其主要任务是解析建筑BIM模型并转化为IFC格式、审图所需模型构件的提取、规则与数据的匹配以及审图报告生成等功能;3)应用层:应用层基于JavaScript程序语言,为使用者搭建网页端操作界面,用户可由此进行模型交互操作及查看具体构件信息、审图内容等;4)终端层:终端层各类设备上的Web浏览器。

图1 建筑智能审图系统结构图

1.2 智能化审图系统原理

该系统原理主要分为建筑规范文本数据采集、建筑模型的识别与提取、文本数据与模型数据匹配及审图结果网页端展示等部分。首先构建面向建筑规范文本的知识图谱,自动提取并存储审图所需的文本数据信息;接着解析提取BIM建筑模型,并转化为IFC格式数据,实现智能化审图所需的建筑模型数据完整性,主要包括建筑的模型构件及功能房间特征提取;之后将建筑规范数据信息与被审模型数据信息进行向量匹配,为后续智能审图工作开展奠定基础;最后结合HTML5框架与WebGL技术实现建筑模型交互操作、审图成果的网页端可视化展示等功能,完成智能审图系统的全部开发工作。

1.3 智能化审图系统软件及环境设置

为完成智能化审图系统的设计开发工作,需采用针对性的软件工具和环境参数等实现开发任务实施,具体选型结果如表1所示。

表1 软件选型及环境参数表

2 系统实现的关键技术

该系统的开发工作涉及到相关设计规范与行业标准的数据信息完整度,智能化审图所需建筑模型数据的提取与整合,文本数据信息与被审模型数据结合匹配等工作,同时如何利用AI技术实现被审模型的三维展示、自动生成审图报告等亦为系统开发的重要研究内容。后续通过构建建筑规范知识图谱、BIM模型数据提取整合、规则条文与模型数据匹配以及系统的网页端开发等工作实现系统的设计开发过程。

2.1 建筑规范知识图谱构建

知识图谱技术拥有从建筑规范数据中提取可利用信息,并有效发掘、整合数据间隐含关系的能力,对建筑规范领域知识的高效融合利用提供巨大助力。传统的知识图谱构建方式多为自顶向下、自底向上的方式[7],两者的差异在于是否先从文本中抽取数据模式。本文结合建筑规范数据特点,将两种方式相结合,提出一种面向建筑规范的知识图谱构建方法。

文中所述的构建方法流程如图2所示,包含知识建模、数据源获取、知识获取和知识存储等步骤。首先基于概念、属性及关系的设计完成知识建模;接着依据数据源结构化的差异性,采用不同技术针对性地进行知识获取,为后续步骤奠定数据基础;然后经过知识融合、知识存储环节形成建筑规范知识图谱。

图2 建筑规范知识图谱构建流程

2.1.1 基于本体的知识建模

知识建模确定知识的描述及表达方式,是知识图谱构建的先前工作,能最大程度描述事物间的的基本关系、内在特点与发展规律。通过本体可定义领域内各类概念、属性及概念间的关系,起到支撑整个知识图谱的概念架构和主体框架的作用,进而实现规范数据信息的有机统一,提升资源的高效利用,因此保证其搭建的高准确率十分必要。

本文通过基于传统的人工构建方式与基于机器的方法完成本体抽取工作,之后利用protégé本体[8]编辑工具进行人工修正,保证顶层整体架构低偏差率,使之后知识图谱在数据层的构建更加客观有效。文章将建筑规范领域相关概念总结为6大类:建筑空间类、建筑场地类、建筑构件类、建筑物类、建筑项目类和建筑楼层类[9]。再将每类概念逐级细分,直至不可再细分子概念,概念与逐渐细分的子概念形成层级关系体系。构建的建筑规范领域部分概念本体如图3所示。

图3 建筑规范领域部分概念本体

2.1.2 建筑规范领域数据源和知识获取

知识建模完成后可得到整个建筑规范领域知识图谱的数据模式,接下来需要从数据源中获取具体的实体、属性和关系。本文以建筑规范专业性文本为数据基础,包含各类结构化数据、半/非结构化数据,且主要以非结构化数据为主[10]。

1) 数据源获取与处理。

针对结构类型差异的数据需采用不同的技术方式获取知识。(1)结构化数据多存储于关系数据库或行业领域数据库中,开源工具多为D2R Graph和D2RT,针对此类数据,采用D2R(Data to RDF)技术进行数据知识的提取、整合;(2)半结构化数据中既含有结构信息,又存在数据资源,典型的半数据类型有HTML、IFC和JSON文件等;(3)非结构化数据结构形态存在不确定性,因其结构的特殊性使得不同结构类型的文本不受约束限制,可容纳最大数量的数据信息。如建筑规范中的纯文本数据是典型的非结构化信息。考虑到半结构化和非结构化数据的特殊性,文章采用知识抽取技术获取其核心信息内容,具体分为命名实体识别[11](NER,named entity recognition)和关系抽取[12](RE,relation extraction)两部分。

2) 命名实体识别。

实体是建筑规范领域知识图谱中的最基本数据,命名实体识别将无序的知识进行结构化和数字化,并定义全新的概念模式,且由此为基础对已识别的实体进行归类分析,从而为实体的语义表示提供基础。传统的命名实体识别方法只注重于‘词-字符’之间的特征提取,忽略了规范中词的上下文的语义信息,无法表征一词多义[13];同时目前没有一个完整的建筑规范字典囊括所有类型的实体,无法使用文本匹配的方法对实体进行识别,实体识别效果欠佳,难以应用于实施过程中。

综合以上考虑,本文通过分析建筑设计规范文本的特性,并结合拥有多重语义信息表达的BERT模型,提出一种基于BERT-BiLSTM-CRF的命名实体识别模型[14],该模型整体结构如图4所示。

图4 BERT-BiLSTM-CRF模型整体框架

该模型主要分为3个模块。首先将分词标注完成的语料输入至BERT模块,经过模型处理后得到语义丰富的动态词向量;然后再由BiLSTM模块处理得到的词向量,输出相应的标注序列;最后CRF模块对序列进行最优化预测,从最优的处理结果中完成全部实体的抽取与归类。

需要注意的是,本文采用的BERT模块区别与文献:文章采用中文的分词习惯,将整词作为一个单元进行训练,以全词Mask[15]的方法应用在建筑规范上,全词Mask遵循“共荣”原则,即只需整词中的一部分被Mask即可,剩余部分也会被Mask。避免了整词被拆分成单个字,在训练过程中被随机Mask,造成训练结果不理想情况。分词情况具体如表2所示。

表2 全词Mask

全词Mask的BERT模块结构如图5所示。

图5 BERT模块(全词Mask)结构图

基于模型的命名实体识别的具体步骤为:(1)将建筑规范中的相关条文细则转换为txt格式的文本语料,并进行相应存储;(2)利用jieba工具等对已储存的文本语料进行分词标注工作;(3)利用TensorFlow对改进的BERT-BiLSTM-CRF模型进行训练,首先对部分数据进行训练,让模型掌握从语句中提取所需实体并进行分类的能力,之后在模型中训练已有的训练集的数据,训练完成后得到最终可用模型;(4)将预处理后的文本输入到最终的模型中,从而完成对实体的识别任务。

3) 关系/属性抽取。

关系抽取的目标是从规范中抽取出实体、属性及属性值三者间的表达关系。传统的关系抽取方法大多是基于手动构造语义规则的方法进行实体关系识别,在取得较好效果的同时也造成严重人工成本损失,同时极易产生依存关系包含率低、关系混淆、词性识别错误等情况,严重影响到关系抽取的质量。

属性可对建筑规范的实体进行全面概括,如耐火极限是建筑楼板的规定条件。徐红霞[16]等通过支持向量机实现对人物属性的抽取,验证了属性可看做实体和属性值之间的某种链接关系。本文将建筑规范属性抽取作为关系抽取工作的分支。

本文提出一种基于注意力机制[17]融合句子语义的建筑规范关系抽取方法,结合建筑规范的语言特性,通过分析研究句子语义相似性及特征关系,构造句子特征表示,并输入到模型中。模型的关键部分为注意力机制,其通过分析句子中词与词之间的关联层度修改权值系数矩阵来得到词表征,如式(1)所示:

(1)

图6 注意力机制融合句子语义的模型结构

由图5模型所示,当输入某一建筑规范语句,如“住宅建筑的设计规范要求,消防设计部分”,首先将该建筑规范语句进行jieba分词处理,再输入进BERT模块完成标注工作;然后将训练完的词向量输入到BiLSTM模型中,通过模型的前后文信息向量解析得到句子语义信息;最后注意力机制给句子中的各个字赋不同的权值,将低权值信息当成无用信息并自动忽视,只注重高权值信息,从而获取到影响实体关系抽取的字节,最终基于softmax层对输入权值向量的语句关系进行分类。最终输出结果为“住宅建筑的消防设计规范”。

2.1.3 知识融合与存储

知识融合与存储是知识图谱底层设计的重要环节,有效提升较大场景图谱的整合利用率。本文通过基于自适应双阈值算法的实体对齐方法,实现对建筑规范的知识融合;此外,选用高性能、成熟度好的Neo4j[18]图数据库来进行知识存储需求,一定程度上解决建筑规范数据高价值密度、数量集大、设计范围广等问题。

建筑规范领域知识融合完成后,采用知识存储映射算法将其转换到Neo4j图数据库中,完成建筑规范知识的存储工作。将建筑规范中的‘概念’、‘关系’和‘实体’元素构成三元组,具体见式(2)。

Graph=(C,R,E)

(2)

其中,‘概念’对应Neo4j图数据库的标签,具有类别作用;‘实体’对应节点,形象直接列出具体实体;‘关系’对应数据库的边,指明存在关系属性的实体范围。

基于映射算法的知识存储流程具体如下。

输入:Neo4j图数据库地址(dbURI)、RDF文件;

输出:Neo4j图数据库中存储的融合数据内容;

(1) 基于Jena的API接口读取解析RDF数据文件,得到所有三元组R,之后解析三元组Ri(三元组数量为n个,i≤n)为Triple={s,p,o}。

(2) 基于公开的REST_API设计封装模式,并以此为接口对访问Neo4j图数据库地址进行连接,针对数据库事务采用begin_Transaction和commit_ transaction模块进行事务的开始与确定。同时为‘实体’和‘关系’创建数据库索引RestNode, RestRelationship。

(3) 从实体索引中获取triple.s及triple.o的对应节点Vs和Vo,查看数据库中是否已存在Vs和Vo,若已存储则进行下一步,反之则重新创建节点并添加到实体索引中。

(4) 与步骤(3)相似,首先从关系索引中获取triple.p的对应边Ep,查看数据库中是否已存储Ep,若已存在则进行下步操作,反之则创建全新Vs→Vo的有向边,并将其加入到关系索引中。

(5) 检查是否所有的三元组Ri已完成遍历任务,若i

(6) 建筑规范领域知识存储于Neo4j图数据库中,并做可视化展示。具体算法流程如图7所示。

图7 知识存储算法流程

2.2 建筑模型数据提取

BIM数据具有多源异构的特性,在数据表达方式上存在较大差异,为保证智能审图拥有较好的数据基础,本文采用了基于IFC的数据提取方法。

首先,将多源异构的BIM数据解析转化为IFC格式文件,同时结合已构建的知识图谱,获取建筑规范的实体、属性及关系集合的三元组(E,Rt,S)。之后,依据其中的属性集Rt,得到审图所需类型集T;根据实体与属性间的关系,得到审图所需模件集C。具体关系如式(3)所示。

T=∪(i=1,n)ti

C=∪(i=1,n)ci

(3)

其中:(ti,ci)分别为审图所需的具体类型、单一类型模件的集合。

筛选、提取与审图相关的模件信息,先提取模件集C中每个模件的具体数据信息,并将其归类罗列为基础信息数据集B、状态信息数据集G及属性信息数据集A三个方面;最后,整合处理3个方面的数据集,得到最终审图数据集P。具体关系如式(4)所示:

B=∪(i=1,n)bi

G=∪(i=1,n)gi

A=∪(i=1,n)ai

P=∪(i=1,n)pi

(4)

其中:(bi,gi,ai)分别为单一模件的基础信息、状态信息及属性信息数据;pi为智能化审图某一个数据单元。建筑模型数据提取具体流程如图8所示。

图8 建筑模型数据提取流程

2.3 建筑模型数据与知识图谱匹配

在完成建筑模型数据提取的基础上,实现数据信息与知识图谱的匹配,并将匹配内容转化为三维可视的智能化审图结果。具体任务为完成模型数据与知识图谱中的条文细则匹配工作。

m=max(li),i≤n

(5)

其中:m,n分别为约束向量的最大维数、审图内容数量;li为第i类的约束向量维数。向量组补齐如图9示意。

图9 向量组补齐示意图

通过向量组中的数值元素判断被审建筑模型是否符合规范要求,若审图结果低于对应的规则条文约束,则向量组数值元素为“0”,反之则显示为“1”。

2.4 网页端可视化展示

为实现建筑模型及审图结果的三维可视化展示及跨平台查看等功能,本系统研究设计Web端可视化展示功能模块。系统基于HTML5标准下的语言描述方式构建网络应用内容,在visual studio2018编译环境下,采用JavaScript语言实现对模型的json文件解析和模型网页端重建。具体步骤为:首先搭建HTML5框架,完成系统网页端架构的实现;之后搭建Three.js[20]渲染场景,以此创建场景、相机和光源,使得医疗建筑的三维模型及后续对象能在屏幕上最佳显示;对json文件进行解析并进行网页开发,实现建筑模型在网页端三维展示。用户可直接于浏览器中查看模型信息及审图内容,方便快捷,无需安装专业的模型生成软件,且系统具有可扩展性,方便后续内容的添加与修改。

3 建筑智能审图系统设计与实现

本系统结构化梳理审图所需的建筑规范条文、行业文本标准等数据信息,并解析转化建筑模型数据,之后将二者进行向量匹配比较,完成建筑审图自动化的基础工作。基于此,设计开发建筑智能化审图系统,主要包括模型上传与查看模块、模型构件审图模块、模型功能房间审图模块3个部分。

3.1 模型上传与查看模块

相关人员可基于该模块上传需审图的建筑模型并展示三维可视化场景,并对模型进行缩放平移等功能。具体步骤为:将待审建筑Revit模型导入系统中,再进行建筑模型json格式文件的读取解析、构件信息重构、几何空间构建等步骤,完成待审建筑模型到网页端展示的全部工作。

此外,用户可通过添加鼠标控件在网页端实现对建筑模型及模型所含构件进行操作,可全方位查看建筑模型。如图10展示的为模型旋转缩放平移效果。

图10 模型交互查看效果图

3.2 模型构件审图模块

用户点击建筑模型的某一构件,系统自动生成审图报告,主要从构件的属性、平面布置以及消防信息等方面进行数据信息展示,同时显示数据对应的指标数值以及相对应的规范标准细则。为了验证系统审图的准确性,点击模型中的‘楼板’构件,系统自动生成审图报告,审图结果如图11所示。

图11 模型构件审图结果展示

3.3 模型功能房间审图模块

用户通过模型数据审查模块,可实现对建筑模型中各房间部门的审查,包括房间的平面布置、消防查询、构件属性以及其他信息说明,同时生成房间明细表,对模型内的所有房间进行所在楼层、房间面积等信息展示。选择‘模型审查模块’中的‘房间审查’部分,点击某类型功能房间,具体审图内容展示如图12所示。

图12 功能房间审图展示

3.4 实验结果与分析

为了验证所构建系统的准确性与有效性,选取某地眼科医院建筑作为实验对象,人为将医院建筑模型中‘门诊部用房’的‘墙体’构件的燃烧等级由A级改为B1级,相关人员通过点击‘数据信息查询’中的‘构建审查-墙’选项,系统自动高亮显示信息有误的墙体构件,并自动生成审查报告和相对应规范条文,设计人员可以方便快捷地对模型进行查看并做相应修改,具体审图结果如图13所示。

图13 实验结果展示

该系统审查出隶属于门诊部的某一‘墙体’构件的燃烧性能等级低于《建筑内部装修设计防火规范GB 50222-2017》[21]中5.2.1条例要求。建筑模型中的楼板的燃烧性能等级为B1,不符合规范的A级等级要求,需修改和完善该类构件。由实验结果可知,该系统针对建筑的智能化审图方面具有高准确度和完备性,满足行业的智能化审图需求。

4 结束语

传统的建筑审图方式存在效率低下、审图准确度较低以及审查范围无法全覆盖等一系列问题,无法满足当前社会智能化,信息化的审图行业需求。本文利用BIM技术先进的数据协作能力,并结合拥有强大知识管理能力的知识图谱技术,设计开发了建筑智能审图系统,为运维人员提供了全新的直观易懂、快速准确的建筑模型审图方式,进一步降低模型审图对人工的依赖性,提高了建筑审图的效率与准确度。此外后续可扩展知识图谱在建筑其他领域的应用,丰富建筑规范知识图谱的信息维度容纳。

猜你喜欢

图谱实体规范
“植物界大熊猫”完整基因组图谱首次发布
钢结构防火设计规范及要点探讨
基于伪谱法的水下航行体快速操舵变深图谱研究
基于ColBert-EL 和MRC 模型的零样本实体链接
规范汉字书写
从创新探索到立法规范
规范汉字书写
实体钱
图表
2017实体经济领军者