基于知识图谱技术的住建领域AI知识平台构建
2022-03-04刘学东高凤许小虎冯川川张海月吴自成
文|刘学东 高凤 许小虎 冯川川 张海月 吴自成
住建领域知识图谱发展现状与推广进阶路线
知识图谱通过RDF(三元组)大规模语义网路表达大数据时代知识,为描绘物理世界生产生活行为提供有效的方法和工具。而知识图谱也是现阶段对认知智能所形成的知识底座数据支撑,承载人工智能数据、算法、算力着床。伴随“十四五”规划大力发展人工智能技术,以及随着近些年大数据逐步对住建领域的渗透,人工智能技术在行业已从感知智能阶段全面进入认知智能阶段。
1.人工智能与知识图谱在住建领域发展现状
2020年发改委明确界定“新基建”:以新技术创新为驱动,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级,融合创新服务的基础设施体系。以“新城建”对接“新基建”,引领城市转型升级,推进城市现代化,“新基建”进入发展快速车道。
(1)“新基建”加速人工智能应用落地
人工智能本身被定义为一种新的基础设施,“新基建”又推动人工智能产业化,为人工智能产业提供基础设施。受发展政策利好,各地政府与企业纷纷投入建设,根据中国信息通信研究院统计数据,“十四五”规划期间,“新基建”投资预计达到10.6 万亿,占全社会基础设施投资10%。
随着“新基建”推动,带动工程数字化建设、区域链及大数据集成,数据量将迎来爆发式暴涨,全国数据中心大规模建设,企业业务整体趋向云端化,直接加速了AI 模型开发、训练和推理应用迭代;数据与物联网场景实时对接,进行边缘数据处理,带动边缘数据的崛起,整体降低算力成本;随着“新基建”数据融合面的不断拓展,同时也带动了人工智能应用场景的拓展。总体来看,“新基建”为人工智能在现阶段带来数据、算法、算力、应用场景等基础建设全面支持。
(2)城市信息模型CIM 建设
以城市数据为基础建立的三维城市空间模型,是地理信息系统(GIS)、建筑信息模型(BIM)和物联网(IoT)的有机结合。随着CIM 构建的数字孪生生命周期的深入,CIM 建设由概念阶段逐渐融入AI 人工智能、云计算、大数据后的加速发展,CIM+应用平台建设与数据颗粒度需求的提高,多源异构数据的融合引发数据标准规范体系、信息安全体系和运维保障体系需求升级。
图1 CIM 发展趋势
现阶段CIM 发展分两个主要发展方向:一是以智慧城市为切入点;二是以支撑工改为切入点。CIM 功能模块主要围绕数据的汇聚、查询、管理、可视化、应用方向开展,数据可视化逐渐接近人的感知,模型关联更接近实体,与物联网融合向着可分析与智能决策方向迈进,AI 人工智能与知识图谱融合技术成为必然选择。
(3)数字标准知识体系赋能数字化转型升级
应对住建领域知识量庞杂,量大且刚需多样化,隐藏信息难发现,人工判定成本高,机器决策难理解,业务横向难贯穿等诸多因素,为促进全生命发展,住建知识平台融合AI 人工智能技术与知识图谱技术,梳理住建行业知识,数字结构化住建标准、规范等,形成住建领域数字标准知识体系,采用高度统一的可视化知识数据和知识解释权,形成各阶段、各专业知识贯通微循环,自动驱动知识学习、结构化重组更新,综合校准知识,以标准数字体系实现数字知识立体化管理,全面助力行业数字化转型升级。
2.知识图谱在住建领域应用价值
从政策、行业、经济、技术方面共同的作用,造就了住建智慧化升级的必然趋势,驱动住建知识平台建设。
(1)知识平台外部
在数字经济时代,数据是最重要的生产要素,建筑行业的数据资源虽然规模庞大,但在数据的关联使用上仍有不足。政策、新基建的规划领域中,明确提出对人工智能融合新型基础建设的必要性。促进产业经济拉动,产业链已初具规模,互联网公司、人工智能公司及大数据智能公司纷纷入局;2019年知识图谱核心产品市场规模约65 亿元;预计2024年将突破200 亿元;2019年知识图谱技术带动经济增长规模约391.8 亿元,预计 2024年将突破1000亿元。
数字经济与大数据的不断发展,传统经济模式和应用场景持续变革,建筑行业数据应用离不开知识图谱等相关人工智能技术的支撑。缓解住建行业暴露出诸多的问题,人口红利消失,实体经济结构转型,专家成本高昂,建筑行业管控越来越严格等。
(2)数字政府管控
图2 住建知识图谱
“互联网+政务服务”深化发展,深化“数智+政务”的深度融合。住建领域集中解决政府数据碎片化,引导行业突破技术壁垒,以健全统一标准实现数据共享及开放,驱动行业实现数据决策、推理的深度应用,解决数据资源应用单一,海量数据资源浪费。
图3 知识平台架构
图4 数字化智能查询
图5 知识可视化查询
(3)行业内部问题驱动改革
数据贯穿“规、建、管”整个建设过程,实现住建领域技术由感知智能向认知智能,数据管理到数智管理整体转变。
住建知识平台建设
住建AI·建筑知识平台将国家规范、国标图集、地方标准、设计图纸、工程模型、专家经验等知识利用人工智能技术翻译成结构化立体化的计算机可理解的语言,实现知识的精准查询、语音问答、智能推荐、专家解答等,服务于规划、设计、审查、运维全生命周期,助力建筑行业由“数据管理”向“知识管理”升级。
(1)数字化智能查询。相关设计知识的精准查询-通过对查询内容的理解和分析,让知识查询更高效、关联知识推送更精准,有效提高使用者工作学习效率。
(2)知识可视化查询。对建筑行业知识进行拆解、关联、重组,形成建筑知识规则库,实现知识的可视化和关联知识的快速筛选。
(3)语音智能问答。结合语音技术,对于设计中常见的问题,用户可通过语音问答的方式对系统进行提问,系统会对问题进行分析,与用户进行多轮交互,最终给出对应答案。
(4)规范与审查的联动。实现规范条文的一键解析,自动识别出条文中的实体要素和逻辑关系,快速生成审查算法,实现智能审查。
住建知识平台未来发展趋势及推广进阶路线
图6 知识关联查询
知识类是一个特殊的内容形体,目前阶段大量的媒体传播平台还是聚焦在尾部,KOL 市场的开发是当下面临的问题。知识数字标准化体系进阶路径是根据实施过程中能力状态,形成匹配、可执行、具有发展战略的价值目标。将经历“政府搭台多方参与”到“规建管一体化”实施的可持续发展过程。
图7 语音智能问答
图8 规范一键解析
知识专业壁垒问题,更多强调知识的规范性、专业性及权威性。知识作为文明的传播载体,内容覆盖垂直属性强烈。而住建知识平台的价值是为用户进行行业知识、专业领域经验进行充电,同时知识平台也从用户中实现自我充电,随着政策引导、顶层发展规划建设,数据将成为新的生产新要素,成为竞争力之一,已然成为共识,随着算力和技术的发展,大数据和AI 技术融合下的数据智能,将逐渐带动工程建设在商业环境中应用,并间接创造价值。
数据是一切AI 人工智能技术模型的基础,完善数据基础的设施建设对于AI 发展至关重要,随着住建知识数据平台的应用,多种应用场景智能化应用需求,提升数据效率将成为眼下重点关注对象。首先,在数据接入方面,利用OCR、NLP 和机器学习技术,自动化批量接入同源异构数据,将成为数据发展态势;其次,基于机器学习、深度学习的过程中提取有效的数据质量评估指标,逐渐实现数据自动化清洗,建立重复识别匹配规则和匹配链接规则;利用语音识别、CV、文本分析等技术实现企业元数据的业务词库的构建,提取各类有价值的非结构化元数据的资源池;最后,基于机器学习、NLP 和文本聚类分类技术,对数据进行基于内容的实时精准分类分级,防止重要数据泄露,信息的安全性将从科技技术上提升得以保障,从而推动“新城建”向产业动能转化。
图9 规范知识推理
图10 联动审图
基于现阶段住建知识图谱技术处于初步探索阶段,整个建设应遵从以单点应用为探索出发,利用计算机算法、算力对大数据分析和应用,逐步形成局部优化应用模块。随着技术逐渐成熟,实现单点向多领域复制,形成体系化融合,趋于完善,完成生态重构。宏观上,严格恪守“产”“政”齐飞,重塑区域经济发展与生存认知的高度一致性,知识平台建设涉及组织、流程、业务、区域企业共同配合。需总体实现区域主导思想的转变,管理模式的转变。
建筑产业智能化的前提是产业数字化,建筑产业数字化的前提是建筑知识化,各方参与的数智时代将为建筑创建一个全新产业生态,随着住建知识平台逐步深入覆盖市场,最终将改变行业格局的态势。