面向数字孪生基于CIM 平台的数据治理研究
2023-09-12汪枫
汪 枫
(上海市城乡建设和交通发展研究院,上海 200032)
引言
数字孪生(Digital Twin)是用数字化方式建立物理实体的虚拟模型,通过实体空间与虚拟空间的交互反馈、融合分析、决策迭代等手段,提高物理实体的精细化管理能力[1]。Grieves 教授[2]于2003 提出了数字孪生实体产品、虚拟产品以及二者间的连接的三维模型。陶飞等[3]对该三维模型进行了扩展,引入孪生数据和服务两个新维度,提出了数字孪生五维模型,并对数字孪生模型构建与交互进行了研究,提出了“四化四可八用”的构建准则,从“感知—通信—映射—联动—融合”五方面提出了数字孪生交互理论[4,5]。张晨源、杨帆等[6,7]对数字孪生模型或孪生体可信度评价指标进行了研究。李琳利等[8]对数字孪生系统信息安全框架及技术进行了研究。赵鹏、陈健等[9,10]分别对电力行业、岩土工程行业数字孪生的关键技术与进展进行了阐述。张超等[11]对行离散型智能车间提出数字孪生制造单元系统新理论模型与参考框架,并进行了建模与验证。冷柏寒等[12]提出了面向可重构制造的数字孪生映射建模与监控仿真一体化平台架构,对虚实映射进行了针对性研究。康孟珍等[13]研究实现了从单向的三维展示的圆明园到虚实互动的平行圆明园,将虚拟空间的圆明园应用于物理空间的圆明园管理模式创新、生态重构及改善体验等。郭丞皓、尚可、张宇琳、张科等[14-17]分别在飞机起落架健康管理、智慧停车场、异质交通流安全、空气污染扩散等具体点上进行数字孪生应用研究。
面对数字孪生,多空间(实体空间、虚拟空间)、多领域、多时域和多类型全域数据治理成为数字孪生的重要支撑与关键,数据治理是数字孪生物理实体与虚拟实体交互融合的核心[18]。张宁等[19]对数据治理的概念、体系、内容和应用的相关研究进行了述评。安小米等[20]通过对三大国际标准化组织ISO(国际标准化组织)、IEC(国际电工委员会)、ITU-T(国际电信联盟电信标准局)数据治理相关标准的分析,提出了数据治理宏观关注政策法规与组织机制,中观落脚点在数据资产规划、设计与管理,微观主要关注数据质量与数据安全的数据治理框架。如何对数字孪生的物理空间、虚拟空间以及连接与互动的数据进行治理的研究与验证,成为加速推进数字孪生城市建设,促进数字孪生深层应用的急为迫切的问题。
在物理空间中,与物理空间位置相关的信息占90%以上,空间位置信息已成为多源信息组织与融合的核心。城市信息模型CIM 基础平台是管理和承载城市空间三维数字模型,集成GIS、BIM 与IoT 数据的综合性基础平台,支撑城市规建管用,是智慧城市的基础性和关键性信息基础设施[21],CIM 平台也是数字孪生城市的支撑平台[22]。
本文分析在数字孪生背景下数据治理的范围,研究提出基于CIM 平台面向数字孪生的数据治理框架,并对基于工作流的数据治理与基于分层分级的多源数据可视化等技术进行研究,给出上海市CIM 平台数据治理建设成果,并对后续研究与实践工作进行讨论。
2 面向数字孪生数据治理框架
2.1 数据治理内容
面向数字孪生,数据治理范围包括物理空间与虚拟空间两大空间的数据,物理空间包括物理数据、服务数据、知识数据与衍生数据,虚拟空间包括虚拟数据、服务数据、知识数据与衍生数据。其中物理数据包括体现实体规格、功能及性能等的物理要素属性数据与反映实体运行状况的IoT 数据,虚拟数据包括三维模型以及仿真、验证、评估、分析与预测等的仿真数据,服务数据包括业务应用算法与行为结果,知识数据包括专家知识、行业标准、规则约束与推理推论等,以及数据处理中的衍生数据等[3]。数据治理内容包括两个空间宏观、中观与微观三个层次。物理空间与虚拟空间的数据治理内容如表1 所示。
表1 物理空间与虚拟空间的数据治理内容
2.2 基于CIM 平台的数据治理框架
城市信息模型CIM 平台是数字孪生数据中、微观数据治理的载体与环境,是数据治理的容器。基于CIM 平台可融合实现的物理空间与虚拟空间的数据治理功能包括:
(1)数据资产管理,包括数据分类分级、数据资产归一化、目录管理、元数据管理;
(2)数据交易管理,包括数据确权、数据估值、数据定价、数据共享、数据交易、数据授权、数据销售、数据审计以及数据服务保障;
(3)数据融合与分析,包括虚实数据融合、时空数据融合、空间数据与业务数据融合、时空数据分析、业务数据分析以及数据可视化等;
2002年台湾淡江大学的Liu提出了一种用于模具抛光的柔顺工具架,它是利用线性弹簧增强设备的柔顺度,即改变接触柔度,以减小模具的表面粗糙度,如图4所示[5]。2007年湖南大学的王平研究了一种利用弹簧产生变形以防止抛光工具与模具表面接触力突变的单自由度自调末端执行器[6]。目前,RAD公司已开发出弹簧式柔顺末端操作器产品,可实现轴向的柔顺控制,如图5所示。
(4)数据质量管理,包括考虑数据一致性、可用性、安全性与可及性的数据收集质量、数据组织质量、数据表示质量以及数据应用质量管理;
(5)数据安全管理,包括考虑机密性、完整性以及可及性的数据隐私安全管理;
(6)标准管理,包括数据标准管理与平台建设标准管理等。
基于CIM 平台中的数据治理框架如图1 所示。
图1 基于CIM 平台的数据治理框架
整个框架包括基础设施、数据中台、业务中台、数字孪生应用、数据安全及标准规范六部分,可对物理空间与虚拟空间的五大类数据进行融合治理。
基于CIM 平台的数据治理框架是可扩展的框架。广义的数据治理包括数据全生命周期各个阶段的所有涉及数据处理与应用的全过程,数据治理是一个循序深入的过程。基于CIM 平台的数据治理框架,可以逐步丰富数据治理内容,通过原子化与模块化,把数据治理内容作为流程节点,通过动态组合,快速实现不同的数据治理需求,并能在现有基础上实现动态柔性扩展与深化。
基于CIM 平台的数据治理框架是开放的框架。五大类数据可逐步进入治理平台,并能以三维空间模型为基础,通过全实体对象的唯一编码,把该对象的全域数据进行关联整合,形成该实体对象历史、现在与未来的全生命周期数据集,进一步支撑数据分析与融合,提供应用服务。
基于CIM 平台的数据治理框架是可视化的框架。数据治理工作涉及大量的计算,数据治理的效果与监控需要可视化展示。通过CIM 平台的全对象实体可视化能力,可以动态叠加对比分析数据治理效果,比如BIM 模型的轻量化数据治理、数据质量管理可视化监控等,通过可视化比对与监控分析动态调整数据治理参数,进而实时动态掌控数据治理过程与效果。
2.3 数据质量与安全治理工作流
科学工作流技术已广泛应用于科学研究、城市管理以及办公自动化OA 等活动,它是将数据管理、计算、分析及可视化等一系列工作变成原子服务,通过数据流、业务流将原子服务组合在一起,通过流程化定制与任务调度执行,解决大规模数据自动化计算问题[23]。基于工作流理念,马文臻等[24]设计实现了自动、高效、实时和标准化的空间科学卫星工作流数据处理系统,完成了多卫星任务、多载荷数据源的大规模数据的高度复杂的处理。科学工作流为解决具有流程性的复杂的数据治理提供了有效的手段。
数据质量管理与安全管理,涉及数据接入、质检、清洗、标签及安全等环节。把这些数据治理环节功能分解为原子模块,通过动态组合,定义工作流节点、流程与任务,实现数据资源动态规划与治理。数据治理核心是建立知识库,通过建立目录发布、数据同步、数据质检、数据清洗、数据标签、数据安全、数据融合以及数据服务发布知识库,结合可视化界面动态配置工作流任务,实施数据质量与安全的自动化治理。基于工作流的动态数据治理,同步保持动态扩展能力,随着知识库的丰富、数据治理功能或模块的增加,将实现虚实空间二三维空间地理数据、IoT 数据、业务管理数据的统一快速治理。图2 是基于工作流的数据质量与安全治理流程框架。
图2 数据质量安全治理工作流框架
2.4 BIM 数据分层分级动态可视化
数据可视化是多源数据治理展示与数字孪生应用的窗口,这要求数据可视化要具有流畅性与沉浸感。边根庆[25]对IFC 格式的BIM 模型重构进行了研究。陈静等[26]对三维模型纹理烘焙和多尺度可视化GPU绘制方法进行了研究。刘北胜[27]提出了基于云渲染技术的三维BIM 模型可视化方案。饶平平等[28]基于模型轻量化技术,建立BIM 模型轻量化平台,并应用于BIM 工程信息分析与应用。
本文在数据可视化过程中,为解决不同场景可视化问题,设计按照市、区、街镇不同的空间范围,分别对应白模、精模、BIM 三维模型数据,单栋BIM 数据按照先外立面再内部细节,研究建立了空间范围与精细度相互配合的分层分级可视化方案,并基于乐高标准构件可插拔理念,通过可插拔技术,构建分层分级可视化能力,实现不同场景三维数据动态加载与分析。
3 上海市CIM 平台数据治理
上海市CIM 平台建立了空间地理信息云环境,集成了二三维空间地理数据、BIM 数据、IoT 数据与业务管理数据,实现了空间数据、业务数据、IoT 数据的统一接入管理、目录管理以及元数据管理,以及数据质检、数据清洗、数据标签、数据安全、数据融合,数据分析、数据共享交换、数据服务及应用支撑。基于工作流实现了数据自动化归集、流程化管理、定制化服务与可视化监控;数据可视化实现了二三维数据一体化、动静态数据一体化、地上地下数据一体化以及BIM 数据分层分级可视化。
3.1 数据质量与安全治理
在上海市CIM 平台中,作为数据中台,通过前置数据库、数据接口和流文件三种方式,连通了17 条数据归集与同步通道;设计了非空、数据范围、长度、唯一、数据格式、数据字典、文件验证、截取验证以及节点验证等10 类质检类型;定义了逻辑错误(去重)、格式内容清洗、缺失值清洗、逻辑错误清洗等6 类清洗类型;设置了信用、行政许可、行政处罚、电子档案、自然人和法人等8 类标签;实施MD5 处理、数据裁切、数据模糊化与AES 4 类安全审计;并建立了证件类型、城市体检指标类型、实施机构、业务状态等约50 个基础数据字典;按照数据质量与安全治理需求,设置数据编目、归集、质检、清洗、标签及安全6 个节点,定制了通用数据处理、简易数据处理、一网通办数据处理、信用数据处理以及电子档案处理等五类数据治理模版;基于工作流编制数据治理流程并实施数据治理任务,每天动态处理约100 万条数据;并对数据治理的六个节点按照红、绿、灰三种状态的进行动态可视化监控(红:异常;绿:正常;灰:没启动)。通过工作流自动化数据治理,大大节约了人力成本,提高了数据质量管理与安全管理的效能。数据治理总体界面如图3 所示。
图3 数据治理监控系统总界面
3.2 BIM 数据融合可视化
基于上海市CIM 平台实现了二维地图服务与三维模型服务的动态叠加,即二三维地理空间数据一体化;实现了交通实时路况、船舶实时位置与城市三维模型的动态叠加,即动态静态数据一体化;实现了地下管线、构筑物以及轨道区间与车站、城市地质等地下三维模型与地上三维模型的叠加,即地上地下三维数据一体化;实现了全市白模、精模以及BIM 模型的分层分级可视化。其中BIM 数据的动态可视化加载与查询分析如图4 ~图7 所示。
图4 全市白模加载
图5 拔下白模数据
图6 插上BIM 数据
图7 BIM 内部细节数据动态加载
4 结语
数字孪生背景下的数据治理是一个持续深入的过程。本文提出了一个基于CIM 平台的数据治理框架,对基于工作流的数据治理与数据可视化二个具体问题进行了初步研究,给出了数据治理成果,这可为相关数据治理研究与实践提供参考。后续研究重点包括:
(1)传统的二维空间地理数据的组织管理方法已经很难适应数字孪生背景下的三维数据管理与应用,需要建立面向实体对象的数据组织理论与方法,以有效支撑多源数据融合、抽取与分析;
(2)目前三维空间模型数据与业务管理数据、社会活动数据集成融合正在研究应用中,但是面对数字孪生,仿真数据与业务数据交互融合成为发挥数字孪生应用的关键;
(3)目前数据安全的理论、政策和技术的研究与突破尤其迫切,区块链技术的研究与应用将可更进一步推进数据安全管理[29,30],因此研究数据上链技术,成为数据安全管理的重要方向。