基于元数据的铁路设计成果数字化交付方案研究
2020-07-24解亚龙刘北胜王万齐
解亚龙,刘北胜,王万齐,顾 爽
(1.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081;2.北京交通大学 科学技术处,北京 100044)
随着铁路工程建设信息化进程的推进,当务之急是通过信息化技术手段对铁路建设项目施工图及变更设计成果的交付过程和交付物内容进行规范。按照统一的数据标准和交付格式,完成数字化设计成果的交付工作,并逐步实现铁路工程项目预可行性研究、可行性研究、初步设计阶段的设计成果数字化交付。在推进过程中分步骤实现数字化审批、电子签名、电子版文件分发管理等工作,最终实现设计成果的数字化交付。
数字化交付与传统的纸质交付最大的区别是数据传递方式的改变。纸质交付中的数据传递一般通过数据报表来完成,报表中的数据缺乏严格的格式规范与结构关系,属于非结构化数据,无法直接通过计算机进行识别和解析。这种方式给后期数据的分析和利用带来很多不便,不能有效发挥数据资源的真正价值。数字化交付的目标是实现设计成果数据的结构化交付,通过对数据的语义、格式、结构等进行规范,建立一个全行业统一的数据语义字典和数据结构标准,使铁路行业信息供应链中的各方以统一的格式创建和管理数据,从而使数据能够高效、无损传递。
铁路行业的设计成果数据量庞大,数据来源范围广,涉及多个专业领域,数据关联关系复杂,这对设计成果的数字化交付提出了新的挑战。元数据针对上述情况为数据资源的生产者和使用者提供了有效的管理手段。本文对铁路基础设施全寿命周期信息化管理的整体规划进行了阐述,对整体规划中设计成果交付的相关问题进行了分析,并根据数字化交付的具体需求提出基于元数据的铁路设计成果数字化交付解决方案。
1 铁路基础设施的全寿命周期信息化管理总体规划
1.1 体系架构
铁路工程建设项目具有规模大、技术标准高、建设速度快、管理协调复杂、周期长等特点。传统的工程管理模式难以适应铁路工程建设信息化的发展需求[1]。2012 年以来,中国国家铁路集团有限公司着手设计铁路工程管理平台,并制定了以铁路工程设计、建造、运营全寿命周期管理为目标的平台总体规划。总体规划中的一项重要需求是实现“勘察-设计-施工-运维”数据的一体化集中管理,从而建立铁路工程建设信息化各参与方的联接,促进各方交流与互动。在总体规划的指导下,构建铁路基础设施全寿命周期信息化管理的体系架构,包含设计协同平台、铁路基础设施数据平台、铁路建设管理平台和施工建造管理平台4 部分,如图1 所示。
图1 铁路基础设施全寿命周期信息化管理的体系架构
铁路基础设施数据平台贯穿铁路工程建设项目全寿命周期,是整个体系的核心基础。设计协同平台产生的设计成果数据通过设计交付系统移交至基础设施数据平台进行统一管理和维护,基础设施数据平台为建设管理平台中的各应用提供数据支撑,同时接收建造阶段产生的过程数据。设计交付系统主要负责承接设计阶段产生的成果数据并向基础设施数据平台移交,起到了数据传递的重要作用。本文的主要研究内容围绕设计成果的数字化交付,通过元数据管理和应用,实现设计成果数据的统一格式创建和移交。
1.2 数字化交付相关问题
为了实现设计成果的数字化交付,需要考虑交付文件格式、交付数据结构、数据校验、数据安全、数据合法性认证等问题。
(1)交付文件格式
铁路建设项目设计交付文件可分为结构化文件和非结构化文件2 类,其中结构化文件是指一些设计成果数据文件,例如项目信息、线路参数等。这些数据需要以结构化的方式创建和提交,一般采用JSON或XML 方式表达。非结构化文件是指图纸、文档类文件,一般以通用的PDF 格式文件表达。
(2)交付数据结构
数字化交付的核心目标是设计成果数据以统一的数据结构进行创建和交换。需通过对行业关键业务数据的梳理,建立行业数据标准,规范关键业务数据的内容、格式、结构等。数据的生产者根据数据标准进行数据创建,从而达到数据结构的统一。
(3)数据校验
交付的设计成果数据在进入基础设施数据平台之前需要进行校验,检查数据是否符合数据标准,找出内容、格式、结构、取值不符合数据标准的数据项,保证数据的质量。
(4)数据安全
交付的设计成果数据具有极高的价值,需要确保数据在传递过程中不被盗用及篡改,因此应采用数据加密及线下移交的方式保证数据安全。将设计成果数据文件通过加密光盘的方式进行移交,数据的导入和导出均在与互联网隔离的专网环境中进行,杜绝数据被非法窃取的情况。
(5)数据合法性认证
2 铁路基础设施元数据管理
2.1 元数据概述
元数据是数据信息管理中的一个重要概念,是关于数据的组织、格式及关系的信息。它用规范的方式对数据的特征进行描述,通过一个模型结构,用标准的数据元素来表达通用的信息[2-3]。元数据具有以下特点。
(1)独立性强
无论使用何种平台,元数据自身不受影响,从而保证了元数据的通用性和可移植性。
(2)提供统一的数据规范
可通过元数据模型来定义实体对象的特征、结构、地位以及与其他对象之间的关系等,形成统一的数据规范。
(3)可生成数据模型
可以通过相关的工具,基于元数据直接生成具体数据的数据结构模型,从而完成具体数据的创建和维护。
2.2 元数据管理流程
实现基于元数据的设计成果数字化交付的前提是建立一套统一的元数据标准。对铁路基础设施元数据进行梳理,实现设计成果数据的统一格式创建,为设计成果规范化、数字化交付提供支撑。元数据管理的具体流程如图2 所示。
当当还小,不能吃太多甜食。于是每次夫妻俩在家吃甜食,都是一个人会帮另一个人打掩护。钱海燕吃的时候,周启明想办法转移注意力;轮到周启明的时候,钱海燕就去逗儿子。
图2 元数据管理流程
2.2.1 元数据梳理
元数据梳理是指利用元数据模型对铁路基础设施关键业务数据的特征、结构和关联关系进行描述。元数据梳理的关键是要建立元数据与铁路IFD(International Framework for Dictionaries)标准的对应关系[4],并最终形成一套基于IFD 标准的铁路元数据标准。
(1)元数据分类
元数据本身具有很强的逻辑结构,一般的元数据都是有层次的树状结构。为了能够对铁路基础设施信息资源进行准确和高效的描述,需要建立铁路基础设施元数据分类结构树,如图3 所示。
图3 铁路基础设施元数据分类结构树
铁路基础设施元数据可分为项目类、人员类、组织类和文档类4 大类。其中项目类包含描述具体项目、线路、专业、设计单元等信息的元数据[5]。
(2)元数据描述
元数据的梳理应从制定统一规范的元数据描述方法入手。参考一些国际上通用的元数据的描述方法,本文从基本信息、类型信息、约束信息、关联关系、附加信息以及管理信息6 个方面对元数据进行描述[6-7],如图4 所示。
图4 元数据描述
2.2.2 元数据维护
元数据的维护工作主要包含著录、审核和标准发布。元数据著录是指将梳理好的元数据导入平台,导入后的元数据可在系统中进行查看、检索和导出等操作。元数据审核是指对梳理出来的元数据进行检查,对有问题的元数据进行更正,从而保证元数据质量。元数据标准发布是指将审核通过的元数据以合适的形式进行发布,提供给信息供应链中的各方使用。
2.2.3 设计成果交付
基于元数据的设计成果交付是指利用元数据对设计成果数据进行创建和组织,使交付的设计成果数据符合统一的元数据标准要求。在设计成果提交时可通过元数据对具体数据的内容、格式、结构进行校验,从而保证交付数据的质量。另外,在元数据应用过程中可能需要对元数据进一步完善和扩充,可通过对元数据的梳理持续更新元数据。
3 基于元数据的设计成果交付方案
本章主要针对元数据的应用方法进行探讨,并提出利用元数据进行设计成果数据交付的方案。
3.1 Schema概述
Schema 是一种可以被计算机识别的元数据表达方式。Schema 使元数据表达更加有效、语义更加清晰和易于交流,显著发挥了元数据的作用,可用于指导设计成果数据的创建,以及对交付的设计成果数据进行校验,保证数据的内容、格式和结构符合统一的标准,为实现铁路信息资源的共建与共享提供了基础保障。Schema 在设计成果交付中有2 个主要应用场景。
(1)设计成果数据的创建
由于Schema 具有很强的结构性,而且完整定义了数据的内容、格式和关系等信息,所以利用Schema 可直接生成设计成果数据结构模型或数据的录入界面。设计成果数据可直接通过Schema 生成的数据模型进行创建。
(2)设计成果数据的校验
由于Schema 可定义数据的格式、约束、取值范围等信息,所以利用Schema 可对设计成果数据进行校验。校验合格的数据符合统一的标准,可显著提高数据的质量和可用性。
3.2 Schema应用流程
利用Schema 进行设计成果数据交付的具体流程如图5 所示。
(1)导出Schema
将元数据按照一定映射规则导出成Schema 形式。Schema 完整定义了数据的内容、格式、结构、约束条件、取值范围等信息,可进行后续数据模型创建、数据校验等工作。
(2)生成数据模型
利用Schema 可直接生成设计成果数据的数据模型,数据模型又为设计阶段各类应用的数据库提供了一个统一的框架。数据的生产者可根据统一的数据库框架进行具体数据的创建。
(3)数据提交和校验
基于Schema 创建的设计成果数据可导出成结构化的数据文件,数据的表达方式一般为JSON 或XML。将具体数据提交到设计交付系统后,需要通过Schema 进行校验。校验的主要内容是数据项命名、数据结构、数据类型、数据格式、数据取值等是否符合元数据规范。校验合格的数据将被导入到基础设施数据平台并提供给数据的使用者进行利用。
4 结束语
本文根据铁路工程建设信息化发展的总体规划,阐述铁路基础设施全寿命周期信息化管理的体系架构,并在此架构的基础上,针对设计成果数字化交付的具体需求,提出了基于元数据的设计成果交付方案,其中包含铁路基础设施元数据的分类和描述方法、元数据的管理和维护流程及基于Schema 的设计成果数据统一格式创建和校验的思路。为铁路设计成果数据的统一格式创建和移交提供了可行的技术路线[8]。
通过对铁路基础设施元数据的梳理,可形成行业内关键业务数据的定义词库,实现行业内各单位关键业务数据的语义统一。在今后的工作中,将进一步深入研究,形成设计成果共享和利用的系统性解决方案,并最终实现行业信息资源共建和共享的目标。