铁路大数据标准体系研究
2019-08-20吴艳华郑金子李平马小宁
吴艳华,郑金子,李平,马小宁
(中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)
0 引言
随着科技社会的不断进步,各类工作分工越来越细、参与者越来越多、协作过程越来越复杂,标准就是在这些问题越来越显现的阶段应运而生的。GB/T 20000.1—2014《标准化工作指南 第1部分:标准化和相关活动的通用词汇》附录A表A.1序号5.3中对标准的定义是:通过标准化活动,按照规定的程序经协商一致制定,为各种活动或其结果提供规则、指南或特性,供共同使用和重复使用的文件。一方面,制定和实施标准是保障分工协作过程中统一、协调、顺畅的有效措施;另一方面,标准也是科学、技术和实践经验的总结。各行业都纷纷认识到构建标准体系、建立各项标准的重要性,如电子政务行业提出“电子政务标准先行”,制造业提出“智能制造标准先行”。
近年来,铁路先后发布不同专业信息化相关标准及规范等。在公用基础信息标准方面,仅有通信、线路、钢轨损伤、货运事故分类、行车事故统计、货车车种车型车号、货物运输品名等标准;在业务应用系统标准化方面,仅仅涉及到列车超速防护、调度集中和调度监督系统以及DMIS、调度集中和调度监督系统间的数据通信标准;在数据接口方面,制定TMIS与DMIS间的数据接口规范、铁路电子支付平台数据接口规范和中俄铁路电子数据交换接口规范等[1]。总体而言,与电力、银行、航空等行业相比,铁路行业在信息化标准方面还存在一定差距:一是现有铁路信息化标准比较零散,不成体系;二是铁路信息化标准体系是一个有机的整体,正处于逐步建设阶段,许多方面缺乏完备的技术标准。
铁路大数据作为促进铁路业务创新增值、提升企业核心价值的重要驱动力,亟须逐步填充完善其相关标准[2]。基于国家大数据标准体系现状,开展铁路大数据标准体系研究,一方面将健全铁路大数据标准体系,另一方面满足铁路数据服务平台、铁路大数据应用建设的急迫需求,同时也为《铁路信息化总体规划》和《铁路大数据应用实施方案》的全面推进奠定大数据标准化基础。
1 大数据标准研究现状
1.1 国外大数据标准研究现状
美国国家标准与技术研究院(National Institute of Standards and Technology,NIST)的NBD-PWG小组是最早开展大数据标准化工作的组织,该小组下设术语和定义、用例和需求、安全和隐私、参考体系结构以及技术路线图5个分组。目前,已经发布《NIST.SP.1500.1~7》等V1.0版本系列标准,标准卷名分别为《大数据定义》《大数据分类》《大数据用例和需求》《大数据安全和隐私需求》《大数据参考架构调研白皮书》《大数据参考架构》《大数据路线图》,同时V2.0版本研究工作正在展开[3]。英国标准协会(BSI)在2016年上半年发布的研究报告中,从6个方面对大数据潜在标准进行了归纳和研究,包括大数据指导标准、元数据标准、术语和条件标准、消费者数据管理标准、大数据交流标准以及大数据的制定标准等[4]。2012年6月,日本IT战略本部发布电子政务开放数据战略草案,利用标准化技术生产信息确保国民方便获取数据[5-7]。
1.2 我国大数据标准体系现状
在大数据浪潮下,我国大数据标准化研究工作在中华人民共和国工业和信息化部、国家标准化管理委员会的支持下快速开展。2014年2月,全国信息技术标准化技术委员会(TC28)成立大数据标准工作组,主要负责研制我国大数据领域的标准体系,对大数据相关技术标准展开研究[8]。目前,下达的10项第1批大数据国家标准计划中,《信息技术大数据术语》《信息技术大数据参考架构》等3项国家标准开始全面实施,《信息技术数据交易服务平台交易数据描述》《信息技术数据溯源描述模型》等6项国家标准已进入报批阶段。
《大数据标准化白皮书(2018版)》(简称白皮书)中提出了我国大数据标准体系,包含基础标准、数据标准、技术标准、平台/工具标准、管理标准、安全和隐私标准、行业应用标准等。白皮书大数据标准体系框架见图1。
1.3 铁路信息化标准体系现状
2015年,原中国铁路总公司开展了铁路信息化标准体系研究,制定了铁路信息化标准体系框架,由信息技术通用基础标准、基础设施标准、信息资源标准、业务应用标准、信息安全标准、管理与服务标准、新技术应用标准等7大类构成(见图2)[9]。铁路信息化标准体系框架的提出,将为铁路大数据标准体系的构建提供参照。
图1 白皮书大数据标准体系框架
图2 铁路信息化标准体系框架
2 典型行业大数据标准现状及分析
在大数据白皮书的基础上,工业和电力行业纷纷提出大数据标准体系,对各行业都可起到参考作用。对比分析白皮书标准体系与工业大数据标准体系、电力大数据标准体系的对应关系,将为构建铁路大数据标准体系提供参考。
2.1 工业大数据标准体系
2.1.1 概况
工业大数据专题组于2015年7月成立,是全国信息技术标准化技术委员会大数据标准工作组下属专题组之一。专题组在研究提出的工业大数据技术框架基础上,结合工业数据自身标准化特点、工业数据全生命周期管理和当前各领域推动工业大数据应用的典型场景,以及未来工业大数据发展的重点区域,提出工业大数据标准体系框架[10]。
工业大数据标准体系由4个一级标准组成:基础标准、数据处理标准、数据管理标准和应用服务标准。
(1)基础标准为整个标准体系提供3项基础性标准。术语用于统一和规范工业大数据领域的常用术语,参考架构给出工业大数据的基础架构和研究范围。
(2)数据处理标准主要针对工业大数据的数据处理相关技术进行规范。
(3)数据管理标准主要针对工业大数据的数据管理相关技术进行规范。
(4)应用服务标准主要针对工业数据应用平台确定应用和实施规范。
目前,工业大数据专题组提出6项国家标准提案,其中已申请立项4项,即《信息技术工业大数据术语》《信息技术工业大数据参考架构》《信息技术工业大数据产品核心元数据规范》《信息技术工业大数据订单元数据》,同步启动了该4项标准以及《智能制造对象标识符编码与存储规范》《智能制造对象标识的分配、注册与解析》标准的研制工作。相关标准已经在江苏省徐州工程机械集团有限公司等10多家单位开展试点示范和应用推广工作。
2.1.2 与白皮书大数据标准体系的对应关系
白皮书大数据标准体系与工业大数据标准体系的总体对应关系见图3。工业大数据标准体系下设4个一级标准,主要对应白皮书大数据标准体系中的前5个一级标准,即基础标准、数据标准、技术标准、平台/工具标准、管理标准。二者一级标准的对应关系主要包括3方面:
(1)工业大数据标准体系中的“基础标准”与白皮书大数据标准体系的“基础标准”一一对应;
(2)白皮书大数据标准体系中的“平台/工具标准”是工业大数据标准体系中“应用服务”的子集,对应于其二级标准“服务平台”;
(3)工业大数据标准体系中的“数据处理”和“数据管理”是白皮书大数据标准体系中“数据标准”“技术标准”和“管理标准”下属标准的打散重组。
白皮书大数据标准体系与工业大数据标准体系一级标准对应关系见图4。
2.2 电力大数据标准体系
2.2.1 概况
根据大数据应用的本质,大数据的相关标准大多分布在数据的采集、传输、存储和管理、分析挖掘等方面。针对电力行业目前的业务应用及发展现状,电力大数据的相关标准体系现状如下:
(1)大数据采集方面,主要是用电信息采集相关标准和视频监控数据采集相关标准。其中用电信息采集相关的标准包括IEC标准4项、国家标准13项、行业标准3项、国家电网公司企业标准2项。
(2)大数据传输方面,IEEE标准协会制定并通过了一系列智能电网通信标准项目,如IEEE C37.118.2:2011《电力系统同步相数据为转移的标准》,为大数据应用提供了有效支撑。
全球能源互联网研究院通过分析国内外大数据的相关标准,并结合电力大数据技术、产品和应用需求,提出电力大数据标准体系设想。目前,电力行业并未出台专门的电力大数据标准体系,根据《国家电网公司技术标准体系表(2016版)》,提取出大数据相关标准,并整理形成电力大数据标准体系。电力大数据标准体系下设5个一级标准,分别为基础综合、信息通信运行、信息通信资源、信息通信应用技术、信息通信安全。
2.2.2 与白皮书大数据标准体系的对应关系
电力大数据标准体系下设5个一级标准,主要对应于白皮书大数据标准体系中的基础标准、数据标准、技术标准、管理标准4个一级标准。二者一级标准存在2个方面对应关系:
(1)电力大数据标准体系中的“基础综合”与白皮书大数据标准体系的“基础标准”一一对应;
(2)电力大数据标准体系中的“信息通信资源”和“信息通信应用技术”是白皮书大数据标准体系中“数据标准”“技术标准”下属标准的打散重组,但没有体现“处理生命周期技术标准”。
白皮书大数据标准体系与电力大数据标准体系一级标准的对应关系见图5。白皮书大数据标准体系大而全,涵盖了与大数据相关的各个方面。白皮书大数据标准体系与电力大数据标准体系的总体对应关系见图6。
图3 白皮书大数据标准体系与工业大数据标准体系总体对应关系
图4 白皮书大数据标准体系与工业大数据标准体系的一级标准对应关系
3 铁路大数据标准体系研究
基于大数据白皮书中标准体系框架,以及工业大数据标准体系、电力大数据标准体系与之的对比分析,结合铁路大数据应用和实施的需求,提出铁路大数据标准体系框架。
3.1 铁路信息化标准体系与铁路大数据标准体系的对应关系
铁路大数据标准体系在建立过程中,一方面以全国信息技术标准化技术委员会的《大数据标准化白皮书》《工业大数据标准白皮书》为参考,另一方面也以符合铁路信息化标准体系为基本出发点。铁路大数据标准体系与铁路信息化标准体系的总体对应关系见图7。
铁路大数据标准体系共划分为技术和工具、数据、应用、安全、管理等5个子体系。划分出的5个子体系与铁路信息化标准体系的二级体系相对应。其中,“技术和工具”对应于“2.基础设施标准”,“数据”对应于“3.信息资源标准”,“应用”对应于“4.业务应用标准”,“安全”对应于“5.信息安全标准”,“管理”对应于“6.管理与服务标准”。可见,铁路大数据标准体系借鉴相关标准的同时,强化铁路大数据的专题性,且兼容于铁路信息化标准体系,体现该标准的合理性与时效性。
图5 白皮书大数据标准体系与电力大数据标准体系一级标准对应关系
图6 白皮书大数据标准体系与电力大数据标准体系总体对应关系
3.2 铁路大数据标准体系框架
参照国家《关于促进大数据发展行动纲要》《大数据产业发展规划(2016—2020年)》《关于运用大数据加强对市场主体服务和监管的若干意见》《大数据标准白皮书》《工业大数据标准白皮书》等政策和技术文件,以及原中国铁路总公司《信息化总体规划(2017)》和《铁路大数据应用实施方案》,制定铁路大数据标准体系。铁路大数据标准体系见图8。
3.2.1 技术和工具
技术和工具类标准主要是对大数据相关的技术、数据使用过程中的过程性工具和终端应用类工具进行标准化规范,主要包括基础设施和平台、铁路数据采集、铁路数据存储、铁路数据共享、铁路数据挖掘等方面。
基础设施和平台类标准主要是对总体规划中铁路数据服务平台及部署的软硬件要求、功能和性能要求等进行规范;铁路数据采集、存储、共享标准,主要是针对数据从收集到使用过程中的关键技术、工具等进行规范;数据挖掘类标准主要是针对数据挖掘过程中的通用方法、工具和关键技术等进行规范。
图7 铁路大数据标准体系与信息化标准体系对应关系
图8 铁路大数据标准体系
3.2.2 数据
数据标准主要是对铁路相关数据及其质量等进行规范,主要包括铁路主数据、铁路元数据、铁路地理信息数据、铁路数据目录、铁路数据分类分级等。
铁路主数据、元数据和地理信息数据是铁路数据服务平台中存储的基础数据,对这些数据进行标准规范是提升数据质量的重要支撑。以上数据的质量标准可适当参考ISO 8000数据质量系列标准,该系列标准主要是对数据质量的把控,并根据铁路大数据应用和发展的需求,进行适当增补。数据本身的模型、风险、等方面,同样具有较高要求,因此要对数据目录、分类分级等进行规范。
3.2.3 应用
应用类标准从发挥数据价值的角度出发,将应用分为数据访问、开放、共享、交易及行业应用等环节,主要包括与平台数据接口、各业务领域应用等标准。
数据接口标准是描述数据服务平台与各外部系统间的数据接入规范和技术文件,由于外部系统众多,因此需针对不同系统分别制定相应规范。同时,己有铁路相关系统间的接口和共享标准可作为本部分内容的参照文件。各业务领域应用类标准主要针对应用过程中的数据使用、数据分析(专业数据模型、方法)、应用分析工具、可视化工具等进行规范。
3.2.4 安全
安全类标准主要是针对通用的安全和大数据环境下隐私数据的保护,主要包括数据安全、隐私保护等。其中数据安全是基于信息安全技术的系列标准,为数据提供软硬件等多方面的安全保护;隐私保护则重点针对铁路数据中信息主体利益密切相关的数据进行更严格的安全保护。
3.2.5 管理
管理类标准是大数据标准的重要支撑,贯穿于数据生命周期的各阶段,主要包括铁路数据运维、业务数据治理、铁路数据共享。其中数据运维包括数据库维护、运行维护、运行安全维护、大数据系统及相关工具等方面的运维及服务标准;数据治理包括数据资产管理、大数据解决方案设计、数据管理能力成熟度评价等。
4 结束语
为充分发挥大数据在铁路行业的作用,应以“标准先行”。在借鉴国内外大数据标准体系经验的基础上,对大数据标准化白皮书、工业行业和电力行业大数据标准体系进行对比分析,并紧密结合铁路信息化标准体系架构,提出铁路大数据标准体系,既具有客观性又具有实用性。铁路大数据标准体系框架的提出,将为铁路运输企业进一步建立健全大数据应用标准打下基础。