城市轨道交通行业大数据服务平台的研究与设计
2022-02-06阳梦华卢乐天
阳梦华,卢乐天
(湖南省邮电规划设计院有限公司,湖南 长沙 410000)
0 引 言
目前,世界各国的轨道交通发展呈现百花齐放的局面,轨道交通运输具有流量大、安全、可靠等优点。城市轨道作为城市交通出行的重要工具,为城市居民的工作和生活带来了诸多效益的同时,也使得城市轨道交通的建设与运营部门面临着巨大的挑战[1-6]。随着城市轨道建设的增多,城市轨道交通集团的信息化手段在不断增加,城市轨道业务数据规模和种类也在不断增加,需要借助云计算、大数据、物联网等技术手段,从技术驱动到数据驱动,为城市轨道交通单位的业务数据化、数据业务化等方面提供有力的支撑。
通过对城市轨道交通集团信息化系统的数据进行归集和整合,并对业务数据进行治理和规划,建立城市轨道交通大数据服务平台,为城市轨道交通单位的业务管理、便民服务、广告运营、安全生产以及工程建设等业务提供数据服务能力。
1 存在的问题
由于城市轨道交通集团一般涉及多个部门、各类子公司等,业务复杂、数据分散,现有城市轨道交通单位应用系统存在的问题主要包括以下几点。
1.1 缺乏有效的数据标准规范
由于国内各个城市的经济等方面存在着差异,因此对于轨道交通运营和管理标准也存在着差异[7]。城市轨道交通集团内各部门和子公司的业务系统属于各自独立建设,部门间的数据格式、数据结构等不统一,导致数据交换存在一定的困难。没有实现统一的数据标准规范,存在严重的数据壁垒。
1.2 数据资源分散,难以集中管控
由于城市轨道交通集团各部门及子公司单独建立业务系统,数据资源暂时都是分布在各个业务部门的业务系统中,集团不清楚现有数据规模、数据类型以及数据分布区域。此外,由于数据分散在各个业务系统中,存在数据源不统一、数据质量规则不规范以及数据安全不合规等现象,难以对内部数据资源进行统一管控和利用[8-10]。
1.3 部门间数据共享难度大
城市轨道交通集团没有统一的数据资源集中平台,各部门及子公司的数据交换共享只能点对点,有些业务系统之间甚至没有对接接口,只能通过拷贝方式,部门间数据共享难度大。在各部门间没有渠道实现数据资源共享交换的情况下,数据平台的建立对数据资源的共享交换提供了有力支持。
2 建设内容
2.1 建立统一的大数据服务平台
建立统一的大数据服务平台,对现有数据及新增数据进行统一梳理和整合,摸清轨道交通集团内部的数据资源情况,包括现有业务系统、数据资源情况、现有系统运行情况、数据规模、使用的数据库类型及数据分布情况等内容,分析轨道交通集团内部部门间共享交换的需求和应用场景,为数据共享交换提供条件,有助于对数据进行挖掘分析,为轨道交通集团的运营和领导决策提供有力支撑。
2.2 建立统一的数据资源管理平台
遵循国家、省市及行业标准,通过对城市轨道交通集团建立统一的标准规范,制定相应的管理办法和规章制度,建立统一的数据资源管理平台,对现有数据及新增数据进行集中的标准和质量检测管理。建立元数据溯源管理系统,对发现的数据质量问题及时通知相应的部门和源系统负责人,出具数据质量评估报告,实现数据标准输入和规范输出,提升数据质量,为轨道交通集团内部挖掘和分析数据打好基础。
2.3 建立主数据管理系统
城市轨道交通集团各部门及子公司各业务系统存在很多共享数据,如客户、员工、物资等等数据信息,统一由主数据管理系统统一标准,准实时或实时更新到其他的业务系统中,实现主数据的标准性,便于数据的维护和管理。
3 大数据服务平台
城市轨道交通集团大数据服务平台的建设主要是实现企业各类数据的统一采集、处理、存储、加工、分析以及展现等,加强数据资源管理科学化,提升业务运营支撑能力,强化信息资源梳理整合,实现数据归集及整理、数据分析等功能,支撑集团内部的数据共享与决策分析,全方位提升集团在业务运营管理、运营评估优化、应急指挥协调、资源开发策略、公众信息服务等方面的综合分析支撑能力。
数据源的数据来自于城市轨道交通部门的内部数据,包括运营管理数据、经营管理数据、工程建设数据以及企业管理数据等,通过各业务系统的数据库将源数据通过数据仓库技术抽取转换进入基础数据资源库中。
数据资源层包含基础数据资源库、数据仓库、专题库、全文库、数据资源目录以及数据资源管理工具等内容,主要是用于对数据的存储、计算和分析,通过对城市轨道业务数据的梳理、清洗、整合,建立运营管理、维护保障、工程建设、人力资源以及财务保障等主题库。
数据服务层包括数据服务接口、企业服务总线内容,主要用于对上层应用的数据服务提供支撑服务。数据服务接口主要包括数据查询、数据下载、数据操作、数据交换等接口,通过接口配置功能实现业务系统对基础数据资源库的访问;企业服务总线主要包括服务注册、服务提供者和服务需求者,服务提供者将服务注册到企业服务总线上,由服务总线进行服务接口的统一管理和调度。
应用展示是对上层应用业务需求功能的展示,实现数据服务的能力,包括数据查询、分类统计、报表展示等内容,并及时建立城市轨道交通行业的大数据应用,包括客流预测、设备故障预测、运营仿真预测等。
4 数据资源管理平台
数据资源管理平台主要包括数据标准管理、数据质量管理、元数据管理及数据资源监控,通过制定统一的数据标准规范和质量检测规则,帮助城市轨道集团对内部业务数据进行标准规范和质量提升,并通过元数据管理确定数据资源之间的关系,实现城市轨道数据资源的资产化和价值化。
数据标准管理是基于城市轨道交通部门内部业务情况,在国家、省、市及行业标准基础上建立内部的业务标准、数据标准、共享交换标准、安全标准等,为数据标准管理提供依据。数据质量管理基于数据标准管理对数据质量规则进行规范,并对各业务部门提供的数据提出要求,检查归集到大数据服务平台的数据,在发现问题数据后及时进行反馈和改进,定时出具质量检查报告,不断提升大数据服务平台的质量。元数据管理主要是通过对归集到大数据服务平台的业务数据、技术数据以及管理数据进行管理,确定元数据的标准和数据的源头,为数据血缘、数据地图分析提供支撑。数据资源监控是实时监控进入大数据服务平台的数据资源情况,对采集的数据资源进行实时管理,发现问题并及时进行告警和反馈,同时统计大数据服务平台现有数据规模、数据质量等情况,掌握企业内部的数据资产情况。
5 主数据管理系统
企业需要重点管理主数据,对主数据的管理相当于抓住了数据管理的主线,能起到事半功倍的效果。基于城市轨道交通集团的业务发展和管理需要,分析数据架构与业务应用、集成架构之间流转的数据,识别出部分城市轨道交通集团内部的主数据及主要的业务数据。主数据管理信息流如图1所示。
图1 主数据管理信息流
主 数 据 管 理(Master Data Management,MDM)系统的数据主要是偏交易型的操作数据,数据源来自于各个操作业务数据库。主数据信息如表1所示。
表1 主数据信息表
主数据管理的信息流是某个业务库的主数据进行更新后,通过抽取、转换、加载(Extract-Transform-Load,ETL)后进入主数据管理系统,主数据管理系统通过元数据管理、质量检测、标准规范后,对主数据进行标准统一,通过企业服务总线将统一后的主数据分发给其他含有主数据内容的业务库,实现数据的实时/准实时一致性。主数据与数据仓库的数据可以互相调用,主数据更新后同步到数据仓库,数据仓库新生成的一些历史数据也可以同步到主数据管理系统中。主数据属于业务操作型数据,数据仓库的数据面向主题,主要用于分析应用,2者相辅相成,缺一不可。
6 大数据应用
6.1 设备故障预测
通过大数据服务平台采集和整合各车辆设备、运维设备以及监控设备等设备数据,通过数据分析工具建立设备故障预测模型,帮助运维人员预测设备告警级别,在设备出现故障之前迅速且准确地定位问题并排除故障,达到智能监控网络设备的目的,降低设备故障率。
6.2 客流预测
客流预测是大数据技术在轨道交通中的另一个应用,根据现有的轨道客流数据,统计出各线路、各站点的客流量、断面客流以及各站间和各区域的客流数据,利用大数据挖掘分析能力有效获取关键信息,迅速且较准确地找出其内部规律。分析各个节假日、各个条线的轨道交通客流变化趋势,提前做好客流预测,不仅能合理规划其他线网,还能为轨道运营管理和行车组织提供重要的依据。
6.3 运营仿真预测
基于大数据服务平台的数据基础和分析模型,建立车站仿真、线路仿真以及路网仿真平台,实现相应层次轨道交通运营环节的仿真和3个层次之间的交互,实现对轨道系统有机整体的全面描述与展现。
7 结 论
城市轨道交通行业大数据服务平台主要通过对城市轨道交通集团内部复杂的业务数据进行梳理、清洗和汇聚,通过数据资源的治理,规范数据标准,提升数据质量,对主数据进行统一管理,为业务部门间数据共享和交换提供便利,为集团领导提供决策支撑,更好地服务公众。