城市轨道交通大数据技术应用研究
2022-03-03宋大治徐钟全刘光杰
宋大治,王 健,徐钟全,刘光杰
(1.南京地铁建设有限公司,南京 210017;2.北京全路通信信号研究设计院集团有限公司,北京 100070;3.南京信息工程大学电子与信息工程学院,南京 210044)
随着近年来城镇化的加快发展,城市人口数量在不断增加,城市规模也在逐步扩大。城市轨道交通以其运输人数量大、运行速度快、安全程度高的优势,成为解决城市人口出行的重要手段。城镇化的趋势使得城市轨道交通的压力也在逐渐加大,城市轨道交通如何适应城镇化的趋势,利用更前沿的技术解决发展过程中遇到的问题是城市轨道交通建设中的重要挑战。
国务院印发的《中国制造2025》在大力推动突破发展的重点领域中着重提到了先进轨道交通装备,指出“加快新材料、新技术和新工艺的应用,重点突破体系化安全保障、节能环保、数字化智能化网络化技术,研制先进可靠适用的产品和轻量化、模块化、谱系化产品。”其中数字化智能化网络化技术的在轨道交通领域的运用和发展是构建世界领先的现代轨道交通产业体系的关键因素。
城市轨道交通在运营、运维日常工作中会产生海量的用户数据、设备数据、日志数据等,这些数据来源众多,种类各异,累积量大,更新频繁,这些数据以自动或主被动的形式产生,形式包括非结构化数据、结构化数据和半结构化的数据,城市轨道交通数据是名副其实的大数据。如何利用这些轨道交通大数据从运营、施工、决策、设计等方面来服务轨道交通,通过对轨道交通大数据存储、加载、结构化、清洗、处理、分析等手段来获取关键指标数据,这是线网指挥中心大数据平台建设的重要要求。
1 城市轨道交通的数据特点
不同于其他方向的信息领域,城市轨道交通数据有4个明显的特点。
1)数据生成符合一定的时序规律
城市轨道交通按照既定的计划和方案来运转,每天都能产生符合时间规律的数据,这些数据满足一定的时间特征。
2)数据生成形式多样
轨道交通数据来源于不同的业务,跨部门多用途,数据产生的方式也各不相同。数据分布的异构性使得非结构化数据占绝大部分。
3)数据相互关联
虽然数据生成形式多种多样,但是数据之间相互关联,其中一个系统中部分数据的变化可能会引起或导致另外一个业务系统的连锁反应。
4)数据实时动态更新
城市轨道交通在日常运营过程中,不间断地产生各种数据,数据刷新速度频繁,更新速度快,累积量大。
通过分析可知,城市轨道交通数据有上述4个主要特点,类似于工业现场数据。城市轨道交通数据符合大数据的主要特征,适用于大数据处理环境。利用大数据技术实现数据的存储、清洗、加工分析,实现城市轨道交通线网大数据中心的合理建设和有效使用,为业务系统决策提供直接的依据。城市轨道交通线网指挥中心的数据类型如图1所示。
图1 线网指挥中心数据分类Fig.1 Data classification of line networking command center
线网指挥中心数据来源广泛、颗粒众多、维度不同、关联性强的特点,使得传统的数据存储手段不能有效地发挥线网指挥中心的价值。通过大数据技术,解决海量数据存储问题、非结构化数据关联问题、实时数据分析问题等实际困难,有效提高线网指挥中心的数据地位,引导业务系统健康有序发展,进而提升城市轨道交通运行效率和运维安全。当前,在国内的部分城市中已经有一些线网指挥中心引入了大数据技术并指挥城市轨道交通数据中心建设。但是,大数据技术在城市轨道交通中的应用还有待发展,主要表现在以下3个方面。
1)数据统计分析工作缺失
在当前的数据中心存在数据样本缺失、数据维度不统一,数据分析困难,缺乏对轨道交通数据的基本处理和分析统计工作。
2)数据质量参差不齐
由于在城市轨道交通行业的数据生产缺乏统一的行业标准,各业务系统生成的数据类型、数据格式、数据存储形式等不一样,数据规范性较差,数据前期准备工作需要处理的问题较多。
目前,各个业务系统分别运行,业务系统之间缺乏必要的通信接口或数据接口,这使得业务系统相对孤立,各业务系统之间隔离导致信息孤岛的情况。
2 城市轨道交通大数据平台构建
2.1 大数据总体架构
基于自顶而下的数据资源构建思想,城市轨道交通线网数据中心大数据平台架构主要包括3个部分,分别是基础平台、支撑平台和数据资源UI平台。其中基础平台由3部分组成,分别是数据集市、数据仓库管理和资源数据库。支撑平台包含6个部分,分别是Hadoop大数据处理平台、资源库存储、资源库安全、资源库规范、资源库安全和资源库目录。数据资源UI平台提供用户接口,提供风险评估、决策支持和预警预测等服务。大数据平台架构如图2所示。
图2 大数据平台架构Fig.2 Platform architecture of big data
数据资源池包括城市轨道交通运营数据、行业数据和政府数据等,数据形式包括结构化数据和非结构化数据。这些数据经过整理形成主体资源数据库,以数据模型的形式保存。通过Hadoop大数据平台的存储、加载、清洗、转换等流程来建立数据资源仓库,进而为业务系统决策、业务系统管理和改进提供依据。
城市轨道交通线网指挥中心大数据平台建设的基本目的是利用大数据处理技术实现对轨道交通各业务系统的数据整合,并以此海量数据为基础实现具备预警决策、改进支撑的大数据管理信息系统,更好地促进城市轨道交通健康有序发展。
2.2 基础平台
2.2.1 大数据资源介绍
1)数据分类
按照数据中心的功能和定位,包括指标数据、路网基础数据、系统配置数据3大类信息资源的数据架构如下。
本文通过实验表明,为心脏起搏器植入术患者提供综合护理干预护理效果明显,能够有效的降低不良反应的发生率[4],提高患者的治疗效果,主要原因有:通过为患者提供术前护理,降低患者在术中出现风险事件,有利于保证患者的生命安全,通过为患者提供术后体位护理,向患者讲解生活中注意事项,有利于加快伤口愈合速度,提高患者生活质量[6],通过为患者提供术后心理护理,有利于消除患者不良情绪状态,增强患者对治疗的信心,通过为患者提供术后饮食护理,增强患者营养物质的吸收,在一定程度上降低患者出现便秘的发生率,促进患者舒适度[7]。
第一类是指标数据:是在路网运营数据仓库基础上为用户提供标准的、统一的、具有可扩展性的数据支撑,包含了轨道交通内部信息系统的原始数据、衍生数据、过程数据等。具体包括了运营路网数据、运营设备数据、列车运行数据、列车时刻数据、工作日记与监控数据等。
第二类是路网基础数据:主要包括轨道交通相关的各类文件数据、基础路网数据和基本参数数据3个部分。具体包括地理信息数据、法规数据视图、多媒体数据、设备数据、列车数据、线网数据和站台厅数据等。
第三类是系统配置数据:主要包括用于支撑业务工具和业务方案的相关配置数据和业务资源数据。其作用是把来自于数据集市中的数据按照指标、模型和算法进行结果加工。最终在展现层中以报表、多维、仪表盘和查询等方式进行展现。
2)数据的来源
线网指挥平台(NCC)采集各线路行车数据(ATS)、客流数据(ACC)、供电、风水电等设备及运行数据(ISCS)、能耗数据(EMS)、图纸文档及视频、外部数据(包括气象信息系统、地理信息系统、互联网数据、公共服务部门数据)等,大量运行数据日益呈现体量大、类型多、价值高等特征。数据量爆炸式的增长,数据分析处理能力落后与数据快速增长之间的矛盾将更加突出。随着数据量、数据类型的不断增多,也出现数据分析性能瓶颈、缺少数据分析挖掘的高级方法、非结构化数据尚缺乏有效利用等问题。在数据丰富性方面,利用信息化技术采集开放平台、开源数据中心等多种来源的数据库内容来丰富数据中心资源。在系统建设中,应用主题搜索技术充分挖掘公开互联网信息资源,充实壮大数据中心数据。
3)数据编排方式
城市轨道交通线网指挥中心大数据平台数据来源于各不同业务系统,数据的类型决定了数据的文件存储格式,即为了便于快速检索数据文件,对数据的存储编排也不尽相同。根据数据产生的形式不同,数据编排方式包括文本数据、视频数据、图片数据、动画数据、音频数据和网页数据等。不同类型的文件以各自的形式存储于大数据处理平台。
2.2.2 主题资源数据库
在建设目的上,主题资源数据库应满足数据的完备性、准确性和时效性,且数据内容面向不同的主题要求。数据通过主题资源数据库实现共享,在主题资源数据库保存的数据文件可供多种不同类型的业务员系统使用。在建设主题上,根据大数据技术在城市轨道交通中的建设需求,可分为当事人、路网、设备、行车、票务、渠道、起止、客流、清算、事件等主题。主题资源数据库仅存储相关主题的数据,其存储内容不应随业务系统而改变。主题资源数据库承担着各数据集数据共享的桥梁功能,避免了各数据集之间的冗余存储和数据孤岛现象的出现。
2.2.3 数据资源仓库
在大数据平台架构中,数据资源仓库是主题资源数据库的上层应用,即数据资源仓库从主题资源数据库中抽取特定类型、形式、结构的数据文件,根据数据文件所在的主题形成数据资源集市,以便上层业务系统调用。数据资源仓库具有多种特点,包括基于主题性、定制性、时序性等。数据资源仓库提供了使用者便捷获取主题资源数据库中内容的方式,便于其快速获取相关数据并实现数据管理和关键决策,实现数据的重要价值。数据资源仓库是主题资源数据库与上层业务系统之间的桥梁。
2.3 支撑平台
为了便于数据仓库资源高效、便捷的使用,建立城市轨道交通大数据支撑平台,设计采用Hadoop大数据架构。支撑平台是大数据架构中不可缺少的组件,利用Hadoop大数据处理技术构建数据资源仓库并完成数据接口对接,Hadoop将各业务系统中的数据经过数据提取、转化,实现异构数据的统一管理,异构数据经过数据清洗、数据整合、数据分析、数据挖掘、数据处理,最终形成符合存储需求的数据结构和形式,保存在数据资源仓库中。城市轨道交通支撑平台支持的数据类型包括结构化数据、非结构化数据和半结构化数据。
2.4 数据资源UI平台
数据资源UI平台是城市轨道交通大数据中心的重要组成组件,通过建立统一的数据资源UI平台,实现用户对大数据中心的快速友好访问,提供数据资源发布、数据资源搜索、数据资源聚合等用户交互功能。数据资源UI平台的建设实现如下的功能。
1)建设集中式的标准化数据接口,整合业务数据,提供数据关联方法。
2)实现海量数据资源管理和展示,数据资源包括结构化数据、非结构化数据和半结构化数据,数据资源通过数据资源UI平台展现给用户。
3)利用Hadoop大数据技术实现城市轨道交通海量数据资源的数据存储分析,深入发掘数据的潜在价值。
4)利用订阅/查询组件实现城市轨道交通数据资源UI平台用户的资源需求,实现数据订阅、数据分发。
5)为便于决策系统和业务优化系统及时准确地获取特定类型的数据,数据资源UI平台根据数据功能规划提供数据资源访问接口。
6)为保证数据资源的完整性和准确性,基于最小权限原则,数据资源UI平台实现用户角色权限管理功能,根据用户角色来确定其访问数据资源的权限,避免数据资源非法访问。
3 大数据技术应用分析
3.1 大数据技术解决的痛点需求问题
在城市轨道交通日常运营过程中,大数据技术重点要解决的运营方痛点需求包括服务质量提升、安全运行保障、系统节能、管理决策等。
1)服务乘客的质量是城市轨道交通运营的一个重要关注点,服务质量评价体系的数据来源主要包括乘客评分和车辆客观状况。其中乘客以线上或者线下的方式提供乘客主观乘车体验,车辆客观状况包括车辆的运行时间、拥挤情况、环境情况等因素。大数据技术利用评价数据对乘客服务质量做出客观评价,基于评价体系对提高服务乘客质量和改进服务标准提供有力的数据支撑。
2)安全运行是城市轨道交通运行中最基本的要求。安全运行主要是跟硬件设备信息和客流信息相关。硬件设备信息是指与硬件设备安全关联的因素,这是用于判断轨道交通安全性的重要指标,大数据技术利用设备安全性指数进行综合分析判定,并对不安全的线路状态进行预警和判定。客流信息是指影响客流量的关键指标,如大型户外活动、突发紧急事件等可能会带来巨大的客流量,客流量的激增显著增加了城市轨道交通运行的风险。利用大数据中心对突发事件进行预判和突发客流预警,依据预警给出突发事件预案,进而避免城市轨道交通在面临突发事件时不可预知情况的发生,提升城市轨道交通应急运营能力。
3)系统节能指标也是城市轨道交通中一个十分重视的因素。利用Hadoop大数据技术分析系统历史耗能数据、系统近期耗能数据、系统计划耗能数据,给出系统耗能数据趋势,并对数据分析发掘影响系统能耗数据指标是否合理,进而分析城市轨道交通运营中提升系统节能指标的关键因素并对可能出现的峰值用能进行提前预判。从数据分析的角度实现节能减排和合理计划用能。
4)数据资源支撑也是运营方管理决策的主要依据。在管理决策时,运营方以定性数据为依据来给出合理化判定。大数据技术利用数据资源支撑平台中的数据,通过事先设定的逻辑规则发掘数据内在的关联关系和关键价值指标,为运营方管理决策提供实际数据支持。另外,利用大数据技术的可视化平台能够直观地给出关注事件的趋势和预警,便于精准快速决策。
3.2 大数据技术的应用场景
目前,大数据技术在一些城市的轨道交通中已经开展应用,其在城市轨道交通运营中发挥着重要的作用。依赖于大数据技术的发展及其在轨道交通领域的应用理解,以及城市轨道交通面临的痛点需求问题,对大数据技术在城市轨道交通中的以下应用场景开展深入研究。
1)安全运营管理:城市轨道交通运营中,安全是第一要素。为了保证设备、乘客、运行安全,依托于大数据技术在海量轨道交通历史数据分析处理中的优势,对系统关键指标进行分析和预判,及时发现可能存在的安全隐患,防患于未然。
2)日常运营优化:通过分析关键指标、模拟运行情况、预测客流量、指定行车时间路线计划等手段,以日志数据、支撑平台为辅助方法,为决策预警提供数据支持。通过对历史场景的情况演练、分析和验证,指定应急时间处理方案,提升运营方的应急处理水平。
3)提升经营效益:通过分析能耗数据、资产数据、设备数据等成本因素,以高质量服务和安全高效运营为基础,以大数据在成本因素中各需求进行综合评估和判定,进而制定节能减耗的方案。通过不断优化经营手段,降低运营成本。
4)管控安全建设:利用大数据技术对城市轨道交通中安全建设数据的分析,来改进施工计划进度、加强施工建设安全,实现安全建设和风险评估,从数据层面指引、管控安全建设。
4 结论
“云计算” “大数据” “互联网+”等信息化领域的新兴设计理念,在城市轨道交通快速推广应用。国内众多城市已开始构建数据采集、数据建模、数据治理、数据安全、数据应用为一体的线网大数据平台,通过大数据分析技术形成智能决策分析,助力城市轨道线网协同指挥,提供强有力的大数据支撑服务。