APP下载

基于大数据平台的线网中心运营指挥系统的运营指标分析技术*

2018-11-16陈莉莉周映江

城市轨道交通研究 2018年11期
关键词:结构化客流温湿度

胡 波 李 冰 陈莉莉 周映江

(1.南瑞集团(国网电力科学研究院)有限公司,210003,南京;2.国电南瑞科技股份有限公司,210061,南京;3.南京邮电大学自动化学院,210023,南京//第一作者,高级工程师)

随着各个城市轨道交通线路由单一化逐渐向网络化发展,轨道交通运营中产生并积累了大量的数据。如何有效地处理和分析这些结构化和非结构化数据,挖掘其中有价值的信息,通过海量数据的采集、整理和分析,提高轨道交通的运营水平,提升科学决策能力,日益成为业界关注的重点及研究方向。

目前,地铁线网中心运营指挥系统(TCC)通常采用数据仓储MPP(massively parallel processing)进行数据分析及管理,对于地铁运营海量的数据,其在客流分析、能效管理、运营指标分析等方面尚异常薄弱,没有达到提升运营水平的目的[1-3]。本文提出一种基于大数据平台的运营指标分析的方法,通过研究数据挖掘技术,完成对TCC海量数据的分析。通过合理的数据模型设计搭建大数据平台,进行数据统计和建模,挖掘数据的深层价值,从而提升轨道交通信息服务能力及运营水平,提升效益,降低成本。

1 轨道交通TCC数据

1.1 TCC数据分类

轨道交通运营中每时每刻都产生并积累大量的数据,特别是非结构化数据,更是呈指数级增长。TCC的数据来源包括:各线路的综合监控系统(ISCS,含电力监控与数据采集(PSCADA)、环境与设备监控系统(BAS)、火灾报警系统(FAS)、站台屏蔽门(PSD)、自动售检票(AFC)等专业),以及信号(SIG)、闭路电视(CCTV)数据;自动售检票清分中心(ACC)的客流数据;主变电所的PSCADA数据;来自能源管理系统的能效数据;视频文档等文件。根据数据的类型,分为结构化数据、非结构化数据和半结构化数据,具体说明如下:

结构化数据:主要包括ISCS(PSCADA、BAS、FAS、PSD、AFC等)、列车自动监控(ATS)、ACC、能源管理系统等。ACC系统提供客流数据和清分清算类数据,各线路ISCS和主变电所提供设备状态类数据,ATS提供行车数据,能源管理系统提供能耗数据。

非结构化数据:主要包括CCTV视频资料、图纸、档案文件、文档,以及系统运行过程中生成的日志、视频、音频、图片文件等,如应急指挥系统执行过程中的归档记录、历史报表等。

半结构化数据:主要指系统中的XML、HTML文档。

1.2 TCC数据特点

对TCC数据进行分析可知,TCC数据结构的复杂性主要表现为:

大规模:数据容量巨大,每年增量在几十TB;

异构性:数据来源于各个系统,数据结构及类型千差万别;

分布性:数据源的多样性及跨地域性造就了数据的分布性;

动态性:每时每刻的实时数据。

2 大数据平台

2.1 大数据介绍

大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。其不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理[4]。

借助大数据平台,整合SCADA、FAS、BAS、ATC、AFC、ACC等专业数据,实现客流、 行车、设备数据的集中统一,形成企业级数据统一视图,实现企业数据标准化,再通过平台强大的数据分析和数据挖掘能力,可帮助地铁企业充分发掘潜在的数据价值,全面提升运营管理能力、科学规划能力、应急辅助决策能力及公众信息服务能力。

2.2 大数据平台建设方案

进行数据分析首先需要选择一种合适的数据平台。本文采用处理效率及性能更佳的基于Hadoop的大数据平台代替数据仓库的MPP进行数据分析及存储。大数据平台的数据处理包括元数据处理、ETL(数据抽取、转换及装载)数据处理、数据挖掘等部分,本文主要涉及的是数据挖掘部分。大数据平台的架构见图1。

3 基于大数据的数据统计和预测

3.1 数据统计和预处理

TCC中的数据除了结构化数据,还包括照片、视频、音频、文档、日志等非结构化数据,并且需要支持数十TB到PB级的数据存储需求。采用分布式架构的大数据平台,将数据仓库部署在不同的服务器上,并将来自各个源的数据规整,以统一格式存储在大数据平台中。

首先要对数据源中的数据进行格式规整处理,再用清理、集成、变换、规约等预处理技术改善数据质量,从而提高数据分析的效率与质量。

3.2 数据挖掘和数据分析

所谓数据挖掘和数据分析,就是以业务为驱动,利用数据分析算法,从海量数据中发掘出其中隐含的模式。

数据分析方法一般包括估计、预测、关联、聚类、分类等。分析的过程就是模型构建的过程。模型构建通常包括模型建立、模型训练、模型验证和模型预测四个步骤。模型的建立是一个反复的过程,需要仔细考察不同的模型以判断优选。常见的数据分析方法见图2。

3.3 客流数据分析

在TCC数据中挑选出客流信息,通过对客流数据进行建模分析,预测短期日常客流、实时客流及预估大客流。从ACC得来的客流数据和起点/终点(OD)数据信息,可通过客流和换乘的统计分析,进行路径规划和能效控制;可以监视客流数据进行客流预测;可分析实时断面客流量和三色图展示,协助进行客流引导。常用的分析方法为时间序列法和回归分析法。

图1 大数据平台架构

图2 常见的数据分析方法

3.3.1 短期日常客流预测输入

客流预测条件导入模块通过指定日期条件(某天或者一段时间范围内),从统计分析平台加载AFC历史客流数据作为预测参考数据,实现短期客流预测输入功能。其数据流如图3所示。

图3 短期日常客流预测数据流图

客流预测条件导入模块从统计分析平台加载历史客流数据,界面可设置客流影响因素,包括大型活动车站等。

3.3.2 实时客流预测输入

客流预测条件导入模块通过指定日期条件(某天或者一段时间范围内),从统计分析平台加载AFC实时客流数据作为预测参考数据,实现实时客流预测输入功能。其数据流如图4所示。

图4 实时客流预测数据流图

客流预测条件导入模块从统计分析平台加载AFC实时客流数据,经过实时客流预测数据输入功能对数据清洗/变换,保存为预测用的客流数据;客流预测模型管理模块在正常情况下实时客流预测、中断行车情况下客流预测、大客流情况下客流预测中读取此数据,执行客流预测。

3.3.3 预知大客流预测输入

客流预测条件导入模块通过指定大客流事件的时间、车站,从统计分析平台加载同类型的历史客流数据作为预测参考数据,实现预知大客流预测输入功能。其数据流如图5所示。

图5 预知大客流预测数据流图

客流预测条件导入模块从统计分析平台加载历史客流数据,经过预知大客流预测数据输入功能对数据清洗/变换,保存为预测用的客流数据;客流预测模型管理模块在预知大客流情况下客流预测中读取此数据,执行客流预测。

4 运营指标分析

4.1 运营指标体系

目前轨道交通行业常用的指标体系是国际地铁联盟CoMET指标体系和中国城市轨道交通MOPES指标体系。

CoMET的核心是建立衡量地铁运营效率的关键绩效指数系统,并建立有针对性的基准化分析方法。CoMET指标数据仅在联盟内使用,对外有保密公约,所以不具有公开使用价值。

MOPES是为了加强轨道交通行业内部的密切联系,统一运营绩效评估指标和统计方式,树立绩效参照标杆,建立经验交流平台和组织开展专题攻关等。整个评价体系含基础指标2类8个,绩效指标6类75个。基础指标包括线网指标和车站指标,是基础设施的评价数据。绩效指标包括客流指标、运行指标、服务指标、安全指标、能耗指标和成本指标,是在一定基础设施条件下反映运营效率的主要指标[5]。

4.2 TCC常用运营指标分析

目前,通过大数据平台可采集到以下数据:

(1) 从线路实时采集的数据,包括列车运行信息、电扶梯运营状况、AFC闸机/售票机运营状况、车站站厅站台温/湿度、火灾报警等。

(2) 从线路定时采集的历史数据,包括AFC闸机/售票机历史运营状况等。

目前TCC中的运营指标分析模块,仅能对上述数据进行简单的加工,做一些简单的运营指标统计分析。这些分析主要集中在单一指标,并没有深度挖掘不同数据之间的关系。

表1是TCC中核心统计的运营指标,可以看出,此三种指标目前互相孤立,之间没有联系。其实从能效管理的角度,通过闸机的通过率、电扶梯的使用率等判断出人流量的大小,提前预测站内合适的温湿度,可力保乘客乘车候车的舒适度,也能在一定程度上进行节能。

表1 现系统常用运营统计指标

4.3 进站量分析自适应预测温湿度

温湿度预测将所有的温湿度预测业务按照预测方案组织起来,首先需创建温湿度预测方案。在预测方案中设置预测的目标和具体的时间维度、空间维度条件,选择预测的类型及应用的预测模型,并录入与温湿度预测方案相关的描述性信息,根据不同预测类型和预测模型的需要设置温湿度预测的相关参数,完成预测方案的创建。客流预测流程各步骤如图6所示。

通过大数据平台,选择相关的关联算法,对车站进站量数据及站内温湿度数据进行统计、训练,通过计算机拟合出车站进站量与温湿度之间的曲线,找出他们之间的内在关系。

5 结语

目前的地铁TCC在运营指标分析及应急指挥方面功能薄弱,不能满足实际运营的需求。本文研究了基于大数据平台的城市轨道交通网络化运营指挥中心的关键技术,利用大数据平台对数据进行统计、挖掘,通过算法寻找相关联的运营指标。通过对运营指标的综合分析,可提升地铁运营管理能力和应对突发应急事件的能力。

图6 温度预测系统流程

猜你喜欢

结构化客流温湿度
客流增多
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
结构化面试方法在研究生复试中的应用
基于AT89C51的数字型蚕用温湿度计的设计
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
基于DSP的多路温湿度监测系统
基于温湿度控制的天气预测装置
蒸发冷却温湿度独立控制空调系统的应用
基于自学习补偿的室内定位及在客流分析中的应用