APP下载

铁路行车组织数据分析系统的设计与实现

2016-12-15明,秦

铁道货运 2016年10期
关键词:晚点行车货车

夏 明,秦 胜

(1.卡斯柯信号有限公司 北京分公司,北京 100045;2.中国铁道科学研究院 运输及经济研究所,北京 100081)

铁路行车组织数据分析系统的设计与实现

夏 明1,秦 胜2

(1.卡斯柯信号有限公司 北京分公司,北京 100045;2.中国铁道科学研究院 运输及经济研究所,北京 100081)

根据建设数字化铁路的需要,分析铁路行车组织数据分析系统的需求,构建铁路行车组织数据分析系统,提出系统的总体结构,以及数据管理、调度指挥过程数据抽取、调度指挥分析指标计算、多维数据分析、调度指挥辅助支持 5 种功能。最后阐述数据抽取、数据挖掘算法和系统实现等关键方法和技术。该系统通过预先定义的抽取过程,从行车调度指挥系统抽取信息,可以为决策者提供多维数据分析功能,为调度指挥人员提供辅助支持。

行车组织;调度指挥;辅助决策;数据挖掘;数据抽取

1 铁路行车组织数据分析系统的需求分析

以信息技术为基础的“数字铁路”“智能铁路”是 21 世纪铁路现代化建设可持续发展的战略目标,为实现铁路调度指挥智能化作业,需要借助人工智能等技术从行车组织运输生产信息中发掘有用的知识、规律和经验,辅助调度指挥人员快速制定出高质量的行车组织方案[1-2]。铁路日常调度指挥信息的有效利用与知识挖掘需要解决以下 3 个主要问题。

(1)专业面较广。铁路日常调度指挥信息涉及计划调度、行车调度、机车调度、货运调度、施工调度等多个专业,这些信息分布在各自独立的信息系统中,采用不同的数据库结构,缺乏统一规划和组织[3]。

(2)行业特点鲜明。在长期的铁路运输生产过程中,行车组织专业形成了许多具有鲜明行业特点的分析、考核指标,需要设计专业程序进行大量复杂的运算,在数据抽取-转换-加载 (Extraction—Transformation—Loading,ETL) 过程中,不能仅仅进行简单的数据转移和标准化,某一考核指标的计算往往需要从多个数据源获取数据,这大大增加了系统数据抽取的难度,导致很多商业智能 (Business Intelligence,BI) 解决方案应用困难。

(3)信息量较大且关联紧密[4]。行车组织决策需要全面考虑各专业的实际情况,调度指挥人员需要人工查找、对比各专业的统计数据,工作内容较为繁琐、枯燥。随着行车组织日常生产信息的数据量与复杂度攀升,透过如此众多的统计表格洞察数据本质,发掘

辅助行车调度指挥的有益信息,变得越来越困难。

针对上述问题,设计研发铁路行车组织数据分析系统 (Transportation Data Analysis System,TDAS),从行车调度指挥系统抽取信息,从多个维度对列车晚点、货物列车兑现、旅行速度、货车停留时间等调度指挥核心指标进行分析,为决策者提供全方位的分析工具,为调度员提供辅助支持。

2 铁路行车组织数据分析系统的总体结构

TDAS 系统结构图如图 1 所示。

由图 1 可知,TDAS 系统由数据库功能模块、ETL功能模块、数据挖掘功能模块、维护终端和查询终端组成。为保证安全,系统与生产库通过网闸相连,或者采用中间库的方式,避免对生产系统造成影响。

(1)数据库功能模块。以列车运行过程、货车装卸过程和机车牵引过程为主题域,设计数据存储模型。考虑系统的可扩展性,针对所需处理需求数据的量级、系统架构和存储系统的不同,提供集中存储模式和基于分布式架构的并行处理模式 2 种模式,前者适用于万亿字节 (Trillion byte,TB) 级以下数据、普通存储结构,或者单机已经足够满足性能需求;后者适用于异构数据库存储系统,TB 级和千万亿字节 (Peta byte,PB) 级以上数据量。

(2)ETL功能模块。负责运行一组数据抽取任务,从铁路运输调度管理系统(Transportation Dispatch Management System,TDMS)、综合调度集中系统(Centralized Traffic Control,CTC)/ 列车调度指挥系统 (Train Operation Dispatching Command System, TDCS) 系统中抽取列车时刻表、编组计划、现车、装卸车及机车等原始数据,按照定义好的数据模型导入数据库服务器中。

(3)数据挖掘 (Data Mining,DM) 功能模块。负责承载预先设计的指标计算和数据挖掘分析任务,定时对列车晚点率、货物列车开行兑现率、货车停留时间、接入/交出货车数量等各种指标进行多维度的计算分析,同时以列车运行、货车开行和机车运用等历史数据为样本进行数据挖掘模型训练,为当前行车组织数据分析提供参考。

(4)维护终端。负责维护管辖范围内的基础数据字典。管理数据抽取、挖掘分析的数据源,以及多维分析所需的数据立方体制作等。

(5)查询终端。采用 B/S 方式,提供友好的查询分析界面,可以查看分析结果。根据用户不同,可以分为统计分析和辅助调度指挥 2 个用户组,分别查看统计分析和辅助支持 2 组功能页面。

图1 TDAS系统结构图

3 铁路行车组织数据分析系统的功能

3.1 数据管理

(1)数据源管理。用户可以根据需要配置数据源类型、连接参数。

(2)静态数据管理。系统提供车站字典、区间字典、公里标和管辖范围等静态数据的存储和维护。

(3)动态数据管理。系统以列车、机车、货车等移动设备的作业和活动为核心,对生产系统产生的动态数据进行重新组织,构建数据集市兼容单机数据库和分布式数据库 2 种模式,对分析挖掘工具提供统

一的接口,提高查询、分析效率。

3.2 调度指挥过程数据抽取

系统提供面向调度指挥过程的数据获取、清理、转换和存储全过程的 ETL 工具,根据列车、货车和机车数据集之间的逻辑关系定义 ETL 过程,并且定义执行的时间或时机,保证从 TDMS 和 CTCTDCS获取列车计划、实际轨迹、确报、现车和机车等数据的一致性和正确性。

3.3 调度指挥分析指标计算

系统提供列车晚点、列车兑现率、列车旅行速度、货车中时 (停时)、货车走行公里、辆公里、保有量等常用指标的计算模型。可以根据分析对象的时间范围 (月度、日班、时段)、区域范围 (路局、区域、区段、车站、区间) 和特殊分析属性 (如车辆类型、始发终到类型) 等维度进行分析计算,便于构建分析对象的数据立方体。

3.4 多维数据分析

(1)数据立方体构建。提供数据立方体制作工具,利用该工具可以将分析对象与时间、空间及属性等维度信息相互关联,制作数据立方体。以晚点列车数据立方体为例,晚点列车数为关注指标,在时间层面,通常用户比较关心每月晚点列车数,同时希望了解每日、每班晚点列车数,因而可以将月、日、班作为时间维度构建数据立方体;在空间层面,用户既可能需要查看全局晚点列车数,也需要查看调度台晚点列车数,因而可以将全局、调度台作为空间维度构建数据立方体。

(2)多维数据展示。用户可以通过拖拽方式灵活构建所关心的分析表格。例如,在晚点分析中,以日为行、以全局为列,可以构建出分析全局每日晚点列车变化的表格;如果以日为行、以调度台为列,既可以实现对某日各调度台晚点列车数进行同比,又可以实现对某调度台多日晚点列车数进行环比,同时还可以对关心的细节进行钻取、旋转、切片、切块等多维数据分析操作。

(3)数据输出。支持图表数据输出操作,可以通过直方图、饼图、折线图等丰富的图表类型直观展示分析结果。

3.5 调度指挥辅助支持

数据挖掘的主要目的是从海量历史数据中,发现规律和有价值的信息,辅助调度指挥。系统利用决策树分析、关联分析等数据挖掘模型,对列车运行过程、货物列车开行方案、货车运用和机车运用进行分析,得出关于调度指挥的普遍规律,还能实现列车晚点预测、货物列车作业组织提醒、货车在站作业安排提醒和机车优化调配等辅助决策功能。

(1)列车晚点预警。对当前班运行的列车进行晚点预测,标识出可能发生晚点的列车,提醒列车调度员注意。

(2)货物列车兑现提醒。自动识别不能兑现货物列车的规律,识别当前行车计划中可能无法开行的列车,提示当班调度员加强机车、车流组织,预防取消开行计划列车情况的发生[5]。

(3)货车作业安排提示。分析铁路局管内所有周转时间超过平均值的货车特征,探查当前管内符合特征的现车,提醒调度员注意加强该货车的工作组织,缩短其停留时间等,提高货车使用效率。

(4)机车运用优化。对机车周转过程的影响因素进行建模,分析当前可能延长周转时间的机车,辅助调度员优化机车运用。

4 铁路行车组织数据分析系统实现的关键技术

4.1 数据抽取

确保数据的一致性和完整性是进行数据分析挖掘工作的基础,也是数据抽取过程的关键。行车调度指挥系统间的数据字典往往采用不同的编码方式。例如:车站字典在铁路运输管理信息系统 (Transportation Management Information System,TMIS) 中采用电报码的方式,而在调度系统中则采用单独编码的方式。TDAS 系统提供统一的编码转换方式,避免不一致的情况发生。

与此同时,铁路调度指挥系统中的数据往往由于地域范围广而被分解为各个独立的单元进行管理,如列车运行线经常会被划分为若干个调度台的运行线单元,在划分的过程中,各单元之间的联系已经被

切断,导致难以实现对列车的整体性进行分析 (如总里程、旅行时间、旅行速度等)。旅客列车由于规律性、准时性较高,可以按照徐承禹等[6]提出的方法进行运行线连贯及晚点统计。对于货物列车,TDAS 系统首先从 TDMS 系统获取车次、径路、计划到发时间等,再根据计划台与行调台的对应关系,利用该列车的车次、始发站、到发时间从 CTCTDCS 系统搜索匹配的实际列车信息,最后采用徐承禹等[6]提出的方法对货物列车运行线进行连贯。由于货物列车运行里程及时间跨度较大,因而匹配时将搜索 2 日内的全部运行线数据。对于自然灾害等造成的严重晚点等特殊情况,系统提供人工监控功能,可以扩大匹配搜索时间范围进行人工纠正等。

4.2 挖掘分析算法

TDAS 系统对行车组织数据进行挖掘分析的主要目的是利用历史数据预测列车、货车、机车在行车组织过程中可能发生的情况,并且对各因素是如何影响结果的进行一定的描述。因此,选择决策树算法。J48 算法是决策树算法的一种,由于其产生的分类规则易于理解,并且准确率较高,因而选取 J48 算法进行挖掘分析。在 J48 算法中,属性的选择至关重要,直接影响算法的分析性能和计算结果的准确性。根据评价目标, 选取各分析目标的属性如表 1 所示。

表1 各分析目标的属性

与此同时,对挖掘结果的表达与分析也至关重要。例如,系统利用 3 个月的历史数据对列车运行过程决策树模型进行训练,对考察的样本数据进行分析,并且将预测目标及置信度转换为晚点预警信息提醒调度员注意,判断结果及表达内容如表 2 所示。

表2 判断结果及表达内容

4.3 实现技术

ETL 过程没有采用开源 ETL 工具,基于 java语言开发一组数据抽取程序,每日定时在后台自动运行。联机分析处理(On-Line-Analytical-Processing,OLAP) 后台服务采用开源项目 Mondrian,用于管理多维分析建模的元数据,定义从数据库到多维逻辑模型的映射关系。为方便用户使用查询,数据展示功能为 B/S 模式。系统采用 JQuery 组件,基于 BackBone框架实现前端显示功能,通过后台服务连接数据挖掘服务器,并且动态生成查询分析界面。在选择分析模型后,通过拖拽统计指标和维度,就可以生成各种报表。数据挖掘采用开源机器学习组件 weka[8],总是利用最近 3 个月的数据进行模型训练,保证样本规模的同时也更贴近运输组织的变化,并且将模型输出的预测结果转换为调度员可以理解的形式。

具体工作流程为:①明确分析对象,定义分析模型 (数据立方体);②定义 ETL 后台程序运行时间及参数,从 TDMS 和 CTC/TDCS 系统抽取分析数据;③选择挖掘目标和分析属性,定时进行模型训练;④选择数据立方体,选择分析目标及维度,自动生成报表;⑤对当前阶段的列车运行和货车运用等进行数据挖掘分析,将结果推送到客户端,进行预告和警示。

5 结束语

目前,铁路行车调度指挥系统建设主要解决了调度指挥计算机化、信息通讯与存储等方面的问题。实现数字铁路、智慧铁路,还需要在数据挖掘和分析利用方面进行大量应用研究。TDAS 系统在这方面进行有益的探索,提供了一系列的数据挖掘和分析功能,并以实际数据为例,验证其应用效果。铁路行车调度

指挥涉及的专业、部门、人员数量庞大,调度指挥模式、行业地域特点非常显著,系统的功能及应用还有待进一步完善。系统基于其他系统数据库进行分析,不可避免地存在局限性,将来应研究建立信息采集终端,实现自动采集所需数据,有利于系统的应用和扩展。同时, 铁路调度指挥需要对管辖范围内列车、机车和货车进行统筹安排,这也导致调度指挥各事件之间存在密切的关联,因而系统还应将各专业调度指挥信息进行统一的数据挖掘分析,探索有价值的信息。

[1] 阮秋琦.“数字铁路”21 世纪我国铁路现代化建设的战略目标[J].铁道学报,2000,22(3):96-101.RUAN Qiu-qi.Digital Railway—21st Century Strategy Object of Our Country's Railway on the Modernized Construction[J]. Journal of the China Railway Society,2000,22(3):96-101.

[2] 贾利民,秦 勇,张 媛.数字铁路、智能铁路与铁路智能运输系统[J].中国铁路,2012(3):16-20.JIA Li-min,QIN Yong,ZHANG Yuan.Digital Railway, Intelligent Railway and Railway Intelligent Transportation System (RITS)[J].Chinese Railways,2012(3):16-20.

[3] 吴惠娜.数据仓库在铁路统计分析中的应用[J].铁道运输与经济,2007,29(3):36-38. WU Hui-na.Application of Database on Railway Statistic Analysis[J].Railway Transport and Economy,2007,29(3):36-38.

[4] 代明睿,朱克非,郑平标.我国铁路应用大数据技术的思考[J].铁道运输与经济,2014,36(3):23-26.DAI Ming-rui,ZHU Ke-fei,ZHENG Ping-biao.Thoughts on Applying Big Data Technology to China Railways[J].Railway Transportand Economy,2014,36(3):23-26.

[5] 史柱文,王俊刚.北京铁路局压缩货车周转时间对策的思考[J].铁道货运,2014,32(5):25-28.SHI Zhu-wen,WANG Jun-gang.Thoughts on Countermeasures of Shortening Wagon Turnround Time by Beijing Railway Administration[J].Railway Freight Transport,2014,32(5):25-28.

[6] 徐承禹,韩旭芳.旅客列车正晚点实时分析系统的设计与实现[J].铁路计算机应用,2012,21(11):18-21.

[7] 杨 浩,何世伟.铁路运输组织学[M].北京:中国铁道出版社,2001.

[8] 陈慧萍,林莉莉,王建东,等.WEKA 数据挖掘平台及其二次开发[J].计算机工程与应用,2008,44(19):76-79.CHEN Hui-ping,LIN Li-li,WANG Jian-dong,et al.Data Mining Platform-WEKA and Secondary Development on WEKA[J].Computer Engineering and Applications,2008,44(19):76-79.

(责任编辑 冯姗姗)

Design and Realization of Data Analyzing System of Railway Transportation Organization

XIA Ming, QIN Sheng
(1.Beijing Branch, CASCO SIGNAL LTD., Beijing 100045, China; 2.Transportation and Economics Research Institute, China Academy of Railway Science, Beijing 100081, China)

This paper analyses the requirement of data analyzing system of railway transportation organization and constructs data analyzing system for railway transportation organization based on the need for the construction of digital railway. This paper puts forward with overall structure and five functions including data management, data extraction data digging algorithm, data analysis, dispatching support, analyses key methods and technology of system realization. The system can provide analysis of various data for decision maker and support for dispatchers through defining the extract process and extracting information of dispatching system.

Transportation Organization; Dispatch; Support Decision-making; Data Digging; Data Extraction

1004-2024(2016)10-0016-05

TP399:U292

B

10.16669/j.cnki.issn.1004-2024.2016.10.04

2016-10-09

夏明 (1981—),男,辽宁朝阳人,博士。秦胜 (1980—),男,广西桂林人,博士。

中国铁路总公司科技研究开发计划 (2016X006-C)

猜你喜欢

晚点行车货车
基于马尔科夫链的高铁列车连带晚点横向传播
晚点的火车(外三首)
货车制动抱闸故障预报的探讨
“晚点围巾”揭德铁伤疤
智能OBU在货车ETC上的应用
货车也便捷之ETC新时代!——看高速公路货车ETC如何实现
夜间行车技巧
治超新规实施在即 深究货车非法改装乱象
吉普自由光行车制动易熄火
调度调整在地铁行车组织中的应用