基于大数据的铁路运输调度浅析
2020-03-24王洋王昕
王洋 王昕
摘要:铁路作为国家或企业的重要基础设施,在运营和安全方面都有着极高的要求,铁路调度系统基础数据尚未得到充分挖掘,安全管理仍有优化空间。随着大数据、物联网、云计算等现代化技术日益成熟,以规模化数据为基础提升管理效率与水平,能够有效驱动铁路现代化发展步伐;加快铁路调度大数据功能架构设计及研发运用,能够为充分挖掘铁路调度数据资源,提升铁路调度管理能力,提供有效的技术手段。
关键词:铁路;运输;调度;大数据
Analysis of railway transportation scheduling based on big data
Wang YangWang Xin
School of Traffic Transportation,Lanzhou Jiaotong UniversityGansuLanzhou730070
Abstract:As an important infrastructure of a country or an enterprise,railway has very high requirements in operation and safety.The basic data of railway dispatching system has not been fully mined,and there is still room for optimization in safety management.With the development of big data,Internet of things,cloud computing and other modern technologies,improving the management efficiency and level based on largescale data can effectively drive the pace of railway modernization;speeding up the design and R & D Application of big data function architecture of railway dispatching can provide effective technical means for fully mining railway dispatching data resources,improving railway dispatching management capacity.
Key words:Railway;transportation;dispatching;Big Data
1 大數据概述
大数据迄今并没有公认的定义。但是同传统数据相比,大数据具有如下5V特征:即体量大(volume)、速度快(velocity)、模态多(variety)、难辨识(veracity)和价值大密度低(value)。相对而言,大数据并不只是在数量上的庞大,更多的是数据类型上的复杂。大数据是一种思想,是一种挖掘思想,淘金思想,核心并不是拥有数据,而是用数据去做什么,大数据有什么不重要,怎么用才重要。大数据的核心价值是预测,本质是基于预测所做出的正确判断。以往的数据分析是基于精确数据的深度挖掘,大数据则更多是利用已有数据对分析得出某种趋势。
2 现状分析
2.1 我国铁路运输调度现状分析
我国现行的调度指挥系统遵从分级管理、统一指挥,实行三级调度指挥体系,即中国铁路总公司调度中心、铁路局集团公司调度所和站段调度室。其中,铁路总公司统一调度指挥,站段调度室在铁路集团公司调度所指挥下,按成基层日常工作。
2.2 铁路运输调度存在的问题
当前阶段自从铁路总公司成立以来,我国在运输生产以及铁路运输方面的管理模式依然沿用相同的方式进行,降低了铁路运输的管理效率,无法匹配对应的相关要求。在运输信息管理方面,我国正处于转型发展的关键节点,面临着数据共享困难、数据分析能力不足、数据创新需求迫切等一系列问题。
大数据共享方面,存在数据壁垒严重、共享不足等问题。在我国当前铁路运输调度系统中,调度信息整合及发展上缺乏统一标准,这降低了信息共享及信息透明的作用。不同部门之间无法实现高效沟通,在部分合作带来了巨大挑战。而现有数据分散于各级系统平台,无法统一分析处理。
大数据分析方面,由于缺乏数据意识,庞大数据的应用仅停留在日常工作和日常统计分析层面,对数据深度挖掘不够,无法利用宝贵的数据资源真正改进服务管理,试验智能铁路发展。
总而言之,要利用当前大数据分析挖掘技术,解决铁路目前面临的相关问题,实现铁路基于数据的、以客户为中心的运输调度及经营管理。
3 基于大数据的铁路运输调度指挥系统
3.1 基于大数据的铁路运输调度指挥系统的构想
系统架构研究主要关注于应用功能,铁路应用的提升空间主要表现在:打破信息壁垒,实现应用系统的横向整合;在完善以实时追踪为核心的运输数据管理基础上,围绕三大主题建立铁路核心应用;改变目前以模拟手工操作为主的应用现状,以信息技术引领业务的变革等。基于以上原则,构建图1的系统构架。
运输调度计划编制问题是一个动态复杂问题,影响因素众多,关系错综复杂,即有定量因素,又有定性因素。数学规划中只能对其中定量因素进行数学描述,很难建立准备约束条件的下的数学模型,无法得出其解析解。基于大数据的计划编制利用数据库中海量信息的交互分析,可以解决复杂的调度计划编制问题。智能调度计划编制平台如图2所示。
3.2 措施浅析
3.2.1 数据处理
铁路车流数据处理包括四个模块:采集、分析与挖掘、预测、应用。数据分析可以满足一般的分析需求,主要利用分布式数据库或者分布式计算集群对其中保存的超量数据进行分类和汇总。数据挖掘即是从大量数据中通过各种技术找到其中隐藏的有用信息,是本项目的关键点也是一大难点。该项目拟采用技术有:神经网络、Logistic回归方法、SEMMA方法、预测模型、改进Kmeans聚类算法等。下面介绍Kmeans聚类算法。Kmeans聚类算法基本思想是首先随机选取几个初始聚类中心,其他对象根据与每个中心的距离分别分配,形成聚类。计算每个聚类均值作为新的聚类中心,重复分配對象,直至函数收敛。工作流程图如图3所示:
3.2.2 模型优势
智能调度计划编制平台可以实时收集车辆信息,基于实时数据构建的预测模型不仅可以将预测对象精确到车辆,而且根据每个车辆的实时报告,可以获得动态的数据信息,从而实现动态实时预测,使预测结果更加准确完善。
4 结论与展望
目前铁路企业陆续建立的各种生产信息系统间相对孤立,许多有用信息被埋没在海量数据中。因此,有必要结合大数据管理思维与挖掘方法,建立铁路安全管理大数据分析平台,综合考量作业人员、设备、环境、管理方面失效危险等因素,有效整合各专业系统生产数据,通过对各类数据的综合处理分析,形成各类指数并用于安全预警和安全管理,数字量化单位的安全管理状态,实现铁路生产信息的集中化采集、智能化分析、可视化展示,为铁路管理提供科学的数据支撑和决策依据。
参考文献:
[1]何川宁.高速铁路与普速铁路列车调度指挥对比分析[D].北京:中国铁道科学研究院,2016.
[2]易志勇,王斌.计算机辅助编制车流计划的研究[J].铁路计算机应用,2005.
[3]傅志华.大数据在电信行业的应用.2014.
[4]韩凌波,王强,蒋正锋,郝志强.一种改进的kmeans初始聚类中心选取算法[J].计算机工程与应用,2010.
[5]Anil K J.Data clustering:50 years beyond KMeans[J].Pattern Recognition Letters,2010.
[6]Mahajan M,Nimbor P,Varadarajan K.The planar Kmeans problem is NPhard[J].Lecture Notes in Computer Science,2009.