大数据在铁路运输组织工作中的研究和运用
2017-11-30寇鹏涛
寇鹏涛
(太原铁路局信息技术所,山西太原030013)
大数据在铁路运输组织工作中的研究和运用
寇鹏涛
(太原铁路局信息技术所,山西太原030013)
信息技术的迅猛发展推动着全球各国经济的持续增长,是当前经济发展的重要内驱力。提高铁路运输效率、效益及安全性,是经营者长期以来面临的问题,大数据时代的开启将为该课题的解决提供全新的解决方案和手段。大数据技术的逐步成熟,使得利用大数据技术来提高铁路运输生产安全和效益变得越发迫切。从大数据角度分析了铁路运输生产、安全管理、经营管理等过程,阐述了大数据在铁路行业具体实施的方法和思路。
铁路运输;大数据;信息资产;价值密度
淘宝数据魔方用大数据技术锁定了用户喜好,据此进行生产、库存决策;Farecast利用过去十年所有的航线机票价格打折数据预测用户购买机票的时机是否合适。
1 大数据定义
最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”对于大数据,研究机构Gartner这样定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
2 大数据的特点
业界将大数据的特征归纳为“4V”特征,即容量(Volume)大、种类(Variety)多、价值密度(Value)低、速度(Velocity)快,具体而言,即数据体量巨大、数据类型繁多、价值密度低、商业价值高、处理速度快。
3 现状及存在的问题
2015年,全国铁路旅客发送量完成25.35亿人,全国铁路货运总发送量完成3.358×109t,网上货运业务受理超过99%.当前铁路运输呈现出新的特点:连年增量后铁路安全生产压力较大;人民群众对铁路提供安全、方便、快捷、低廉运输产品有更大的需求;政企分离后,作为企业有实现盈利的内在需求,特别是在2016年以来,全球经济趋向萧条,大宗工业产品滞销,铁路货运量受影响较大,企业增效增收压力大。
3.1 运输生产
铁路局运输实行大一统调度集中模式,统一指挥管内机车车辆,为铁路运输有序提供了保证。随着铁路信息化事业的长足进展,信息系统涵盖了铁路运输生产各环节,货票、客票、公安制证、车站管理等系统服务于铁路运输生产特定环节,本环节内基本实现信息化。但系统间各自为政,连通性较差,数据共享程度不高,无法实现行业数据的综合应用。
3.2 运输安全
我国每年新增不少铁路里程,加上挖潜提效,客货行车密度增加较多,铁轨磨损多,天窗时间短,维修任务急剧增加,确保运输安全压力非常之大,近年来铁路职工人身安全隐患有所抬头就是一个表象。
3.3 经营管理
多年来,铁路一直处于负债经营的状况,一方面是客运、货运价格不能随便涨价;另一方面,管理机制、人员素质、用工配比还有待优化提升,跑冒滴漏还有待于堵塞。
4 铁路运输组织大数据的建设目标
大数据在商业营销、市场预测、经济活动等活动中得到了广泛应用。铁路作为承载国民经济的运输大动脉,必须积极建立大数据平台,优化运输生产、经营管理,提高安全性和社会满意度。
4.1 运输生产
旅客进站,货物送达货位,机车调配,车辆到、解、装、卸、编、发各环节组成了铁路运输主要过程。大数据平台要对运输生产中效率效益问题建立模型,消除影响铁路效率效益的因素,改善当前的工作。比如,通过对每天货物订单的分析,调度人员可以对同一货种目的地一样的货物统一开行五定班列、直达班列。通过对旅客信息的建模分析,获取旅客乘车与日期、去向、长短途之间的关系,获取旅客乘车种类的偏好、对价格与速度的选择、对各交通工具的选择爱好,提供高铁、动车、旅游车开行方案。
4.2 安全管理
对车站作业计划、到发确报等信息进行比较,得出编组站每辆车甩车情况,结合这些信息进一步分析甩车原因、出现频次,查找到与故障相关的因素,进一步辨别是人员责任心问题,还是设备质量问题或检修工艺落实不到位。
4.3 经营管理
利用大数据分析全局历年来收支情况,判断收入的主要来源是客运、货运,对应到运输中是什么类型货物产生的效益较大,机务、工务等成本支出大户的支出变化情况进行研究分析,制订切实可行的节支降耗措施。
4.4 云平台建设
大数据的开展需要有高效、功能强大的云平台作为运算基础。铁路可以与国内的顶级云平台阿里云、百度云等合作,建设自身的云平台,为大数据发展提供坚实保障。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行记录。与这样的大公司合作,能明显提高铁路云平台建设的应用水平。
5 铁路运输组织大数据的建设思路
人民物质文化生活水平的进一步提高对铁路运输可靠性、舒服度、安全性提出新的要求。铁路企业必须正视大众需求,发挥大数据作用,利用大数据决策分析帮助企业实现上述目标。
5.1 搭建大数据主平台
构建大数据平台应先建设依托的云平台。没有大规模计算的云平台作物理支撑,任何大数据恐怕是“无米之炊”。云平台的分布式计算是大数据进行大规模运算的基础和前提。
5.2 接入并丰富各专业信息系统数据
车站综合管理、客货调度等运输关键信息系统要全部接入大数据平台,影响力小的单项系统视情况接入平台。要进一步从功能上加强各系统的互联互通,消灭信息孤岛,促进单项系统间融合,为平台推送高质量、高价值数据。
5.3 做好大数据分析模型的建立
大数据分析过程可以分为数据采集、数据处理与集成、数据分析、用户交互四阶段,最关键的是信息源数据汇总后的数据分析。当前较为流行的是以分布式文件系统GFS、批处理技术MapReduce、分布式数据库BigTable为代表的大数据处理技术以及在此基础上产生的开源数据处理平台Hadoop。
5.3.1 数据采集层
系统建立了大容量的数据库以及接口,将现有各信息系统数据及总公司主数据平台接入大数据平台,大幅扩充数据容量,形成大数据分析的基础信息,为下一步整合分析创造条件。
5.3.2 数据处理与集成
接入平台的各信息系统研发年代不同,研发软件工具不同,数据结构和数据种类都非常复杂,直接利用这些数据会给之后的分析带来巨大的困难。数据处理与集成就是要把这些结构复杂的数据转换为单一或便于处理的结构。这些数据中还存在一些用处不大、重复、不正确的信息,因此,定时对不同来源的数据进行数据清洗、去噪、抽取、转换,可保证数据的质量及可靠性,形成有效数据源。
5.3.3 数据分析
有效数据产生后,可借助数据挖掘、数理统计、智能算法、机器学习、批处理技术MapReduce、分布式文件系统GFS、分布式数据库BigTable以及开源实现平台Hadoop对车辆、作业人员、事故、货物装卸等分析评价,比如判断并找出影响调车作业效率的因素、收益高的货物特点等,得到高价值结论。
5.3.4 用户交互层
数据分析后,可以采用数据化可视技术和人机交互技术对得到的数据进行结果展示和判断说明,并按照不同层次、不同需求将展示界面进行分类、解释,比如运输安全方面的结论反馈至安监部门,运输效率方面的结论反馈至运输部门,提高客票收益率的结论反馈至客运、收入部门,将大数据的强大生产力及时地运用到铁路运输生产中,改进现有的作业方式、作业习惯、营销方式,全面促进铁路效率效益提升。
6 结束语
大数据时代已经到来,技术和应用的变革推动数据价值的重新定义,数据共享开放是趋势。充分学习、利用大数据技术能让我国在当前高铁、重载等技术逐步引领世界的前提下,进一步增强铁路行业核心竞争力,做大做强铁路企业,实现企业、社会、国家和人民群众的多赢。
[1]石平刚.铁路货运生产服务系统设计与实现[J].铁路计算机应用,2016(12).
[2]栗蔚,魏凯.大数据的技术、应用和价值变革[J].电信网技术,2013(07).
〔编辑:张思楠〕
U294.7
A
10.15913/j.cnki.kjycx.2017.19.056
2095-6835(2017)19-0056-02