铁路客运营销辅助决策系统分布式环境下数据交换策略
2014-05-11张军锋武晋飞
张军锋,武晋飞
(中国铁道科学研究院 电子计算技术研究所,北京 100081)
铁路旅客发售和预订系统(简称客票系统)5.0版实现了在数据中心对席位进行集中保存和分级管理。目前有30多个数据中心分布在各个铁路局,并能够随着业务需要动态调整、增加结点。这种分布式的数据中心方案解决了席位相关数据及事务的一致性问题,有助于实现灵活的售票组织功能,如票额共用、限售区段调整、剩余席位调整和售出席位复用等,也为最终实现提高席位利用率、挖潜提效的目标做好了数据和技术上的准备[1~2]。
在分布式数据中心的部署方案中,铁路局担当管理的列车席位等关键信息可以存放在任意一个数据中心,并不局限于本局的数据中心,客票系统通过交易中间件解决了连接导航、交易控制、分布式数据访问等关键问题,提高了交易系统的并发性和稳定性。与客票系统不同,铁路客运营销辅助决策系统(简称营销系统)作为决策支持系统,需要对大量业务数据进行统计、分析,进而挖掘出有价值的信息,最终为铁路局及基层站段客运营销管理人员把握市场动态、完善产品设计、优化运能利用、提升社会和经济效益提供支持。这些功能的实现依赖于数据的准确性和完整性,但单个铁路局客票系统的数据中心并不能提供本局营销系统所需的完整数据,如何快速、完整地收集和传输各个客票数据中心的业务数据成为系统运行效率高低的关键。因此,需要针对客票系统数据中心相互独立、归属分散的特点制订有效的数据传输策略,实现分布式环境下的信息共享。
1 营销系统总体框架
铁路客运营销辅助决策系统与客票系统紧密结合,采用分布式布局方案,在每个铁路局部署服务器,充分利用现有客票网络通道,在实现与本局客票系统数据同步的基础上,也实现了不同铁路局营销系统之间的数据交换[3]。该系统总体框架如图1所示。
图1 营销系统总体框架示意图
2 数据流程设计
营销系统是以客票系统业务数据为基础,利用先进信息技术和决策分析方法构建的系统,具有历史数据查询和趋势分析、实时预售分析预警、辅助决策等功能。这些功能的实现依赖于历史数据和实时数据的准确及时传输。
图2为营销系统与客票系统以及营销系统之间的关键数据交换示意图。
图2 数据流程示意图
主要的数据流说明如下:
(1)数据流(A)铁路局客票系统到营销系统的数据流。采用Sybase Replication技术实现营销系统与客票数据中心(包括主中心和负载中心)存根、票库和相关基础数据的同步更新。
(2)数据流(B)(C)标识了系统中非实时数据的传输情况。其中(B)是铁路局营销系统在对业务数据进行统计汇总后,通过中间件数据库通信服务器(DBCS)传输至铁道部营销服务器进行合并,以形成完整的全路营销数据集合。
(3)数据流(C)为铁道部营销系统回传铁路局营销系统的数据流。铁道部营销 系统根据业务相关性进行分配后通过中间件DBCS传输至相应铁路局营销系统,确保该铁路局获得完整的分析数据。
(4)数据流(D)为铁路局营销系统之间的数据流,标识了系统中实时数据的交换情况。在快速统计汇总的基础上,采用传输中间件DBCS,实现实时分析数据的及时交换,其中包括实时预售和实时密度表等数据。
3 数据交换策略
为了支撑实时和非实时的业务分析需求,将分散的、由各铁路局独立管理的数据中心集中至营销系统,实现广泛共享,本文在现有客票网络环境下制订了营销系统的数据交换策略。该策略以并发统计为基础,采用DBCS传输中间件,充分利用其良好的转发、路由和数据完整性控制方面的功能和机制,通过传输配置文件和日志表控制数据传输的时间、范围和目的地,采用数据压缩和断点续传技术提高传输效率[4~6]。数据交换策略示意图如图3所示。
图3 数据交换策略示意图
(1)并发统计。客票系统中存放着大量的交易记录,这些数据无法、也没必要直接用于营销分析,需要进行汇总统计后再用于分析。通过分析营销系统中数据抽取的特点,充分利用数据库高并发的优势,通过将统计任务进行合理分割和分配,设计出合理的数据结构,使用多线程技术开发营销统计程序,提高了统计效率。
(2)任务配置。营销系统中不同主题和粒度的数据,传输的目标和频率也有所区别。如变化频繁的席位数据需要30 min甚至更小时间间隔的更新,列车定员等相对固定的数据实现每天更新一次即可。通过任务配置可以定义传输任务,控制目标和频率,并能够协调传输过程中的预处理、传输和后处理等多个环节。
(3)日志控制。除了利用任务配置控制数据传输外,在应用程序中可以利用传输日志记录表实现对数据传输的控制,达到应用和数据的有机协调。
(4)数据压缩。为保证传输数据的安全性、完整性和提高传输效率,传输系统采用数据压缩算法对传输的数据进行数据压缩,以减少网络传输带宽占用,节省传输时间。
(5)断点续传。发送方和接收方建立协调机制,在传输故障被排除后,调度模块会根据接收方的记录向发送方传递传输信息,发送方收到消息后从断点处开始发送,从而实现断点续传。采用该技术保证了数据传输的可靠性,提高了传输效率。
4 策略应用情况
营销系统2011年通过铁道部相关部门的技术审查后开始在全路进行系统推广,目前完成了大部分铁路局的营销系统部署工作。现有的数据交换策略很好地解决了客票系统数据分散和营销系统数据集中之间的矛盾,保证了铁路局营销系统的数据完整性、准确性和及时性。复制技术在实现数据同步的同时能够确保营销系统不会对客票系统的业务造成任何影响。并发统计和数据压缩分别加快了数据收集和传输的过程,通过统计日志和配置文件的配合,每个营销系统服务器都能发送和获取数据,实现了数据的快速共享。目前,铁路局营销系统先后经受了春运和黄金周等客流高峰的考验,已经成为铁路局业务人员日常工作必不可少的工具,为掌握和监控客流情况、挖潜提效提供了有效的数据支撑。
5 结束语
分布式环境下数据交换策略的研究和应用,有效保证了营销系统数据的及时性、准确性和完整性,有利于增强各铁路局间相互沟通和协同的工作能力,提高客运业务,特别是客流突然变化情况下的工作效率,有助于业务部门随时获取车站、旅客列车的客流情况,为支持决策提供科学依据,从而提高铁路客运营销水平、旅客服务质量和管理决策的科学性。
[1] 朱建生,单杏花,周亮瑾. 中国铁路客票发售和预订系统5.0版的研究与实现[J]. 中国铁道科学, 2006,27(6):95-103.
[2] 铁道部客票总体组. 中国铁路客票发售和预订系统5.0版技术手册[M] . 北京:中国铁道出版社, 2006.
[3] 铁道部运输局,北京交通大学,中国铁道科学研究院.铁路客运营销辅助决策系统总体技术方案[R]. 2009.
[4] 张军锋, 王炜炜, 刘相坤. 基于多线程技术的营销统计算法研究与实现[J]. 铁路计算机应用, 2006, 15(11A):73-75.
[5] 张军锋,徐东平,王红爱. 客票系统数据统计中的智能化调度策略[C]. 第五届中国智能交通年会暨第六届国际节能与新能源汽车创新发展论坛优秀论文集,2009.
[6] 朱建军,祝红光,王智为. 数据传输平台JWDTP及其客票系统中的应用[J]. 铁路计算机应用,2006,15(11A).