APP下载

基于TDCS数据分析的铁路区间通过能力利用研究

2015-12-19张星臣陈军华

铁道运输与经济 2015年7期
关键词:数据处理利用率区间

王 晓,张星臣,陈军华

WANG Xiao, ZHANG Xing-chen, CHEN Jun-hua

(北京交通大学 交通运输学院,北京 100044)

(School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044, China)

基于TDCS数据分析的铁路区间通过能力利用研究

王 晓,张星臣,陈军华

WANG Xiao, ZHANG Xing-chen, CHEN Jun-hua

(北京交通大学 交通运输学院,北京 100044)

(School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044, China)

在阐述区间通过能力利用分析传统流程的基础上,分析基于TDCS数据分析的区间通过能力分析原理及能力利用的基础数据处理流程设计,提出基于数据库拆分的海量数据获取技术和基于XML的多源数据处理等TDCS数据处理关键技术,最后以包神铁路为例,对线路困难区间的能力利用进行分析,并且给出合理化建议。实践证明,基于TDCS数据分析的铁路区间通过能力方法简单易行,具有实际推广意义。

铁路运输;能力利用;TDCS;数据挖掘

铁路通过能力具有动态瞬时的特点,如何利用先进的技术方法,分析能力利用的波动规律和能力制约影响因素,实现对能力科学、有效、合理的利用,是目前铁路区间通过能力亟待解决的问题。传统的能力利用分析基于实测数据,主要依靠调查人员实地调研获取,所得数据随机性大、样本量少、代表性不强,以此为基础进行能力利用分析不能客观反映实际情况[1]。事实上,铁路信息化的理想条件为能力利用研究提供数据基础[2]。调度管理指挥系统 ( TDCS ) 积累了大量的列车运行数据[3],这些数据规模庞大、真实可靠,蕴藏丰富的决策支持信息。利用 TDCS 数据进行能力利用分析具有精确、实时的特点,能够动态反映特殊区段和特殊时期的能力利用情况。通过提出基于 TDCS 数据的能力利用分析方法,科学掌握线路能力利用情况,为进一步规划决策、挖潜扩能提供依据。通过阐述能力利用分析原理,并且设计基于 TDCS数据的能力利用分析流程,重点解决海量数据拆分和多源数据处理的技术难点。

1 基于TDCS的能力利用分析原理及流程设计

1.1 传统的区间通过能力利用分析

能力利用研究是铁路能力理论的核心问题[4],通过分析能力在不同时段和不同区域的使用情况,发现制约能力的薄弱环节,找出关键因素,为能力的加强和发展指明方向。一般情况下,主要从车站、区间、线路 3 个方面进行能力利用分析,分析基础是能力计算和测定,分析结果的客观性和实时性取决于计算的精度和速度。

(1)区间能力计算 ( 原始资料获取 )。查阅铁路部门相关文件获取区间运行时分、起停车附加时分、不同时到达间隔时间及会车间隔时间等列车运行参数,按照区间实际情况选择适宜的理想能力计算方法,如按追踪运行图、非追踪的平行运行图进行能力计算。

(2)实际能力测算 ( 人工写实获取 )。能力写实是指统计不同类型的列车在某方向 ( 上行或下行 ) 一段时间内通过车站的数量,写实工作一般在车站进行,并且需要在一段时间 ( 3 d 以上 ) 内持续进行。

(3)区间能力利用率等指标计算与图表分析。根据所采集的数据,可以求得平均利用率、分时段利用率等指标,最后结合实际情况提出挖潜扩能的合理化建议。

1.2 基于 TDCS 数据分析的区间通过能力分析

传统对能力利用的分析限于数据样本的有限性和随机性,很难客观反映能力实际使用情况与实时车流、人员操作、天气情况等因素的关联关系,给予管理者的决策支持显得粗犷和模糊。通过 TDCS底层的海量数据支持,开发相应的信息系统能够实现对能力利用的实时分析。能力利用的波动规律和影响因素关联关系的分析方法如下。

1.2.1 能力利用波动规律分析方法

定义能力利用率最高、次高的区间分别为第一饱和区间和第二饱和区间,能力利用长时间饱和的区间可以认为是限制区间,而传统限制区间的确定方法是通过计算线路各区间运行图周期时间所确定,运行图周期时间最长的区间即为限制区间。

采用 HP 滤波法对不同季节和不同时间段的能力利用波动规律进行分析。HP 滤波法可以将趋势循环变量 ( GCt) 分解为长期趋势 ( Gt) 和周期波动个部分[5],方便了解能力利用波动规律的长期趋势和周期波动。( Gt) 通常被定义为损失函数的最小化问题的解,计算公式为

式中:Yt为时间序列数据,可分解为 Yt= Gt+ Ct,t = 1,2,…,n;λ 为平滑参数 ( 正数 ),Gt该值越大, 越平滑。

1.2.2 影响因素与能力利用的关联分析方法

影响区间能力利用的因素很多,能力利用的波动主要由车流在时间与空间分布的不均衡性、车流组成结构的差异性,区间设备故障的随机性等原因形成[6]。通过处理 TDCS 数据,可以对这些影响因素与能力的关联进行定量研究,考虑采用回归分析方法进行分析。以确定列车比例与区间能力饱和程度的关系为例,确定各比例参数的计算公式为

式中:α 为某时间段内区间平均能力利用率;β 为 2种不同类型列车比例,β = nA/ nB,其中 nA,nB分别为 A,B 类型列车数量,由列车运行实测数据统计出;λ1,λ2,b 为需要通过回归确定的未知参数。

1.3 能力利用的基础数据处理流程及关键步骤设计

基于 TDCS 数据分析的区间通过能力分析重点工作是对基础数据的处理,TDCS 数据处理流程设计如图1 所示。首先,获取海量 TDCS 数据、处理多源数据,从而得到可使用的原始数据;其次,进行预处理、数据类型划分等基础工作;然后,进行列车区间运行时分、列车密度等参数分析,统计均值、中位数等描述性指标,用于波动规律分析和影响因素关联分析;最后,重点描述能力利用波动规律数据处理流程和影响因素关联分析流程。

图1 TDCS 数据处理流程设计

1.3.1 能力利用波动规律数据处理

步骤 1:计算理论最大能力。由经典计算公式[6]可知,首先需要获取区间纯运行时分。区间纯运行时分的处理需要经过以下步骤:①判定列车类型,由于同区间不同类型列车如万吨列车(大列)、5 000 t 列车 ( 小列 ) 的运行时分不同,需要判定列车类型;②判断列车经由径路,将原始数据表按车次号和时间排序,即可得到每列车的经由径路;③确定列车区间并为区间编号,列车经由径路上相邻车站之间即为区间,编写区间号;④划分列车通过区间的类型,列车通过区间运行时分类型如表1所示,而纯运行时分只为“通通”类型列车通过区间的时间;⑤获取纯运行时分,统计某种类型列车通过各区间的“通通”类型的运行时分,绘制频率分布直方图,进行形态分析,获得不同可达度下的纯运行时分[1]。

表1 第 i 区间 ( j-1 站至 j 站 ) 运行时分类型

步骤 2:统计区间实际能力。执行步骤 1 中的①至③步,然后统计所有通过区间的列车总数。

步骤 3:计算能力利用率,绘制能力利用规律图表。在绘制不同时段、不同区间的能力利用波动规律时,加入判定时间、判定区间的步骤。

1.3.2 影响因素关联分析

步骤 1:计算能力利用率。

步骤 2:统计不同类型列车区间列车密度。可以按照能力利用波动规律中步骤 2 进行处理,重点关注不同类型列车的划分。

步骤 3:得到回归分析能力利用率与不同类型列车比例变化之间的关联关系。

2 TDCS 数据处理关键技术

2.1 基于数据库拆分的海量数据获取技术

列车运行过程中记录了海量的运行数据,如何从繁杂的数据中获取能力利用相关信息是一项难题。采用数据库拆分的数据获取技术[7]获取海量数据,基本思路为:①将表格初步分类;②建立查询,确定列车运行过程中事件触发与表格记录之间的关联,方便准确推断表格内容;③根据感兴趣的数据垂直拆分表格,并且将拆分内容存储到不同数据表空间上,使数据在物理上被分离;④最后建立1 个链接所有分区的视图,使数据在逻辑上仍然为一个整体。

2.2 基于 XML 的多源数据处理

TDCS 下中心逻辑处理子系统、调度终端子系统、车站子系统、网络子系统等各子系统,以及各子系统中包含的更多子系统,它们之间数据记录格式/类型不同,从而造就数据的多源性。对 TDCS 数据处理关键技术之一是对多源数据的处理。通过采用 XML ( eXtensible Markup Language 可扩展标记语言 ) 的异构数据转换技术[8-9],提出基于 XML 的TDCS 多源数据处理方法如下。

步骤 1:从数据源提取数据。在数据提取文件中设置提取数据的规则,可以分别从多个数据源对应的多个数据库中提取信息,如可以根据数据被记录时的时间、列车类型或关键字等信息从数据库中提取数据。

步骤 2:对提取的数据进行预处理。预处理数据包括异常数据剔除、缺失数据补齐、参数修正等。

步骤 3:生成第一 XML 文件。将所提取并且经过预处理的数据直接映射为第一 XML 文件。

步骤 4:生成第二 XML 文件。将第一 XML 文件中的每个元素映射为 XML Schema 中的内置数据类型的样式,得到第二 XML 文件。XML Schema 的内置数据类型可以分为基础类型和派生类型,具有统一标准。

步骤 5:设置第二 XML 文件中的元素表现样式。在设置元素间的关系时,应考虑最终的表现样式尽可能清楚地反映铁路运输区间能力,同时考虑计算模型的需要,方便数据能够被更清晰快速地访问。

步骤 6:生成第三 XML 文件。第二 XML 文件中的元素根据表现样式文件中所定义的元素间的关系进行数据转换,生成用于交换的第三 XML 文件。典型的数据转换形式包括重构、数据类型转换、日期 / 时间格式转换等。

步骤 7:能力利用数据处理。从第三 XML 文件中获取数据,以构建模型对区间能力利用进行分析。

3 案例分析

以包神铁路为例,选取其能力紧张的东线区段进行研究。通过对该线区间能力波动规律及大小列的比例变化对能力利用的影响进行研究,以验证该能力利用分析方法的有效性和实用性。选取包神铁路东胜—敖包沟、敖包沟—沙沙圪台、沙沙圪台—巴图塔、巴图塔—石圪台、石圪台—瓷窑湾的上下行区间,数据为 2012 年 1 月—2013 年 2 月的 TDCS数据样本。

选取巴图塔—沙沙圪台区间的列车密度,统计不同时段的列车密度均值、最大值和最小值等指标,巴图塔—沙沙圪台不同时间段能力利用分析表2 所示,分析可知区间内各时间段平均能力利用均衡,但最大值和最小值差异显著 ( 时间段内相差达到 10 列 ),表明波动较大。通过 HP 滤波分析法 ( 取经验值 14 400[10]) 得到的巴图塔—沙沙圪台区间日均能力利用率波动图如图2 所示,分析可知每日能力利用率差异明显 ( 上行能力利用率在 0.4~0.65 之间,下行能力利用率在 0.5~0.75 之间 )。

表2 巴图塔—沙沙圪台不同时间段能力利用表

东线区段各区间利用率对比如表3 所示。通过分析可知,东线区段下行方向比上行方向能力利用率高 5 %~15 %;第一饱和区间为沙沙圪台—巴图塔区间,第二饱和区间为石圪台—瓷窑湾区间,因而建议如下。①列车在这2个区间应加速运行,减少其对线路能力的限制。②石圪台是支线与主线的交叉点,开行支线列车时应充分与主线协调,尽量在主线空闲时开行,以减轻第二饱和区间的能力紧张程度。

图2 巴图塔—沙沙圪台每日区间能力利用率波动图

表3 各区间能力利用率对比

开行大列对缓解区间能力紧张作用明显,在实际工作中确定大列开行的数量很难做到科学合理。以巴图塔—石圪台下行区间为例,通过数据挖掘分析大、小列比例与能力利用率间的定量关系,为确定大小列数量提供参考,计算公式为

经 F 检验,拒绝原假设的可能性为 3.12 × 10-6<0.05,表明拟合成功,该模型可行。通过对巴图塔—石圪台区间数据结果进行分析可知:①随着区间开行大列的数量增加,区间能力利用率从 60 % 下降到 30 %,输送能力却从 25 万 t 上升至 35 万 t,巴图塔—石圪台下行回归分析如图3 所示;②根据图3 可知,随着大列数量增加,区间能力利用率降低的速度明显减缓,比例超过 1.5 后变化不再明显。

4 结束语

铁路通过能力利用分析是现场管理人员决策的基础,由于能力利用的影响因素很多,分析结果很难达到准确、全面和实时,不能达到决策支持的目标和要求。因此,提出基于 TDCS 数据分析的能力利用分析技术、方法和流程,通过设计基于 TDCS数据的能力利用波动规律和影响因素关联分析的算法流程与步骤,解决数据获取和处理难点。通过包神铁路的实例分析,表明所提分析方法和数据处理技术简单易行、可靠度高、实时性强,可以为管理人员实时掌握能力利用情况、进一步研究运行图指标兑现率和运行图结构等问题提供研究思路和借鉴。

图3 巴图塔—石圪台下行回归分析

[1] 王 军,张星臣,张 懿,等. 基于监控数据挖掘的运行图参数查定与修正方法[J]. 中国铁道科学,2011,32(4):117-121. WANG Jun,ZHANG Xing-chen,ZHANG Yi,et al. Method for the Measurement and Correction of Train Diagram Parameters based on Monitoring Data Mining[J]. China Railway Science,2011,32(4):117-121.

[2] 马钧培. 中国铁路信息化建设与展望[J]. 交通运输系统工程与信息,2005(5):5-9. MA Jun-pei. Construction and Prospect of Information Systems for Chinese Railways[J]. Journal of Transportation Systems Engineering and Information Technology,2005(5):5-9.

[3] 王兴中. 铁路调度指挥系统中数据存储体系及索引结构的研究[D]. 北京:中国铁道科学研究院,2011. WANG Xing-zhong. A Study of Data Storage System and Indexing Structure for the Railway Dispatching System [D]. Beijing:China Academy of Railway Sciences,2011.

[4] Abril M,Barber F,Ingolotti L,et al. An Assessment of Railway Capacity[J]. Transportation Research Part E Logistics & Transportation Review,2007,44(5):774-806.

[5] He Y,Wang B,Wang J,et al. Correlation between Chinese and International Energy Prices based on A HP Filter and Time Difference Analysis[J]. Energy Policy,2013,62(9):898-909.

[6] 杨 芳. 线路通过能力利用率的研究[D]. 兰州:兰州交通大学,2012. YANG Fang. Study on the Degree of Railway Line’s Capacity Utilization[D]. Lanzhou:Lanzhou JiaoTong University,2012.

[7] Villarroya S,Viqueira J. Geodadis:A Framework for the Development of Geographic Data Acquisition and Dissemination Servers[J]. Computers and Geosciences,2013,52(3):68-76.

[8] Agreste S,De P,Ferrara E,et al. XML Matchers:Approaches and Challenges[J]. Knowledge-Based Systems, 2014(66):190-209.

[9] 陈军华,张星臣,徐 彬,等. 信息化条件下车站作业标准时间查定方法研究[J]. 交通运输系统工程与信息,2011(3):119-123. CHEN Jun-hua,ZHANG Xing-chen,XU Bin,et al. Research on Railway Station Operation Standard Time Assessment Method under the Conditions of Informatization of Railway[J]. Journal of Transportation Systems Engineering and Information Technology,2011(3):119-123.

[10] 高铁梅,王金明,梁云芳,等. 计量经济分析方法与建模[M]. 北京:清华大学出版社,2009. GAO Tie-mei,WANG Jin-ming,LIANG Yun-fang,et al. Econometrics Analyzes Methods and Modeling[M]. Beijing:Tsinghua University Press,2009.

责任编辑:吴文娟

Study on Utilization of Railway Section Passing Capacity based on TDCS Data Analysis

Based on expounding the traditional flow of utilization analysis of section passing capacity, this paper analyzes the analysis principle of section passing capacity based on TDCS data analysis and the design of basic data processing flow of the passing capacity utilization, and puts forward the key technologies of TDCS data processing such as the technology of mass data acquisition based on database sharding and the multi-source data processing based on XML. In the end, taking Baotou-Shenmu railway as an example, the paper analyzes the capacity utilization in dilemma line section, and gives reasonable proposals. The practice shows the method of utilizing railway section passing capacity based on TDCS data analysis is simple and practicable, and also has practical promotion significance.

Railway Transportation; Capacity Utilization; TDCS; Data Mining

1003-1421(2015)07-0021-05

U292.5+2

A

2015-05-20

国家自然科学基金资助项目 ( U1361114 )

猜你喜欢

数据处理利用率区间
你学会“区间测速”了吗
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
基于低频功率数据处理的负荷分解方法
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
2019年全国煤炭开采和洗选业产能利用率为70.6%
全球经济将继续处于低速增长区间
化肥利用率稳步增长
浅议如何提高涉烟信息的利用率
区间对象族的可镇定性分析
板材利用率提高之研究