APP下载

城市轨道交通客流高峰持续时间预测方法*

2016-03-15石庄彬邵星杰

城市轨道交通研究 2016年7期
关键词:客流量高峰持续时间

石庄彬 张 宁 邵星杰

(1.东南大学ITS研究中心轨道交通研究所,210018,南京; 2.南京地铁运营有限责任公司,210008,南京∥第一作者,博士研究生)

城市轨道交通客流高峰持续时间预测方法*

石庄彬1张 宁1邵星杰2

(1.东南大学ITS研究中心轨道交通研究所,210018,南京; 2.南京地铁运营有限责任公司,210008,南京∥第一作者,博士研究生)

分析了国内城市轨道交通运营管理的发展现状,总结了关于客流高峰持续时间现有的研究方法,通过对比分析,选择回归分析作为城市轨道交通客流持续时间预测模型。分析和定义了城市轨道交通客流高峰事件的概念,探讨了客流高峰事件的影响因素,阐述了回归分析模型的理论基础和求解方法。以南京地铁1号线的数据作为原始数据并进行建模,在此基础上验证研究方法的可行性。

城市轨道交通; 客流高峰持续时间; 回归分析

First-author′s address ITS Rail Transit Research Institute,Southeast University,210018,Nanjing,China

目前,我国的城市轨道交通发展还处于初期,运营管理水平仍有很大的提升空间。尤其在城市轨道交通客流高峰事件管理方面,主要依靠管理人员主观经验,缺少必要的理论支持,存在不能对客流需求变化做出及时反应、通行能力浪费和服务水平低下等问题。

我国城市轨道交通当前的总体趋势是各大中城市正在不断地建设新线,逐步形成城市轨道交通网络,客流模式还处于发展变化之中。由于城市轨道交通快速、准时、运量大等优势,公共交通中选择城市轨道交通出行的乘客比例随着城市轨道交通线网发展迅速攀升。同时,我国城市人口密度大,出行需求较高,导致高峰时段乘客的等待延误和拥挤现象时有发生,成为提升城市轨道交通服务质量的瓶颈。为合理节省企业资源和提高运营管理水平,迫切需要一种简单迅速、准确性高的城市轨道交通客流高峰持续时间预测方法。

国内外许多学者已在交通事件持续时间预测分析方面做了一定的研究,由于数据来源、分析角度、研究目的不同,所建立的预测方法也不尽相同。主要的预测方法包括:概率统计[1,3]、回归分析[4-6]、决策树模型[7-8]、模糊逻辑法[9]、生存分析[10-11]等。

近年来,一些研究者试图加入其它的方法,如贝叶斯决策理论、人工神经网络、支持向量机等,以提高预测的精度和扩大模型适用范围,并证实预测方法的有效性。考虑到现有的一些方法具有过于复杂难以理解、计算处理时间较长、易收敛于局部极小值等缺陷,在实际应用中实施比较困难,而回归分析操作相对简单且能取得较好的预测结果,本文选择回归分析作为城市轨道交通客流高峰持续时间预测模型。首先从客流高峰事件的定义出发,对客流高峰事件的影响因素进行重点分析,然后介绍回归分析模型的原理,并通过实例应用对模型有效性进行验证。

1 客流高峰事件持续时间影响因素

1.1 客流高峰持续时间定义

目前,国内外对于交通高峰事件尚未有明确的定义。根据美国道路通行能力手册(HCM2010),高峰小时被认为是一天中交通流量最大的1 h[1]。高峰小时流量反映了线路的交通通行需求,是通行能力以及其它交通分析的重点,在交通工程设计和运营决策过程中往往作为一个十分重要的基础数据。一般日常客流高峰是指由于居民通勤、上学、娱乐等出行行为引起某个时间段内的交通流量明显高于其它时段,接近甚至超过线路的通行能力,在客流分布曲线上形成明显的“山峰”。其中最典型的现象是城市交通的早、晚峰。根据历史经验,在实际的分析中,通常划分早高峰时段为7:00—9:00,晚高峰时段为17:00—19:00。

但对高峰小时交通量的统计结果及依据经验划分的高峰时段对客流的描述过于粗糙,无法准确判断交通进入高峰状态的时间以及高峰状态持续的时间长度。造成这种情况的主要原因在于缺乏对交通量实时精确的检测。与城市道路交通不同的是,城市轨道交通自动售检票(AFC)系统详细地记录了乘客进出站的交易信息,并有能力将交易数据实时上传至清分中心(ACC),这就为城市轨道交通客流高峰事件的分析提供了实施的基础。

城市轨道交通的客流高峰持续时间可定义为从进入客流高峰到退出客流高峰之间的时间长度。而判定客流高峰的关键在于选择合适的高峰阈值作为客流是否进入高峰状态的依据。从乘客舒适性的角度而言,应基于列车时刻表计算线路的通行能力,通过乘客交易信息估计线路上最大断面客流和最大的站台乘客密度,当服务质量低于一定水平时,则视临界状态时的客流为高峰阈值。在单位时间进站客流量累积频率分布曲线上,15%~85%分位区域内客流量变化比较平稳,超过上85%分位时客流量增长明显。借鉴新建公路以自由流车速的上85%分位速度作为划分一般状态和超速行驶的分界值[1],本文以单位时间客流量的上85%分位点作为临界点。具体的判定方法是:对一段时间内单位时间线路进站客流量的统计结果由低到高进行排序(即累积频率分布曲线),选取上85%分位点的线路进站客流量作为高峰阈值;为避免由于短时客流波动而导致错误的判断,只有在连续5个单位时间段的线路进站客流量大于高峰阈值时,确认客流进入了高峰状态;在进入客流高峰后,若在连续5个单位时间段内有2个单位时间段的线路进站客流量小于高峰阈值时,确认客流退出高峰状态。

1.2 影响因素分析

在以往的研究中,研究对象一般是道路交通事件的持续时间,尤其是关于道路上车辆的交通事故的持续时间,鲜有对客流事件持续时间的研究。在道路交通中使用的事件持续时间预测模型显然是不适用于城市轨道交通客流高峰事件的。因此,需要因事制宜地构建客流高峰持续时间模型。本文所选择的回归分析方法的核心在于分析事件持续时间和不同影响因素的关系,其首要的步骤是对城市轨道交通客流高峰事件的影响因素进行分析和选择。与城市轨道交通客流高峰事件相关且获取比较容易的数据主要有客流数据(包括交易的时间、地点、编号等交易记录)、事故记录、施工记录、天气情况、举办大型活动等,根据这些数据可获得的主要影响因素如下:

(1) 事件开始时间:城市轨道交通客流高峰事件的开始时间在一定程度上反映乘客出行的模式,如出行目的、客流组成类型、出行方式选择等特征。具体对客流高峰事件开始时间所考虑的候选变量有事件在当天的时间段、事件在当周的星期几、事件发生的季节等。城市轨道交通客流在一天内的出行可以分为3个时间段,分别为早高峰(6:30—09:00)、晚高峰(16:30—20:00)、其它时间段。一个星期的日期可简单地分为工作日和周末,如果对预测的精度要求较高且数据量足够,也可用8个变量表示一周的7天和特殊节假日。季节则按照习惯分为春、夏、秋、冬4个变量。

(2) 客流量:随着我国城市轨道交通的发展,城市轨道交通客流量及其在公共交通出行方式中所占的比例迅速增加,车站内的客流密度逐渐加大,从而延长了客流高峰的持续时间。客流量的增长具有时间趋势性,同时也具有一定的波动性,为减弱客流量的波动所产生的影响,可选择观测日前一周的平均线路日客流量作为变量。

(3) 线路站点布局:城市轨道交通线路站点数量、途经的城市区域类型,决定了乘客对于线路上乘降地点和乘降时间的选择。此外,线路的线网布局和列车交路类型也会影响乘客在线路上的分布。

(4) 天气条件:选择天气条件作为城市轨道交通高峰客流事件的一个影响因素,是因为城市的天气变化会改变人们的出行习惯,尤其是遇到雨雪天气时,人们往往不愿意外出,而必须出行的乘客通常偏向于选择最易获得的方式出行。天气条件包括雨、雪、雾霾、大风等变量。

(5) 车站运行环境:车站内的运行环境发生变化时,乘客对出行方式的选择也将随之改变,例如车站设备发生故障、线路施工建设、发生火灾事故等情况下,乘客对城市轨道交通服务质量的满意度会降低,部分乘客会优先选择其它的交通方式出行。

(6) 车站周边环境:车站周边环境对乘客出行心理的影响会对城市轨道交通客流造成或增或减的变化,具体的变量包括车站周边通道施工、车站周边地面公交运行变化、车站附近举办大型活动等。

2 回归分析模型理论基础

对客流高峰持续时间和影响因素的数据表进行标准化处理,得到标准化数据表T*和X*。标准化的方法如下:

(1)

式中:

根据多元线性回归模型,客流高峰持续时间ti与影响因素之间的关系可表示为:

ti=b0+b1xi1+b2xi2+…+bdxid+εi

(2)

式中:

b0,b1,b2,…,bd——待定系数;

εi——干扰项,表示随机误差以及其它被省略的影响因素对持续时间干扰的总体效果,一般设E(εi)=0。

令β=(b0,b1,b2,…,bd)T,ε=(ε1,ε2,…,εn)T,在影响因素标准化数据表添加一个值为1的常数列,即:

由式(2)可得到客流高峰持续时间和影响因素的标准化数据表之间回归关系的矩阵表达形式:

(3)

(4)

3 应用实例

3.1 数据采集及预处理

回归分析模型所需要的数据主要分为两部分,分别对应模型的因变量和自变量。其中,因变量是指客流高峰事件持续时间,通过对城市轨道交通原始的交易数据进行整理获得目标数据集;自变量则需要选择合适影响因素作为模型变量,并设定相关的量化准则。

本文选取2013年3月11日至2013年5 月26日共计11周的南京地铁1号线乘客日常交易数据作为算例基础数据。南京地铁1号线于2005年4月10日正式开始运营,2号线于2010年5月28日正式运营,经过数年的发展,南京地铁的客流模式已逐渐趋于稳定,其客流数据能较好地反映客流的本质规律。本文以基础数据中第一周的上85%分位点的线路进站客流量作为高峰阈值,通过数据预处理流程得到客流高峰持续时间的数据表。在数据量充足的条件下,确定高峰阈值的数据时间段宜尽量的长,例如1年或者2年,以免短期数据无法全面反映信息特征。

设定单位时间Δt=1 min,按Δt对时间进行分段,统计原始交易数据在各单位时间段内的1号线全线进站客流量,对一段时间内单位时间线路进站客流量的统计结果由低到高进行排序,选取上85%分位点的线路进站客流量作为高峰阈值,然后按城市轨道交通客流高峰持续时间的判定方法确定客流高峰事件以及客流高峰持续时间t。为提高模型预测结果的可靠性,还需要对目标数据进行清洗。采用孤立点分析去除目标数据的噪声,具体过程是:在一个以客流高峰事件的持续时间为中心、半径为10 min的时间段内搜索其它客流高峰事件,若搜索到的客流高峰事件数量不大于样本总量的3%,则将该客流高峰事件视为孤立点,并从目标数据中剔除。

此算例的目的是演示城市轨道交通客流高峰持续时间预测模型的操作方法,并验证模型的可行性。为了数据取样和建模过程的方便性,算例所使用的数据样本量相对较小。由于所选择样本数据的时间跨度不长,客流增长的变化趋势不明显,以及极端天气、事故、施工等特殊情况出现的频率较少等原因,算例在模型影响因素的选择上作了一些精简,排除掉部分偶发因素和长期因素。算例的时间影响因素变量包括日期、开始时刻、高峰时段、是否为工作日,天气因素主要考虑是否下雨,车站周边环境变化因素产生较大影响的变量是奥体中心是否举办大型活动。具体变量设置说明如表1所示。

依照表1中影响因素变量的设置要求以及交易记录数据库中的信息,建立影响因素的数据表。联合客流高峰持续时间的数据表和影响因素的数据表,将数据表拆分成两部分,其中前10周数据作为训练数据,第11周数据作为测试数据。

3.2 算例分析

通过观察城市轨道交通客流高峰持续时间与上述变量值之间的关系,发现早高峰和非早高峰时段的客流高峰持续时间明显不同。工作日的客流变化曲线呈明显且相对稳定的早晚高峰现象,而非工作日的客流变化曲线高峰现象不太显著。此外,算例数据中所有的早高峰均发生在工作日。考虑到不同出行时间段下高峰持续时间与其它变量关系的差异,为提高预测的准确性,将数据分为早高峰(Model1)、工作日非早高峰(Model2)、非工作日高峰(Model3),分别建立回归模型。

表1 模型变量设置

借助统计软件导入训练数据,通过回归模型参数标定方法得到三种不同客流模式下模型的回归结果,包括方差分析表(见表2)和参数估计,最终得到城市轨道交通客流高峰持续时间预测模型的表达式为:

表2中模型的F统计检验结果显示该预测模型的线性回归关系是高度显著的,说明使用回归分析方法进行城市轨道交通客流高峰持续时间预测具有一定的可靠性。

表2 不同客流模式的方差分析表

为进一步说明模型的预测效果,使用测试数据对模型的准确性进行评估(见表3)。对比客流高峰持续时间的实际值和预测值可知,工作日的预测残差均小于5 min,特别是早高峰的预测残差都在2 min以内。这是一个可以接受的预测结果,可为城市轨道交通列车运行图的调整提供较好的辅助决策。表3中周末的预测误差较大,预测值与实际值的偏差接近25 min,通过分析周末的客流变化情况,发现其主要原因是周末的客流量日变化趋势相对比较平稳,且单位时间客流量一般在高峰阈值附近波动,导致客流高峰持续时间的随机性较强。因此,非工作日的高峰持续时间对于城市轨道交通行车组织的指导意义不大。

表3 模型准确性评估表

4 结语

科学地预测客流高峰持续时间,有助于实现城市轨道交通高峰事件的科学管理,是提升城市轨道交通服务质量的有效措施。本文对城市轨道交通客流高峰事件进行了定义,总结了持续时间的研究方法,讨论了城市轨道交通客流高峰持续时间的影响因素,并使用回归分析的方法验证了研究的可行性。本文只是对城市轨道交通客流高峰持续时间进行了初步探讨,以起到抛砖引玉的效果,为了提高城市轨道交通运营管理水平,实现优化运营企业资源配置和改善社会形象两者之间的最佳平衡,还需要更多深入的研究。

[1] Transportation Research Board.Highway capacity manual [M].Washington D C:National Research Council,2010.

[2] GOLOB T F,RECKER W W,LEONARD J D.An analysis of the severity and incident Duration of truck-involved freeway accidents [J].Accident Analysis & Prevention,1987,19(5):375.

[3] GOOLSBY M E.Influence of incidents on freeway quality of service [M].Washington D C:Highway Research Record,1971.

[4] GIULIANO G.Incident characteristics,frequency,and duration on a high volume urban freeway [J].Transportation Research Part A General,1989,23(89):387.

[5] GARIB A,RADWAN A E,AL-DEEK H.Estimating magnitude and duration of incident delays [J].Journal of Transportation Engineering,1997,123:459.

[6] KHATTAK A J,,SCHOFER J L,WANG M.A simple time sequential procedure for predicting freeway incident duration [J].Journal of Intellient Transportation Systems,1995,2(2):113.

[7] OZBAY K,NOYAN N.Estimation of incident clearance times using Bayesian Network approach [J].Accident Analysis and Prevention,2006,38(3):542.

[8] 姬杨蓓蓓,张小宁,孙立军.基于贝叶斯决策树的交通事件持续时间预测[J].同济大学学报(自然科学版),2008,36(3):319.

[9] CHOI H K.Predicting freeway traffic incident duration an expert system context using fuzzy logic PHD dissertation [D].Los Angeles:University of Southern California,1996.

[10] JOVANIS P P,CHANG H L.Disaggregate model of highway accident occurrence using survival theory [J].Accident Analysis & Prevention,1989,21(5):445.

[11] 康国祥,方守恩.基于风险分析的交通事件持续时间预测[J].同济大学学报(自然科学版),2012,40(2):241.

Prediction of Passenger Flow Duration in Urban Rail Transit Peak Hours

SHI Zhuangbin, ZHANG Ning, SHAO Xingjie

The current development situation and operation management of rail transit in China are firstly analyzed, the existing research methods on the passenger flow duration in peak hours are summarized.By means of comparison, the regression analysis is selected as the basic prediction model. Then the concept of rail transit passenger flow in peak hours is defined, the influential factors of which is investigated, the theoretical basis and methods for solving the regression model are proposed.Finally, by using the data of Nanjing Metro Line 1 to establish a prediction model, the feasibility of this research method is verified.

urban rail transit; passenger flow duration in peak hours; regression analysis

*交通运输部建设科技项目(2015318J33080)

U 293.13

10.16037/j.1007-869x.2016.07.008

2014-08-16)

猜你喜欢

客流量高峰持续时间
病毒病将迎“小高峰”全方位布控巧应对
石庆云
基于嵌入式系统的商场客流量统计算法
雨天早高峰,自在从容时。
The 15—minute reading challenge
基于AFC数据的城轨站间客流量分布预测
基于SVD的电压跌落持续时间检测新方法
从客流量推算公交出行PA矩阵的方法
新建旅游项目客流量分析方法初探
极寒与北极气压变动有关,持续时间不确定