基于数据分析的城市交通节假日客流预测
2016-06-25徐瑞华公安部交通管理科学研究所江苏无锡4000同济大学交通运输工程学院上海0804
许 俊,周 峰,徐瑞华(.公安部交通管理科学研究所,江苏无锡4000;.同济大学交通运输工程学院,上海0804)
基于数据分析的城市交通节假日客流预测
许俊1,周峰2,徐瑞华2
(1.公安部交通管理科学研究所,江苏无锡214000;2.同济大学交通运输工程学院,上海201804)
摘要:城市轨道交通客流的预测是制定和调整列车开行计划、支持车站客运组织等工作的关键。节假日客流较近期客流变化较大,往往会给城市轨道交通的运营带来巨大压力,甚至存在着巨大的安全隐患,对节假日客流关键指标数据的预测显得尤为必要。对节假日客流的预测模型与方法进行研究,通过对大量真实历史进站客流数据的分析,总结不同类型车站客流特点。根据不同类型的客流特点提出“相似日”城市轨道交通节假日预测法。基于真实数据地验证,显示该方法可以较好地对城市轨道交通节假日客流进行预测。
关键词:城市轨道交通;数据分析;节假日客流预测;相似日法
近年来,城市轨道交通发展迅猛,随着大规模建设的到来,城市轨道交通工作的重点将转向运营管理。客流是运营管理工作开展的基础,城市轨道交通客流的影响因素复杂,短期内客流预测可以根据历史客流的趋势外推,但是若预测当天发生了对客流有重大影响的事件,从历史客流得到的预测数据就没有意义了,而节假日客流较近期客流变化较大,一些突发的大客流还存在严重的安全隐患,所以对于节假日客流的预测显得尤为重要[1]。
1 理论基础
本文所指的节假日是如“五一”、“十一”等传统的较为正式的节假日,在这些日子乘客的出行行为较平时会有较大的不同。相关的研究已经表明[2],在没有发生特殊影响因素的情况下,城市轨道交通客流有其固有分布形态,而在特殊影响因素的影响下,这些客流分布的形态将会发生变化,分析其变化特点得到其变化规律将是节假日客流预测方法的关键技术。
本文将以具体的节假日为例,通过海量历史客流数据分析城市轨道交通节假日客流特征,并根据其客流特征,构建特殊日客流预测的模型与方法。由于其他类型的客流可以通过进站客流的演化得到,所以以进站客流为例对实际特殊日客流进行特征分析。所采用的数据来源于北京地铁清分中心提供的实际数据。
2 客流分析
节假日期间由于放假、旅游等原因,乘客的出行规律较假期前几周时间内的同期客流发生了变化,则其客流特征与上周同期也有着较大的变化。在节假日期间对于地铁车站客流而言,当进站客流在短时间激增时,无论是对车站的客运组织工作还是列车的运输能力而言都是一种挑战,所以从运营管理的实际需求出发,为了做好大客流的应急处置工作,有必要对节假日进站客流出现激增的车站进行分析,从而为节假日客流预测找到方法。
2.1重点车站的定义
定义重点车站,指在节假日期间进站客流与上几周同期客流的对比有显著上升的车站。节假日期间由于乘客的出行行为发生了变化,则城市轨道交通客流相应就会发生变化,这种变化体现在很多方面,比如网络进站客流的变化、线路客流的变化等等,反映到最基本的单元,就是车站进站客流的变化。车站进站客流的变化分为降低和上升,进站客流上升又可分为显著上升和略微上升,从安全的角度出发,对于减少的客流,由于减轻了客流组织工作,在不改变原有运营计划的前提下仍能保证运营的安全,但是对于增加的客流,当其增加幅度超过了一定范围,如果仍然采用原来的运营计划,那么有可能就会存在运营的安全隐患,对于城市轨道交通运营管理安全而言,只有进站客流显著上升的车站是值得关注的。
2.2重点车站的挑选
挑选重点车站的方法:
1)获得节假日全路网各个车站的小时进站客流ZHi,Z代表车站,i代表全天的第i个工作小时,H代表节假日当天。获得节假日前几周的同期全路网各个车站的小时进站客流,其中Z代表车站,i代表全天的第i个工作小时,j代表的是第j周是指Z车站在节假日前几周同期剔除异常客流后的平均小时进站客流。
2)获得节假日客流增幅超过一定指标的车站,计算方法如(1)所示:
式中:p为规定的涨幅,也即当节假日小时进站客流增长超过一定的涨幅,则认为该车站为重点车站。
2.3重点车站的分析
采用实际数据进行分析,根据公式(1),以北京市2013年某节假日为例,对全路网200多个车站的全日小时进站客流进行对比分析后,确定36个车站(其中3个车站为换乘重合站)为重点车站。这些重点车站的分布如表1所示。此处选取的p=200%,也即当增幅超过200%时,认为该车站存在安全隐患,也即是重点站。需要指出的是200%是本文研究取的一般值,实际运用中该值应根据车站的实际情况选取。
根据这些重点车站的分布等特点,重点车长分为4类,具体分类如表1所示。
表1 重点车站分类Tab.1 The classification of key stations
由表1可知,根据车站的特点,可以将所挑选出来的车站分为景点车站、郊区区域车站、交通枢纽类车站以及重点换乘站4类。下面就这4类车站在节假日进站客流的特点,分别进行分析。
2.3.1景点车站
像北京、上海这样的历史文化名城或者国际性大都市,一到节假日必然会吸引大量的旅游客流,在这些城市轨道交通系统发达的城市,城市轨道交通必然是旅客出行的首选,而这些城市的景点车站,也将会迎来大客流。以天安门东为例,其节假日(2013年“五一”假期)当天客流与上周同期(2013年4月24日)对比如图1所示。
为了客流的精细化分析,此处采用的是5 min客流,也即图中横坐标代表当天第几个5 min,如75指的就是当天第75个5 min,代表了5:10—5:15之间的客流。本文以下的客流对比也采用了5 min间隔,如未特别说明都代表相同涵义。
由图1可知节假日客流与上周同期差距较大,则用上几周客流的历史数据不能再预测节假日客流当天的数据。虽然个体的出行规律千差万别,但是从总体的角度出发,相同节假日期间城市总体的出行结构与特征应该是类似的,基于这样的思考,本文尝试将近3年同类型的节假日客流进行对比,对比结果是虽然节假日的间隔差距达一年以上,但是景点车站节假日进站客流的相似程度却仍然相当的高,同样以天安门东的全日5 min进站客流为例如图2所示。
图1 节假日客流与上周同期对比Fig.1 Comparison of the passenger flow
图2 天安门东节假日进站客流对比Fig.2 Comparison of the passenger flow in East Tiananmen
由图2可知,相同节假日景点车站的进站客流分布是十分相似的,特别是节假日当晚的一个异常高峰客流居然也是十分类似,虽然笔者不知道这个异常高峰进站客流的原因,但是根据相同节假日的历史客流,可以提前做好预警工作,做到防患于未然。
2.3.2交通枢纽类车站
北京地铁路网中的北京南站和北京站在节假日当天的小时进站客流中均有超过了200%的时间段,这说明节假日对城市重大的对外交通枢纽客流有着较大影响。
铁路类交通枢纽的客流产生有其自身的特点:这些客流都是由铁路网客流转换而来的,也即铁路网客流转换成城市轨道交通网客流,这说明对外交通枢纽类的城市轨道交通进站客流变化规律应当与铁路客流的到达规律一致,以城市轨道交通北京站为例,其近3年同类型的节假日全日进站客流分布如图3所示。
由图3可知,北京站2011年节假日进站客流分布与2012和2013年有较大差别,而2012与2013年之间的进站客流有着较高的相似性,其原因除了铁路客流近2年的增幅较大以外,列车时刻逐渐地稳定也决定了该类车站进站客流规律的稳定性。由于铁路客流运输能力有限,这类车站进站客流的增长也非常有限,所以,结合铁路列车运行图变动和去年节假日客流特征就能得到较准确的城市轨道交通交通枢纽类车站的进站客流预测值。
图3 北京站节假日进站客流对比Fig.3 Comparison of the passenger flow of Beijing Station
2.3.3换乘车站
换乘站进站客流的增加与节假日当日客流的特点有关,通过对重点换乘站的进站客流进行分析,发现虽然换乘站之间的客流呈现不同的变化特点,但是每个换乘站相对于本站历史节假日的进站客流,每年的节假日也都存在着一定的相似性,即城市轨道交通换乘车站节假日进站客流分布呈现了与景点车站相同的规律。以4号线西直门车站为例,近3年同类型的节假日全日进站客流分布如图4所示。
由图4可知,同类型节假日的换乘车站进站客流在分布形式与客流数量上都呈现了较高的相似性,则对于换乘站进站客流的预测重点与景点车站类似,即是同类型节假日历史客流的获取。
2.3.4郊区车站
北京城市轨道交通路网的不少郊区车站的节假日进站客流在很多时段都超过了200%。郊区车站进站客流在节假日与普通日之间有较大差距是较为明显的,因为城市轨道交通郊区线路一般都有较明显的潮汐现象,在平峰时期节假日客流必然会远高于普通日客流。以良乡南关车站为例,做出其以近3年同类型节假日全日进站客流分布如图5所示。
图4 西直门换乘站节假日进站客流对比Fig.4 Comparison of the passenger flow in Xizhimen transfer station
图5 郊区车站节假日进站客流对比Fig.5 Comparison of the passenger flow in the countryside station
由图5可知该类车站的客流在数量上其实并不大,高峰小时5 min进站客流也就100人左右,可见这类车站由于远离市区,进站客流应该是相当小的,客流还处在一个培育的过程。但是同样也如图5所示,这类客流的分布也有一定的规律可循,其客流数值虽然与去年同期相比有较大变化,但是其分布形状是类似的,也即是说通过历史同类型节假日郊区车站全日进站客流的分布,经过一定的处理来预测今年的客流。
3 相似日法
3.1相似日法的提出
通过上节对节假日客流特征的分析可知,城市轨道交通不同类型的车站节假日客流有着其自身的特点,所以对节假日客流预测也应该结合其自身特点进行。不同车站类型节假日之间的客流分布相差较大,但是同类型车站节假日之间的客流却有着相当的相似程度,其本质原因是城市乘客出行结构特征在同类型车站节假日间有着较高的相似程度,基于这样的特征,提出一种在城市电力系统已经广泛使用于城市电力短期负荷的方法[3-4],即相似日法。在电力负荷短期预测中,发现如果预测日在气象状况、特征类型等电力负荷影响因素方面与某一个历史日比较相似时,则预测日的电力负荷与该历史日的负荷也较相似,具体可以表现为电力系统的全日负荷曲线基本吻合,则通常称该历史日为相似日[5]。
在城市轨道交通节假日客流预测中,节假日客流由于影响因素复杂,且客流与影响因素之间往往难以寻找到合适的函数表达关系,即便存在这样的函数关系,其量化函数也异常复杂,而且仅仅一项影响因素,如下雨对进站客流的影响就难以量化,如果多种影响因素综合,其复杂程度将超乎想象。所以在实际的预测过程中,提出了借鉴电力系统负荷的预测方法,即考虑主要的影响因素,在历史日中寻找主要影响因素相似的节假日,再结合具体的节假日类型进行城市轨道交通节假日客流的预测。
3.2节假日客流相似日法预测
相似日法预测的基本思想是首先将影响城市轨道交通节假日客流的各因素构成一个日特征向量,用以描述该日的特征;然后采取某种相似评估分析方法根据日特征向量的相近程度从历史日中选取若干相似日;对若干相似日的日负荷数据采取相应方法处理后作为预测值。相似日法预测由以下2个主要部分组成:
3.2.1相似日的选取
相似日选取的核心工作是特征向量和相似评估函数的确定[6-7],在城市轨道交通节假日客流预测中,特征向量除了包含某类具体的假日因素外,还应该包含一些基本的对客流分布有影响的因素,比如包含周期规律的星期因素等。
相似日特征向量的定义:
式中:t1,t2,…,tn为相似日选取中的n个特征。一般可以通过构建模糊集在历史客流中根据特征向量的值来确定相似日。
选取合理的相似评估函数,通过评估函数确定与预测日最相似的一个或者几个历史日。关于相似性的描述,在电力系统负荷预测中定义[8]为“垂直平移相似性”,也即在只允许垂直方向平移的情况下,两条曲线的最大重合度。其计算公式
式中:X=(x1,x2,…,xn),Y=(y1,y2,…,yn)分别代表2个不同日期n个时间段的客流值,RXY的大小反应了这两日的相似程度。
3.2.2节假日客流的预测
通过确定的历史相似日,采用一定的算法,如加权平均、趋势外推等,结合需要预测节假日自身特点对城市轨道交通客流进行预测。
由上文分析可知,相同节假日客流的分布是十分相似的,即使时间间隔达到一年,但是用去年同类型节假日的客流来预测今年的节假日是实际可行的。以城市轨道交通进站客流为例,节假日进站客流的预测算法流程:
1)重点车站的模式识别。根据本文的数据分析,将重点车站分为景点车站、对外枢纽车站、重点换乘站以及郊区车站,在节假日客流预测时首先应该对所预测的车站进行识别。
2)历史相似日的确定。节假日历史相似日的确定方法较为明确,如“五一”节、“十一”节期间,前文的数据分析已经说明,同类型节假日客流数据可以用以预测未来节假日,所以采用同类型历史节假日客流数据作为相似日。
3)节假日客流预测。若预测车站为景点车站和重点换乘车站,采用取平均值的方法对进站客流进行预测。
若预测车站为重点枢纽站,首先判断列车到达时刻是否与历史节假日相同,如果相同则采用平均值方法进行计算,否则按照时间的变动对历史节假日客流平均计算后再进行调整。
若预测车站为重点郊区车站,则根据历史节假日客流构建线性回归函数对节假日进站客流进行预测。
4 实例与总结
以“五一”节景点车站进站客流为例,采用2011年和2012年“五一”节全日的小时进站客流预测2013年全日小时进站客流。做出预测值与实际值的对比如图6。
图6 节假日客流预测对比图Fig.6 Comparison of the predicted passenger flow
由图6可知采用2011年和2012年的历史同类型节假日客流对2013年节假日客流预测基本上能够反映客流的变化趋势,在客流的数量的分布上也基本同真实值一致。
本文就城市轨道交通节假日客流预测的方法进行了研究。根据对城市轨道交通节假日进站客流的特点,将节假日客流分不同的车站类型进行分析,该分析方法体现了大数据的思维,即通过大量数据的内在联系来反映某一特殊影响因素对城市轨道交通的影响。提出了在电力负荷预测领域已广泛使用的相似日法,其核心内容是根据所需预测日当天对客流变化有影响的相关因素,根据这些因素的组合在历史日中寻找影响因素类似的历史日客流,结合不同特殊日客流特点对城市轨道交通特殊日客流进行预测,最后通过实际数据的分析,显示提出的基于数据分析的节假日客流预测相似日方法基本可以满足城市轨道交通运营管理的需求。
参考文献:
[1]黄颖.南昌轨道交通消防安全管理的思考[J].华东交通大学学报,2014,31(3):74-79.
[2]王奕,徐瑞华.基于周期时变特点的城市轨道交通短期客流预测研究[J].城市轨道交通研究,2010(1):46-49.
[3]黎灿兵,李晓辉,赵瑞,等.电力短期负荷预测相似日选取算法[J].电力系统自动化,2008(9):69-73.
[4]谢宏.电力系统日负荷预测理论与方法的研究[D].保定:华北电力大学,2001.
[5]刘晶.基于相似日和支持向量机的短期负荷预测研究[D].广州:华南理工大学,2010.
[6]王惠中,周佳,刘轲.电力系统短期负荷预测方法研究综述[J].电气自动化,2015(1):1-3.
[7]嵇灵,牛东晓,汪鹏.基于相似日聚类和贝叶斯神经网络的光伏发电功率预测研究[J].中国管理科学,2015(3):118-122.
[8]莫维仁,张伯明,孙宏斌,等.短期负荷预测中选择相似日的探讨[J].清华大学学报:自然科学版,2004(1):106-109.
(责任编辑姜红贵李萍)
Forecast of Urban Rail Transit Passenger Flow in Holidays Based on Data Analysis
Xu Jun1,Zhou Feng2,Xu Ruihua2
(1.Traffic Management Research Institute of the Ministry of Public Security,Wuxi 214000,China;2. School of Transportation Engineering,Tongji University,Shanghai 201804,China)
Abstract:The urban rail transit passenger flow forecast is the key to making and adjusting train plans,and facilitating passenger transportation organization as well. Holiday passenger flow changes dramatically compared with normal passenger flow,which brings great pressure to the running of urban rail transit and sometimes causes potential safety hazard. So it is essential to forecast key index data of holiday passenger flow. This paper studies the models and methods of holiday passenger flow forecast,and concludes passenger flow characteristics of different types of stations after analyzing large quantities of real historical traffic data. According to different characteristics,a prediction method of urban rail transit passenger flow called“similar day”is put forward. Verified by actual data,the proposed method is proved to be useful for forecasting the urban rail transit passenger flow in holidays.
Key words:urban rail transit;data analysis;holiday passenger flow forecast;similar day
中图分类号:U39-3
文献标志码:A
文章编号:1005-0523(2016)02-0072-06
收稿日期:2015-05-23
基金项目:中国博士后基金项目(2014M551454)
作者简介:许俊(1989—),男,硕士,研究实习员,研究方向为交通规划、设计、运营与管理。
通讯作者:周峰(1986—),男,博士,助理研究员,研究方向为轨道交通运营管理。