基于云模型的城市轨道交通短时客流预测*
2018-05-02付保明
付保明 王 健 张 宁 徐 文
(1.东南大学智能运输系统研究中心城市轨道交通研究所,210096,南京;2.南京地铁建设有限责任公司,210008,南京;3.北京城建设计发展集团股份有限公司,100037,北京;4.苏州市轨道交通集团有限公司,215004,苏州//第一作者,助理工程师)
客流预测是基于时间序列的客流数据来预测未来某个时间段的客流量,通常将时间粒度小于15 min的客流预测称为短时客流预测[1]。随着轨道交通在我国的快速发展,轨道交通运营与管理面临着新的机遇与挑战。作为运营管理的基础,短时客流预测与分析不仅能为客运组织安排提供可靠依据,并且能有效降低拥堵机率,提高服务水平,提升轨道交通车站乃至整个线网管理与服务能力[2]。
轨道交通短时客流受天气等多种因素的影响,既表现出相对稳定性,又有较强的不确定性。客流预测的常用方法,如时间序列模型[3]、马尔科夫模型、神经网络[4]、支持向量机[5]等,存在样本量较大、参数标定复杂等问题,且对短时客流不确定性的考虑不足。
云模型不仅考虑研究对象的随机性,还能反映随机性与模糊性之间的关联性,同时具备实现定性趋势与定量数值之间的转换能力,已被广泛运用于时间序列预测、方案决策评价等方面,并取得了良好的效果[6]。笔者在南京地铁自动售检票系统(Automatic Fare Collection,AFC)客流数据的基础上,统计分析了线路短时进站客流规律,结合云模型的相关理论,构建了基于云模型的单条件多规则不确定性预测模型,利用该模型对南京地铁2号线线路短时进站客流进行预测,并验证了该模型的有效性。
1 轨道交通短时客流特性分析
城市轨道交通线路进站客流在1 d内随城市生活的节奏呈动态变化。虽然各工作日短时客流整体变化趋势相同,即它们的变化具有周期性规律,但由于生活中存在着许多无法预测的不确定性因素而影响着人们的出行,导致相同时段的短时客流量又存在一定的差异。因此,可用准周期性来描述线路工作日这种短时进站客流的时间分布规律。双休日的客流时间分布特征虽与工作日相差较大,但也存在准周期性,并且两者的准周期长度均为1 d。南京地铁2号线某周工作日与双休日以15 min为1个计时单元的进站客流量时间分布如图1 a)、b)所示。
短时客流的准周期性表明了客流量与时间的密切关系。云模型能够对客流量和时间进行有效的软化分,建立时间、客流量定性概念与定量数据之间的不确定性转化关系。同时,基于客流的准周期性,通过建立时间云与客流云之间的关联关系,仅利用时间等简单信息便可预测未来客流量的大小和置信区间等。
因此,利用云模型进行短时客流的预测,对样本数据量的要求较低,且能充分考虑客流的不确定性,是一种切实可行的方法。
图1 南京地铁2号线进站客流时间分布(以15 min为1个计时单元)
2 客流预测模型
对于轨道交通客流时间序列D:{(ti,qi)|0≤ti<t},其客流数据的准周期长度为 T(1 d),预测时间 ty可表示为 ty=t′+K·T。其中,t′∈[0,T],K 为整数。则客流数据可以分为历史客流数据HD:{(ti,qi)|0≤ti<K·T}和当前趋势客流数据CD:{(ti,qi)|K·T≤ti<t}。根据历史客流数据生成历史时间云以及客流云模型,根据当前趋势客流数据生成当前趋势云模型,并建立定性推理规则,以实现短时客流预测。
2.1 云模型基本概念
设论域U是一个用精确数值表示的集合且U={u},T是论域U上的某一定性概念。论域中的任意元素u对概念T的隶属程度CT(u)∈[0,1]是一有稳定倾向的随机数。概念T的云模型是从论域U到区间[0,1]的映射[7]:
云模型 T(Ex,En,He)用期望值 Ex、熵 En及超熵He等3个参数来描述,将模糊性和随机性完全集成在一起,从而构成定性概念和定量值相互间的映射。Ex表示最能代表概念T的点,它完全属于该定性概念。En是概念T模糊度的度量,反映了该概念的不确定性。He也称为熵的熵,反映了云的离散程度。
云发生器(Cloud Generate,CG)是指用软件或者固化硬件实现云的生成算法,可分为正向云、逆向云、x-条件云、y-条件云发生器。正向云发生器和逆向云发生器相结合,即可实现定性与定量的随机转换。
2.2 客流预测相关的云概念
2.2.1 历史云
历史云涵盖了两个云概念:历史时间云和历史客流云。其中,历史时间云反映了历史准周期客流在时间上的集聚状态,是对高峰期、低谷期等不确定性客流时间概念的描述,在具体的时间值与定性时间概念之间建立不确定性关系;历史客流云则与时间云相对应,表明了各时间概念对应的客流量低、中、高等定性概念与具体客流量之间的关系。
对于历史客流时间序列HD:{(ti,qi)|0≤ti<K·T},首先统计得到历史客流每日平均时间分布,然后采用基于峰值的云变换算法[8]得到初始时间云概念模型,即:
式中:
g(x)——客流平均时间分布函数;
fi(x)——基于云的概率密度期望函数;
ci——幅度系数;
m——变换后云的个数;
ε——用户定义的可允许的最大误差。
通过云变换得到的时间云比较粗糙,相邻云之间的相似度有可能过高,存在概念重复等不足,有必要采用考虑云的幅度系数影响的概念跃升方法[9]对云变换之后的概念进行简化,形成意义更加清晰独立的时间云概念。
依据正态云的“3En准则”确定各时间云对应的时间范围,并根据该时间范围内客流的变化情况确定历史客流云的Ex、En以及He参数值,从而形成与各时间云相对应的历史客流云模型。
2.2.2 当前客流趋势云
对于当前趋势客流CD:{(ti,qi)|K·T≤ti<t},依据短时客流时间序列客流数据相对稳定的特性,采用无需确定度信息的逆向正态云算法[10],仅利用当前趋势客流数据生成预测时间点所对应的当前客流云模型,以定义当前客流变化趋势下,客流量与客流定性概念之间的不确定关系,称为当前客流趋势云。
2.2.3 预测云
轨道交通客流历史云反映了客流的整体变化规律,不能完全表示当前客流细节变化情况,而当前客流趋势云模型只反映了未来的可能性,不能产生精确的预测结果。因此有必要将历史客流云与当前趋势云进行合并,生成预测云。假设与当前趋势云模型Ct(Ext,Ent,Het)对应的历史客流云模型为Hi(Exi,Eni,Hei),则两者采用加权算法合成的预测云模型Si(Exi,Eni,Hei)满足:
由公式(3)可见,预测云模型同时考虑了客流的整体变化规律以及当前客流局部变化趋势,更加精确地定义了未来短时时间内客流量与客流定性概念之间的存在关系。
2.3 关联分析
将预测时间ty作为各个x-条件时间云发生器的输入,输出预测时间ty对各个时间云的隶属度,然后选择最大隶属度对应的时间云作为其隶属云,实现对预测时间ty的软化分。
时间云与客流云之间可建立一一对应的关系,如轨道交通客流高峰期间的客流量大,低谷期间的客流量小等对应关系等。依据时间云与客流云之间的对应关系,可建立两者的关联规则:预测时间ty所隶属的时间云Ti(Exi,Eni,Hei)与历史客流云Hj(Exi,Eni,Hei)存在定性关联规则“If TiThen Hj”如图2所示。
图2 基于云模型的关联规则
2.4 基于云的预测模型
在确定时间云、客流预测云以及关联规则后,将时间云作为云模型关联规则的规则前件,将客流预测云作为关联规则的规则后件,并且分别将预测时间和预测客流作为规则前件的输入及规则后件的输出,建立单条件多规则发生器,即可实现短时客流的单条件多规则不确定性预测,该定性预测机理如图3所示。
图3 单条件多规则不确定性预测机理
由图3可知,利用云模型进行短时客流预测所需的数据量较少,依据客流的准周期性,仅需上一个周期(即前一天)以及当前趋势客流数据即可对当前短时时间段的客流量进行预测。但为减轻客流随机性的干扰,将近期的历史周期平均客流作为历史客流周期客流,可进一步提高预测的精度。
3 实例分析
选取南京地铁2号线2013年12月9日至2013年12月22日期间运营时间为6:00~23:00,以15 min为1个计时单元的线路进站客流数据,共计952个样本数据。由于工作日与双休日的客流时间分布规律不同,需对两者分别建模分析。本文只对工作日的客流建模进行分析(双休日客流类似)。
首先将2013年12月9日至2013年12月19日期间普通工作日客流数据作为历史客流,获得工作日历史平均客流时间分布曲线,利用基于峰值的云变换方法得到历史客流时间分布基础云模型。工作日历史平均客流时间分布及时间云的概率密度期望函数如图4a)所示。利用考虑云的幅度系数影响的概念跃升方法对初始时间云进行概念跃升,得到9个时间概念的云模型,如图4b)所示。
将2013年12月19日6:00~9:00的客流作为当前趋势客流,9:00之后各计时单位的客流作为待预测客流,依据本文建立的预测模型进行短时客流的预测。
由于模型本身的不确定性,预测系统相同的预测时间输入会得到不同客流输出。因此,本文在进行客流预测时采取多次输入预测时间得到多个预测值,然后采用加权平均法获得最终预测值;也可根据实际需求,依据多个预测值的分布得到客流预测区间。同时本文采用迭代预测法实现多个时间段客流量的预测,即迭代预测未来客流量并根据预测值迭代构造当前趋势云,最终得到下一时刻的客流预测值。
采用ARIMA预测模型对客流量进行预测,并与云模型的预测结果进行对比,两者的预测结果如图5所示。
图5 两种预测方法预测值与实际值的对比(以15 min为1个计时单元)
为了评价预测效果,通过平均绝对偏差(EMAD)、误差标准偏差(ESDE)以及平均绝对百分误差(EMAPE)进行分析评价,计算方法如式(4)所示:
两种预测方法对应评价指标值如表1所示。
表1 两种预测方法评价指标对比
由表1可知,采用云模型预测方法的EMAD、ESDE及EMAPE指标值分别为184.8、229.1和3.33%,均优于ARIMA预测模型。可见,采用云模型进行轨道交通短时客流预测是可行、有效的。
4 结语
针对轨道交通短时客流的不确定特点,提出了基于云模型的单条件多规则轨道交通短时客流预测模型。该方法充分体现了预测中数据的模糊性和随机性特征,在对实际客流数据的分析预测中,表现出了较高的预测精度。考虑到客流影响因素的多样性,当外界发生突发情况时,模型的预测精度可能受到影响。因此,下一步主要考虑将影响客流的其他因素,如天气、突发情况等纳入预测模型,形成多条件多规则的短时客流预测模型,并与模糊神经网络等智能算法相结合,进一步提高客流预测的精度。
[1] 陆海亭,张宁,黄卫,等.短时交通流预测方法研究进展[J].交通运输工程与信息学报,2009,7(4):84.
[2] 王雪梅,张宁,张云龙.城市轨道交通短时客流预测体系框架及关键技术[J].交通运输工程与信息学报,2013,11(2):107.
[3] 王奕,徐瑞华.基于周期时变特点的城市轨道交通短期客流预测研究[J].城市轨道交通研究,2010,13(1):46.
[4] 鲁明旭,叶银忠,马向华.神经网络在地铁客流预测中的应用[J].机械研究与应用,2012,25(3):86.
[5] 周家中,张殿业.基于空间加权的LS-SVM城市轨道交通车站客流量预测[J].铁道学报,2014,36(1):1.
[6] 杨锦伟,肖新平,郭金海,等.基于少数据云推理的短时交通流预测模型[J].交通运输系统工程与信息,2015,15(3):64.
[7] 蒋嵘,李德毅,陈晖.基于云模型的时间序列预测[J].解放军理工大学学报,2000,1(5):13.
[8] 秦昆,王佩.基于云变换的曲线拟合新方法[J].计算机工程与应用,2008,44(23):56.
[9] 孟晖,王树良,李德毅.基于云变换的概念提取及概念层次构建方法[J].吉林大学学报(工学版),2010,40(3):782.
[10] 陈昊,李兵,刘常昱.一种无确定度的逆向云算法[J].小型微型计算机系统,2015,36(30):544.