APP下载

基于网约车数据的居民出行需求特征分析及需求预测

2018-11-06贾兴无

交通工程 2018年5期
关键词:需求预测网约时空

贾兴无

(山东省公安厅交通管理局, 济南 250031)

0 引言

随着信息技术在个人出行领域的应用越来越广泛,通过个人移动终端可以获取大量、精准、多维的居民出行行为数据,例如手机信令、地理信息数据、兴趣点数据、导航数据、移动轨迹等[1]. 与传统基于人口普查和调查访问获取的居民出行行为数据相比,这些数据具有覆盖范围广、记录时间长、样本量大、数据时效性强、位置定位准确等特点,这为交通管理者研究居民出行行为偏好、出行热度和时空动态分析提供了基础[2-6].

目前应用于居民出行行为的研究方法主要分为2种:基于出行(Trip-based)和基于活动(Activity-based)的分析方法[7]. 基于出行的分析方法主要应用于经典的“四阶段法”,该方法通过居民出行OD调查将居民出行行为从定性分析转化为定量分析,并服务于整个交通需求预测过程. 传统的居民出行调查方法存在主观性较强、调查时耗长、误差较大等问题. 因此,越来越多的研究者将目光投向于基于活动的分析方法. 近年来,研究人员一直试图采用移动交通大数据结合人工智能方法来研究居民出行行为以及提高出行预测模型的准确性[3,8-9].

本文采用南京市网约车数据研究居民出行需求特征,具有以下优势:首先,网约车软件使用人群大多集中在20~50岁之间,该年龄段的居民是城市交通日常出行最活跃的群体,出行目的大多是以工作、购物以及其他商业活动为主,相较于其他年龄层来说出行次数较多,所以对该年龄段出行需求预测分析,能够反映出行活跃居民的一般规律. 其次,由于网约车具有方便、快捷、“门到门”出行、运营时间长(一般24 h)等特点,部分没有固定出行交通工具或者不常使用固定交通工具的人群是使用主体,且该人群出行一般集中在城市范围之内. 从城市出行结构的角度分析,该人群属于交通方式可转移人群,研究该部分人群的出行生成对交通规划、交通管理措施的制定有一定的指导意义,可以合理调整公共交通运力、调整交通模式、提升公共交通的竞争力. 最后,采用该数据可以深入分析居民出行的时空特征,获得动态的出行比例,从而进一步提高出行需求模型预测精度.

1 时空特征分析

1.1 相关性分析

在本文中通过网约车订单数据试图解释以下问题:“什么样的移动特征对人们的出行行为有影响?”“移动出行如何在时间维度影响居民出行行为?”“居民的出行特征和土地性质之间是否存在相应规则?”. 论文致力于从微观角度利用这些数据来分析出行需求中的时空特征,为交通管理部门提供有用的建议. 图1表示的是工作日和休息日居民选择网约车出行的供需图. 图1 (a)表明工作日居民出行具有明显的通勤特征,早高峰时段为08:00—09:00,晚高峰时段为17:30—19:30. 相比之下休息日(图1 (b))早高峰出行量要远低于工作日. 此外,图1显示无论高峰时段还是平峰时段,出行需求量均高于供给量,因此,研究居民出行的时空特征可以动态调整一天内不断变化的出行需求和交通供给,进而建立短时交通流预测模型,根据出行需求的时空特征来动态调整交通供给满足出行需求.

为了从时空维度分析居民出行特征,本文采用南京市1个月内(2017-03-01—2017-03-31)的网约车数据,该数据包括司机ID、用户ID、订单地点和时间、上车/下车地点和时间以及票价. 通过对原始数据的标准化处理,为后续的分析和预测提供数据支持.

1.2 小区划分

和其他公共交通工具相比,网约车的活动范围往往能够覆盖城市的大部分区域,图2(a)是南京市居民一天内使用网约车数量的热力图,从图表中可以看出全市具有较高的出行需求,尤其是核心区域. 本文以南京市核心区作为研究重点,根据不同的土地性质将核心区划分为居住区、商业区、教育区、医疗区和休闲区(公园)5类区域,一共102个不重叠的小区,如表1所示.

1.3 时空特性分析

从网约车数据中可以获取每个时刻的出行生成量(包括发生量和吸引量),进一步获取每个时间段各小区的生成量,分析生成量随时间的变化规律. 为了确定出行需求的时空特征,绘制了时间、小区和频率的三维图(见图3). 图3可知,居民出行需求呈现先增加后减少再增加再减少的趋势,其中商业区和居住区出行需求较高,其次是医疗区和教育区,最后是休闲区.

表1 南京核心区小区划分表

图2 南京市网约车分布及小区划分图

总的来说,休息日居民选择网约车出行需求要高于工作日. 具体而言,可以分成5个阶段. 第1阶段,00:00—07:00,出行需求逐渐减少,绝大部分居住区和休闲区出行量为零. 但商业区和医疗区仍有少量需求:如新街口(小区64、66、67),鼓楼医院(小区26),由于地铁等公共交通工具停运,部分下班或结束娱乐的居民会选择使用网约车;第2阶段,07:00—10:00,出行人数达到一天中的第1个峰值,此时出行需求最大的区域为居住区. 相比之下,休息日居民在这一时段出行需求明显减少. 第3阶段,10:00—17:00,出行变化比较平稳,出行人数达到白天的最小值,但在13:00左右出现小幅波动. 第4阶段,17:00—21:00,该阶段出行需求又达到1次峰值,在这一阶段除了通勤出行还存在大量弹性出行(如娱乐、购物、餐饮等). 休息日在这一阶段的出行需求远高于工作日,出行需求热点包括热门的商业中心或旅游景点:新街口,紫峰大厦(小区36),秦淮河(小区78、79、80),夫子庙(小区87、88). 此外,一些公园也有很多旅游需求,例如玄武湖公园(小区17). 第5阶段,21:00—24:00,这一阶段出行需求略有上升,主要集中部分商业区如酒吧,影院,餐厅.

图3 工作日和休息日出行需求时空特征图

上述分析表明,出行需求与时间和空间有着密切的关系,这就需要量化它们之间的关系,有利于对出行需求的预测. 为了获得更准确的出行需求预测结果,本文建立一种短时需求预测模型,为了提高预测精度,分别对不同的时间和空间进行预测.

2 出行需求预测模型

本文采用WAVE-SVM耦合模型来预测居民出行需求,该方法结合小波分析(Daubechies5)和支持向量机(SVM)模型的互补优势,不仅可以获得较高的预测精度,还能够捕捉到短时交通需求的非平稳特性[10].

2.1 模型算法

WAVE-SVM方法包括4个步骤:

步骤1原始数据预处理. 处理的数据按时间排序,生成一个出行需求原始时间序列,表示为式(1):

(1)

式中,n0和l0分别为网约车订单的原始时间序列a0,i(n0)的序号和数据量;i为订单信息日期的数量;m为总天数.

(2)

(3)

式中,lt-1为at-1(nt-1)中样本数据量,h(k-2nt-1)和g(k-2nt-1)为2列共轭滤波器系数,它们由小波系数决定.

步骤3训练和预测. 采用如下方法:

1)首先,采用5倍交叉验证的方法,给定一组训练数据点,表示为式(4):

Train={(xn1,yn1),…,(xnl,ynl)}∈(X×Y)

(4)

式中,xni∈X=Rn;yni∈Y=Rn;ni=1,2,…,li;i=1,2,3,…,m.

2)其次,我们选择径向基函数为高斯核函数(RBF),表达式为式(5):

K(x,xi)=exp (-‖x-xi‖2/(2σ)2)

(5)

式中,x=m+1;xi=i.

()求解,通过重构最小化问题和受到等式约束来求解式(6):

(6)

式中,φ(·):Rn→Rnh为核函数;w∈Rnh为权矢量;eni∈R为误差变量;b为偏差值;J为损失函数;γ为正则化参数.

4)预测,预测核心方程的表达式为式(7):

(7)

(8)

2.2 数据验证和误差分析

在本节中,采用Matlab软件对WAVE-SVM模型进行算法实现和数据分析. 训练数据来自南京市网约车订单数据,包括10个工作日(2017-03-01—2017-01-16)和6个休息日(3月4日,5日,11日,12日,18日和19日). 测试数据是3月17日(工作日)和3月25日(休息日). 为了验证模型的预测精度,首先对2017年3月17日整个核心区的出行需求分别采用本文建立的WAVE-SVM模型和SVM模型进行预测,图4表示的是WAVE-SVM模型和SVM模型预测结果与实际值的对比图. 从图4(a)中可知,本文建立的WAVE-SVM模型相较于SVM模型不仅预测精度高,还能够捕捉到居民出行需求的非平稳特性. 图4(b)详细对比了WAVE-SVM模型和SVM模型预测误差值,其中WAVE-SVM模型误差范围集中在[-100,100],而SVM模型误差范围为[-150,150]. 因此,从图4中可以明显看出本文建立的组合模型相较于单独的SVM模型预测效果较好.

图4 南京市核心区实际值和两种模型预测值对比

采用WAVE-SVM模型分别对不同区域工作日和休息日的出行需求时间序列进行预测. 预测误差采用3种标准评判方法,分别是:MRE(平均相对误差),VAPE(绝对误差的方差)和RMSE(均方根误差). 其中MRE和VAPE用于计算所有区间的实际值和预测值之间的相对误差的平均值和方差,RMSE用于衡量预测值与真实值之间的偏差.

图5显示了实际值与预测值之间的比较. 红线表示实际值,蓝线表示预测值. 由图5可知,WAVE-SVM方法显示出良好的预测精度,特别是在区域1(住宅区)和区域2(商业区),而区域5(休闲区)的精度略低,原因是休闲区出行需求变化幅度较大,受制于SVM算法的局限性,预测结果更趋向于平稳. 总体而言,本文使用模型能够精准预测居民出行需求的时空特征.

表2显示了WAVE-SVM模型预测误差结果. 除休闲区外,其他小区的预测精度均高于整体预测,结果表明:不同的时空特征能够直接影响出行需求预测的精度,所以可采用出行需求的时空特征来动态调整交通供给满足出行需求.

图5 实际值与预测值之间的比较

小区类型预测日期MRE/%VAPE/%RMSE全区 2017-3-1714.322.1040.682017-3-2516.182.7448.53住宅区2017-3-177.951.2110.862017-3-258.701.7820.03商业区2017-3-178.140.8023.252017-3-253.200.5320.79医疗区2017-3-1710.191.458.072017-3-2511.031.799.64教育区2017-3-1715.952.2110.862017-3-2515.762.0510.66休闲区2017-3-1722.135.464.102017-3-2517.564.982.39

3 结束语

本文采用南京市网约车数据研究居民出行行为特征,着重分析了出行需求与时间和空间之间的密切关系. 通过研究发现采用该数据可以深入分析居民出行的时空特征,获得动态的出行比例. 进一步建立了出行需求短时预测模型WAVE-SVM,该方法不仅获得较高的预测精度,还发现不同的时空特征能够直接影响出行需求预测的精度. 本文结果表明:采用网约车数据可以研究居民出行需求的时间特征,对于制定相应的交通规划、交通管理措施有一定的指导意义;此外,居民的出行需求随着地块的土地性质而改变,可以有效帮助交通管理者合理调整公共交通运力、调整交通模式、提升公共交通的竞争力.

猜你喜欢

需求预测网约时空
网约车平台责任条款的识别方法——基于解释进路的正当规制
跨越时空的相遇
镜中的时空穿梭
网约车侵权责任在司法实践中的认定
网约车问题研究及对策
网约车安全性提高研究
玩一次时空大“穿越”
基于计算实验的公共交通需求预测方法
时空之门
基于灰色理论的山东省能源需求预测及分析