APP下载

基于移动数据的拥堵信息预测算法

2014-10-29张川胡雪松杨冀源

电子技术与软件工程 2014年16期

张川 胡雪松 杨冀源

摘 要

本文基于对大规模出租车GPS数据进行分析,结合交通量OD分布概率模型计算热点小区的交通量,给出拥堵预测模型,帮助城市管理者更好地管理城市交通管理问题。

【关键词】城市交通拥堵 GPS终端定位 OD分布概率

1 研究背景

出租车是城市客运交通的重要组成部分,是常规公共交通的重要补充。随着出租车数量的不断增长,出租车交通量已成为城市道路交通总量中的重要组成部分,成为影响城市道路交通分布及分配预测准确性的重要因素之一。由于出租车运行的随机性,没有固定的起讫点和运行线路,给定量分析带来一定的困难。

各大城市越来越多的出租车的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和方向等信息,是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据,这些数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向(8个方向)等信息。这些GPS数据为我们研究出租车交通情况题共了参考和依据。

2 传统交通分析模型存在的问题

现阶段在交通拥堵方面主要集中在研究某个路口的情况,并且用缓冲区方法,而没有对整个区域有个整体的描述,而对于整个区域的研究则是基于交通需求建立模型,数据采集的精度不高。

目前公共交通设施是最常见的移动轨迹数据采集途径。从已有的研究工作看,针对移动轨迹数据的分析碰到的问题可能有:

2.1 数据存储

大规模轨迹数据的存储一般都采用基于R-tree索引(或在R-tree基础上改良的索引,如Quad-tree)的数据库,这类索引的好处是给定查询点以后,可以从查询点所在索引结点出发,沿着树型索引依次访问到离查询点距离越来越远的被索引的点;最近,有很多研究者提出了针对路网距离的索引,使得路网距离下也可以类似的由近及远的访问被索引的点。基于以上这类索引结构,kNNT问题可以转化为信息检索领域中的聚合Top-k查询问题。

2.2 地图匹配问题

地图匹配算法可以按照其考虑的轨迹范围分成全局算法和局部算法。局部算法又称递增式算法,该类方法采用贪心的策略依次将每个轨迹点匹配到相应的路段上。这类算法通常基于距离和角度的相似性,对于每个轨迹点找到局部最优的路段进行匹配。

2.3 移动数据的收集与处理问题

现阶段针对交通拥堵的研究主要集中在交通路口,对数据的收集主要为车辆的行驶速度与方向信息,其中不包含车辆的具体信息如车牌、车辆具体位置等,这样不能够做到对行驶车辆的实时监测和数据的精确处理。

2.4 缺少居民出行信息

在研究拥堵问题时必须要考虑到对周边居民的影响,之前的算法中不包含此类信息,诸如周边小区居民出行的高峰时段与高峰时间,不能做到将这些信息及时的反馈。

3 基于移动数据的拥堵预测算法

3.1 算法的详细过程

本算法主要通过大规模出租车GPS数据进行分析,结合路网信息,首先获取热点区域和热点小区;其次结合交通量OD分布概率模型计算热点小区的交通量,然后计算各个小区的总体出行情况,从而获取各小区的交通出行量,同时结合时间信息查找各时段拥堵路段和拥堵路口,最后依据上述信息得到具体的算法过程:

(1)首先,由安装在各个出租车上的GPS装置得到实时的出租车载客信息,包含着各个时刻出租车的位置信息。我们可以利用马克威分析系统中关于快速聚类的方法来对各小区进行划分,得到每个小区的具体坐标和热点小区的具体位置信息。

(2)其次,通过建立的交通量OD分布概率模型,利用Bayes方法对该模型进行参数估计与效果检验,由马克威分析系统得到各小区的交通量信息,求解出交通量的OD分布。

(3)再次,通过得到的小区交通量的OD分布,来绘制各热点小区交通量的分布模型。

(4)然后,通过采集周边各小区的居民出行数据,得到各小区居民出行的高峰时段与出行的热点小区区域,并且将得到的热点出行区域信息与上面步骤中得到的出租车出行的热点小区区域进行匹配,得到交叉地带。

(5)最后,通过收集出租车的GPS数据,筛选出有用的数据,由上述算法,便可以查找到车辆比较拥堵的路段与时段信息。将该信息与上面采集到的居民出行的高峰时段与热点小区区域进行比较匹配,即可得到居民出行的拥堵路段与时段信息。

3.2 算法的创新之处

针对大规模轨迹数据的分析问题,现有的解决思路往往都是通过构造地图来进行热点扫描和偏好轨迹扫描。针对大规模轨迹数据,之前已经完成了离线预处理、频繁轨迹图模型、以及在线打车推荐部分算法。本算法的关键特色是从大规模GPS数据快速抽取热点和热点小区,然后绘制频繁小区地图,结合交通量分析计算热点小区出行量,再根据各个小区的总体出行情况,获取各个小区的交通出行量,从而查找各时段拥堵路段和拥堵路口,根据上述参数获取拥堵预测模型。具体说来,本算法的创新之处有:

(1)由安装在出租车上的GPS得到出租车每个时段的行驶信息,可以得到实时的运行信息。

(2)设计与实现了热点和热点小区的识别算法。

(3)建立交通量OD分布概率模型,求解出交通量的OD分布。

(4)由采集到的GPS数据动态构造各个时段拥堵路段和路口的计算模型。得到拥堵路段与时段模型。

(5)增加了居民的出行信息,通过采集到的小区居民出行高峰时段与路段信息与出租车拥堵路线进行匹配,可以得出居民出行的拥堵区域与时段信息,更加方便小区居民进行出行选择,同时提高了该算法的应用性。

4 结论

当前是一个信息爆炸的年代,由于物联网技术的发展,我们已经进入了大数据时代。

本文基于GPS终端的海量数据,计算随时间变化的车流状态,结合交通量分布OD分布概率模型来计算热点小区的交通量,最终得到拥堵的预测模型,可有效地帮助城市管理者管理城市交通和小区居民选择更加合适的出行方式与时间,在北京、上海等大中城市具有很高的应用前景。

参考文献

[1]黄凤忖.电信运营业发展的影响因素分析[D].首都经贸大学硕士学位论文,2005(03).

[2]李勇平.遗传神经网络在电信业务收入预测中的应用研究[J].商场现代化,2008(11).

[3]胡德敏,曹桓.四网协同无线网络规划策略与综合评价研究[J].通信管理与技术,2012(12).

作者单位

大连理工大学软件学院 辽宁省大连市 116001endprint