基于出租车GPS大数据的城市道路交通运行状态判别方法刍议
2015-12-16巴兴强朱海涛姜博瀚谷吉海
巴兴强,朱海涛,李 燊,姜博瀚,雷 杰,谷吉海
(1.东北林业大学交通学院,哈尔滨150040;2.哈尔滨商业大学轻工学院,哈尔滨150028)
1 出租车运行研究概述
伴随我国经济快速的发展和城市化进程的逐步扩大,有关于交通方面的各项设施也逐步得到了完善,城市交通的快速发展为我们的出行提供了很多便捷。但是,由于道路路网的规模不可能无限制的扩大,但汽车产量却在不断地提高,致使两者之间出现了日益激化的矛盾。在这种交通供给无法满足交通需求增长的状况下,交通路网的正常运行常常受到很多因素的干扰,并且一旦异常的交通状态形成如交通堵塞、交通事故等现象,并由点到面的迅速蔓延,很可能会导致整个交通路网路段出现瘫痪。出租车GPS数据信息采集是依据装载有GPS设备的出租车在其运行过程中定期记载的车辆行驶信息,如出租车编号、GPS采集时间、纬度、经度、速度、运行方向和空重车等数据,应用地图匹配和坐标转换等相关计算模型和算法进行处理,使出租车行驶数据和路网路段在时间和空间上关联起来,最终得到出租车所经过道路的车辆平均行驶速度和行驶时间等交通信息。
1.1 出租车GPS数据在城市交通运行状态中的应用
对于GPS数据的挖掘与应用,国内的研究人员主要从利用GPS数据对道路状态进行估计、利用出租车GPS数据研究出行行为、利用GPS数据建立出租车调度系统和将出租车GPS数据应用于交通规划4个方面进行研究。
(1)利用浮动车GPS数据对道路状态进行估计
同济大学童小华等人在此方面研究出了成功的模型。他们的实验结果验证了所建立的模型的有效性和方法的正确性。他们的主要思路是:在基于大样本以及长周期条件下(大样本即车辆数目在5 000~50 000辆之间,长周期即GPS数据传送间隔为2~8 min),在GIS环境下,用仿真的出租车GPS数据来估计和推算行程时间(包括建立估计模型、基于GIS的仿真、使用House holder变换求解大规模矩阵),以便将仿真数据与最初每条路段上的行驶时间进行比较[1]。
黄玲和徐建闽等人利用浮动车的GPS数据对路网实时交通流的状况进行判断,并结合路网静态的拓扑结构,应用多重模糊推理方法,对路段发生交通拥挤的概率、行程时间和拥挤程度做出预测,从而提出了一种预测动态交通拥挤的新模型。该模型的现场实测数据表明,新模型具有较为良好的预测效果[2]。
张和生等人的研究是在GPS数据误差修正的基础上,采用样本平均值来估计大样本数据量的路段平均行程时间,采用中位数来估计小样本数据量的路段平均行程时间,并在此基础上计算出置信区间和置信度。该研究采用出租车GPS数据进行估计,与实测数据的估计值进行比较后发现结果相差较小,证明了该方法能够较好的应用于在估计路段平均行程时间[3]。
(2)利用GPS数据研究交通运行特性和居民出行行为
李艳红等人在采集苏州市出租车GPS数据的基础上,对出租车调度系统进行研究,使用空间分布等评价指标体系和分析方法,构建了出租车出行时间分布模型。该时间分布模型通过比较工作日和非工作日的出租车出行特性,为城市交通管理措施的制定和进一步研究出租车的交通运行特性提供了数据支持[4]。
同济大学的傅常伦等人对出租车的空驶现象进行了调查研究,利用出租车的GPS数据得到了不同时段出租车乘车的供给和需求的关系。通过分析不同时段的出租车空驶率,该研究旨在找出降低空驶率、实现出租车资源有效利用的手段[5]。
中南大学的童晓君等人则利用出租车的GPS数据分析了居民出行行为,对工作日和非工作日情况下的出行分别进行对比研究,取得了一定的成果[6]。
(3)出租车GPS数据在车辆调度方面的应用
南京大学的周晓敏等人将GSM网络、带有GPS功能的手机和安装了GPS系统的出租车及GIS应用等进行整合,进行出租车呼叫与调度的研究。客户端手机采用处理后的栅格化数据进行电子地图显示,服务器端采用矢量数据进行显示,以满足嵌入式设备以及系统的实际需求。该方案具有成本低、速度快等特点,能有效降低出租车空载率[7]。
同济大学的杨涛以上海大众交通公司提供的出租车GPS数据为基础,对原数据进行过滤和处理,实现了提取功能,满足了交通公共信息平台的应用要求和交通管理和建设的需要,有效的提高了交通资源的利用率[8]。
(4)出租车GPS数据在交通规划中进行应用
赵磊等人基于现有的出租车OD调查在实际过程中存在的不足,提出了一种基于GPS和GIS系统的推算方法。该算法通过FME UniversalTranslator矢量图形转换软件和Excel—VBA宏,实现了出租车OD 矩阵的推算[9]。
武汉大学的唐炉亮等人则研究了驾驶员路径选择的认知行为和类蚁群行为的特征。他们利用采集的浮动车数据,根据城市道路等级与通行频率等信息,建立驾驶员路径选择的信息素等级路网,以此作为路网初始信息素,综合考虑行程时间、通行距离、路径信息素等级等多个因素,提出了公众出行路径的基于蚁群优化算法的优化算法。该算法以武汉市路网和浮动车为试验数据,将得出的路径与浮动车数据库中的轨迹进行了比较。结果表明,基于蚁群优化算法与出租车GPS数据的公众出行路径同出租车驾驶员选择的路径的相似程度很高[10]。
出租车运营GPS数据的城市交通运行状态判别方法可以高效地获取实时的路网路段信息,获知路网路段交通状况,实时快速地为出行者提供交通信息,还可以通过查询选择最优出行路线、时间和方式,高效地完成出行过程。同时可为交通管理部门提供实时可靠的数据分析,便于交通管理部门对交通状态的判别和分析,提高整体行车速度,确保道路畅通。
2 出租车GPS数据处理
2.1 GPS数据处理方法
在获取的城市出租车GPS数据信息的基础上,建立oracle数据库,包括出租车的坐标、轨迹、空驶状况等,对获取的数据进行分类储存,对储存的数据进行挖掘分析。其中包括数据过滤、降噪,根据城市地理范围选择调查的区域,选择城市范围内出租车数据,去除城市范围外的数据。可利用车辆瞬时速度阈值检验法去除错误数据,车辆瞬时速度Vp应满足0≤Vp≤fv·vmax,其中fv为修正系数(一般取值为1.3~1.5),vmax为道路的限制速度(km/h)。通过分析,确定合理的交通小区划分、出租车运行状态采样时间间隔和出租车样本量等参数。
2.2 GPS数据信息与电子地图匹配
首先利用点-线投影法将GPS数据点与路段进行匹配,然后利用行驶方向数据(见表1)对GPS数据点在道路上的方向进行匹配如图1所示。
表1 行驶方向数据Tab.1 Directional data
图1 GPS数据点与路段匹配Fig.1 GPS data points matching with sections
我国学者沙云飞[11]等人充分研究了浮动车所采集的数据返回时间间隔,如果GPS返回数据时间间隔较短,那么返回数据点就会比较多,可采用CesarA Quiroga在其研究中描述的速度积分法[12]来计算平均速度,平均速度。
式中:t0为出租车在该路段上返回的第一个数据时间;tp为出租车在该路段上返回最后一个数据时间;td为第一个返回数据与最后一个返回数据的时间间隔;d为出租车行驶的距离。
3 交通运行状态判别方法
3.1 GPS 数据结构
利用出租车运营实时监控系统,从数据库中获取出租车运营起讫点GPS坐标数据、出租车运营行驶轨迹和出租车空驶状况等。出租车GPS设备应用AGPS模块采集的数据,具有标准的固定格式,其中包括序号、出租车编号、GPS采集时间、纬度、经度、速度、运行方向和空重车等数据如图2所示。
3.2 交通运行状态判别
对处理后的出租车GPS数据进行数据挖掘,采用K-Means聚类分析法对交通小区进行动态划分,做出合理的交通小区。基于出租车GPS和GIS数据,计算出租车OD时空分布。对划分后的交通小区进行初步筛选,利用平均行驶速度描述第i个小区在t时段内的运行快慢。根据各小区局部速度分布图和该区域出租车GPS数据中的位置和时间信息,将处理后的出租车GPS数据信息、路网路段内一定数量的出租车在一定时间内的平均行程速度、位置和时间信息作为依据,对一定区域内道路交通状态和出租车运营状态进行分析,参考设定的拥堵隶属度判断城市一定区域道路的交通状态。
上述为出租车运营GPS数据的城市交通运行状态判别方法的主要内容,技术路线如图3所示。
图2 AGPS模块采集数据Fig.2 AGPS module to collect the data
图3 技术路线图Fig.3 The technology roadmap
4 结束语
伴随城市经济的快速发展和道路交通需求的持续增加,我国交通运输事业也在迅猛发展,而车辆定位导航系统方面的研究便成了智能交通系统(ITS)研究的一个重要热点。尤其是在出租车安装有车载GPS定位系统后。本文提出一种如何利用出租车GPS大数据为交通出行者和管理者提供道路交通状态判别的方法,如何处理和利用车载GPS定位系统所采集的大量定位信息,使其成为对交通出行者直观有效的信息,同时这也是本文的研究目的。利用出租车的车载GPS定位系统所采集的大量定位信息,并结合出租车的交通流量,估计城市一定区域道路车辆的行驶速度,是一种判断城市道路实时交通状态的方法,为交通管理者和出行者提供直观有效的信息,这种判断方法的准确程度还有待于后续的分析研究。
[1]童小华,陈 建.基于GIS和GPS的交通状态参数估计与仿真模型[J].同济大学学报,2005,33(12):1604-1607.
[2]黄 玲,徐建闽.基于浮动车技术的动态交通拥挤预测模型[J].华南理工大学学报,2008,36(10):47-51.
[3]张和生,张 毅等.利用GPS数据估计路段的平均行程时间[J].吉林大学学报,2007,27(3):533-537.
[4]李艳红.基于出租车OD数据的出租车出行特征分析[J].交通运输系统工程与信息,2007,7(5):85-89.
[5]傅常伦.基于车辆定位系统的数据融合及其在城市交通中的应用[D].上海:同济大学,2008.
[6]童晓君,向南平,朱定局.基于出租车GPS数据的城市居民出行行为分析[J].电脑与电信,2012(1):56-59.
[7]周晓敏,赵红玉,俞建新.基于GPS的出租车呼叫与调度系统[J].计算机工程与设计,2009,30(21):4995-4997.
[8]杨 涛.出租车管理系统与交通公共信息平台数据交换方式研究[J].电脑知识与技术,2005(3):9-11.
[9]赵 磊,葛 欢,周志浩.基于GPS定位信息的出租车OD矩阵推算[J].交通标准化,2011(8):148-150.
[10]唐炉亮,常晓猛,李清泉.基于蚁群优化算法与出租车GPS数据的公众出行路径优化[J].中国公路学报,2011,24(2):89-95.
[11]沙云飞,曹瑾鑫,史其信.基于GPS的路段旅行时间和速度估计算法研究[C].第一届中国智能交通年会论文集,2005.
[12] Quiroga C A,Bullock D.Travel time studies with Global Positioning and Geographic Information Systems:an integrated methodology[J].Transportation Research Part C,1998,6(1):101-127.