基于手机数据与交通指数的关联分析算法研究
2018-01-22王浩淼杨彬彬姚远
王浩淼+杨彬彬+姚远
【摘 要】手机信令数据采集及应用作为新兴并快速发展的交通信息采集技术,已在北京、上海、广州、深圳等大城市得到充分研究应用。研究探讨了如何利用手机信令数据分析不同的手机行为与交通指数之间的关联。通过两者关联分析,利用微观手机用户行为发掘区域宏观交通状态。选取了试验区域,对两者关联性及关联分析方法进行了验证。结果表明,总体上手机信令数据可以作为交通指数分析的补充数据源,反应城市道路交通状态变化。
【关键词】智能交通;手机信令;信令事件;交通指数;关联分析
0 引言
目前,手机信令数据及其应用由于其覆盖范围广、样本量巨大、投资成本低等先天优势,已逐步成为城市交通出行信息采集、分析及应用的重要数据。道路交通指数作为一种反应城市交通状况的数据信息,是城市交通拥堵评价指标体系和评价方法的核心评价指标,能够综合宏观反映道路网交通运行状况[1],已在部分大城市中得到应用。道路交通指数受多种因素影响,难以通过一成不变的分析方法获取到真实客观的数据。
本文尝试充分利用手机信令数据资源,深入挖掘手机信令大数据潜在价值与内涵。通过大数据分析处理关键技术,分析研究手机信令数据与交通指数之前的关联。利用手机信令数据相关信息从另一个侧面来反映城市道路交通指数及其变化规律。
1 手机信令数据
采用起源蜂窝小区定位技术与手机切换定位技术实现交通信息提取与应用。在手机通话切换的过程中,移动网络运营商会保留相关记录,以上记录的保存为利用手机切换进行交通信息采集提供了可能以及所需的必要参数[2]。通过起源蜂窝小区与手机信令切换定位技术,可实现手机用户静、动态位置采集,实现基于手机信令数据的交通信息采集。
通过与运营商、手机数据采集商的沟通与协调,获取上海移动信令數据研究及应用授权。运营商提供详细的MSID、LAC、CELL、时间戳、信令事件等信息。其中,正常位置更新、周期性位置更新、主叫和短信启呼过程、BSC切换等四类典型信令事件,在手机信令数据中占有比率较高,且是交通信息采集中常用的几种信令事件数据。
2 交通状态指数
文中交通指数,主要针对上海城市道路交通状态指数(Traffic State Index,TSI),用以描述道路交通拥堵程度,综合反映交通出行畅通程度。利用交通状态指数,可以评价城市交通整体或区域的运行状况,科学分析和判断中、长期交通发展趋势,有效预报、预警交通拥堵程度和范围,为政府制定科学合理的交通规划、辅助交通管理决策提供定量、可参考的依据[3]。上海城市交通状态指数TSI取值介于0至100之间,数值越大表示道路交通状态越拥堵,数值越小表示道路交通状态越畅通。在指数数据区间基础上,通过对历史数据统计分析、出行调查和现场验证,分类归纳出对快速路、地面道路交通拥堵的习惯感受程度,划分拥堵程度等级[4~5]。
3 手机数据与交通指数关联分析
3.1 信令事件与交通指数偏相关性
研究对上海市重点交通区域交通指数与手机信令数据进行偏相关分析,得到手机数据属性与区域交通指数的偏相关系数。
根据偏相关系数结果发现,正常位置更新事件与交通指数呈正相关关系,而周期性位置更新、主叫与短信启呼过程都与交通指数呈负相关关系。
a.正常位置更新事件数量与交通指数呈正相关关系
正常位置更新发生在手机用户的出现跨越LAC行为,则认为手机用户产生了出行记录,并且有可能是距离为数公里的出行。因此,在某个地面道路区域内,如果正常位置更新的信令记录越多,则这个区域内手机用户在这个区间内出行的人数也越多,人的出行伴随着交通状态的变化。出行人数越多,交通指数可能越高,因此可将该属性作为衡量地面道路区域内人们出行的活跃程度。
b.周期性位置更新、主叫与短信启呼过程都与交通指数呈负相关关系
周期性位置更新事件表示该手机用户在一个更新周期内,没有跨出所在LAC区域的位移,可认为该手机用户在一定时间段内始终停留在同一位置,没有发生出行行为。分析表明,某区域分析时段内周期性位置更新事件数量上升,则该区域的手机用户处于室内工作或休息的比例就越高,出行量也越低,道路更畅通,交通指数下降。
主叫与短信启呼过程事件表示该手机用户在当时处于通讯状态,但通讯过程中,如果出现跨小区行为,会出现BSC内切换事件。如果主叫与短信启呼过程事件数量明显比BSC内切换事件数量要多,则表明该区域的手机用户在该时段内出行活跃度不高。
3.2 信令事件与交通指数回归分析
利用回归分析方法,对上海市多个地面道路区域的手机信令数据与交通指数数据建立回归分析模型。
以徐家汇的交通指数为例,根据回归分析徐家汇的地面道路交通指数为:
TSRxjh=20.764+1.883*C-0.030*U1-2.883*U2+0.178*M-1.155*H+0.054*S(2)
式中,TSRxjh表示徐家汇区域交通指数;C表示手机用户数量;U1表示正常位置更新量;U2表示周期性位置更新量;M表示主叫与短信启呼过程量;H表示BSC内切换量;S表示信令事件总量。
回归分析结果表明,可以根据该地面道路区域内的某时段内(半小时)该区域检测到的手机用户数量(C)、正常位置更新事件的数量(U1)、周期性位置更新事件的数量(U2)、主叫与短信启呼过程事件的数量(M)、BSC内切换事件的数量(H)以及信令总量(S),可以拟合出该区域地面道路的交通指数。为验证回归模型有效性,对模型拟合度进行评价,一般采用R2作为评价标准。R2值基本都在0.7以上,具有很好的拟合优度。
3.3 模型评价
采用模型精度计算公式计算回归模型分析精度:
Err=拟合值-实际值/实际值×100%
Acc=1-Err(3)
从68个区域地面道路交通指数拟合平均绝对误差看,平均精度为90.15%,具有十分高的精度。因此,可以将手机信令数据,作为交通分析的补充数据源,对地面道路交通指数进行实时的评估。
4 结语
研究针对手机信令事件与地面道路交通指数的关系,利用偏相关分析,探索了不同信令事件与交通指数的关系。通过回归分析方法,对上海市68个区域的地面道路分别建立了交通指数回归分析模型,模型具有相当高的拟合精度,平均精度达到90%。研究表明,手机信令数据可以作为交通分析的补充数据源,实时检测地面道路区域的交通变化状况。
【参考文献】
[1]刘莹,陈艳艳,程颖,等.基于交通指数的机动车污染物排放分析方法研究—以北京为例[J].北京工业大学学报,2017,43(3):422-427.
[2]杨飞,裘炜毅.基于手机定位的实时交通数据采集技术[J]. 城市交通.2005,3(4):63-68.
[3]上海交通信息中心.上海交通出行网[EB/OL].http://www.jtcx.sh.cn/index.html,2017-07-17.
[4]冉斌.手机数据在交通调查和交通规划中的应用[J].城市交通,2013,11(1):72-81.endprint