大数据背景下基于手机信令的道路识别研究
2015-02-06
(广州杰赛科技股份有限公司,广东 广州 510310)
1 引言
采用手机信令数据进行道路识别是当前国内外交通工程研究的重点、难点。传统的道路识别技术大多数是基于GPS定位的道路匹配方法,该方法的思路是通过坐标投影把用户的位置投影到道路上,然后把历史位置与当前位置进行道路位置的判定。但是该方法由于获取测量数据成本和计算的复杂度很高,因此本文提出一种基于手机信令的道路识别方法,该方法具有投资小、信号覆盖广、采集数据丰富的优点,较适合在城市发展相对较慢的二、三线城市应用。
2 切换原理及序列提取
2.1 切换原理
切换是指当移动台在通话过程中从一个基站覆盖区移动到另一个基站覆盖区,或者由于外界干扰造成通话质量下降时,必须改变原有的话音信道而转接到一条新的空闲话音信道上以继续保持通话的过程。切换通常发生在移动台从一个基站覆盖小区进入到另一个基站覆盖小区的情况下,为了保持通信的连续性,MSC将移动台与当前基站之间的链路转移到移动台与新的基站之间的链路,这种切换操作不仅要识别一个新的基站,而且要求将语音和控制信号分配到新基站的相关信道上。
在手机用户进行移动的过程中,会发生各种手机业务或者要进行小区的切换,这些信息都会记录在信令数据里面,通过手机信令采集系统可以获得手机用户的所有切换信息。记录下的用户切换信息表如表1所示:
表1 手机用户的切换信息表
2.2 序列提取
通过A接口、IUCs接口、Gb接口和IUPs接口获取用户的切换小区标识变化的序列和每次发切换的时间,通信数据获取之后,可以提取出在一定时间间隔内目标区域发生切换的所有样本的切换序列和切换时间差。如图1所示,可以看出无缝覆盖小区与路网相交得到的映射关系。不同基站发出的无线信号覆盖至整条道路,实际覆盖情况利用无线传播模型对其进行仿真得到,各小区的覆盖区域将道路切分为许多段,当用户在道路上移动并穿越小区时将发生切换。切换数据中会记录下用户经过的一系列小区ID,按照时间先后进行排列,即得到用户移动过程中的连续轨迹点。如图1所示,某用户先在道路1上移动,然后转移到道路2上,如箭头所指路径,所经历的切换小区可以记为:R={CID3, CID6, CID8, CID10, CID9, CID12,CID14}。
利用该数据就可以计算出各用户切换路段的行程轨迹。基于得到的单用户轨迹,按照每条道路进行人流量统计,则可以对交通状况进行跟踪分析。
图1 路网与小区的相交映射关系
3 道路切换序列标定
通过从通信数据中获取的样本切换序列与切换路网标定的道路切换序列标识进行对比,一般通过相似度判别矩阵的方法将各个通信网中获取的切换样本与实际道路进行匹配。本文通过重复多次真实的路测数据,采用寻找最大权重路径的方法,将路测得到的切换序列看作带权重有向图,对其进行搜寻,找出最大发生频率的切换变化模式作为该道路的切换序列标识。
4 协同过滤进行用户道路识别
4.1 协同过滤的原理及应用
对于已经进行切换序列标定的路网数据,将其包含的每个小区作为该道路的一个特征,即可把每条道路看作是具有多种特征属性的“商品”,而每个用户携带的切换轨迹信息也可以看成具有多个特征的“用户”,采用基于项目的协同过滤算法,计算每个“用户”的各个特征——切换序列与“商品”属性之间的相似性,从而给每条道路打分,得分最高的作为该用户的真实移动轨迹。具体步骤如下:
(1)对每条道路标定得到道路切换序列;由第3节中提到的方法对路网进行序列标定,得到路网切换信息表如表2所示。
(2)对每个用户的移动轨迹按照时间序列进行切换信息提取并进行筛选,过滤掉无移动轨迹和干扰数据。主要包括:
1)WCDMA网络基础参数的过滤,对室内基站以及与道路无关的基站进行过滤,确保数据的有效性;
2)对手机样本进行处理,去除不在道路上运动的手机用户数据,这些可以看作是噪声数据;
3)统计分析,分析样本的各类统计值,根据结果的规律进行筛选,以达到去除噪音的目的,最后得到用于匹配的用户切换信息表如表3所示:
表2 路网切换信息表
表3 去噪后的用户切换信息表
(3)计算出每个用户的切换轨迹与不同道路所标定的切换序列之间的相似度,进而可以根据相似度的大小,将道路匹配的结果进行排序,将排序最靠前的道路作为用户的实际运动轨迹,采用余弦相似度计算方法,具体公式如下:
其中,n为某条道路所包含的切换序列对个数,xi代表第i个切换序列对中前一个小区,yi代表第i个切换序列对中后一个小区,根据上面的公式即可计算出用户的运动轨迹与实际道路的匹配程度。
4.2 实际场景的道路识别
图2即为将手机切换信令数据应用于交通路段人流量采集的实际案例。每条道路上的实际人流量以不同的颜色进行区分展现在地图上,可以很直观地反映出当前的交通状况。
图2 用户道路识别的应用场景
5 结论
本文将切换路网标定转化为图论问题,通过寻找最大权重路径来进行切换路网标定,确定可以代表道路整体切换变化特征的“识别标签”,包括切换序列和相应的切换位置,后将其应用到手机用户的道路识别定位上,采用的是协同过滤算法的思路,很好地将该算法与现实难题相结合,较好地解决了利用低成本的通信切换数据进行交通状态跟踪的问题。并把该方法应用到实际的系统开发中,使保定市的道路人流量统计系统得以实现。
[1] 杨飞,裘炜毅. 基于手机定位的实时交通数据采集技术[J]. 城市交通, 2005(4): 63-65.
[2] 杨飞,惠英,杨东援. 基于手机切换定位的交通路网标定方法[J]. 同济大学学报:自然科学版, 2009,37(1): 67-72.
[3] 杨飞,惠英. 基于手机切换变化模式的道路匹配方法[J].系统工程, 2007,25(11): 6-13.
[4] 孙棣华,张星霞,张志良. 地图匹配技术极其在智能交通系统中的应用[J]. 计算机工程与应用, 2005(20): 225-228.
[5] 范秋明,何兆成. 基于手机基站定位数据的地图匹配研究[J]. 交通信息与安全, 2011(4): 52-57.
[6] 段玮. 基于协同过滤的个性化推荐算法研究[D]. 武汉:华中科技大学, 2009.
[7] 郭艳红. 推荐系统的协同过滤算法与应用研究[D]. 大连: 大连理工大学, 2008.
[8] 邓爱林,朱扬勇,施伯乐. 基于项目评分预测的协同过滤推荐算法[J]. 软件学报, 2003,14(9): 1621-1626.
[9] 赵亮,胡乃静,张守志. 个性化推荐算法设计[J]. 计算机研究与发展, 2002,39(8): 986-991.
[10] 施华. 基于项目和用户双重聚类的协同过滤推荐算法[D]. 长春: 东北师范大学, 2009.