APP下载

基于移动信令数据的城市交通出行结构探索及实证研究

2022-06-30张安英陈兴博

广东交通职业技术学院学报 2022年2期
关键词:移动用户信令城市交通

张安英,陈兴博

(广东省交通运输规划研究中心,广东广州 510101)

传统城市交通出行方式调查主要基于人工调查或线上问卷调查等,存在调查精度低、实时性差、人力物力消耗大等特点。手机信令数据具有样本量大、采集成本低、数据稳定可靠、空间解析度高、动态性强等优势,基于手机信令数据的调查统计分析方法,可以有效获取全面、准确的居民出行数据。杜亚鹏[1]等人采用手机信令数据和导航数据相结合的形式,利用聚类算法以及时间关联性算法,实现步行、驾车、公共交通等出行方式的识别。冉斌[2]将手机数据映射至交通分析单元,并经信息预处理、匹配分析、交通模型分析处理、数据去噪、扩样等一系列海量数据运算处理,获得了居民出行特征数据。李祖芬[3]等人通过对重复冗余的手机数据进行处理,运用地理信息系统将手机数据映射至所研究的交通区域,探索得到了居民的出行时空分布特征。章玉[4]基于手机信令数据识别城市群通道出行的原理,研究了通道出行特征指标提取方法,并以重庆至合川通道为例进行了验证。上述研究大多是基于手机信令数据对小范围区域内出行群体的出行行为进行研究和探索,但对大规模的出行结构调查,运算效率则明显偏低。为了高效利用手机信令数据大规模探索城市交通的出行结构,本文在对广东省21 个地市中心城区常住人口移动用户信令数据调查分析的基础上,建立了一套基于“出行距离+旅行速度”的出行方式判定方法,通过利用移动终端PAAS 大数据平台,探索分析得到各地市移动用户出行结构情况,可为城市交通政策制定提供数据支撑。

1 移动信令数据

移动信令数据是指移动手机用户在发生通信事件(包括收发短信、主被叫、开关机、小区切换以及位置更新事件)时的信息记录,在通信系统中,把话音信号以外的信号统称为“信令”。

移动通信数据主要包含移动信令数据表(见表1)及移动基站信息表(见表2),前者用于存储移动用户的信令记录,后者主要记录基站编码以及经纬度坐标。以基站编码为匹配字段,将移动信令数据表和移动基站信息表中TIME、LON、LAT等字段在数据库中做连接运算,可获得便于城市交通分析的时空轨迹数据。

表1 移动信令数据结构表

表2 基站位置信息表

2 基于移动信令数据的出行方式判断方法

2.1 停留点识别

移动信令数据定位主要采用基于基站小区的模糊定位技术(Handover 定位法)。移动通信网络信号覆盖逻辑上被设计成若干多边形的基站小区相互邻接而构成的面状服务区,手机用户总能与其中一个基站小区保持联系,移动通信网络能够定期或不定期地主动或被动地记录手机用户时间序列的基站编号。通过解析移动信令数据和基站信息,从而可以获取移动用户的定位信息,将用户活动范围在某限定区域停留超过某一限定时间的定位点判断为停留点,停留点识别算法如下:

Step1:将MSID(用户识别码)作为主关键字,TIME(时间戳)作为次关键字进行排序,读取当前移动用户的LAC(位置)数据以及映射的LON(经度)和LAT(纬度)数据。

Step2:设定空间距离阈值ΔD和停留时长阈值Δt。

Step3:以用户初始点为第一个停留点,判断用户前后时间戳的移动距离DISTANCEi,i+1,若移动距离在空间距离阈值ΔD之内,则首次判定与前一时刻位置为同一停留点;否则用户为移动状态,判定条件。

Step 4:计算处在同一停留点中所有时间戳的最大时间差,若最大时间差在停留时长阈值Δt之内,则二次判定与初始点为同一停留点;否则认为此区域为短时逗留区域,从停留点备选集剔除。最后根据停留时间比例计算该区域的核心停留点作为用户停留点,用户停留点判定公式如下所示。

其中:ΔD为空间距离阈值;Δt为停留时长阈值;LONcenter、LATcenter为该用户确定停留点的经纬度;ti、tj为停留区域该用户信令数据的第i条和第j条时间戳;tstay为停留区域该用户的停留时间;LONi、LATi为停留区域该用户信令数据的第i条时间戳的经纬度。

2.2 移动信令轨迹识别

提取移动用户的出行轨迹是对判断分析居民出行方式的基础和前提,将用户连续相邻的两次停留点作为用户一次有效出行的起讫点,分析得出一次有效出行段产生的信令数据。基于移动基站经纬度与道路网或交通小区的映射关系,可还原得到用户的OD 出行轨迹。一次有效出行段涵盖了本次出行段的开始位置、开始时间、结束位置、结束时间以及中间轨迹点的所有定位切换事件,用户轨迹序列如下所示。

其中:MSID为用户识别码;O为移动用户本次出行段的第1 个核心驻留点,即第1 个停留点;D为移动用户本次出行段的第2 个核心驻留点,即第2 个停留点;Pi为移动用户本次出行段的第i个中间轨迹点;to,ti,td分别对应用移动用户本次出行段第1 个停留点、第i个中间轨迹点和第2 个停留点的信令数据时间戳。

2.3 出行方式判断方法

根据移动用户在不同位置的停留或位移的状态信息,将其一天完整的出行轨迹分割为若干个一次出行段。在此基础上经过必要的路径匹配过程,确定出行者选择的出行线路,进而计算得到出行距离、平均旅行速度等属性数据,结合交通出行特征,综合判定交通出行方式,出行方式判断逻辑框如图1 所示。

图1 出行方式判断逻辑框架图

基于不同交通方式的出行特征,在对底层移动信令数据进行分析处理后,经多次测试验证及模型探索,对不同出行方式的速度与距离规则作出以下定义,如表3 所示。

表3 城市交通出行方式判定规则

3 应用案例

3.1 模型建立

监测广东省各地市中心城区约2826 万人移动用户数量,生成底层移动信令数据约9200 亿条,底层数据主要为全省各地市中心城区实时移动用户5 分钟粒度位置信息,如表4 所示。

表4 移动用户5 分钟位置信息表

3.2 探索过程

移动信令通过5 分钟快照实现,现阶段最小的时间颗粒度为5 分钟,最小地理网格为500 米,可满足一次出行的最小定义距离,即空间距离阈值ΔD为500 米。停留时长阈值基于抽样用户灵敏度分析,以5 分钟为间隔,对比确定Δt取值为30 分钟,测试结果可保证样本误差控制在5%以内。

在移动网络中对广东省全域按照500 米×500 米的网格划分,将全省5 分钟信令数据表通过CGI关联至OD 网格维表,剔除未完全匹配到网格ID的记录数,得到全体移动用户信令数据数据资源维表信息,如表5 所示。

表5 数据资源维表

基于网格中心点维表、全省实时移动用户5分钟粒度位置信息维表、中心城区划分维表和移动扩样系数维表,通过500 ×500 用户网格轨迹模型、距离系数模型和时空聚类算法,在PAAS大数据平台运算得出所有常住移动用户的平均出行距离和平均旅行速度,从而判断得出用户的出行方式和出行特征数据。

3.3 探索结果

基于“出行距离+旅行速度”的出行方式判断规则,通过移动终端PAAS 大数据平台运算,探索分析得到广东省各地市移动用户各种交通方式出行结构情况(如图2 所示)。

图2 广东省各地市中心城区城市交通出行结构探索结果

以广东省G市为例,全市中心城区共有常住移动用户716.6 万人,调查期间共采集有效移动信令数据3100 亿条。根据移动信令数据探索结果,G 市中心城区全方式出行量约2844 万人次/日,其中乘坐常规公共交通出行量约359万人次/日,乘坐地铁出行量约421 万人次/日,公共交通方式(含常规公交和地铁)占全方式出行结构比例约为27.42%。G 市具体探索结果如表6所示。

将G市中心城区利用移动手机信令数据探索获取的出行结构与本地开展的大规模出行调查结果进行对比(如表7 所示),各城市交通出行方式的偏差均保持在5%以内,表明利用本方法探索的结果质量较高,可以作为反映广东省各地市中心城区城市交通出行结构特征的参考依据。

表6 广东省G市中心城区城市交通出行结构探索结果

表7 移动信令探索结果和本地调查结果对比表

4 结论

本文基于移动用户信令数据,提出一套以“出行距离+旅行速度”为判别因子的城市交通出行方式判定方法。在分析广东省21 个地市中心城区所有移动用户手机信令数据的基础上,利用移动终端PAAS大数据平台,运算得出各地市中心城区不同出行方式出行结构情况。探索结果与广东省内相关城市的交通出行调查结果相比,符合性较好,表明该方法可以较为准确地判别出城市交通主要出行方式和出行结构,研究成果对客观反映广东省各地市城市交通发展水平和支撑交通运输管理部门实施宏观决策具有重要意义。

猜你喜欢

移动用户信令城市交通
老龄化背景下关于城市交通适老化对策的思考
SLS字段在七号信令中的运用
持续跟踪 精准发力 充分发挥世行在城市交通建设中的引智引资作用
共享单车对城市交通的影响
共享单车对城市交通的影响
移动信令在交通大数据分析中的应用探索
基于信令分析的TD-LTE无线网络应用研究
无线通信技术未来发展趋势分析
基于预测位置的移动用户位置隐私保护研究
LTE网络信令采集数据的分析及探讨