基于移动网数据的城市交通分析研究
2020-02-27安瑞虹中国联通网络技术研究院北京100048
安瑞虹,王 雨,王 题(中国联通网络技术研究院,北京 100048)
1 概述
近年来,大数据在智慧旅游、智慧城市、金融征信、公安监察等领域发挥了重要作用。智慧交通是智慧城市的一个重要组成部分,是在交通领域中充分运用物联网、云计算、人工智能、自动控制、移动互联网等现代电子信息技术,通过高新技术汇集交通信息,对交通管理、交通运输、公众出行等交通领域各个方面以及交通建设管理全过程进行管控支撑,使交通系统在区域、城市甚至更大的时空范围具备感知、互联、分析、预测、控制等能力,以充分保障交通安全、发挥交通基础设施效能、提升交通系统运行效率和管理水平,为通畅的公众出行和可持续的经济发展服务[1]。
传统的智慧交通数据采集方式,包括交通调查、定点监测、摄像机摄像等,技术成熟且精度较高,适用于交通量较大的道路。然而,其缺点也非常明显,采集范围小、成本高、施工周期长。而电信行业的大数据具有实时性强、数据量大、覆盖人群广、成本低廉、信息丰富等特点,近年来被称为一种新兴的动态交通探测手段[2]。
基于移动网数据,电信运营商可为城际交通和市内交通提供丰富的数据支持。典型城际交通应用包括城市人口迁移分析、城市间联系紧密程度分析、交通干线客流量分析、跨城市通勤分析;典型市内交通应用包括人口职住分布及出行路径分析、交通枢纽客流量分析、交通枢纽旅客来源分析、交通枢纽旅客去向分析、交通枢纽旅客画像分析等。
本文基于移动网用户侧计费账单、计费详单[3]以及XDR 数据,给出了部分典型交通应用场景下的分析方法及应用案例。
2 分析数据源
2.1 用户侧数据
B 域数据包括月度汇总账单以及语音、数据详单。通过分析月度汇总单数据了解用户的年龄、网龄、套餐类型、用户等级、当月总体消费等信息[4];通过分析用户的详单数据,可获知用户发生业务的时间、地点以及业务量[5]。图1 为用户侧数据24 h 的用户数统计,可以看出,用户数量在某些时段会有明显的下降。
图1 用户侧数据24 h用户数统计
2.2 XDR数据
XDR 数据包含丰富信息量,包含用户与网络侧网元所有交互信息。XDR 数据可解析出用户所在基站,进而间接获知用户所处地理位置[6],表1 为某地XDR解析后得到的用户位置信息,可精确至分钟级。
图2 为XDR 数据24 h 的用户数统计,可以看出,相对B 域数据,XDR 包含用户业务和信令数据,虽然数据计算量大,但信息更加完整。
3 城市人口迁移及紧密度分析
3.1 算法描述
表1 XDR 解析后数据
图2 XDR数据24 h用户数统计
电信运营商用户侧账单包含用户号码的归属地,而详单可以识别出用户的实际业务发生地。因而,通过号码归属地和实际业务发生地的差异性,可以获知用户的迁移情况。根据用户在统计周期内(如一个月)的漫游情况,可以判定用户的漫游属性(长期漫游用户和短期漫游用户),如图3 所示。在此基础上,可以获知城市之间的人口迁移情况,分析城市之间的联系紧密度[7]。
图3 漫游用户属性判定
a)根据用户卡号归属地和实际所在地分析城市人口迁移情况。
b)根据各个城市双向人口迁移量分析城市之间的联系紧密度。
3.2 应用场景
根据3.1 节中所述算法,可以统计得出某月31 天内各省的短期漫入漫出人次,可以看出,广东、河南、北京、江苏、河北等省漫游用户较多,其中广东、江苏、河北以漫入为主,河南、北京以漫出为主(见图4)。
图5为分地(市)漫游统计,可以看出京津冀、长三角以及珠三角城市群内的漫游用户较多。
统计各个城市双向人口迁移量作为城市间的联系紧密度指标。可以看出,北京与周边城市联系最为紧密,其次为广州、天津、廊坊、深圳、东莞等地;与北京联系最为紧密的主要为天津、廊坊;长三角城市的联系紧密度不如京津冀以及珠三角(见图6)。
图4 分省漫游用户数
图5 分地(市)漫游用户数
图6 分地(市)漫游用户数
4 跨城市OD分析
4.1 算法描述
移动运营商的手机信令及业务数据包含用户使用的小区信息,在合理保护隐私的前提下,可获知用户的时间及地理位置信息。随着智能终端的普及,出行者的手机使用率以及业务次数均有了大幅提升,基于运营商B 侧数据可智能识别任意2 个区域之间的OD[8](ORIGIN,DESTINATION)用户,并分析用户特征及出行时间。
以某一天的移动网手机业务数据为基础,关联小区工参,得到用户不同时刻所在地(市)信息。在此基础上即可识别出A、B 2 个区域之间的各类用户,包含A→B、B→A、A→B→A、B→A→B。
a)A→B→A:最早业务在A 地、最晚业务在A 地,并且在B 地有业务,且在B 地业务期间未在A 地有业务。
b)B→A→B:最早业务在B 地、最晚业务在B 地,并且在A 地有业务,且在A 地业务期间未在B 地有业务。
c)A→B:最早业务在A 地、最晚业务在B 地,并且两地业务时段无交叉。
d)B→A:最早业务在B地、最晚业务在A 地,并且两地业务时段无交叉。
用户出行时间的分析主要通过分析用户手机信令数据中的时空位置信息,识别出用户的移动和停留行为,从而确定出行端点。具体步骤为:
a)手机信令数据采集、筛选及处理,获得用户标识、时间、小区编号、经纬度等信息。
b)对用户手机信令数据按时间排序,判断用户某一时刻t的运动状态,即t时刻与t-1 时刻相比,距离超过了临界值,则认为用户处于移动状态。
c)根据用户的运动状态确定出行的起始点和结束点。
4.2 应用场景
利用某省用户的用户侧数据,根据4.2 节中所述算法,可识别出4类出行用户(见表2)。
基于识别出的18 780 个用户,统计出行时间,可分析所有用户的出行时段。
表2 A地、B地不同OD分类用户数
a)两地往返用户:多为到达目的地后即返回,考虑业务需求主要为往返办事、接送人、运送货物等。
b)单程用户:多在上下班时间出行,重点考虑企业商务或出差人士等。
图7 给出了A 地到B 地单程用户出行时间分布示意图。
图7 A地B地单程用户出行时间
5 交通枢纽客流分析
5.1 算法描述
交通枢纽的客流总量不仅是交通枢纽分级的基础,同时也是交通枢纽设施配置的重要依据[9]。移动运营商的手机信令及业务数据包含用户使用的小区信息,进而获知用户的时间及地理位置信息,在此基础上,根据交通干线的轨迹以及用户移动速度来判定交通干线用户,筛选流程如图8所示[10]。
a)出现在交通干线周边。
b)跟踪用户出行轨迹,当天出现在交通干线的这段时间内,轨迹应与干线一致。
c)运行速度符合交通干线实际速度。
交通枢纽客流量、来源、去向分析流程见图9。
a)以出现在某交通枢纽为基本筛选条件,在此基础上跟踪用户出行轨迹,依据当天入站前、出站后以及在该站中间的轨迹是否与交通线路一致判定用户类别。
b)以入站前、出站后停留超过一定时间为标准判定用户的出发地和目的地。
5.2 应用场景
以京津高铁为例,筛选出北京南站相关高铁用户46 500人(见表3和图10)。
图8 交通干线用户筛选流程
图9 交通枢纽客流分类
表3 北京南站相关分类用户数
a)高铁用户主要为到达用户(25 287人)。
b)通过跨省高铁来京上班人数2 113人。
图10 南站出发旅客来源
南站出发客源较多来自南站附近以及建国门附近:如西罗园街道、陶然亭公园、右安门街道,明城墙遗址公园、东花市街道、建国门街道等地区。
6 总结及展望
本文基于移动网用户侧计费账单、计费详单以及XDR 数据,给出了城市人口迁移、跨城市OD 分析、交通枢纽客流分析等应用场景下的分析方法及应用案例。本文中所述分析方法及内容,对区域级的交通战略、城市级的交通研究有着重要的指导意义。
本文中提到的分析结果,仅分析了出发地、目的地,形成了一个二维出行矩阵,后续可考虑根据用户业务使用基站信息,识别出用户的出行路径,服务公路网规划、路网结构调整、交通枢纽的选择和规划等。