基于WIFI 和蓝牙数据的公交客流OD 分析方法研究
2023-11-21徐艺梅胡兴华毕宇航陈晓艳
徐艺梅,胡兴华,毕宇航,陈晓艳
(1.重庆交通大学交通运输学院,重庆 400074;2.宁波市民卡运营管理有限公司,浙江 宁波 315199;3.四川省交通运输发展战略和规划科学研究院,四川广安 638099)
公共交通是解决城市交通问题的重要途径,其中公交OD(Origin-Destination)可以为公交规划、公交调度以及车内拥挤度计算提供基础数据源,国内外对利用IC 卡和手机信令等数据技术推导公交OD矩阵等方面有较多研究[1-5],但由于公交IC 卡数据只有乘客乘坐公交车的上车时间的记录,没有下车相关信息的记录,需要结合其他数据信息来推算下客人数。由于无线通信技术的快速发展,许多研究者也开始将WIFI 探测数据包以及蓝牙数据应用到交通领域。部分学者利用WIFI 探针捕获公交车乘客的WIFI 探测数据包,分析公交车的载客量信息[6-11]。部分学者利用蓝牙智能感知技术预测公交车的到站时间和乘客等数据[12-16]。
该文提出一种基于WIFI和蓝牙数据的公交客流OD 分析方法,利用WIFI探针和蓝牙检测器采集的相关数据文本来获取公交车辆的设备数,推算公交车辆的上下客人数,获得更加准确可靠的OD 数据。
1 系统总体设计
1.1 系统架构设计
当车辆的GPS 模块识别到车辆到达公交站台时,便用装在每个公交站台的WIFI 探针和蓝牙检测器连续探测公交车辆上的设备,生成MAC 地址时间位置以及信号强度等相关数据文本,进行数据预处理后上传给云服务器。其架构设计如图1所示。
图1 总体架构设计
图2 装置采集前端功能模块图
1.2 检测装置结构设计
该检测装置设计包括三个子模块,分别为采集模块(用于采集开启了WIFI 或蓝牙设备的数据信息,并对初始数据进行解析和粗略地过滤,完成数据的预处理)、缓存模块(用于缓存预处理后的数据信息,对其进行管理)以及发送模块(负责读取数据,并发送给服务器)。
2 数据处理
WIFI 探针和蓝牙检测器收集到的数据是相互独立的,因此检测状态可以分为四种:同时开启了WIFI 和蓝牙;开启WIFI 关闭蓝牙;开启蓝牙关闭WIFI;同时关闭WIFI 和蓝牙。需要进行数据融合处理得到每个站台总的设备数,以此作为计算公交车辆在每个站点的上下车乘客人数的基础数据源。
2.1 数据预处理
由于收集到的WIFI 探针数据集和蓝牙检测器数据集中存在部分无效数据,主要有以下三类:1)经过站台附近的非公交乘客;2)在站台附近的停留人员,长时间停留在公交站台;3)离站台较远的人员,被偶然识别并记录下来。
因此,为了消除三类无效数据,有必要对数据进行预处理。需要剔除掉30 s内非重复出现的数据,其可能是公交站台附近经过的车辆以及周边的行人。并剔除掉数据中连续3 min 内重复出现的MAC 地址,据此可以筛除掉非公交车辆乘客。最后还需要剔除掉信号强度过低的数据,筛除离设备接收端较远的非公交车辆乘客设备。
2.2 数据源融合
当对数据进行预处理后,得到WIFI 探针数据集和蓝牙检测器数据集,需对其进行数据融合才能得到最准确的各个站台的设备数。由于既开启了WIFI 也开启了蓝牙的设备数被记录了两次,需要将其提取出来,同一个设备的WIFI 和蓝牙MAC 地址前六位完全相同,依据此特性进行数据融合:在云服务器中,标记出WIFI 探针和蓝牙检测器所存储的数据中MAC 地址前六位相同的数据文本,并减少一次蓝牙数据记录,保留被记录在WIFI 探针储存的数据。字段及其含义如表1 所示。
表1 字段及其含义
如将公交站台15 的WIFI 探针和蓝牙信号检测器检测到的有效MAC 地址上传入云服务器内,检查是否有重复的MAC 地址,若有,则提取出来,并删掉重复的数据。再重新记入云服务器中,经过数据预处理后的数据信息如表2 所示。
表2 初始数据信息
对表2 中数据进行数据融合,创建一个以WIFI1815 命名储存的数据表,里面储存了对数据进行预处理后的该时期编号为18 的公交车在15 站台的有效WIFI探针数据集,并创建一个以bluetooth1815命名的数据表,里面也储存了蓝牙检测数据集。然后需输入Python 语句来筛选出表bluetooth1815 字段macAddress的字段值与表WIFI1815字段macAddress的字段值在前六位相同的重复数据,并在表bluetooth 1815 中剔除掉筛选出的重复数据,语句如下:
将表bluetooth1815中的数据合并到表WIFI 1815中。针对表2 中系统能提取到站台15 的蓝牙检测器储存的ID 为1 的MAC 地址,与WIFI 探针储存的ID为3 的MAC 地址在前六位相同,符合为统一设备的特征,因此将其蓝牙检测器中的重复数据信息删除,并将其合并到WIFI 探针储存的数据表中,融合后数据信息如表3 所示。
表3 融合后数据信息
2.3 站点上下车客流统计
假设在进行数据源融合后,检测到的一台设备为一个乘客,从公交车第一站开始所有持有设备上车的乘客人数为Szn,当到达第n个站台,并且出站以后,此时车内持有设备的乘客人数占此时车内总乘客人数的比例为Kn,因此从第一站开始所有上车乘客数为Ozn,其计算公式为:
假设使用公交IC 卡进行刷卡乘车的人数占总乘车人数的比例为KIC,该系数为一个常数,可以利用时间平滑预测法来计算一段时间内该地使用公交IC 卡的人数占总乘车人数的比例,该比例便为KIC,那么从第一站开始到第n站的所有刷卡乘车的乘客数为Izn,则有:
结合式(1)和式(2),可以得出:
公交车离始发站越近,Kn值的误差就会越大,因此可以设定当Szn小于30 时,Kn便取值为K,其值由在一个月时间内,该公交车持有设备上车的总乘车人数Sz和该公交车的总乘车人数Iz决定,因此Kn的计算公式如下:
假设公交车到达第n站并出站后,车内乘客总人数为Qn,此时检测到的车内持有设备的乘客数为Sn,此时车内持有设备的乘客人数占此时车内总乘客人数的比例为Kn,所以计算公式为:
结合式(4)和式(5),可以计算出公交车在第n站出站后的车内乘客数Qn,其计算公式为:
上车乘客数:所有上车的乘客都用公交IC 卡进行刷卡乘车,则假设在第n站上车乘客数为On,其值等于In。
下车乘客数:在第n站下车乘客数为Dn,其计算公式为:
3 公交客流OD分析
3.1 基于WIFI和蓝牙数据的公交客流OD矩阵
为了便于统计,可以将这些详细数据利用SQL存储在一个新的数据表中,并通过关系型数据库查询统计出某个日期的某段时间内任意两个公交站点间的OD 数据信息,进而得出基于WIFI 探针和蓝牙信号检测器数据的公交OD 矩阵,如图3 所示。
图3 基于WIFI和蓝牙数据的公交OD矩阵
最后还需要进行校正,需使得各个公交站点的总上车数之和等于总下车乘客数之和,即:
3.2 校正后的公交客流OD矩阵
图3 中的客流OD 数据只是基于WIFI 和蓝牙数据计算的,每个站点上车乘客数为Mn,下车乘客数为Nn,基于此可以计算出结合车载售票信息所推算出的每个站点的上车乘客数为On,下车乘客数Dn,如图4 所示。
图4 实际公交OD矩阵
图4 中各个站点的On 和Dn已知,图3 中的各个站点的Mn和Nn已知,Qi,j已知,则可以根据相对应的比例因子求出图4 中的Xi,j,其计算公式如下:
计算出的Xi,j若为小数,则四舍五入,并进行校正,需使得:
计算出各个站点间的到发情况后,便可以得出最终的实际公交客流OD 矩阵。
4 结论
现有研究大多是基于公交IC 卡和GPS 数据来获取公交OD 的推算结果,会出现由于乘客刷卡信息错误而影响数据准确性的问题,以及对各站点的下客人数推算精度不高,难免会产生一定的误差,该文提出一种基于WIFI 和蓝牙数据来进行公交客流OD 方法的分析,利用WIFI 探针和蓝牙检测器来识别每个站台的设备数,结合车载售票信息如IC 卡数据来计算出公交车辆在各站点的上下客流数,与基于WIFI和蓝牙数据的OD 矩阵进行校正,计算出最终的实际公交客流OD 矩阵,得到的公交OD 信息也更加准确可靠。随着智能手机的普及率越来越高,利用WIFI和蓝牙数据来分析公交OD 方法的准确率也将越来越高,其有望成为一种重要的公交客流OD 信息获取的有效手段,为城市的公交规划、公交调度和车内的拥挤度计算提供基础数据源。在碳达峰碳中和目标框架下,对于城市客运碳排放量核算的要求更加精准,利用该设备为计算公交客运周转量的能耗强度和碳排放强度提供了技术基础。
该文研究基于公交站点的公交客流OD,为城市公共交通管理者提供较为全面的居民出行信息,是城市公交站点布局的合理性和公交线路可达性的评价依据,但与以交通小区为基本单元的传统交通规划的统计方法有较大区别,因此在下一步研究中,将站点归类于小区,以获得交通小区之间的公交出行OD 矩阵。