APP下载

多源数据驱动下公共交通出行行为特征挖掘与预测

2021-10-20翁剑成胡娟娟

科学技术与工程 2021年28期
关键词:公共交通公交乘客

梁 泉, 翁剑成, 胡娟娟, 韩 冰*

(1.交通运输部管理干部学院道路教研部, 北京 101601; 2.北京工业大学城市交通学院, 北京 100124)

公共交通作为城市交通的骨干网络,具有承载量大、布局紧密、服务覆盖范围广等特点,在保障城市居民日常出行中发挥着举足轻重的作用[1]。如何有效提高公共交通服务水平,满足居民庞大的出行需求,是目前城市公共交通系统急需解决的重点和难题。当前,已有的个性化公交服务模式,比如商务班车、通勤快车、定制公交等,在满足公共交通出行者差别化的出行需求方面取得了一定成效,但其覆盖范围和精准程度均有较大提升空间。因此,进一步开展公共交通出行特征挖掘和出行行为预测方法研究,准确把握不同类型公交乘客的出行需求十分必要。

以往公共交通出行行为特征分析和行为预测研究主要借助局部抽样调查或单一来源出行行为数据[2-3],采用统计分析方法和构建数学模型,分析总体或均态层面的出行行为规律[4-5]。然而,一方面,由于监测数据缺乏,基于抽样调查的出行行为分析方法样本小、覆盖面窄、调查成本高、结果准确性待商榷,出行总体特征的描述精确度不够,无法实现不同类型公共交通出行行为的精细化鉴别与统合;另一方面,时间序列法、增长率法等行为预测模型侧重面向群体乘客的浅层出行规律分析,对多因素影响下个体出行行为多维选择的考虑不足,缺乏对于个体出行特征的表达,阻碍公共交通出行行为的系统性解析和准确预测。

随着信息感知手段的丰富和系统集成技术的不断完善,先进的智能公共交通系统数据能够记录每一位公共交通出行者交易过程和车辆运行状态信息,建立起了一套低成本、高质量的公共交通多源数据获取体系[6]。但由于出行数据存在海量、异构和部分信息不完整等特点,有必要基于公共交通多源数据探寻新的思路与方法,实现面向不同公共交通个体乘客的出行行为特征提取与准确预测。

鉴于此,以公共交通多源数据为基础,着眼于公共交通个体乘客的出行行为特征和不同类型乘客的差异化出行需求,制定“特征刻画—人群划分—行为预测”的总体研究体系,多维度精准刻画公共交通个体乘客出行特征,在准确甄别不同类型乘客的基础上提出下次出行行为的预测方法,为把握多层次和差别化的公共交通出行需求提供综合解决方案。

1 传统公共交通出行需求分析

在现有常规公交网络的基础上,快速公交、商务班车、通勤快车、定制公交和微循环袖珍公交等发挥着多层次公交服务网络的优势,为公共交通出行者提供多样化、有针对性的出行服务[7]。由于在公共交通出行特征挖掘和出行行为预测等关键核心方面仍存在一定的局限,已有的个性化公交服务模式覆盖范围较窄,提供服务的精准化程度仍有待提升。现从公共交通出行特征挖掘和出行行为预测两个方面梳理传统公共交通出行需求分析的贡献和不足。

1.1 公共交通出行特征挖掘

已有研究基于抽样调查数据、公交集成电路(integrated circuit, IC)卡数据、轨道自动售检票(automatic fare collection, AFC)系统数据和部分手机数据,在公共交通出行特征指标提取、时空分布特征挖掘、出行行为选择等方面开展了大量工作,有效推动了公共交通出行特征的总体把控。

在基于抽样调查数据的出行特征分析方面,林雨平等[8]以公共自行车调查数据为基础,采用Logistic模型分析了公共自行车使用者的个人属性、出行特性与出行频率的交互特征。Ji等[9]采用出行调查数据形成通勤识别规则,借助高斯混合模型,提炼了人群的出行特性。梁春岩等[10]依据轨道交通调查数据,提出了轨道交通换乘的费用、时间分布、出行方式等与出行距离的关系。Walle等[11]研究了不同时间与空间因素影响下居民公共交通出行方式的选择特征。Yang等[12]利用调查数据,构建NL模型,对比分析工作日和节假日出行行为特征差异性。

在基于公交IC数据的出行特征分析方面,陈绍辉等[13]针对一票制公交线路IC卡数据,通过聚类分析提出了交易记录与乘车站点的匹配方法,建立了公交车辆运行指标算法,分析了公交车辆运行特征。Ma等[14]基于IC卡交易数据提取了公交乘客的出行链,并借助基于密度的空间聚类算法和粗糙集理论开展了历史出行特征的聚类研究。梁枫明[15]根据IC卡数据和公交全球定位系统(global positioning system,GPS)数据,提出了公交客流特征指标的统计模型,包括客流量统计模型和区域出行起讫点(origin-destination,OD)矩阵统计模型等。Geng等[16]通过公交刷卡数据提取乘客出行时空熵,揭示了公交乘客出行轨迹时空特征,识别了偶遇公交乘客(至少两次同时在同一台公交车上出现的乘客)。刘耀林等[17]基于连续一周的公交上车IC卡数据,构建了出行模型和职住地判别规则。王俊兵[18]根据IC卡数据统计乘客公交出行时空分布特征等交通出行参数,分析乘客出行方式选择及换乘路线。黄艳国等[19]利用IC卡和公交GPS数据,采用高斯混合聚类模型研究了节假日与通勤日公交出行特征差异。

在基于轨道AFC数据的出行特征分析方面,曹守华等[20]依据AFC数据,分析了轨道交通乘客进站、出站、换乘、候乘等不同阶段的交通特性。Zhang等[21]利用轨道刷卡数据研究了公共交通出行者群体出行行为特征和时空分布,结果表明群体出行规模和频率服从长尾分布。Gong等[22]基于刷卡数据采用特征分解法将特征相似的站点进行聚类,并探索了各类地铁站点客流特征与周围用地属性的交互特性。刘源[23]利用轨道AFC刷卡数据,分析乘客上车选择行为特征,提出乘客站内行走时间分布估算方法。褚凡[24]选取轨道刷卡数据,提取了轨道交通出行的站点、时间和线路信息特征。姚向明等[25]采用轨道AFC数据分析用户出行时空关联特征,并运用中心点法对不同类型乘客的居住特性进行辨识。

另外,部分学者采用手机移动设备追踪居民出行的数字脚印,开展了高频出行时间[26-27]、空间分布[26-28]、职住空间规律[29-31]等群体出行特征分析,但对于用户选用公共交通、小汽车等不同出行方式的辨识精度仍有待提高[32-34]。

综上以往公共交通出行特征挖掘研究可以发现以下局限。

(1)以往公共交通数据获取较多依赖抽样调查数据,样本量小,对公共交通系统出行特征的反映不精确;部分研究基于公交IC数据或轨道AFC数据,往往分析单一公共交通出行方式的群体特征。

(2)基于抽样调查数据的出行特征分析,侧重从整体层面分析交通小区、总体乘客或特定乘客的出行规律;基于单一公共交通出行数据的统计性分析结果仅能够反映公共交通乘客的平均出行特征与总体出行属性,缺乏面向个体乘客出行特性的准确表达。

总之,一方面,受限于抽样数据或单一公共交通出行方式数据,以往公共交通出行特征提取精细化程度还不够,较大程度上忽略了不同个体的行为特征差异,存在局部性和片面性等缺陷;另一方面,传统公共交通特征挖掘对个体乘客出行时间、换乘特征等出行链信息提取方法的研究较少,缺乏个体出行规律和特征的准确表征,影响公共交通总体出行规律的深度挖掘。

1.2 公共交通出行行为预测

掌握公共交通乘客的出行需求,准确预测出行行为是关键。以往侧重针对总量乘客开展公共交通出行行为预测,采用数理统计递归预测、空间分析和预测模型等方法,在出行总量把控、时空分布特性和出行路径预测等方面取得诸多成果。

在基于数理统计递归预测方法的出行行为预测方面,Bowman等[35]基于出行链数据分析出行者的日活动出行模式,并归纳递推出行规模。Lee[36]、Loo等[37]和Sang等[38]根据交通普查数据,评估了工作岗位数和工人职住平衡关系对通勤量的影响,对通勤需求量进行了预测。

在基于空间分析法的出行行为预测方面,Quan等[39]运用地理可视化分析技术,对通勤客流流向进行了对比分析与旨向性预测。Shen等[40]运用GPS数据和3D可视性技术,分析了通勤出行时间、起讫点、出行方式和出行路径的灵活性,重点开展了起讫点、出行方式和路径的预测研究。靳佳[41]和郭婕[42]基于北京市IC卡数据,挖掘了公交出行起讫点及客流信息,并利用统计学与空间分析方法预测了北京市居民公交出行时空分布特性。

在基于预测模型的出行行为预测方面,以往通常采用的预测模型主要包括生成率法、类别生成率模型、增长率模型(Furness模型、Fratar模型)、重力模型、Logit模型、灰色系统模型和时间序列模型(指数平滑法、自回归法)等[43-44]。Mcarthur等[45]尝试用重力模型预测通勤出行的空间转移参数。Vetrivel等[46]通过构建系统优化模型,探索工作日通勤最优出行模式,并预测了最佳交通分配、最佳公共交通线路,提出了通勤者路费和车费的改善路径。Gummadi等[47]采用时间序列法开展了换乘站点通勤乘客出行量预测分析。Kyung等[48]建立了非线性Logit模型,开展了韩国首尔地区地铁乘客出行预测,并利用智能卡数据进行测试。

归纳以往公共交通出行行为预测研究可以发现以下不足:①以往研究较多面向出行乘客总体,采用数理统计递归预测等方法把握未来整体的公共交通出行规模,预测精细化程度较低;②大多研究主要采用空间分析法,运用地理可视化分析等技术预测未来出行时空分布特征,预测粒度较粗略;③已有研究通常采用生成率法、重力模型法等预测模型,预测出行时间、出行线路等出行特征,侧重反映宏观出行特征,预测精度仍待提高。

总之,以往公共交通出行行为预测,侧重于总量客流未来出行特征、出行规模及时空分布的预测,较少关注不同类型公共交通乘客的出行行为差异化特性,较难准确把握不同类别公共交通个体乘客差别化的出行需求,对多层次和精细化公共交通出行需求的支撑力度仍然不够。

2 多源数据下的机遇与挑战

2.1 多源数据带来的机遇

随着信息化和智能化水平的提升,公共交通数据感知手段日趋增多,覆盖范围增大、监测规模提升、动态实时性增强,为公共交通出行行为监测提供了良好的数据基础。信息化数据处理技术发展为开展精细化出行行为分析提供了可能。以北京市为例,交通运行监测与调度中心(TOCC)平台覆盖了多维度、细粒度的公共交通出行数据,前期的多源数据处理经验,较好满足异质、多粒度的数据管理需求。

2.1.1 交通运行监测平台数据

TOCC建设的北京市交通数据中心,整合并接入6 000多项静、动态数据,涵盖路网运行、公共交通、民航客运、交通气象、综合运输等15个监测领域。尤其实现了公共交通系统的公交刷卡数据、轨道AFC系统数据、公交GPS数据、乘客特征数据、公交站点数据、自行车数据等多类数据的连续接入,为公共交通出行行为精细化分析提供支撑。

2.1.2 多源数据处理方法

基于北京1158条地面公交运营线路的地理信息系统(geographic information system,GIS)数据及2.3万辆运营车辆的GPS位置和每日2 003万人次的公共交通IC卡和轨道AFC数据以及3 000份北京市地面公交乘客满意度调查问卷数据[49],构建并优化了公交站点上下车人数、区域公交客流发生和吸引分布、OD期望线、出行热度、出行时间、出行距离等出行特征指标的提取算法,为多源公共交通数据处理提供借鉴和支撑。

2.2 多源数据下的挑战

公共交通多源数据汇聚为特征规律精准挖掘提供了充实的数据基础,助推公共交通出行行为的精细化分析与预测。同时,公共交通数据量大、种类繁多、范围广、异质性突出,为数据的有效集成和高效利用提出了新挑战。主要包括多源数据关联匹配、计算效能和数据存储等方面。

2.2.1 多源数据关联匹配

公共交通数据涉及多种出行方式,包括轨道、地面公交和自行车,数据多维、复杂并存在不确定信息。在多源数据采集、传输、存储、处理及应用过程中,产生一定程度的误差数据。如部分数据回传中断存在数据缺失;线路调整导致公交基础信息待更新,如站点信息、线路信息;刷卡机产生部分重复纪录等,误差数据为多源数据的关联匹配带来了挑战。需提出合理的数据预处理方法,设置科学的时空关联规则和阈值,从个体角度分析乘客出行过程,获取全过程出行链,为准确分析乘客出行规律提供数据基础。

2.2.2 计算效能

面对公共交通多源大数据,如何进行准确高效的处理、分析和预测,挖掘深层应用,做出实时正确的预判和预警,是实施多源数据处理分析的核心。公共交通数据存在多源、异质、时空关联、异步性、信息稀疏性和并发性等特点,现有的数据融合、计算理论与方法难以满足高时效性的数据处理以及基于数据的知识构建与转换等需求[50],亟需提出时效约束的大数据多尺度汇聚计算和动态图谱的公共交通多源数据分析新方法。

实际上,公共交通乘客个体的出行目的、出行习惯和收入等个体属性往往具有一定差别,导致个体出行规律具有明显差异性[51]。目前数据的表示方式,较难直观体现个体出行数据的含义和差异,需要寻找新的理论和方法实现公共交通出行行为特征的可视化表示。同时,传统的数理统计方法难以满足高维空间的出行行为隐含规律挖掘,需寻找新的数据挖掘方法实现隐性知识序列的挖掘与演化。

3 解决方案与对策

准确预测公共交通乘客下次出行行为,是掌握未来公共交通出行需求进而提升公共交通精准化服务水平的关键,其本质是明确公共交通个体乘客出行特征规律和预测不同类型乘客的下次出行行为,需要重点解决多源数据驱动下的数据关联匹配、个体出行行为特征刻画和下次出行行为预测等核心问题。

3.1 公共交通多源数据关联匹配

公共交通多源数据关联匹配的目的是通过关联分析多模式公共交通出行数据提取个体乘客出行链,并关联匹配乘客个人属性及一卡通卡号等信息,为公共交通乘客行为特征刻画、类型划分和出行行为预测提供数据支持。公共交通多源数据一般包括客观公共交通出行数据和主观调查数据。

3.1.1 公共交通出行数据

获取多模式公共交通动态数据与静态线站数据,包括地面公交刷卡数据、轨道AFC系统数据、公交GPS数据,以及地面公交和轨道交通线站数据,记录乘客出行信息。并按照用户卡号和上车时间将刷卡数据排序,完成多源数据关联分析,进而通过换乘点时间与空间阈值判别实现个体出行链提取,为刻画个体乘客的出行特征奠定数据支撑。某个体乘客出行链示意如表1所示。

表1 个体乘客P出行链示意Table 1 Travel chain data sample of individual passenger P

3.1.2 调查数据

采用现场与线上调查相结合开展出行行为显示偏好(revealed preference, RP)调查,获取乘客个体出行属性信息。一方面,获得乘客自身行为特性与社会经济属性;另一方面,通过调查获得一卡通卡号实现公共交通出行链与RP调查数据的关联匹配,获取公共交通个体乘客出行过程信息。

3.2 基于多源数据的公共交通出行特征刻画

不同公共交通个体乘客的出行规律存在较大差异性。以往基于抽样调查数据或单一方式出行数据得到出行特征的统计性分析结果,缺乏个体乘客出行特性的精准表达。近年来,包括节点、线条、转移概率等的知识图谱在交通、医疗、图书和情报等多个领域广泛应用[52-54]。因此,基于公共交通乘客的个体出行数据,参照图谱的元素、规则与其他必需因素,采用分层规划理论,提出个体出行知识图谱的构建方法,准确刻画个体乘客的出行特征。

个体出行行为知识图谱利用出行链数据,将低水平数值类的数据转换为高等级的抽象形式,实现个体乘客出行特征直观展示,构建流程图(图1)。首先,在个体出行链预处理的基础上,考虑公共交通乘客依赖性,将乘客进行分类(步骤1)。其次,分层考虑出行空间位置、出行时间和出行路径,并通过抽象化处理,构建个体出行关联图(步骤2)。最后,将每个出行关联图视为知识图谱的大节点,通过弧段连接和设定规则的关联图布局,连接个体出行关联图构成个体出行知识图谱(步骤3)。出行行为知识图谱实现公共交通个体乘客出行空间、时间分布、出行路径和下次出行行为概率预测的准确表征。

图1 个体出行知识图谱构建流程图Fig.1 The flowchart of individual travel behavior graph construction

3.3 基于人群分类的公共交通乘客出行行为预测

不同类型乘客出行特征存在显著差异,将乘客人群进行分类,对于准确掌握乘客的出行特征和规律,有针对性的引导客流出行具有重要意义。而针对不同类型的乘客开展下次出行行为预测,逐项递推,助力提高公共交通乘客出行行为预测方法的准确性。

3.3.1 公共交通乘客分类

通勤与非通勤人群出行特征存在显著差异,有效分析公共交通通勤乘客出行行为,有助于满足通勤乘客的出行需求。实现公共交通通勤乘客准确鉴别是挖掘通勤乘客出行规律和需求的前提。以往研究主要基于先验知识辨别公共交通通勤乘客[55],但仅能够鉴别通勤特性显著的乘客;部分研究采用朴素贝叶斯分类器[56]、决策树[57]和支持向量机(SVM)[58]等方法开展通勤人群辨识,但模型输入层特征变量考虑不全面,适用性有待提高。

由于人工神经网络能实现输入到输出的高度非线性映射,具有自学习、自组织、较好容错性和优良非线性逼近能力,能够克服传统人工智能方法对于非结构化信息处理等方面的缺陷,可以较好地解决分类、预测等问题[59]。因此,引入知识图谱特征变量,构建基于人工神经网络的公共交通通勤行为分类模型,实现通勤乘客准确识别。

3.3.2 通勤乘客出行行为预测

开展公共交通通勤个体乘客下次出行行为预测,助力提高公共交通总体通勤乘客出行行为预测准确性。以往研究大多以乘客整体为研究对象,较少考虑公共交通不同人群的出行行为差异,并且忽略了不同乘客的个体特性和社会经济属性,公共交通通勤乘客出行行为的预测精度有待提升。

机器学习具有挖掘隐性关系的独特优势,能够更好地学习出行行为因果变量间的关联,为解决公共交通通勤乘客下次出行行为准确预测奠定方法指导。研究基于出行行为不同要素产生链路,构建“下次出行日期-下次出行目的地-下次出发时间-下次出行方式”的下次出行行为预测模型结构,综合采用图谱转移概率和机器学习等方法,分别建立面向不同出行行为要素的差别化预测方法。在获得个体乘客下次出行行为预测结果的基础上,通过行为聚合获取乘客下次出行行为分布与规律,并对聚合结果进行验证。考虑乘客分类后,公共交通乘客下次出行行为的预测准确性较高,有助于精准掌握未来公共交通出行需求。预测结构如图2所示。

图2 公共交通通勤者下次出行行为预测结构Fig.2 Next travel behavior forecast design of public transport commuters

4 案例分析

4.1 数据基础

以北京市公共交通监测数据为例,结合RP调查数据,通过一卡通卡号与出行链进行关联匹配,获取了775名公共交通乘客的个体属性信息和实际出行数据,为乘客出行行为特征挖掘和预测奠定数据支撑。

4.2 特征刻画

采用北京市2018年4月公共交通出行链数据,随机选取1名乘客,通过出行空间位置聚类、出行时间分类和出行路径聚类绘制了个体出行行为关联图,进而整合关联图并计算图谱概率,形成个体出行行为图谱如图3所示。可知,公共交通方式占乘客P全部出行的60%,主要有三类出行行为,以前两类出行行为为主,分别占26.9%。其中,第一类出行行为的出行时间(早高峰)与路径(地面公交出行)唯一。第二类出行行为的出行时间(晚高峰)也较固定,但有3条不同的出行路径,且常采用第一条路径出行(84.6%)。第三类公共交通出行的出行时间平均分布在3个不同的时间段,并且出行路径较短。此外,由不同出行行为间的转移概率可知,前两类出行往往在彼此后发生,并且有很高的出行概率,表明该两类可能为往返性出行。并且,如果发生第三类出行则第一类出行将有很高的发生概率(0.67)。通过以上的出行规律挖掘,可推断该乘客极可能为公共交通通勤者。

图3 乘客P出行行为图谱Fig.3 Travel behavior graph of passenger P

4.3 行为预测

4.3.1 通勤乘客辨识

研究基于公共交通出行链数据,以3层BP神经网络为基础[60],以分类结果误差为控制目标,通过测试获取模型的最佳结构与参数,形成公共交通通勤乘客辨识模型,结构如图4所示。模型的输入层为7个特征指标(图4),输出层为乘客行为类别。模型有一个隐含层,隐含层神经元节点数量为4。输入层到中间层的传递函数为tansig,中间层到输出层的传递函数为purelin,训练函数为trainrp,网络学习率为0.01。

图4 公共交通乘客分类BP网络结构Fig.4 BP network structure for public transport passenger classification

以155名乘客为验证数据,计算不同样本所属类别。验证结果表明,模型总体分类精度为94.2%,Kappa系数为0.875(Kappa系数为0.75~1.00表明模型分类精度达到几乎完全一致[61])。可知,研究构建的BP神经元网络模型能够较好地进行公共交通通勤乘客辨识。

4.3.2 通勤乘客出行行为预测

研究综合采用XGBoost集成学习算法[62]、Logisitics算法和图谱转移概率,面向公共交通通勤乘客开展下次出行行为预测。

(1)下次出行日期预测。以通勤乘客P为研究对象构建Logisitics模型,输入变量为高峰出行、出发时间、目的地,输出变量为下次出行日期(当天/第二天)。计算得到通勤乘客下次出行日期的平均预测精度为90.9%,R2为0.735。

(2)下次出行目的地预测。通过构建结构方程模型确定乘客P出行目的地显著影响因素为个体特性、单次出行特征和外在属性3类共7个特征变量,如表2所示。以出行目的地显著影响因素和该次目的地为输入变量,下次出行目的地为输出变量,通过XGBoost模型参数调优与图谱转移概率修正,构建公共交通通勤个体下次出行目的地预测模型。随机选取该乘客整体数据的80%进行训练,另外20%的测试数据进行验证,将模型运行10次的平均预测准确率并利用转移概率修正,得到乘客P下次目的地预测准确率为92.2%。

(3)下次出发时间预测。以公共交通通勤乘客P出发时间显著影响因素,包括个体特性、单次出行特征和外在属性(表2)、该次目的地和该次出发时间为输入变量,下次出发时间为输出变量,通过XGBoost模型参数调优,构建公共交通通勤个体乘客下次出发时间预测模型。同样,以80%数据进行训练,另外20%数据进行验证,结果表明乘客P下次出发时间预测准确率约为89.53%。

(4)下次出行方式预测。通过结构方程确定通勤乘客P出行方式影响因素,包括建成环境、出行特征和社会经济属性3类共14个特征变量(表2)。基于XGBoost集成学习算法,分别选取出行方式显著影响因素、该次目的地、该次出发时间和该次出行方式为输入变量,下次出行方式为输出变量,通过参数调优,得到下次出行方式预测准确率为85.0%,Kappa系数为0.571(Kappa系数为0.41~0.75,表明模型预测结果较好[61])。汇总下次出行目的地、出发时间和出行方式模型输入特征变量如表2所示。

表2 下次出行行为预测模型特征变量

(5)下次出行行为聚合。以调查获得的公共交通通勤乘客为研究对象,面向通勤个体乘客的下次出行行为开展聚合分析。选取时间节点为2018年4月25日24:00,以该日24:00后的下一次公共交通出行行为预测结果为例,聚合分析公共交通通勤乘客的下次出行日期、下次出行目的地、下次出发时间和下次出行方式。进而,依托北京市城市公共交通智能化应用示范工程——城市公共交通运行监测与综合信息服务系统中记录的公共交通出行者的特征信息,提取2018年4月26日通勤出行量数据、各交通中区出行吸引量数据和通勤出行方式数据,对本研究的通勤群体出行行为预测结果进行对比验证。结果显示,4月26日早高峰期间通勤者占全部通勤者比例与预测值的绝对百分误差仅为5.37%;早高峰热点目的地预测值与真实值吻合度为90%;各出行方式预测值与真值的绝对百分误差均小于10%。

5 结论

在解析传统公共交通出行需求分析存在问题的基础上,分析了多源公共交通数据为出行行为精细化分析和预测带来的机遇和挑战,进而从公共交通多源数据关联匹配、出行行为特征刻画和出行行为预测三个方面提出多源数据下公共交通出行需求精细化分析的解决方案,并通过案例分析验证了可行性。得出如下结论。

(1)基于交通运行监测平台与交通调查,实现公共交通出行数据细粒度和高精度采集、汇聚与关联匹配,形成体现个体乘客出行全过程的出行链。

(2)采用分层规划理论,构建公共交通个体出行知识图谱,实现公共交通个体乘客出行行为特征的准确刻画。

(3)充分考虑个体乘客差异性,采用机器学习等大数据挖掘方法,形成公共交通通勤个体乘客的下次出行行为预测,包括下次出行日期、目的地、时间和方式,精准获取乘客下次出行行为分布与规律。

猜你喜欢

公共交通公交乘客
一元公交开进太行深处
城市轨道站点公共交通一体化衔接分析
“风的乘客”
汽车顶层上的乘客
等公交
在未来,我们不需要路
二次规划在城市公共交通系统工程中的应用