RFID数据驱动下出行路径选择方法研究*
2021-02-23吕亮钟添翼王世彬蔡晓禹
吕亮, 钟添翼, 王世彬, 蔡晓禹
(1.重庆交通大学 交通运输学院, 重庆 400074;2.山地城市交通系统与安全重庆市重点实验室,重庆 400074;3.重庆市公安局交通巡逻警察总队, 重庆 400055)
交通运输作为国民经济的基础产业,是社会及经济可持续发展的保证。但随着近年来汽车保有量的增加,交通拥堵日益严重,对国民经济造成较大冲击,甚至已上升为制约城市经济发展的重要因素,解决交通拥堵问题刻不容缓。交通拥堵问题大多以城市交通拥堵为主,研究车辆的出行路径,找到拥堵的源头,能有效缓解城市交通拥堵。近年来,随着交通信息化建设的不断推进,综合交通数据汇聚已初具规模。为追寻交通拥堵的根源所在,借助交通大数据的优势追踪车辆的出行,能缓解城市交通拥堵状况,大数据驱动下的车辆出行路径选择方法有待进一步研究。
1 现有出行路径选择方法
1.1 非集计模型
非集计模型又称离散选择模型,主要分为Probit模型和Logit模型。它是以出行者个体为研究单位,充分利用所得数据综合考虑出行者心理活动及经验习惯,使模型更精确地反映实际出行状况。文献[1]构建较完整的出行路径选择行为非集计理论体系,并对其应用条件及特性进行了补充;文献[2]从出行者出行方式选择与路径选择行为出发,建立了分层Logit多方式随机用户均衡分配模型;文献[3]建立非集计二项Logit模型,研究了出行者对路况和习惯的依赖程度。Logit模型是基于随机效用理论的模型,能对个体和群体行为进行分析,所需数据量小,易于求解。但Logit模型只能假定每条路径彼此间独立,若出现重叠路段则不能反映独立性。其次,Logit模型仅以各条路径间的阻抗绝对差来确定选择概率,没有考虑实际情况。
文献[4]利用Probit模型研究了行程时间和期望的行程时间对路径选择的影响,结果表明前者影响更高。文献[5]引入Probit模型研究不同因素对人们过街选择的影响。Probit模型的优点是非相互独立的通勤方式间也可使用,但计算较复杂。
1.2 基于有限理性的理论
有限理性是一种介于完全理性和非完全理性之间的状态,是基于出行者的生理、心理能力提出的一种假设,是指出行者在面临不确定环境时,凭感觉和判断选择最优路径的决策方法。基于有限理性的理论主要有期望效用理论、前景理论及后悔理论。
期望效用理论是一种规范性的理论模型,解决如何决策的问题。文献[6]引入期望效用理论建立出发时刻选择概念模型,证明出行者出行时会受到感知时间和信息的影响;文献[7]基于期望效用理论和贝叶斯推理分析已知交通信息条件下的出行行为,构建了交通信息效用模型。该方法能为预测交通信息条件下的出行行为提供理论依据,但实际出行决策会受到环境等多因素的影响,期望效用理论无法解释不确定条件下人们的出行选择机理。
前景理论是在风险决策方面的描述性理论模型,主要描述个体出行者在不确定条件下的实际决策行为,解决实际怎样决策的问题。文献[8]基于前景理论,从认知、记忆力、偏好等方面判断出行者的路径选择,以更真实地反映出行者的实际路径选择行为;文献[9]基于前景理论,给出了出行路径选择行为模型,定义了出行者决策参照点,提出了连续型路径属性离散化的方法;文献[10]基于前景理论对个体出行者进行风险评估,研究其出行行为特征;文献[11]对比分析期望效用理论和前景理论,认为后者更能真实描述实际出行行为。交通具有随机性和时变性的特点,前景理论比期望效用理论更符合出行者的实际决策行为。在前景理论中,参照点的设定是一个实证问题,影响因素较多,实际应用中需结合更多场景对每个参数进行全面估计。
与前景理论相比,后悔理论的模型简单、涉及参数少,更适用于交通出行路径选择行为研究。该理论认为出行者追求后悔最小化出行,根据其出行行为及心理偏好更能准确描述路径选择行为。文献[12]基于预期后悔理论建立了出行路径选择模型,得出后悔程度与环境风险程度成正相关;文献[13]提出基于随机后悔最小化的出行路径选择行为分析模型对出行者进行方案决策分析;文献[14]基于后悔理论构建理想交通分配模型,通过案例验证了模型的可行性和有效性。后悔理论相对于前景理论较简单,是因为其没有严格的数学推导,故其规范性和实证性存在一定不足,需进一步完善。
1.3 蚁群算法
蚁群算法通过模拟真实蚁群的行为对路径进行优化。文献[15]考虑出行过程中的影响因素,利用蚁群算法模拟了不同属性出行者的决策过程,结果表明蚁群算法能有效降低出行成本;文献[16]基于蚁群算法研究了出行者对最优路径的选择。该算法的鲁棒性和高并行性较强,但算法较复杂,计算时间长,计算过程中可能出现停滞。
1.4 其他方法
除上述方法外,出行路径选择的研究方法还有基于博弈论、马尔可夫过程及统计学的方法等。文献[17]以路段的旅行时间为变量,构建了基于马尔可夫过程的随机时变交通网络下出行者自适应路径选择模型;文献[18]基于博弈论研究了驾驶员出行路径选择效益问题,给出了不同策略下的不同收益,实现了博弈双方的利益最大化;文献[19]基于统计学方法,分析了交通信息对出行者路径选择行为的影响。
1.5 现有方法的缺陷
(1) 主要基于各类模型和算法,只是基于理论的研究,实际效果是否可行还有待商榷。
(2) 对研究结果的验证往往通过建立相关模型或利用统计学的方法进行,难以对研究方法进行客观评价。
(3) 考虑的影响因素不多,而实际中出行需求是多样性的,研究出行路径选择行为需从个体-群体的角度出发,探究出行路径选择行为的一般特征和规律。
(4) 未能结合出行者的出行特征,只考虑了出行者偏好及出行成本等因素,未考虑出行目的需求及出行途中的相关影响因素,难以符合实际情况。
(5) 随着交通信息化建设的不断完善,出行产生了海量交通数据,而这些数据没有很好地应用在路径选择方法研究上,难以揭示出行者的真正出行目的。
2 研究热点与面临的挑战
2.1 研究热点
随着研究的深入,当下的研究热点已逐步从传统模型理论方法转向人工智能、深度学习等新型数据挖掘方法;研究对象也不仅限于个体出行者,而是针对个体-群体;研究数据开始逐渐融入各类出行大数据。
2.2 出行路径选择研究面临的挑战
(1) 城市交通系统的复杂性和多变性。城市干线作为城市交通系统的主动脉,承担城市大量交通出行。而城市交通又具有随机性和时变性的特点,很难精确地掌握每个出行者的出行特征。天气、道路状况和交通管控措施等也影响出行者的出行,这些影响因素为探究出行者的路径选择行为造成了一定困难。
(2) 深入结合出行产生的大数据。尽管现今研究热点已逐渐转向结合大数据,但研究采用的很多数据没有代表性,不能反映出行者的特征,研究方法难以适用于多数条件。有些数据虽然具有代表性,但在研究中没有深入挖掘数据的内在含义,未能真正揭示出行的内在机理。
(3) 客观、准确地结合出行特性的路径选择方法研究。尽管在出行路径选择方面进行了大量研究,但这些研究往往是基于各种理论模型,考虑的因素多是出行者的出行偏好及出行成本等,忽略了天气、道路条件等因素的影响,导致理论模型准确度不够高。同时没有考虑出行者的出行机理特征,研究方法往往不够客观、准确。
3 出行大数据环境
结合目前研究热点和所面临的挑战,提出一种射频识别技术(RFID)数据驱动下,考虑多影响因素的出行路径选择方法。
3.1 出行数据
随着交通大数据的发展,城市已构建起较完善的交通信息采集系统,可获取GPS数据、手机信令数据、RFID数据、车联网OBD数据等交通大数据。
3.2 RFID数据
近年来,以RFID为代表的各类物联网技术以其成本低、识别范围广、识别速率快等优点在交通领域得到广泛应用。RFID数据包含采集编号、采集点位、采集时间、行车方向等关键字段,以重庆市主城区为例,RFID数据的字段见表1。
表1 RFID数据字段示例
3.2.1 RFID数据的特征
相比于其他交通数据,RFID数据具有以下特性:
(1) 数据样本量丰富。从获取的重庆市主城区RFID数据来看,RFID检测器基本能覆盖主城区的所有主要道路,高峰时段1 h内的数据量达数十万条。RFID检测点位分布见图1。
图1 RFID监测点位分布
(2) 数据的完整性。相比手机信令及GPS浮动车数据,RFID数据受其他因素影响较小,系统全天候工作,能保持数据的连续性。同时数量会逐步累积,数据完整性较高。
(3) 数据的准确性。RFID检测点位一般安装于电子警察杆上,位置相对准确,更易提取车辆轨迹而无需进行地图匹配。RFID检测车辆区域过车轨迹见图2。
图2 车辆区域过车轨迹
(4) 数据的实时性较高。检测到车辆信息后,能实时上传各点位数据且全天候工作。
(5) 数据处理速度快。能快速对获取的车辆信息进行处理,并实时传输到后台。
3.2.2 RFID数据的优势
只有精准掌握车辆的出行要素,才能有效地研究车辆的出行行为。RFID数据能通过可视化技术展现车辆的运行轨迹,有利于分析车辆在时间和空间上的变化规律。RFID数据的可靠度较高,研究结果更精确,可为出行特征及路网运行状态等提供有效数据支撑。
4 RFID数据驱动的路径选择方法
4.1 研究思路
研究出行者出行路径,首先需探究出行者的出行特性。借助大量RFID数据对出行者的出行要素进行提取、分析,并与各类影响因素进行关联。研究的主要思路分为出行数据提取、路径级阻抗影响因素研究及建模、路径选择模型建立(见图3)。
图3 出行者出行路径选择方法研究技术路线
4.2 基于RFID的出行特征分析
4.2.1 出行特征指标分析
城市交通系统本质上是一个由大量出行行为聚集而成的宏观系统。研究个体出行行为,能为解决城市交通中各类交通问题提供思路,其中个体出行过程中的影响因素是研究重点。直接分析出行者的出行行为往往较困难,通过可视化技术,结合出行数据,可将出行者的出行行为展现为出行轨迹,通过对轨迹数据的定性分析得到不同群体出行的差异和共性。再通过对原始轨迹的分析,得到表征出行特点的一系列具有代表意义的向量值,这些向量值经过转化后,就是出行的特征指标。
4.2.2 出行特征指标提取
图4为某车经大数据平台可视化技术展示后的运动轨迹。通过对多种轨迹的定性分析,结合各类车辆运行的分布特征及RFID数据特点,基于数理统计分析思想,建立在网时间、出行频次、出行时段、轨迹重复率、活动偏好区域、干线影响区偏好等多位一体的特征指标体系。出行者的出行行为往往存在很大重复性,出行特征指标提取往往需要大量样本。
图4 车辆运动轨迹
4.2.3 出行特征指标模型建立
标准的马尔可夫模型要求观测集合为一维离散数据。而出行特征指标研究中涉及多维连续函数问题,为实现离散状态与连续观察值之间的概率联系,引入高斯算法,使模型变为存在连续观测值的隐马尔可夫模型。由于观测状态是连续值,无法像离散隐马尔可夫模型一样直接给出矩阵B,而是给出各隐藏状态对应的观测状态高斯分布的概率密度函数的参数,表达形式如下:
bj(O)=cjN{O,μj,σj},1≤j≤N
(1)
式中:bj(O)为B的概率分布矩阵;N{O,μj,σj}为以μj为均值、σj为方差的高斯分布。
Gaussian HMM模型表示为:
λ=(A,μ,σ,Π)
(2)
Gaussian HMM模型中观测序列是连续值,无法直接给出观测概率矩阵B,需采用给出各隐藏状态对应的观测状态得到各观测参数的高斯分布,从而得到概率密度函数参数。
4.2.4 结果及分析
研究所涉及的RFID数据中有一列字段可辨识出车辆种类。选取私家车、货车及出租车3种类型车辆各4 000组RFID数据,提取各自出行指标参数并基于上述出行特征指标体系进行分类,将所有样本数据进行求解,得到模型预测结果。与实际值进行比较,预测效果良好,表明所采取的出行指标可较好地表征这3类车辆的出行特征。
4.3 路径选择行为研究
不同车辆有不同的出行行为偏好,辨识车辆类型后,能更有针对性地研究各类群体的出行特点。不同群体在出行时遇到的影响因素不同,各影响因素的作用效果也不同,这些因素会直接影响出行者的时间和经济成本。下面引入相关模型对各类影响因素进行数字化处理,研究各类群体的出行行为。
4.3.1 路径级阻抗影响因素分析
出行者影响因素主要分为内在和外在两类,分别与出行需求和出行环境相关。车辆的外在影响因素主要有道路条件、交通流量及交通管控条件等,只有将这些影响因素量化处理,才能定量分析路径选择行为与影响因素之间的关系。
道路条件取决于道路等级,交通流量则与城市规模、机动化水平有关。分析影响因素时,对不同条件进行定义。如交叉口某个转向禁行,则认为该交叉口的转向延误无穷大;单向交通,则考虑路网的容量并设置一个上限值,以免路段的交通流量超过路段容量。在确定各类影响因素后,找到表征路径级阻抗的参数并建立相关模型,才能研究各类影响因素的范围和强度。
4.3.2 路径级阻抗影响因素建模
选取结构方程模型来处理多个影响因素之间的关系。基本的结构方程由测量方程和结构方程组成,分别表示潜变量与观测指标之间的关系及潜在内生变量和潜在外生变量之间的关系,表达式如下:
x=Λxζ+ω
(3)
y=Λyη+ε
(4)
η=Bη+Γε+δ
(5)
式中:x为测量变量所组成的向量;Λx为x在ζ上的因子负荷矩阵;ω、ε为误差项;y为潜变量所组成的向量;Λy为y在η上的因子负荷矩阵;B、Γ为系数矩阵;δ为结构方程残差项。
通过研究不同出行者的不同决策行为,选取不同影响因素作为变量,利用结构方程量化各类影响因素并探究相互间的关系,表征各类路径级阻抗影响因素,从而进行路径选择行为研究。
4.4 道路交通流量分配
个体路径选择行为无法直接反映道路交通的实际情况,只有经历个体-群体的过程,才能真实反映道路交通的实际出行。路径选择最终结果的准确性可通过道路交通的流量进行验证。基于全有全无、容量限制分配、随机分配、随机用户平衡4种传统的交通分配模型,以重庆市干线影响区为研究对象,提取干线影响区内RFID数据,利用上述模型对影响区内的主要路网进行流量分配,并将各模型分配结果与道路的实际流量进行对比,对模型进行验证。
5 结语
近些年对出行路径选择方法的研究主要经历了两个阶段。第一阶段以个体出行者的自身活动与心理认知为研究对象,基于离散选择模型、有限理性理论等传统理论方法描述出行者的出行决策行为;第二阶段以出行相关影响因素为研究对象,引入蚁群算法、博弈论及统计学等方法进行出行路径选择方法研究。
出行路径选择行为会受到多种因素的影响,传统的路径选择方法因受到模型的限制而无法客观挖掘出行者的出行特征。为研究更贴合实际的出行选择方法,该文引入大数据手段和可视化技术,通过RFID数据及大数据平台分析车辆轨迹的溯源,挖掘出行者的出行要素并分析其特征,为探求出行路径选择方法提供新思路。如何结合交通大数据探求准确的出行路径选择方法将成为未来研究重点。