基于现实与虚拟交互的交通流再现实验方法

2019-01-08杨晓光

同济大学学报（自然科学版） 2018年12期

杨晓光，张楠

(同济大学道路与交通工程教育部重点实验室，上海 201804)

交通流的解析与建模，不仅对于揭示其规律具有科学意义，还可为交通流控制和管理提供科学依据，因此，有关于此的研究由来已久.交通流运行过程是一个动态过程，因受到动态的交通需求和交通行为，以及静态的道路及管理条件等的组合影响，所以交通流状态具有不确定性特点.是否能够准确地描述交通流真实特征和演变规律，是交通流控制和管理的关键基础问题.由于交通流在时间和空间上分布特性的高度复杂性，很难通过观测的方法在任意时间段内直接获取任意范围内的交通流状态的动态演变过程，所以无论是在科学研究和工程应用方面，都需要利用实验的方法对交通流进行建模和分析.包括交通系统在内，现实的科学和工程领域中，有诸多问题很难通过基于还原论的模型进行计算求解，所以需要通过对系统的状态进行观测和实验方法阐明系统运行机理和规律，相对于基于还原论的方法，称其为经验模型法[1].所以，实验交通工程学被提出，利用实验的方法解决交通系统范畴中面临的问题[2].

实验交通工程学是基于复杂系统理论，将交通工程学与计算实验理论和交通数据及信息结合，对交通系统的现象和机理进行模拟与解释[2].童梅的研究从实验交通工程学的起源和基本理论出发，将实验交通工程学的基本问题归纳为：交通数据条件下的交通实验系统的实验建模、实验计算以及应用实验3个基本问题[3].面对交通流的实验研究，杨晓光等利用交通仿真技术作为交通流模型，构建了交通需求、交通运行，以及管理评价的交通仿真实验系统，率先对交通流的实验方法进行了初步探索[4].更进一步, 时柏营建立了基于虚拟环境与现实环境通过离线和在线数据集成的平行系统的交通流实验系统框架[5].在虚拟环境中，利用观测数据还原现实环境交通流的“再现”过程，是虚拟环境与现实环境成为“平行系统”的关键，也是利用虚拟环境进行交通实验及应用的基础前提.

本研究研究重点是在交通流实验系统框架基础上，结合交通流的观测数据，提出交通流再现问题的实验建模和计算方法.

1 交通流再现问题研究综述

交通流实验系统框架包括虚拟环境和现实环境，见图1.交通流实验系统框架又是交通战略实验室的核心组成部分[6].在交通系统的现实环境中，交通控制、管理措施和道路设施是交通流的限制条件.在虚拟环境中，利用信号控制模型和路网模型与现实环境相对应，作为交通流模型的约束条件，管理措施则可以通过变结构路网模型进一步作为交通流模型的约束条件[7].在交通流实验系统框架下，虚拟环境与现实环境组成为平行系统的关键因素是利用现实交通流的观测数据，通过实验计算再现一个与现实交通流相似的交通流.这一过程是一个虚拟与现实交互的动态过程.从广义上讲，交通流实验系统框架是交通战略实验室的一部分[6]，再现的交通流可以作为信号控制与交通管理的分析基础，进一步形成信号控制和交通管理方案对交通流进行控制和管理.这一过程形成了一个虚拟与现实交互的闭环过程.所以，本研究的重点问题在于构建“再现一个与可观测的交通流现实环境相似或者等价的交通状态的模拟系统”的方法.

大多数情况下，再现交通流的一般过程总结如下：首先根据现实环境的交通系统建立一个交通流模型，利用现实的交通流数据对交通流模型参数进行标定和检验.标定之后的交通流模型可以重复生成交通流的实验数据.交通流模型可以划分为宏观交通流模型和微观交通流模型.对于宏观交通流模型主要是利用观测数据对模型中的交通流参数进行估计[8-11]，但是利用线性的交通流模型[8]，或者存在较强的假设条件[10]，限制了交通流模型对非线性交通流再现的适用性，特别是信号控制条件下的交通流.另一方面，宏观交通流模型条件下，多种观测数据存在难融合的问题[11].微观交通流模型包括：跟车模型和换道模型.在应用该模型对交通流进行再现时需要对模型进行标定[12-13]，但是由于驾驶行为等众多不确定因素的影响，所以标定的跟车和换道模型不能适应于所有的车辆轨迹的再现[14]，取而代之的则是广义的标定[15].另外，微观交通流模型的标定需要精度较高的车辆轨迹数据，如NGSIM数据集[16]，对观测数据的要求较为严格.

以上方法的特点均是在给定模型基础上对参数进行标定和校正，该类模型可以被定义为参数模型[17].考虑到有限时间和空间特性的交通流观测数据，同时在虚拟环境中，利用观测数据再现现实中具有不确定性特征的交通流的要求，本研究提出利用非参数模型对交通流进行再现.非参数模型是将模型的参数定义在一个无限可能的数据空间或者是来自于一个不完全确定的形式[17].一方面，非参数模型对于观测数据更具有包容性；另一方面，对于实验方法而言，非参数模型可以被视作为一种经验模型.所以，本研究建立交通流的非参数模型，结合观测数据，利用实验方法得到非参数模型的近似解，实现对交通流的再现.

2 交通流再现实验方法

2.1 交通流再现问题的非参数定义

一般地，描述交通流演变过程可以通过交通流状态特征变量的模型实现.在实验方法中，给定一个空间范围和一定的时间段，交通流演变过程可以定义为交通状态特征参数H的时间序列.定义交通状态变量为随机变量时，时间序列可以被定义为一个随机过程模型M，该模型的参数为θ.对于虚拟空间中的状态特征参数和模型参数，定义联合概率分布函数为p(H,θ|M).对于非参数方法利用参数概率分布函数代替对特定参数的分析.该概率分布可以视作为参数模型中参数的一个数据空间.一定条件下，满足同一个分布的交通流被视为相似或者等价的交通流.

(1)

2.2 交通流再现实验的贝叶斯学习方法

为了求解优化问题(1)，假设交通流特征参数与模型参数相互独立，根据贝叶斯公式将式(1)中的概率分布p(H,θ|M,O)展开得到

p(H,θ|M,O)∝p(O|M,H,θ)p(H)p(θ)

(2)

式中：p(O|M,H,θ)为似然函数；p(H)、p(θ)为交通流特征参数与模型参数的先验分布.

根据Jensen不等式(Jensen’s inequality)，在给定随机过程模型M条件下，观测数据的似然概率的对数可以定义一个下限

(3)

式中：qH(H)、qθ(θ)为设定的交通流特征参数和模型参数的分布.令下限函数为L(q)，且

(4)

在定义了下限函数之后，优化问题(1)可以通过最大化下限函数L(q)得到[18]

qH(H)qθ(θ)≈p(θ,H|O,M)

(5)

所以求解优化问题(1)的实验计算过程可以被描述为：通过有限的迭代计算最大化下限函数L(q)，使得特征参数和经验参数的联合分布qH(H)qθ(θ)不断地接近分布p(H,θ|O,M)，最终使qH(H)成为现实交通流的状态参数分布的近似分布.最大化下限函数的算法可以采用变分贝叶斯学习(variational Bayesian learning)的EM算法[18]进行求解.但是该算法不适应于变量较多、结构较为复杂的随机过程的计算.所以，本文选取更方便于计算的马尔科夫-蒙特卡罗算法中的Gibbs分块抽样算法[19].该方法同样适用于计算复杂随机过程优化问题(1)的近似解[20].

3 信号控制交通流再现实验

交通密度、交通流量和交通流波动速度是交通流最基本的参数[21]。所以，在应用该实验方法对交通流进行再现实验时，首先选择宏观交通流特征参数作为实验框架中虚拟环境的交通流模型参数，描述交通流的动态变化特征.宏观交通流特征参数主要应用于连续交通流的建模和分析中[8-10].对于信号控制条件下的交通流比连续交通流更为复杂[22]. 所以本研究选择信号控制交通流作为研究对象.

如图2所示，城市信号控制条件下最基本的交通系统包括：道路设施、信号控制、检测设备、交通流组成.相对应地，虚拟环境下的交通系统模型包括路网模型、控制模型和交通流模型.本研究结合以上的实验场景设定，建立信号控制交通流再现实验的实验框架，并利用实际数据进行验证.

3.1 路网模型与控制模型

本论文选用宏观交通流特征参数作为分析的基础变量，与之对应的路网模型选用CTM(cell transmission model)模型作为交通流路网模型[23-24].对应于图2中的道路设施，该道路可以由若干个Cell组成的整体来表示，Cell(2)和Cell(3)代表检测器之间的道路，其中Cell(2)表示交叉口范围，Cell(3)表示路段范围，每一个Cell设置通行能力的限制，根据实际的道路交通渠化设计计算其通行能力.阴影的Cell(1)和Cell(4)为虚拟Cell，代表检测器和信号控制.

利用CTM模型时，交通控制可以表示为以下过程：当控制信号相位为绿灯时，虚拟Cell(1)作为一般的Cell，交通流按照其状态从Cell(2)流入到Cell(1)；当控制信号相位为红灯时，从Cell(2)流入到Cell(1)的流量设置为0.

3.2 交通流模型

交通密度、交通流量和波动速度参数中，交通流量是最容易被观测获取的参数，所以，将交通流量作为观测参数，交通密度和波动速度作为隐含参数.对应于非参数化定义，设定波动速度和交通密度服从高斯分布.

图3 信号控制条件下交通流状态划分Fig.3 Traffic flow state division in the condition of signal control

在交通流观测条件下，交通流密度和波动速度的演变过程可以建立一个随机过程[26]，表示为

p(zt|zt-1):πzt-1

(6)

(7)

fzt(ρ(t))=Aztρ(t)+BJ,ztρJ+BQ,ztqmax

(8)

y(t+Δt)=Cρ(t+Δt)+wt

(9)

式中：ρ为t时刻道路的交通密度向量，辆·m-1；y为t时刻道路的流进流出的交通流量的观测向量，辆·s-1；ρJ为道路最大的容量，辆·m-1；qmax为道路最多能通过的车辆，辆·s-1；zt为交通状态模式；πzt-1为状态模式转移矩阵；Azt、BJ,zt、BQ,zt、C均为系数矩阵，其中C为常数；令Θ(zt)={Azt,BJ,zt,BQ,zt}，其中系数矩阵为波动速度[26]；et、wt均为误差，设定其满足均值为0、方差为Σ、R的高斯分布；状态转移矩阵和误差属于模型的经验参数，令θ={Σ,R,π}；lx为第x个Cell的长度，m；Δt为时间段时长，s.

交通流的经验模型将交通流的运行过程抽象成为一个多层的状态转换的随机过程[20]，见公式(6)～(9).该随机过程可以表示为一个多层的隐马尔科夫模型(hidden Markov Model，HMM)[27]，见图4.其中，第1层为交通状态模式转移矩阵为πzt-1的马尔科夫过程；第2层为在交通状态模式条件下，交通密度转移矩阵为系数Θ(zt)的马尔科夫过程；第3层为独立同分布的交通流流量观测变量.该模型中交通状态模式和交通流密度为隐层状态变量，交通流波动速度为未知的系数矩阵.交通状态模式的转移矩阵以及误差为经验模型的未知参数.

图4 动态交通流的马尔科夫过程图形表示Fig.4 Graph of Markov process for dynamic traffic flow

3.3 再现实验框架与算法

建立模型之后，交通流再现的问题可以具体归纳为：通过交通流量的观测数据，再现交通流密度和波动速度，利用再现的交通流特征参数描述现实交通流动态变化过程，该实验框架见图5.将信号控制道路上下游到达和离去的交通流量作为观测数据集.在进行实验计算时，利用再现实验的变分贝叶斯学习算法求解问题(1).

图5 交通流宏观参数再现实验框架Fig.5 Experimental framework for reproduced macroscopic parameters of traffic flow

本研究采用Gibbs抽样算法获得实验计算目标的近似解[20].在观测时间段[0,T]内，抽样算法的迭代过程如下：

(1) 抽样交通密度序列{ρt}1:T.在给定状态模式序列{zt}1:T，系数矩阵Θ(zt)，以及其他经验参数的条件下，图4中的模型，转变为只含有第2层未知变量的HMM.当ρt服从高斯分布作为先验分布，见公式(7)、(8).此时，交通密度序列{ρt}1:T的后验概率计算公式为可以利用高斯HMM的前向-后向传递算法(forward-backward algorithm)进行计算[28], 该算法是利用马尔科夫性质，将全部序列的边缘概率密度的积分计算转变为局部的积分计算.根据该算法状态序列的后验概率分布计算公式为

p(ρt|ρt-1,y1:T,z1:T)∝

(10)

式中：mt+1,t(ρt)为后向传递信息.

(11)

(2) 抽样状态模式序列{zt}1:T.在给定状态模式序列{ρt}1:T，以及其他参数的条件下，图4中的模型，转变为只含有第1层未知变量的HMM.同理，交通流状态模式的后验概率计算公式为

(12)

式中：

p(y1:T|zt,Θ(zt))∝

(13)

交通流状态模式的后验概率可以应用后向信息传递与计算得到[27]，并且抽样得到状态模式序列{zt}1:T.

(3) 抽样系数矩阵Θ(zt).在给定状态模式序列{zt}1:T和交通密度序列{ρt}1:T的条件下，系数矩阵的最优后验分布可以应用变分贝叶斯学习进行计算[26]，交通波动速度的后验分布为

p(ω(k)|ρ(k),Σ(k),zt=k)∝

p(ρ(k)|ω(k),Σ(k),zt=k)p(ω(k),zt=k)

(14)

(4)抽样转移矩阵π.在有限状态的HMM中，k个状态之间的转移矩阵为π的先验分布为Dirichlet分布[29].

p(π|β,k)～Dir(β/k,…,β/k)

(15)

式中：Dir(·)表示Dirichlet分布；β为超参数.

在给定状态模式序列{zt}1:T的条件下，序列中k个状态模式出现次数表示为{n1,…,nk}.转移矩阵π的Dirichlet分布的后验分布为[19]

p(π|β,k,z1:T)∝p(z1:T|π)p(π|β,k)∝

Dir(β/k+n1,…，β/k+nk)

(16)

(17)

式中：δ(·)为Kronecker delta函数.

综上所述，Gibbs分块抽样算法流程见图6.

图6 Gibbs分块抽样算法流程Fig.6 Gibbs block sampling algorithm

交通流再现实验的Gibbs分块抽样算法流程如下：

(2) 分块抽样：设置n=1,…,N，计算

3.4 方法验证与分析

本论文采用NGSIM(NG)数据集[16]中的Peachtree Street的交通流数据. Peachtree Street的数据包括2个以15 min为1个时段的数据集合，分别是12:45～13:00和16:00～16:15.本文选取16:00～16:15时段的数据.如图7所示，因为由北向南方向的路段上下游交叉口之间不存在与其他道路相交的路口，所以选取图中路段和下游交叉口作为研究交叉口和路段.另外，根据选取时段的交通流特征，将交通状态模式划分为4个模式，见图3.以5 s为1个时段统计交通流的状态模式，交通流密度，上下游到达和离去的交通流量(去除交通流量为空的时段)随着时段顺序变化的结果见图8.

图7 实验选取路段与离散化表示Fig.7 Selection and discrete representation of road section

同时可以统计得到4种交通状态下的密度-流量关系图，见图9.在交通控制条件下，密度-流量的关系很难通过单一的波动速度的参数模型描述，如CTM模型[23-24].所以本文提出利用非参数模型，建立波动速度的分布.根据统计的交通流量和交通密度计算得到4种交通状态波动速度，速度的累计频率结果见图10中柱状图.利用高斯分布对4种状态的波动速度分布进行拟合，拟合结果见图10中实线曲线.

a 交通状态模式序列

b 交通流密度

c 到达离去交通流量图8 NGSIM交通流数据统计结果(5 s记为1个时段)Fig.8 NGSIM traffic data statistics(Time interval 5 s)

图9 交通密度-流量关系图Fig.9 Flow versus density

将统计集合中的上下游到达离去的交通流量作为观测数据，设置算法1最大计算次数为2 000步，进行实验计算得到的结果，见图10和图11.因为本研究采用的是非参数的建模方法，所以实验再现的计算结果为交通流密度和交通流波动速度的分布.其中，交通流密度分布为每个统计时段内交通流密度的高斯分布.交通流波动速度为数据集集合整个时段内的分布.

对比再现的交通流密度与现实统计数据可以得到以下结论：现实的交通流密度包含在每一个时段分布的95%置信区间组成的序列数据空间之内，见图11b、d灰色区域.可以认为现实交通流是一系列分布的一个特殊的抽样.因为满足同一个分布，所以在序列分布的每一次抽样结果都可以被认为是在该条件下的近似交通流.

a 模式Ⅰ

b 模式Ⅱ

c 模式Ⅲ

d 模式Ⅳ图10 交通流波动速度实验再现结果与统计值、拟合分布对比Fig.10 Comparison of experiment result of shockwave speed，statistic value, and fitting distribution

a Cell(2)交通流密度分布

b Cell(2)均值和置信区间与观测值对比

c Cell(3)交通流密度分布

d Cell(3)均值和置信区间与观测值对比图11 交通密度实验再现结果(5 s记为1个时段)Fig.11 Experiment result of traffic density

推断得到交通流波动速度的分布见图10中虚线曲线.对比推断交通流波动速度分布与现实统计数据的拟合分布，可以得出以下结论：不同状态模式下，交通流波动速度的均值较为接近，可以作为波动速度的再现近似分布.其中，由于该数据集合的状态模式Ⅰ的数据量相对其他方式较大，所以，状态模式Ⅰ下的分布最为接近.其他模式下的分布的均值较为接近，方差相对较大.本研究提出的实验方法中的经验模型还需要大数据样本观测提升精度.

利用实验推断的交通波动速度的高斯分布产生50组数据与NGSIM的数据进行对比，两组数据的分位数对比分析见图12.图中绝大部分的点都分布在一条直线的两侧，所以认为两组数据近似地来自于同一个分布，所以本文提出的实验方法推断的高斯分布可以作为交通波动速度分布的近似分布.

a 模式Ⅰ

b 模式Ⅱ

c 模式Ⅲ

d 模式Ⅳ图12 交通波动速度实验再现结果：推断分布抽样值与NG统计值的分位数对比分析Fig.12 Experiment result of shockwave speed: Normal quantile-quantile plot

4 结论和展望

本研究在交通流实验系统的框架下，提出通过观测数据，虚拟环境再现现实环境交通流的实验方法.该实验方法首先定义了非参数化的交通流模型，在此基础上定义了现实交通流再现的优化问题，应用变分贝叶斯学习给出该问题的近似解作为交通流再现的近似解.随后，选择信号控制交通流为研究对象，建立了信号控制交通流宏观特征参数再现的实验框架，利用实际数据对本文提出的实验方法进行验证.其结果表明，在考虑特定的观测条件下，本文提出的再现实验方法可以近似地再现现实信号控制交通流的密度和波动速度；此外，该方法可以获得参数的分布特征，该特征更适应于描述不确定性的动态交通流的特征.利用本研究实验计算得到的交通流参数分布，可以进一步对交通流进行模拟、预测等.本研究提出的实验方法，同样适用于连续流的情况，建立的信号控制交通流再现的实验框架模型，可以替换成连续流的模型.

本研究是对实验交通工程学理论和方法的初步探索，提出的方法在未来的研究中需要在以下几个方面进一步提升:①提出的交通流参数属于宏观特征参数，需要进一步选取微观参数作为描述交通流的演变特征，同时考虑观测数据的多样性条件；②提出的交通流路网模型较为简单，需要考虑建立不同管理条件下的路网可变结构模型；③计算结果为推断交通流参数的近似分布，需要在此基础上对数据的潜在影响进行进一步挖掘和分析，并且需要在“大数据”环境下进行测试，提升计算的精度和效率.