APP下载

考虑不完全理性的行人-驾驶员博弈决策分析

2022-07-07董晓琦秦雅琴谢济铭李秋谷

关键词:人车行人意愿

董晓琦,秦雅琴,谢济铭,李秋谷

(昆明理工大学 交通工程学院,云南 昆明 650500)

0 引 言

近年来,人车冲突现象严重,使得交通秩序紊乱,极大地降低了道路的通行效率.人车冲突问题一直是研究热点.在行人过街研究方面,Sueur等[1]从行人过街的风险感知入手探讨过街决策,探索了行人过街风险决策的研究新角度;Cantillo等[2]考虑行人的性别、年龄等建立行人过街的离散模型;Pawar等[3]利用概率的方法评估行人在无信号路段过街可接受的安全间隙,并建立安全间隙模型;Ojo等[4]则调查 6 000 多名行人,找到行人行为与是否能安全过街之间的联系;廖明军等[5]通过视频分析无信号控制路段行人过街行为建立模型,并基于模型进行行人过街的仿真;向红艳等[6]运用定量分析的方法,通过实例验证了在车流量大的无信号路段行人过街风险更高.在人车冲突研究方面,Huybers等[7]研究发现,地面标志标线有助于减少人车冲突;Moudon等[8]发现交通环境以及行人、驾驶员的个性特征均会对碰撞造成影响;Liu等[9]对人车冲突中行人受伤程度进行时空建模分析,发现行人的受伤程度与其性格特征、空间位置以及车辆型号等具有相关性.

1952年后,部分学者开始将博弈论运用于机动车与行人抢行决策行为的研究中,考虑混合交通流存在的问题提出了改进的双向行人模型[10].除此之外,还得出了静态博弈模型、动态博弈模型、演化动力学模型和非合作动态博弈模型等[11-14],并且通过嵌入博弈论模型,构建了元胞自动机仿真系统模型[15].

随着心理学以及运筹学的发展,博弈论出现了新的分支——行为博弈论.实验人员运用心理学等学科研究发现,人类在博弈、决策的过程中,会受到个人性格、社会偏好和公平心理的影响.把行为博弈论运用于行人过街决策行为研究,将使得模型与实际产生的结果更加拟合.

1 行人与驾驶员在博弈论中的基本关系

目前,基于博弈论在无信号控制路段的行人过街决策研究模型大多为传统的博弈模型.然而在行人过街决策过程中,除受到外界环境、车流量、车速、过街人数等影响外,还受到年龄、性别、教育程度、风险感知度等自身因素的影响[16].因此,模型预测与行人实际决策选择行为时常相悖.本文考虑不完全理性下的行人、驾驶员过街行为,从博弈者对自身时间效益的看重程度、博弈者对对方的体谅程度以及博弈者对对方的不信任程度3个方面建立博弈模型.

1.1 完全理性下行人过街指标分析

在完全理性条件下,行人过街安全穿越间隙为式(1);在密度不大,车辆到达符合泊松分布,有充分超车机会的情况下,到达的车辆车头时距大于等于行人安全穿越间隙的概率为式(2).联立(1)和(2)可得出行人在完全理性的情况下,安全穿越街道的概率为式(3):

(1)

P(h≥τ)=e-λτ

(2)

(3)

式中:n为车道数,H为一条车道的宽度,v为行人穿越街道时的速度,tr为行人的反应时间,tc为一辆车的全部车身通过的时间,h为车头时距,λ为车辆的平均到达率.

1.2 不完全理性下人、车冲突博弈分析

在实际交通环境中,行人和驾驶员生理、心理会出现不同的波动,具有不可控性[17].没有信息交流的情况下,双方的决策无法实现一致性,在此情况下形成了人车冲突.行人过街情形可分为三种情况,如图1所示.

图1 无信号控制路段行人过街方式Fig.1 Pedestrian crossing mode without signal control

1) 当行人和机动车距离较远时,行人可判断出此时可以安全通过,则不会造成人车冲突.

2) 当行人与机动车较近时,行人和驾驶员会根据当前的距离和车速判断此时的安全程度,双方很容易做出车辆先行的一致性决策,一般也不会造成人车冲突.

3) 当距离介于这2种距离之间时,行人无法快速准确判断车辆是否通行.在此情况下,由于驾驶员存在个体差异会做出不同决策[18].行人只能根据以往的经验,判断机动车通过的概率,做出自己是否通行的决策.并且因为行人的个体差异,也会做出是否通行的决策,此时驾驶员也需要判断行人通过的概率,以改变自己的驾驶行为.

在双方的博弈中,“人、车互不相让”将造成交通冲突.“人、车互让”将降低交通效率,两种情况均不是最优结果.最高效通行的结果是“车让人”或者“人让车”,行人与驾驶员决策达到一致性,避免冲突的发生.

1.3 人车冲突博弈描述

博弈论中的3个基本要素包括:局中人、策略集和赢得函数.

1) 局中人

在无信号控制路段,行人与机动车抢行的博弈中,有权决定自己是否通行的参与者称为局中人.本文中具体指:行人和驾驶员.用I={1,2}表示该对策局中人的集合.约定行人为1,驾驶员为2.

2) 策略局

参与博弈的行人、驾驶员都为局中人i,i∈I都有自己的决策集Si.在博弈过程中,每个局中人有2个策略.行人、驾驶员都有“通行”、“不通行”两个策略.设行人“通行”策略为a1,“不通行”策略为a2.驾驶员“通行”策略为b1,“不通行”为策略b2.因此该博弈中决策集合,即策略组为S1={a1,a2},S2={b1,b2}.

3) 赢得函数

在一局博弈中,每个局中人选出的策略所组成的策略集可以成为一个局势.即Si是第i个局中人的一个策略,则行人与驾驶员的策略组为S=(S1,S2).一个局势出现后,博弈的结果也就确定下来.此时,对于任意一个局势S,行人或驾驶员会得到一个赢得值Hi(S),行人和驾驶员主要的赢得函数体现为时间效益.对于行人和驾驶员来说,H1(S)、H2(S)分别为行人和驾驶员的赢得函数.

2 赢得矩阵的建立以及混合策略分析

2.1 赢得矩阵的建立

在行人、驾驶员过街博弈中,如果利用具体数据代表收益进行定量分析,求解简便,但是难以得到更具普遍代表性的结果.因此采用字母表示收益,对该局势进行定性分析以得到更加准确的模型.T1代表车辆让行,行人通过时行人节省的等待时间;T2代表行人让行,车辆通行时驾驶员所节省的时间;t1代表行人避让时,车辆随后避让,行人所节省的过街时间;t2表示车辆避让时,行人随后避让,驾驶员所节省的过街时间,其中:T1>t1,T2>t2.同时,考虑行人步行速度与车辆速度情况,则有:T1

表1 赢得矩阵Tab.1 Win the matrix

2.2 行人、驾驶员的安全通行函数

设行人通行决策a1的概率为m,0

p=m(1-n)+(1-m)n=m+n-2mn

(4)

行人、驾驶员的安全通行函数图为一个三维立体空间图,如图2所示.该函数图像类似于马鞍图,关于平面m+n-1=0对称,鞍点为(0.5,0.5,0.5).此时行人、驾驶员通行概率均为0.5,最终可协调通行概率也为0.5.当(m,n)取值为(1,0)或者(0,1)时,安全通行概率为1,达成了“车让人”或“人让车”的一致性决策的协调.

图2 人车安全通行概率图Fig.2 Pedestrian-motor vehicle safe passage probability map

3 基于行为博弈的模型改进

无信号控制交叉口行人过街过程中,在行人与车辆同时选择礼让的情况下则存在多次博弈的情况,在不断博弈过程中彼此相互学习,最终完成博弈.

3.1 模型假设

Von Neumann和Morgenstern[19]提出当博弈的参与者大于两方时,可以将相似的博弈方作为一个联盟,可将多人博弈简化为双人博弈.本文考虑行人与驾驶员的效用函数会同时受到自身与对方的影响,并且博弈双方是不完全理性的,还会受到自身个体偏好与社会习性的影响,构建不完全理性情况下的博弈模型.模型假设如下:

1) 行人与驾驶员双方是不完全理性的;

2) 博弈者的个人所得会受到对手收益的影响;

3) 博弈所处交通条件良好,不存在环境干扰现象;

4) 行人与驾驶员的异质性表现为不同的自身时间的看重程度、对他人的体谅程度与不信任程度.

则人车冲突博弈模型如下:

maxHi(S1,S2)
Hi(S1,S2)=αiπi(S1,S2)+(1-αi)π-i(S1,S2)
-βimax{πi(S1,S2)-π-i(S1,S2),0}
+θimin{πi(S1,S2)-π-i(S1,S2),0}
s.t.Hi(S1,S2)=PSiπi(S1,S2)
0≤αi≤1,i=1,2
0≤βi≤1,i=1,2
0≤θi≤1,i=1,2

(5)

式中:Hi(S1,S2)表示在一次行人过街博弈中,博弈者的效用.在传统模型中引入αi、βi、θi3个参数.αi(0≤αi≤1)表示在行为博弈中的局中人对自身时间效益的看重程度.通常情况下αi≥0.5,因为绝大多数人更看重自己的利益所得,在此表现为所节省的时间.βi(0≤βi≤1)表示在行为博弈中局中人对对方的体谅程度.θi(0≤θi≤1)表示在行为博弈中的局中人对对方的不信任程度.πi(S1,S2)表示博弈者在此次博弈中的收益,而π-i(S1,S2)表示与之相博弈的对方的收益.PSi为博弈者i作出通行决策的概率.

根据维尔斯特拉斯定理:若集合A={y1,y2,…,yn},其中yi互异,1≤i≤n,且A⊆是一个非空紧集,函数f(x1,x2,…,xn)为连续函数,则f(x1,x2,,…,xn)在集合A上至少有一个最值.易知函数Hi(S1,S2)在定义范围内至少一个最值.

3.2 赢得矩阵优化

考虑实际人车冲突的风险情况,引入风险因子和让行后时间收益构建新的赢得矩阵.假设行人风险因子为σ1,驾驶员的风险因子为σ2,且σ1<0,σ2<0,通常情况下,因行人与车辆发生冲突时,行人风险更大,因此σ1<σ2.假设驾驶员让行后时间收益为c1,行人让行后时间收益为c2,且0

表2 赢得矩阵Tab.2 Win the matrix

3.3 赢得函数

根据人车冲突模型以及赢得矩阵得出4种不同决策下的赢得函数:

1) 行人通行,驾驶员通行

H1(a1,b1)=α1σ1+(1-α1)σ2-β1(σ1-σ2)+θ1×0

(6)

H2(a1,b1)=α2σ2+(1-α2)σ1-β2×0+θ2(σ2-σ1)

(7)

2) 行人通行,驾驶员不通行

H1(a1,b2)=α1T1+(1-α1)c1-β1(T1-c1)+θ1×0

(8)

H2(a1,b2)=α2c1+(1-α2)T1-β2×0+θ2(c1-T1)

(9)

3) 行人不通行,驾驶员通行

H1(a2,b1)=α1c2+(1-α1)T2-β1×0+θ1(c2-T2)

(10)

H2(a2,b1)=α2T2+(1-α2)c2-β2(T2-c2)+θ2×0

(11)

4) 行人不通行,驾驶员不通行

H1(a2,b2)=α1t1+(1-α1)t2-β1(t1-t2)+θ1×0

(12)

H2(a2,b2)=α2t2+(1-α2)t1-β2×0+θ2(t2-t1)

(13)

4 行人与机动车不完全理性下博弈社会最优分析

4.1 社会最优局建立

随着礼让行人政策的推广,若要达到社会最优,则需驾驶员礼让行人优先通过.考虑交通效率,在驾驶员礼让的同时,行人需充分信任驾驶员直接过街.形成此策略局时效益最佳,此时保证行人满足式(14),驾驶员需满足式(15):

(14)

(15)

4.2 社会最优分析

分析上述不等式以及数值模拟结果可得出:

1) 对于行人来说,当行人在一定程度上能体谅和信任驾驶员,并且通行风险降低后,行人将首先顺利通行,该博弈将达到社会最优局势.

2) 对于驾驶员来说,当驾驶员能更多程度地体谅行人,加大在有行人过街时驾驶员不礼让行人的惩罚力度,驾驶员将为行人让行,稍后通过路段冲突区,无需反复进行博弈决策,依然能达到社会最优局势.

3) 当α1=α2=1,β1=β2=θ1=θ2=0时,该模型将变为混合策略Nash均衡.

5 倾向调查与数值模拟分析

5.1 行人-驾驶员让行倾向调查与数值模拟

本文采取意向调查(Stated Preference,SP)方式获取行人驾驶员的让行倾向.行人、驾驶员倾向反映了行人、驾驶员长期形成的稳定通行选择,不同特质的行人驾驶员在行为决策中存在差异性.问卷内容包含行人、驾驶员让行倾向、对自我的利益看重程度、对对方的信任程度以及体谅程度.为量化上述不同心理因素,将每类心理因素划分为0~1的10个等级.针对行人、驾驶员分别设置不同让行倾向问卷,对双方在通行过程中不同倾向进行调查.问卷内容设置遵循合理性、逻辑性、准确性和简明性原则.问卷涵盖不同年龄、学历、职业、性别,符合问卷设计规范.

5.2 让行意愿分析

5.2.1 行人-驾驶员让行倾向对比分析

让行倾向在一定程度上反映了行人-驾驶员在无信号控制路段长期形成的稳定行为选择.本次调查共发出问卷700份,收回行人让行倾向有效问卷347份,驾驶员让行倾向有效问卷289份.根据调查数据得出行人-驾驶员让行意愿频率分布及数据拟合图,如图3所示,可得出:

图3 行人-驾驶员不同让行意愿频率分布Fig.3 Frequency distribution of pedestrian - driver different willingness to yield

1) 蓝色为行人让行倾向,橙色表示驾驶员让行倾向.不同颜色线段为不同让行意愿频率拟合Gaussian分布曲线.可以看出,行人、驾驶员让行意愿基本呈高斯分布,行人让行概率分布右偏、驾驶人让行概率左偏,说明随着车让人政策的实施与推广,行人在无信号控制路段对驾驶员让行期望较高,驾驶员主动避让行人意识提高,驾驶员让行意愿普遍高于行人,说明采集数据符合统计规律.

2) 行人让行意愿峰高为71,让行意愿集中分布于0.6±0.1,让行意愿为0.5以上的数据共179组,占据调查到总数据的51.3%.驾驶员让行意愿峰高为74,让行意愿集中分布于0.8±0.1,让行意愿为0.5以上的数据共有219组,占据调查到总数据的75.8%.说明在实际行人过街交通博弈过程中,行人属于弱势交通群体,虽有行人优先政策,但出于自我保护等机制,部分行人仍会主动让行,结果符合实际交通人车博弈情况,验证统计结果的有效性.

5.2.2 行人-驾驶员让行心理影响因素对比分析

对影响行人、驾驶员通行决策的3个心理因素进行调查,分为对自身时间看重程度、对对方的信任程度以及体谅程度.根据调查数据得出行人让行意愿-个性图,如图4(a)所示.驾驶员让行意愿-个性图如图4(b)所示.

1) 图4中蓝色代表让行意愿,橙色代表对自身时间的看重程度,绿色代表对对方的不信任程度,红色代表对对方的体谅程度.不同颜色线段为不同心理因素频率拟合Gaussian分布曲线,可以看出行人、驾驶员不同心理程度基本呈高斯分布,说明采集数据符合统计规律.整体来看,行人与驾驶员在对自身时间看重程度与对对方的体谅程度上基本一致.行人、驾驶员对自身时间的看重程度集中分布于0.7±0.1,对对方的体谅程度集中于0.5±0.1,可见大部分非完全理性人都更看重自己的利益,不管是行人还是驾驶员,对对方的体谅度的一致性,说明让行意愿还需考虑政策倾向、社会偏好、个体特质等因素.

2) 对比图4(a)和(b)可得,行人、驾驶员在对对方的信任程度上差距较大,体现为:行人对对方的不信任程度集中分布于0.5±0.1,而驾驶员对行人的不信任程度集中分布于0.7±0.1的区间.说明随着社会的发展,针对驾驶员的规章制度逐步细化,增强了对驾驶员的管理、惩罚;行人在过街过程中逐步提高了对驾驶员的信任程度,敢于优先通行,驾驶员则在驾驶经验的提升中降低了对行人让行的信任程度.

(a)行人 (b)驾驶员图4 行人、驾驶员让行心理影响因素分布图Fig.4 Distribution of psychological factors influencing pedestrians and drivers to yield

5.2.3 心理因素统计描述

将行人、驾驶员让行意愿按从小到大的顺序进行排列,并对样本进行编号(1~N),N为样本量,随后根据其顺序进行让行意愿、心理因素线性拟合,寻找让行意愿与不同心理因素的关系,发现符合模型假设.线性拟合式如公式(17)所示,参数拟合结果如表3所示:

表3 行人、驾驶员让行意愿-心理因素拟合结果Tab.3 Pedestrian and driver willingness to yield - fitting results of psychological factors

P=Cα1+Dβ1+Eθ1+F

(17)

为进一步讨论让行意愿与不同心理因素之间的规律,绘制出让行意愿、心理因素散点图,如图5所示.在实际交通环境下,每一位交通参与者具有异质性,但宏观来看,随着不完全理性的行人、驾驶员对对方的不信任程度以及体谅程度不断增高,对自身时间看重程度的降低,相对应让行意愿不断提高.但是驾驶员相对于行人来说,受到对对方的不信任程度的影响较大.

(a)行人 (b)驾驶员图5 让行意愿-心理因素统计Fig.5 Willingness to relinquish - statistics of psychological factors

在无信号控制路段,行人、驾驶员通行决策经历“感知-判断-反应”3个层级,双方在感知的基础上,与自身偏好相结合作出判断决策.进一步说明,新实施的车让人政策法规对“交通环境”产生了巨大影响,从行人被迫等待车辆通行后伺机通行变为了驾驶员主动让行.

5.2.4 数值模拟分析

传统博弈模型数值模拟存在设置参数较为主观的弊端,本文在调查分析特性后设置初始数值以及数值走向趋势将更具科学性.依据行人-驾驶员让行倾向调查得到的结论,利用MATLAB对模型进行数值模拟,分析模型中6个参数敏感度α1、α2、β1、β2、θ1、θ2对社会最优局的影响.为了便于计算,数值模拟中作出如下假设:

1) 在倾向调查中发现,驾驶员与行人对自身时间效益的看重程度基本相似,且行人、驾驶员均看重个人所得,因此设置初始参数大于0.5,即α1=α2≥ 0.5;

2) 在倾向调查中发现,驾驶员与行人对对方的体谅程度基本相似,且体谅程度较低,因此设置参数从0.1开始,即初始β1=β2= 0.1;

3) 在倾向调查中发现,驾驶员对行人不信任程度大于行人对驾驶员的不信任程度,即θ1>θ2.

本文设置初始值为:α1=α2= 0.5,β1=β2= 0.1,θ1=1,θ2=0.9,c1=10,T1=20.在分析α1、α2、β1、β2、θ1、θ2参数敏感度变化对最优局影响时,其他参数赋值不变.

6个参数敏感度对最优局的模拟结果如表4所示,从表中的数据可以得出以下结论:

表4 参数敏感度模拟结果Tab.4 Simulation results of parameter sensitivity

1) 将2~4行与第一行对比可以看出:在其他参数不变的情况下,随着α1、α2的增加,即行人与驾驶员对自身时间效益看重程度的增加,行人的收益将逐渐增加,驾驶员的收益将逐渐降低;

2) 从5~7行可以看出:在其他参数不变的情况下,随着β1、β2的减小,即行人与驾驶员对对方的体谅程度的减小,行人收益逐渐增大,驾驶员收益不变;

3) 从8~0行可以看出:在其他参数不变的情况下,随着θ1、θ2的减小,即行人与驾驶员对对方的不信任程度的减小,行人收益不变,驾驶员收益逐渐增大.

在无信号控制路段,人车冲突成为降低道路通行能力以及事故的主要原因.在双方过街的博弈中,行人、驾驶员自身收益大小成为是否通行的主要原因.根据研究得出,行人驾驶员收益受到多方面的影响.结合以上分析,提出以下几个建议:

1) 在路测加装识别监控设备,电子识别并曝光驾驶员不礼让行人行为,一方面通过罚款扣分的形式强制规范驾驶员行为,另一方面通过社会道德约束交通参与者的行为;

2) 在较宽路段设置安全岛,保障行人多次过街的安全性,有助于行人安全过街;

3) 加强交通安全宣传,强化道路参与者安全教育,引导形成车让人的意识.

6 结论与展望

在现有博弈模型基础上引入3个心理表征参数,考虑彼此选择对对方收益的影响,提出了在无信号控制路段不完全理性下的人车冲突博弈模型,得出4种决策局的不同收益,分析“车让人”的社会最优策略局.结合行人-驾驶员让行倾向调查进行数值模拟,模型与调查结果基本吻合,具有相似的趋势.

研究结果表明,行人驾驶员双方在对个人利益看重程度以及对对方的体谅程度上基本相似,但在信任程度上驾驶员对行人让行的信任程度低于行人对驾驶员让行的信任程度.同时,发现在新规则的影响下,在无信号控制路段,人车发生冲突时让行状态从“行人避让车辆”变为“驾驶员主动礼让行人”,说明该政策执行后起到了管制作用.为使驾驶员能主动为行人让行,行人更多地信任驾驶员,可将交通法规教育与硬性管控惩罚手段相结合,提高驾驶员、行人的安全意识,增强驾驶员抢行时的惩罚力度,从而提高道路的通行效率.

文中建立的模型以及分析结果可为无信号控制路段的管控提供参考,但本文选取的3个参数具有一定的局限性,后续需收集大量数据分析,筛选出更主要的心理参数,并标定出不同主观概率所占权重.在无信号控制路段,行人驾驶员过街可能存在多次博弈的情况,因此还需考虑双方在过街时的学习、认知以及不断适应的过程,从而建立认知层次模型.为进一步探究政策诱导效果,可结合不同政策规划下的惩罚力度,建立集主观意识-客观诱导于一体的博弈决策模型.

猜你喜欢

人车行人意愿
健全机制增强农产品合格证开证意愿
毒舌出没,行人避让
“人车合一的体验很奇妙”
汪涛:购房意愿走弱是否会拖累房地产销售大跌
平巷人车连杆式自动连接装置的设计应用
基于“人车互等”智能公交站台的创新研究
路不为寻找者而设
我是行人
曝光闯红灯行人值得借鉴
An Analysis on Deep—structure Language Problems in Chinese