基于博弈论的强行变道处罚及举报奖励对交叉口交通状况的改善
2018-07-30王晶
王晶
(北京城建设计发展集团有限公司 济南分院,山东 济南 250101)
一般来说,系统最优是交通管理者希望达到的一种均衡状态,交通管理者制定诱导策略往往是基于系统最优准则[1-3]。在不考虑诱导的情形下,城市交通车辆在大多数情况下都处于非合作博弈的境地[4-6],每个“博弈者”为了自身收益最大化,不惜做出一些违反秩序的事情,从而达到纳什均衡[7],而非社会总收益最大化(交通流高效运行,社会交通总等待时间最小)。出于对社会总收益的考虑,应使交通流更高效率地运行,节省驾驶人的驾驶时间[8-9],首要措施是完善与强行变道相关的交通法律法规。目前,由于与强行变道相关的交通法规比较模糊,导致实际交通执法过程中没有明确的处罚标准[10]。本文运用博弈论的方法分析强行变道对交叉口交通的影响,引入强行变道经济处罚与举报奖励,对车辆强行变道的经济处罚措施对交叉口交通的改善进行效果分析。
1 问题分析与假设
路网车辆可以分为两类:一类是参与强行变道过程的车辆,包括强行变道车辆和目标车道后车,为了分析和描述的方便,定义强行变道车辆(车辆C)与其目标车道后车(车辆D1)这一组合为强行变道“基本单位”(以下简称“基本单位”);另一类是未参与强行变道博弈的车辆,称为普通车辆。实际的交通运行过程参与者可以理解为由若干强行变道车辆和若干普通车辆组成。在该情境下,由于普通车辆按照秩序排队等待,可以认为其对交通的影响忽略不计,只选择强行变道车辆进行分析。
强行变道车辆强行变道失败时,其表征现象仅仅为在本车道停留时间较长[11-12],若对此时的强行变道车辆进行经济处罚,一方面难以制定处罚标准,另一方面也给交管部门带来管理上的困难。而强行变道成功时,强行变道车辆的行为可以通过交通监控设备发现和记录。
所以,强行变道经济处罚的具体描述为:当强行变道车辆采取强行变道并成功施行时,交管部门即对其采取强行变道处罚。
2 强行变道经济处罚效果评价模型
由于各种原因,车辆未能在具备良好变道条件的可变道区域换道至目标车道,而只能选择在临近交叉口处的可变道区域,采取强行变道措施进入其他方向车道或同方向其他车道[13-16]。因而,强行变道车辆会在运行空间上对目标车辆后车及周边部分车辆进行挤压,迫使目标车辆后车及周边车辆减速或者选择在可变道区域转向其他车道,进而使交通流趋于无序,降低交叉口的通行能力。在强行变道的过程中,由于驾驶人对安全性更为看重,故此时目标车辆后车会采取一定措施来保障自身的安全和行驶权益[17-19]。故本博弈的博弈者(博弈车辆)和策略集为:
1)博弈车辆。强行变道车辆C、目标车道后车D1、强行变道车辆后车D2。
2)策略集。C在有变道需求时,可以选择强行变道、排队等待变道和继续直行3种策略;D1有减速让行和不减速让行2种策略可供选择;D2可以选择绕开C行驶和不绕开C行驶2种策略。
考虑到强行变道车辆的变道需求是不能被忽视的因素,故各博弈车辆在该过程中的交通收益可以从安全性、时间性和变道需求3方面进行考虑[20]。为简化分析,用S、T、R分别代表该地区车辆安全性收益、时间性收益和变道需求收益的平均水平[21],用权重β1、β2、β3分别表示C、D1和D2对S的重要程度,用权重α1、α2、α3表示C、D1和D2对于T的重要程度,在该过程中仅C有变道需求,用权重γ1表示C对于R的重要程度。
在实际生活中:由于发生交通事故除了给驾驶人造成人身伤害与财产损失外,还会给驾驶人带来因事故处理等原因造成的时间延误[22-23],则S>T,C、D1、D2分配给安全性的权重明显大于时间性权重,即βi>αi(i=1,2,3),故βiS>αiT,在同一地区,每个驾驶人分别给予安全性和时间性的权重比相对固定,即βi/αi=d(d为常数)。
2.1 无强行变道处罚时
无强行变道处罚情况下,“基本单位”与D2博弈收益矩阵见表1,每个矩阵内的3项收益分别为C、D1、D2的收益。
表1 无强行变道处罚时“基本单位”与D2博弈收益矩阵
由表1可知:对于C而言,α1T+γ1R>γ1R>-β1S;对于D1而言,α2T>0>-β2S+α2T;对于D2而言,α3T>0>α3T-β3S。因此,为使自身收益最大化,C强行变道、D1让行、D2不绕开D1策略与C排队等待变道、D1不让行、D2不绕开D1策略(表中带阴影部分)是本博弈的纳什均衡点。即:当C采取强行变道策略时,D1会选择让行策略,D2选择不绕开D1;当C采取排队等待变道策略时,D1会选择不让行策略,D2选择不绕开D1。即无论C与D1采取何种策略,车辆D2相较于绕开前车策略会更倾向于选择在C后等待,而D2后的车辆也会面临选择等待或者绕开前车。按照实际情况而言,D2后的车辆若选择绕开C前行,则其面临着要绕开至少两辆车(C、D2)辆的情况,这使得驾驶难度增大,交通收益期望降低,故D2后的车辆更倾向于选择等待。
2.2 加入强行变道处罚时
加入强行变道处罚后,设处罚为Y(Y>0),“基本单位”与D2博弈收益矩阵如表2所示。
由表2可以看出,对于D2而言,α3T>0>α3T-β3S,故D2为追求自身最大收益α3T,当C强行变道时,D2选择不绕开D1的策略优于选择绕开D1的策略,即该情境下D2会选择不绕开D1的策略。
表2 加入强行变道处罚后“基本单位”与D2博弈收益矩阵
加入强行变道经济处罚Y,且Y≥α1T时,结合表2中C的收益,γ1R>α1T+γ1R-Y>-β1S,则C为实现收益最大化,会选择排队等候变道措施,即相较于强行变道策略,C会主动选择排队变道,从而抑制了车辆强行变道行为的发生,降低了交通延误,增大了交通总收益。
2.3 同时加入强行变道处罚和举报奖励
实际生活中,为了更好地记录车辆和邻近车辆的交通行为,车辆一般配备行车记录仪。因此,交通管理部门在制定管理办法时,可以加入对举报强行变道行为的鼓励,由交管部门进行鉴定和处罚,必要时可给予举报人一定的经济奖励。由于行车记录仪具有一定的记录范围,假设只有D1与D2具备记录的能力。在表2所示博弈模型的基础上加入对举报人的奖励,博弈收益矩阵如表3所示,表3中Z为交管部门给予举报人的总奖励,且有Z≤Y,ρ1、ρ2为D1、D2的奖励分配比例。对于ρi(i=1,2)有:当D1、D2均进行举报时,ρ1=0.5;当只有D1举报时,ρ1=1,ρ2=0;当只有D2举报时,ρ1=0,ρ2=1;当D1、D2均不举报时,ρi=0。
表3 加入强行变道处罚和举报奖励后“基本单位”与D2博弈收益矩阵
由表3可以看出:
1)因α3T+ρ2Z>α3T-β3S+ρ2Z,α3T-β3S<0,无论C与D1采取何种策略,D2选择不绕开D1的策略优于绕开D1,即D2会选择不绕开D1的策略。
2)结合表3中C的收益,当Y≥α1T时,有γ1R>α1T+γ1R-Y>-β1S。此时,相较于强行变道策略,C会主动选择排队变道,从而限制了车辆强行变道行为。由于ρ2与C无关,故无论ρ2取何值,C的行为均会受到限制,从而限制了车辆强行变道行为,降低了交通延误,增大了交通总收益。
3)部分地区出于某些原因,其强行变道经济处罚Y<α1T,此时α1T+γ1R-Y>γ1R。由于C与D1均会考虑使自身收益最大化,故需对Z进行进一步讨论:
①当ρ1Z≥α2T时,博弈纳什均衡点唯一,即C强行变道,D1让行,D2不绕开D1,即C会坚定采取强行变道行为,此种情况不符合预期要求;
②当ρ1Z<α2T时,有α2T>ρ1Z>0>-β2S+α2T。此时纳什均衡变为C强行变道,D1让行,D2不绕开D1和C排队变道,D1不让行,D2不绕开D1,即相较于ρ1Z≥α2T的情况,ρ1Z<α2T的情况可以使C强行变道的概率减小。
当设定Z使得ρ1Z远小于α2T时:D1为获取远大于ρ1Z的收益α2T,会更坚定地采取跟驰前车的措施(不让行),不给C变道的空间,此时由于无变道空间,相较于强行变道策略,C会主动选择排队变道,进一步减小了C强行变道概率,从而限制了车辆强行变道行为,降低了交通延误,增大了交通总收益,符合预期的要求。
3 结语
本文运用博弈论的方法分析强行变道对交叉口交通的影响。研究表明:仅加入强行变道处罚,且处罚大于变道车辆的时间性收益时,会有效抑制强行变道行为的发生;同时加入强行变道处罚与举报奖励时,可以在处罚难以达到车辆采取强行变道行为的时间性收益时抑制强行变道行为的发生,从而使交通流运行更加平稳。因此,建议交管部门选择试点进行实施,得出合适的处罚力度,进而规范所在地区交叉口车辆行为,使交通流运行更加平稳有序。