有限理性下民航安保参与方策略演化博弈分析
2021-09-30冯文刚张育玮何晓春
冯文刚, 张育玮, 何晓春
(1.中国人民公安大学 国家安全学院,北京 100038; 2.中国人民公安大学 民航安保研究中心,北京 100038; 3.深圳市公安局 机场分局,广东 深圳 518000)
随着我国综合国力的不断增强。我国民航业发展速度加快。我国民航业自“十三五”规划以来发展迅速,民航运输的旅客运输量年均增长达到10.7%。中国民航运输规模连续15年稳居世界第2位,并逐年缩小与第1位的差距。
安全是民航业的生命线,“十四五”规划对民航业的安全发展提出了更高要求,民航安全的要求越来越高。我国民航公安机关是民航安保工作的管理、检查和监督主体,但民航公安机关在安保工作中长期处于被动应对的状态,主动精准预防和制止民航违法行为的能力较差。民航公安与机场航司等单位也缺乏联动,各类资源的协同效应还没有实现最大化。因此,民航安保工作需在宏观的维度上掌握民航安保工作的作用机制和影响因素,优化民航安保策略,从而让民航公安机关更加充分地履行本身职责。
1 相关研究
当前围绕民航安保的相关研究主要针对犯罪防治、技术应用、安全监管和应急管理等方面。在民航犯罪防治方面,文献[1]分析了我国民航31年来的55例劫机犯罪,归纳出三大劫机犯罪特征,构建出PCC′预防模型;文献[2]探讨了航空犯罪中机上盗窃犯罪侦破困难的问题,提出了机上盗窃问题的针对性侦查方法;文献[3]从4个维度对劫机事件处置及民航安保问题进行了分析和探讨。
在民航安保安全技术应用等方面,文献[4]提出了一种特征级的深度学习方法,得出旅客安检和航班预警模型;文献[5]利用网络爬虫技术爬取微博、朋友圈中针对民航的恐怖威胁信息及信息源,评估微博涉航内容的威胁度并进行预警;文献[6]详述了旅客行为检测在民航领域的应用及其意义;文献[7]设计了一套安检分类决策辅助系统。
在安全监管方面,文献[8]构建了三方博弈模型研究煤炭行业监管问题;文献[9]分析了外卖商家和监管平台间动态交互行为的策略行为;文献[10]构建了消防部门与经营单位的演化博弈模型。
在应急管理方面,文献[11]研究了重大疫情防控中非政府组织与政府的关系,建立了双方演化博弈模型;文献[12]利用演化博弈研究突发公共事件中的中央和地方政府、社会组织与居民三方主体行为策略选择进程;文献[13]为更好地掌握舆情态势,对突发事件中的情绪因素进行了探讨。
上述相关研究对民航公安(警察)的研究较少。演化博弈作为博弈论的重要分支,在多个领域的研究中成果众多,但针对民航安保工作演化博弈的研究很少。本文首先论证了演化博弈论应用在民航安保领域的可行性,然后在前人研究的基础上,采用演化博弈的方法论建立民航安保中相关参与主体的演化博弈模型,对主体的策略选择及演化路径进行研究。
2 模型构建
从演化博弈的视角来看,民航旅客安保过程中始终存在动态变化的行为交互。民航旅客安保的多方主体间是有限理性的,最优策略无法在一次博弈中获得,只能在多次交互中,不断分析对方行为造成的后果,再调整己方策略行为,以实现动态平衡。
2.1 机场航司、民航公安与风险旅客的主体界定
本研究所指的机场即承担旅客运输任务的民用运输机场;航空公司即民航运输企业的法人名称,是从事向旅客提供定期或不定期航班运输服务的企业。本研究所指的民航公安机关是民航局公安机关、机场公安、空中警察等公安机关的统称,风险旅客是指潜在中不确定的可能威胁到民航安全的民航旅客。根据风险程度的高低,可以将民航旅客划分为高风险旅客、中风险旅客及低风险旅客(内部信息)。需要特别指出的是,风险具有客观性,任何旅客在一定程度上都具有一定的风险属性,即使是低风险旅客也有威胁到民航安保的可能性。
2.2 演化博弈模型构建
民航公安的策略选择组合为强打击、弱打击,假设民航公安选择强打击概率为x,选择弱打击概率为1-x。风险旅客作为民航企业的服务对象,民航安保水平的高低与旅客的利益息息相关,但自身的行为对民航的安保同样有很大的影响,需要遵守民航法以及相关的法规。因此,风险旅客的策略选择组合为守法、不守法,假设风险旅客选择守法的概率为y,选择不守法的概率为1-y。机场航司的策略组合为配合、不配合,假设机场航司选择配合的概率为z,选择不配合的概率为1-z。
2.3 演化博弈模型参量设定
2.3.1 民航公安收益参量
设π1为民航公安通过工作能够得到的基本收益;g1为民航公安及时发现风险旅客的违法行为并进行相应处理,能够提高自己的政绩,这部分收益的货币化形式;c1为民航公安选择强打击策略的成本;c2为民航公安选择弱打击策略的成本(c1>c2);假设民航公安在选择强打击策略的情况下,风险旅客的违法行为被发现的概率为1,民航公安选择弱打击策略的情况下,风险旅客的违法行为被发现的概率为α(1>α>0);w为假设机场航司选择配合策略时,若民航公安选择弱打击策略,则会被机场航司方面认为是不作为,降低了政府在企业中的公信力,这部分损失的货币化形式。
2.3.2 风险旅客收益参量
设π2为风险旅客的基本收益;m1为风险旅客不守法的情况下能够获得的额外收益;s为民航公安发现风险旅客进行违法行为时的处罚金额;假设机场航司选择配合策略时,风险旅客的不守法行为若被发现,则会对风险旅客进行一定的惩罚,如禁飞、拉入黑名单等,对旅客的效用减少为d。
2.3.3 机场航司收益参量
设π3为机场航司的基本收益;假设机场航司在配合情形下,能够在一定程度上帮助民航公安更顺利地开展工作,使得民航公安的成本降低h1(c2>h1);h2为当民航公安实行强打击策略时,若机场航司积极配合,则会得到民航公安部门的肯定,这部分收益的货币化形式,反之,若机场航司选择不配合,则会给自己造成一定声誉的损失;h3为风险旅客选择守法时,会给民航业带来安全健康的环境,提升了机场航司的口碑和品牌,这部分收益的货币化形式;c3为机场航司配合的成本;c4为机场航司不配合的成本(c3>c4)。
2.4 支付矩阵构建
根据上述模型的假设情况,可以得出在不同的策略选择情况下,机场航司、民航公安与风险旅客博弈三方的支付矩阵,见表1所列。
表1 机场航司、民航公安、风险旅客三方策略演化博弈模型支付矩阵
2.5 演化博弈均衡分析
根据上述研究,可得出民航公安机关选择强打击策略的期望收益为:
U11′=π1-c1+zh1+(1-y)(g1+s)
(1)
民航公安机关选择弱打击策略的期望收益为:
U12′=π1-c2+z(h1-w)+α(1-y)(g1+s)
(2)
可得民航公安混合策略的平均收益为:
x[π1-c1+zh1+(1-y)(g1+s)]+
(1-x)[π1-c2+z(h1-w)+
α(1-y)(g1+s)]
(2)
因此,可得民航公安选择强打击策略复制动态方程为:
x(1-x)(U11′-U12′)=x(1-x)X
(3)
其中,X=-c1+c2+zw+(1-α)(1-y)(g1+s)。
同理,可得风险旅客选择守法策略复制动态方程为:
y(1-y)(U21′-U22′)=
y(1-y)Y
(4)
其中,Y=-m1+xs+xzd+(1-x)αs+(1-x)zαd。
机场航司选择配合策略复制动态方程为:
z)(U31′-U32′)=z(1-z)Z
(5)
其中,Z=-c3+c4+2xh2。
2.6 演化博弈稳定策略分析
从上述分析可得,当x∈(0,1)时,民航公安的复制动态相位图如图1所示。
图1 民航公安的复制动态相位图
同理可得出风险旅客和机场航司的复制动态相位图。
2.7 演化博弈稳定点分析
由机场航司、民航公安与风险旅客构建的三方群体博弈系统演化,可以用上述(3)~(5)式3个微分方程进行描述。
令G(x)=0、G(y)=0以及G(z)=0,可以得出系统内存在的8个特殊稳定点,分别为:
E1(0,0,0)、E2(0,0,1)、E3(0,1,0)、
E4(1,0,0)、E5(1,1,0)、
E6(1,0,1)、E7(0,1,1)、E8(1,1,1)。
动态系统模型对应的雅克比矩阵为J,本文以(0,0,0)为例,讨论满足系统稳定均衡的条件,计算其对应的雅克比矩阵,计算公式如下:
通过计算可以得出均衡点(0,0,0)所对应雅克比矩阵的特征值为:
λ1=-c1+c2+(1-α)(g1+s),
λ2=-m1+αs,
λ3=-c3+c4。
同理,可以计算其余的7个点对应雅克比矩阵的特征值。通过上述的分析可知,由机场航司、民航公安与风险旅客三方构建的民航安保演化博弈模型中,存在着(0,0,0)、(1,0,0)、(0,1,0)、(1,0,1)以及(1,1,1)5个渐进稳定点。当满足条件-c1+c2+(1-α)(g1+s)<0、-m1+αs<0、-c3+c4<0时,即(g1+s)-c1<α(g1+s)-c2、αs 满足条件-[-c1+c2+(1-α)(g1+s)]<0,-m1+s<0且-c3+c4+2h3<0,即(g1+s)-c1>α(g1+s)-c2、s 当满足-c1+c2<0、-(-m1+αs)<0、-c3+c4<0时,即c2 当满足条件-[-c1+c2+w+(1-α)(g1+s)]<0、-m1+s+d<0、-(-c3+c4+2h2)<0时,即(g1+s)-c1>α(g1+s)-c2、s+d 当满足-[-c1+c2+w]<0、-(-m1+s+d)<0、-(-c3+c4+2h2)<0,即w>c1-c2、s+d>m1、2h2>c3-c4时,均衡点(1,1,1)是模型的渐进稳定点。该结果表明,当机场航空公司选择配合的情况下,若民航公安选择弱打击策略时,在企业中降低的公信力所造成的损失高于选择强打击策略下所花费的额外成本(强打击策略下的成本减去弱打击策略下的成本)时,从成本角度考虑,民航公安会选择强打击策略;当风险旅客通过不守法所获得收益小于民航公安以及机场航空公司对其惩罚所造成损失时,风险旅客会选择守法策略;在民航公安选择强打击策略下,机场航空公司选择配合策略下所获得声誉效用高于配合策略下所花费额外成本(配合策略下的成本减去不配合策略下的成本),此时机场航空公司会选择配合策略。在这种情形下,系统的稳定状态最终会收敛于强打击、守法、配合。 下面以情形1为例,情形1下的参数赋值数据满足条件-c1+c2+(1-α)(g1+s)<0、-m1+αs<0、-c3+c4<0,随机选取50组民航公安、风险旅客、机场航司的初始策略值,运行时间为10个时间步长,博弈三方从不同的初始概率起点出发,经历了不同变化趋势路线,结果如图2所示。 图2 情形1下的系统稳定状态 图2结果表明,无论民航公安、风险旅客以及机场航司三者的初始策略选择大小如何,经过一段时间的博弈,系统最终的稳定均衡结果都为(0,0,0),即民航公安选择弱打击策略,风险旅客选择不守法策略,机场航司选择不配合策略。仿真结果验证了上述情形1条件下的分析。 对(0,0,0)、(1,0,0)、(1,0,1)、(0,1,0)、(1,1,1)5个稳定结果进一步研究探讨。对于民航业而言,保证其安全稳定运行是至关重要的,而在(0,0,0)这个稳定结果中,风险旅客选择不守法策略,而民航公安和机场航空公司在此种情形下却是选择无作为、少作为,这会使得民航安保成为一个重大隐患问题,对于社会而言显然不是一个好的结果。对于稳定结果(1,0,0),此时民航公安非常重视民航安保问题,重点打击违法行为,但风险旅客仍然实行违法行为,而作为维护民航业安全的重要博弈方机场航司却选择不配合,这并不是期望的结果。在结果(1,0,1)中,民航公安强打击,机场航空公司配合,风险旅客仍然不守法,民航公安和航空公司花费了大量的人力物力,却仍然无法制止风险旅客不守法,此时风险旅客因违法的高收益而采取铤而走险的行为,这是一个比较差的结果。对于(0,1,0)而言,在民航公安选择弱打击策略以及机场航空公司不配合情形下,风险旅客选择守法策略,从理论上讲这是一个很理想的状态,既节约了社会成本,又维护了民航业的安全稳定运行;然而从现实经济生活来看,如果政府和社会企业组织采取宽松政策,不作为,少作为,不加强社会秩序管理,会助长民众违法乱纪的风气。对于结果(1,1,1)而言,民航公安选择强打击,风险旅客选择守法,机场航空公司选择配合,这是一个相对理想并且也是符合我国现实社会经济生活发展的结果。民航公安通过加强民航安保的管理,对违法行为进行强打击,而机场航空公司也担负着自己的责任,双方各司其职,发挥各自的优势,可以保证民航业的安全稳定发展;给予风险旅客畏惧感,提高了风险旅客的犯罪成本,使得风险旅客会选择守法行为。并且通过满足该稳定点的数学公式条件可以看出,(1,1,1)是一个比较容易达到的稳定状态,只要民航公安和机场航司重视安保问题,加强奖惩力度,就可促使风险旅客选择守法策略。 取x0,y0,z0∈Ω(0.1,0.5,0.9)分别表示民航安保领域中民航公安进行强打击策略的初始意愿、风险旅客选择守法行为的初始意愿、机场航司选择配合策略初始意愿的低、中、高水平。 3.2.1 不同初始意愿对民航公安策略演化影响 博弈三方初始策略点不同对民航公安的行为策略演化影响如图3所示。 图3 z0=0.5,初始策略点不同对民航公安策略演化影响 民航公安进行强打击策略的初始意愿、机场航司选择配合策略初始意愿的提高,均有助于民航公安的行为决策向强打击方向演化的速率加快,而风险旅客选择配合策略初始意愿越高,民航公安的行为决策向强打击方向演化的速率越慢。这是由于当机场航司配合民航公安进行安保工作时,会为其提供便利,使得工作更好地开展,因此机场航司配合的初始概率越高,民航公安也更倾向于选择强打击策略;而当风险旅客选择守法行为的初始策略越低时,会增加民航公安的危机感,促使民航公安更倾向于选择强打击策略。 3.2.2 不同初始意愿对风险旅客策略演化影响 博弈三方初始策略点不同对风险旅客的行为策略演化影响如图4所示,民航公安进行强打击策略的初始意愿、机场航司选择配合策略初始意愿的提高,均有助于风险旅客的行为决策向守法方向演化的速率加快,风险旅客选择配合策略初始意愿对自身的演化速率却有所不同。当民航公安和机场航司都重视民航安保问题,加强工作管理时,风险旅客选择违法的风险更大,会更倾向于选择守法策略。而当民航公安、机场航司的初始意愿处于低水平(x0=0.2,z0=0.2)时,风险旅客选择守法的初始意愿越高,最终趋于守法行为策略的演化速率却会越慢。这是由于当民航公安和机场航司初始策略概率较低时,会使得处于高度戒备的风险旅客(y0≥0.5)放松警惕,最终趋于守法方向的速率变慢。 图4 z0=0.5,初始策略点不同对风险旅客策略演化影响 3.2.3 不同初始意愿对机场航司策略演化影响 博弈三方初始策略点不同对机场航司的行为策略演化影响如图5所示。 图5 y0=0.5,初始策略点不同对机场航司策略演化影响 民航公安进行强打击策略的初始意愿、机场航司自身选择配合策略初始意愿的提高,均有助于机场航司的行为决策向配合方向演化的速率加快,而风险旅客选择守法策略的初始意愿越高,机场航司的行为决策向配合方向演化的速率越慢。这是由于机场航司与民航公安合作进行安保工作使得工作更有效率地开展,因此民航公安和机场航司的初始概率越高,机场航司趋于配合的速率也越快;而当风险旅客选择守法行为的初始策略越高时,会使得机场航司放松警惕,因此趋于配合方向演化的速率越低。 由图5可知,为了更好地解决民航安保问题,使得风险旅客进行守法行为,就要提高民航公安向强打击策略行为以及机场航空公司向配合策略行为的初始意愿水平,而如果有一方不重视安保问题,放松了安保工作的警惕性,那么就会增大风险旅客的侥幸心理。 3.3.1 强打击成本c1对演化博弈影响 c1变化对民航安保三方行为策略影响如图6所示,当c1增大时,模型的稳定策略由(1,1,1,)向(0,0,0)方向演化。当c1较小时,民航公安向强打击策略方向演化,风险旅客向守法方向演化,机场航司向配合方向演化,并最终趋于稳定状态,且c1越小,民航公安趋于强打击策略方向演化的速率越快。当民航公安选择强打击所花费的成本较小时,其有较大的动力去加强民航业的安全管理。而当强打击成本c1较大时,会使得民航公安采取弱打击策略,风险旅客采取不守法策略,机场航司采取不配合策略,系统无法达到理想的结果。 图6 c1变化对民航安保三方行为策略影响 c1变化对风险旅客行为策略影响如图7所示,当c1处于较低水平时,风险旅客向守法策略方向演化,当c1较高时,风险旅客向不守法策略方向演化,且c1越小,风险旅客趋于守法策略方向演化的速率越快。这是由于当民航公安采取强打击策略的成本越大时,会倾向于选择弱打击策略,此时风险旅客采取不守法策略不容易被发现,会抱有侥幸心理去实行违法行为,c1变化对机场航司行为策略影响如图8所示。当c1处于较低水平时,机场航司向配合策略方向演化,当c1较高时,机场航司向不配合策略方向演化,且c1越小,机场航司趋于配合策略方向演化的速率越快。这是由于当民航公安采取强打击策略的成本越小时,民航公安会更倾向于选择强打击策略,此时如果机场航司不配合民航公安,那么会对自身造成一定的损失。 图7 c1变化对风险旅客行为策略影响 图8 c1变化对机场航司行为策略影响 3.3.2 不守法额外收益m1对演化博弈影响 m1变化对民航安保系统三方行为策略影响如图9所示。 图9 m1变化对民航安保系统三方行为策略影响 当m1增大时,模型的稳定策略点由(1,1,1)向(1,0,1)方向演化。当风险旅客通过不守法行为所获得额外收益较小时,民航公安向强打击策略方向演化,风险旅客向守法方向演化,机场航司向配合方向演化,并最终趋于稳定状态。当风险旅客通过不守法行为所获得额外收益较大时,民航公安和机场航司的演化方向不变,而风险旅客则由守法行为策略向不守法行为策略转变。m1在增大过程中,民航公安的演化方向都是趋于强打击,m1越大,民航公安向强打击方向演化的速率越快。这是由于当风险旅客能够通过不守法行为策略获得更高的额外收益时,会更大概率实行违法行为,此时民航公安会加大打击力度。 m1变化对风险旅客行为策略影响如图10所示,当m1处于较低水平时,风险旅客向守法策略方向演化,当m1较高时,风险旅客向不守法策略方向演化,并且m1越小,风险旅客趋于守法策略方向演化的速率越快。很明显,当风险旅客通过不守法策略会获得更高的额外收益时,其肯定会偏向于实行违法行为。 图10 m1变化对风险旅客行为策略影响 m1变化对机场航司行为策略影响如图11所示。 图11 m1变化对机场航司行为策略影响 m1在变化过程中,机场航司的演化方向都是趋于配合,且m1越大,机场航司向配合方向演化的速率越快。这是由于当风险旅客通过不守法能够获得很高的收益时,风险旅客会实行违法行为,对机场航司的声誉会造成不利的影响,机场航司会更主动与民航公安进行合作。 民航业的健康发展离不开政府机构和企业的协同合作,在现实生活中,民航业的可持续健康发展需要各方共同努力。政府对于选择强打击策略的公安机关需要给予更多政策支持,并且要采取打击措施降低风险旅客不守法所获得的收益等,同时机场航司需要更加配合公安机关行动,社会各方协同合作才能促使民航业更好发展。3 演化模型的模拟仿真和分析
3.1 不同情形下的稳定性结果仿真分析
3.2 三方参与主体初始意愿不同影响仿真分析
3.3 系统主要参数变化的影响仿真分析
4 结 论