APP下载

一种基于信号博弈的智慧城市智能安全管理模型

2022-04-29霍程程黎忠凯齐向伟

关键词:攻击者收益损失

霍程程,黎忠凯,齐向伟

(新疆师范大学 计算机科学技术学院,新疆 乌鲁木齐 830054)

在当前智慧城市建设推进过程中,伴随着各类危安事件、暴力犯罪事件、生态安全等安全问题[1],城市公共安全管理面临严峻挑战。突发安全事件具有随机性高、活动目标小、不可预知等非常规特征,无法及时、准确地预测事件发生的时间、地点。因此,研究安防部门与攻击者在不同情报信息下的战略决策十分有必要,这有利于提升城市公共安全预警防控能力,为实现智慧城市公共安全提供有效保障。

国内外有关社会安全问题的研究视角包括基于博弈论建模角度[2-10]、安全设施选址角度[11-16]、应急资源调配及路径规划角度[17-22]以及复杂网络规划建模角度[23-26]。其中,在博弈论建模角度,Zhuang 等人[9-11]分析了犯罪分子行动与政府防御措施互动行为之间的相互影响;Kyle Hunt[8]研究了单阶段防御攻击模型下,机场安防策略选取问题;王震等人[7]从算法可扩展性、算法鲁棒性、实际应用等多个方面介绍了安全博弈论,并提出未来的发展方向。

综上所述,现有文献研究了设施选址、路径规划、资源调配等城市安防策略的仿真优化问题,也强调了博弈论算法在社会安全领域中的重要性。但从信号博弈理论角度分析安防部门与袭击者在不同信号策略条件下的战略选择,以及对双方策略选择的影响因素进行定量分析方面的研究较少。文章考虑安防部门与袭击者之间的情报状态,以动态信号博弈为基础,构建安防部门与袭击者之间的攻防信号博弈模型,讨论在安防部门在防御信息公开、隐藏的情况下博弈双方的策略选择,并通过数值分析法对均衡解进行稳定性分析。

1 基于安防信号的博弈模型的构建与收益分析

1.1 安防信号博弈模型描述与分析

安全领域主要涉及安防部门与袭击者之间的博弈,文章构建了具有信号隐藏机制的非合作动态信号博弈模型,相关组成要素如下:

参与者集合N ≡(D,A),参与人D代表安防部门即信号发送方,A代表攻击者即信号接收方。

安防部门的行动策略I ≡(id,1 - id),即选择是否花费更高的资金采用新技术实行高等防御;根据安防部的行动策略定义他的类型空间,θ ∈(θ1,θ2),θ1实行高等防御,θ2实行一般防御。

信号策略:sd∈(D,S),sd= D,安防部门通过公共信息平台向公众发布有关防御技术采用及其部署的详细信息;sd= S,安防部门对防御策略实行保密信号策略,公众无法通过有效途径获取相关防御信息。

攻击者的行动策略集,Ia∈(ia,1 - ia),ia攻击者选择攻击行动,1 - ia攻击者选择不攻击。

安防部门和攻击者的收益函数集合,U =(UA,UD),表示参与者的博弈收益,由博弈双方的策略共同决定。

安防部门与攻击者的博弈过程见图1。安防部门是博弈的先行者,首先选择信号策略,如果安防部选择公开防御信号策略,那么博弈按顺序博弈进行分析求解。安防部门选择投入较高资金进行高等防御或者进行一般防御,攻击者根据公开的情报信息选择其攻击策略。如果安防部门实行信号隐藏策略,博弈双方在采取行动时不知道对方的决定,此时子博弈为同时进行博弈。博弈中,攻击者成功攻击的概率取决于安防部门的防御策略。

图1 安防部门与攻击者的信号博弈树

文章模型相关参数定义见表1,当安防部门实行高等防御时,攻击者成功攻击的概率用p表示,当安防部门选择一般防御时,攻击者成功攻击的概率用q表示。文章假设,攻击者在安防部门进行高等防御时的攻击成功率低于安防部实行一般防御时的攻击成功率,即p<q.安防部门防御成本包括信号策略成本和防御技术成本,假设安防部门选择公开信息的信号策略成本为0,实行保密信号策略的成本为c3,安防部实行高等防御的成本为c1,实行一般防御的成本为c2,且c2<c1.攻击者进行攻击时的成本为c4.如果攻击者攻击成功,安防部遭受的损失评估为vd,攻击者获得的损失评估为va.同时将安防部的反击收益纳入博弈双方收益的计算中,实际攻击行动中,无论安防部门能否成功抵御攻击,都可以通过反击行动获得收益。

表1 相关参数、符号、函数表示

1.2 博弈双方收益分析

根据博弈树(图1)以及相关参数变量的定义(表1),文章得出不同情况下安防部门与攻击者的收益(表2)。博弈双方的行动策略在文章中用三维向量表示,D 代表安防部门实行公开防御信息信号策略,S表示安防部门实施信号隐藏策略;h代表安防部门实行高等防御行动策略,g代表安防部实施一般防御行动策略;w表示攻击者攻击成功,f表示攻击者攻击失败,n表示攻击者不攻击。

表2 安防部门与攻击分子不同博弈结果下的收益

2 公开信号策略下博弈模型均衡求解与分析

本节中,安防部门选择公开相关防御信息,攻击者进行攻击行动时可以通过安防部门的信号获得部分信息。安防部门的目标是在公开防御信号策略下,选择相应的防御技术(实行高等防御或一般防御)以最大化其预期收益。

2.1 博弈均衡的定义与分析

攻击者的目标是通过实行攻击或不攻击行动策略获得最大预期效用。博弈双方的最大预期收益如下:

攻击者的最佳响应定义,

攻击者的最佳响应函数:攻击者的最佳响应函数是获得其最优策略,以最大化其对安防部门选择的策略(高等防御或一般防御)的预期效用。

根据逆向归纳法,文章计算出公开信息信号策略下的完美纳什均衡解以及博弈双方的最佳预期效用,是安防部门和攻击者的采取均衡行动时的均衡收益(表3)。

表3 公开信息信号策略博弈的均衡解

安防部门和攻击者有四种可能的纳什均衡策略(表3),且均衡策略皆为纯策略纳什均衡。在第一、二种情况下,安防部门选择高等防御,攻击者的策略为攻击、不攻击。在三、四情况下安防部门选择一般防御措施,攻击者有攻击、不攻击两种策略选择。攻击者攻击时的收益与攻击成功的概率、攻击成本、安防部门的反击收益相关。

2.2 信号博弈均衡解的稳定性分析

本节研究在安防部门公开披露防御信息情况下,博弈双方的均衡策略关于相关参数的稳定关系。c1、c4、vd、va等相关参数值经过官方报告和相关文献分析得出[8,27-31]。高等防御成本c1= 450、一般防御成本c2=200、隐藏信号策略成本c3= 120、攻击成本c4= 65、反击收益k = 30、安防部门损失评估vd= 8000、攻击者损失评估va= 420、高等防御时攻击成功的概率p = 0.16、一般防御攻击成功的概率q = 0.32.城市公共安全损失评估包括基础设施相关物质损失、经济损失以及人员伤亡损失,大多数攻击者的目的是造成人员伤亡,而袭击后安防部不仅承担人员伤亡损失,还承担物质损失、交通中断、灾后重建的经济损失等,故在文章中假设va是远远小于vd的。

2.2.1 防御成本c1、c2、攻击成本c4、反击收益k对博弈双方均衡策略的影响

图2 表明在高等防御成本变化的条件下存在两种博弈均衡策略。在防御成本不高的情况下,存在安防部门实行高等防御且攻击者不攻击的情况。但是随着高等防御成本不断增加,达到较高数值时,安防部门无法承担高昂的防御费用,此时安防部门实行一般防御策略,攻击者冒险攻击,获得收益。

图2 高等防御的成本对均衡策略的影响

图3表明一般防御成本对博弈双方均衡策略的影响。在这种情况下,理论上存在两种均衡策略(高等防御,不攻击)(一般防御,攻击)。文章从安防部门的收益角度进行分析,由于在一般防御情况下,攻击者进行攻击,此时安防部门的损失远远大于实行高等防御的成本花费,所以安防部门选择实行高等防御策略威慑攻击者放弃攻击,从而降低损失。

图3 一般防御成本对均衡策略的影响

图4 表明攻击者攻击成本的变化对博弈双方均衡策略的影响。当攻击者的攻击成本较低时,存在安防部门实行高等防御,攻击者进行攻击的情况。随着攻击成本不断增加,攻击者的策略开始变化,出现攻击者不攻击,安防部门依然实行高等防御的情况。当攻击成本大于150 时,攻击者必须付出高昂的攻击成本,为了最大化其预期效用,攻击者选择放弃攻击,此时安防部门决定采用成本较低的一般防御进行城市安防。

图4 攻击者的攻击成本对策略的影响

图5 表明安防部门的反击收益对博弈双方策略的影响。当反击力度较小时,存在安防部门实行高等防御,攻击者进行攻击的情况。随着反向打击力度增强,反击收益增加,攻击者逐渐改变其攻击策略,放弃攻击,此时安防部门仍然实行高等防御策略。当反击收益上升到一定程度时,鉴于攻击者不会付出昂贵的代价进行攻击,安防部门由高等防御转换为一般防御策略。实际情况下,安防部门可以利用相关新技术进行反向追踪,对攻击者进行打击、跟踪,从而起到威慑作用。

图5 安防部门的反击收益对策略的影响

2.2.2 攻击者与安防部门的损失评估va、vd,攻击成功的概率q、p

图6 反映了攻击者的损失评估对博弈双方策略的影响。在攻击者的损失评估较小时,对攻击者的诱惑力较小,存在攻击者不攻击,政府实行一般防御的情况。随着攻击者损失评估增加,攻击者依然保持不攻击的战略,此时安防部门改变其防御策略,由一般防御转变为高等防御。当攻击者的损失评估值大于600 时,攻击者决定攻击,安防部门维持其高等防御策略。

图6 攻击者的评估损失对均衡策略的影响

图7 反映了安防部门的损失评估对博弈双方策略的影响。在损失评估较低时,存在安防部门实行一般防御策略,攻击者进行攻击的情况。随着安防部门损失评估增加,博弈双方策略均发生变化,政府开始实行高等防御,攻击者放弃攻击,证明安防部门实行高等防御对攻击者有一定震慑作用。

图7 安防部损失评估对均衡策略的影响

图8 反映了一般防御下成功攻击的概率对博弈双方策略的影响。当攻击成功的概率较低时,攻击者不会承担较大的失败风险进行攻击,安防部门选择花费较少的资金进行一般防御,存在安防部门采用一般防御,攻击者不攻击的均衡策略。随着攻击成功的概率逐渐增加,安防部门改变防御策略进行高等防御,攻击者保持其不攻击状态。

图8 攻击成功概率q对均衡策略的影响

图9 反映了高等防御时攻击成功的概率和博弈双方收益的影响。在概率较低的情况下,攻击者放弃攻击,安防部门实行高等防御。随着概率的增加存在安防部门采用高等防御而攻击者进行冒险攻击的情况。图中表示当攻击成功的概率增加到一定程度时,博弈双方的战略均发生变化。由于实行高等防御策略时,攻击者成功攻击的概率依然很大,所以安防部门选择花费较小的一般防御,此时成功攻击的诱惑力较大,攻击者选择攻击获取最大期望收益。但实际生活中,安防部门不会因为攻击成功概率高而放弃花费更高的资金进行防御,攻击者进行攻击时不会获得期望中的收益。

图9 攻击成功概率p对均衡策略的影响

通过以上分析,得出安防部门可以通过高等防御对攻击者进行威慑,从而降低攻击成功的概率甚至使攻击者放弃攻击。但是在攻击成本较低、攻击成功概率高的条件下,攻击者依然会选择冒险攻击,以获取最大期望收益。此种情况下,安防部门应该增强反击力度,追踪攻击者,将其一网打尽,在获得反击收益的同时,震慑潜在的攻击者,降低攻击概率,减少城市安全事件的发生。

3 隐藏信号策略下博弈均衡求解和稳定性分析

3.1 博弈均衡的定义与分析

本节中,安防部门采用保密信号策略,这种状态下攻击者不知道安防部的防御措施,博弈视为同步进行。安防部门与攻击者的目标函数如下:

为了得到均衡解,首先求解博弈双方的最佳反应函数,

安防部门最佳响应定义:

安防部门最佳策略函数:

攻击者的最佳响应定义为:

同理结合攻击者的预期效用,解出攻击者的最佳行动策略函数,

在实行隐藏信号策略的博弈中,博弈双方依然有四种可能的纳什均衡(表4)。文章发现在安防部门实行高等防御时,不存在攻击者不攻击的均衡策略,相比较公开防御信号策略博弈,本博弈过程存在混合策略均衡。

表4 隐藏信号策略下的博弈均衡解

3.2 博弈双方均衡策略的稳定性分型

本小节通过数值分析法研究安防部门在隐藏防御信息的情形下,博弈双方的均衡策略与相关参数的关系。有关参数的基准值见小节3.2.

3.2.1 防御成本c1、c2,采取保密信号的成本c3,攻击成本c4

隐藏信号策略下高等防御的成本对博弈双方均衡策略的影响(图10),存在两种均衡解的情形。在防御成本中等偏低时,存在安防部门和攻击者都选择混合策略的情况(表1)。随着防御成本的增加超过中等值,安防部门放弃继续投入更高的资金进行防御,此时,攻击者攻击的成功概率增加,攻击者选择攻击。

图10 高等防御的成本对均衡策略的影响

隐藏信号策略下一般防御的成本对博弈双方均衡策略的影响(图11)。图中可以看出无论防御成本如何变化,安防部门始终采取一般防御策略进行防御,攻击者始终采取攻击策略。当防御成本较低时,攻击者实行攻击策略可以获得少量收益,随着防御成本的增加,攻击者虽然进行攻击但是一直处于负收益的情形,这种情况下攻击者由于情报的缺失,造成收益断层,不仅无法获得期望收益,还会造成较大的损失。

图11 一般防御的成本对均衡策略的影响

隐藏策略的成本对博弈双方均衡策略的影响(图12)。无论隐藏信号策略的成本如何变化,安防部门和攻击者始终保持混合策略。在这种情况下,安防部门需要花费更多的防御资金去维持均衡,攻击者收益不变。

图12 采用隐藏信号策略的成本对均衡策略的影响

隐藏信号策略条件下,攻击者的攻击成本对博弈双方均衡策略的影响(图13)。当攻击成本较低时,安防部门实行混合策略进行防御,攻击者选择最佳行动策略进行攻击。随着攻击成本增加,安防部门保持混合策略不变,攻击者不愿承担高昂的攻击成本,放弃攻击纯策略,实行混合策略。

图13 攻击成本对均衡策略的影响

3.2.2 反击收益k、安防部损失评估vd,攻击者损失评估va,攻击成功的概率p、q

隐藏信号策略下,安防部门的反击收益对博弈双方的影响(图14)。当反击收益比较小时,安防部门实行混合策略进行防御,攻击者进行攻击,但是攻击者收益浮动较大,无法保持最佳期望收益。随着反击力度增强,安防部门和攻击者都采用混合策略来最大化其期望收益。

图14 反击收益对均衡策略的影响

隐藏信号策略下,安防部门的损失评估对博弈双方均衡策略的影响(图15)。图中表示在vd变化的情况下,存在两种纳什均衡解。当安防部门的损失评估较小时,安防部门采取一般防御策略,此时攻击者利用缺乏高等防御措施的情形,冒险实行攻击获得期望收益。随着损失评估的增加,博弈双方的策略均发生变化,安防部门实行混合策略进行防守,攻击者实行混合策略获得均衡策略下的期望收益。

图15 安防部门的损失评估对均衡策略的影响

隐藏信号策略下,攻击者的损失评估对博弈双方均衡策略的影响(图16)。图中存在两种均衡策略。当攻击者的损失评估较小时,安防部门实行一般防御策略,攻击者进行攻击。随着攻击者损失评估增加,博弈双方均实行混合策略维持博弈均衡。

图16 攻击者的损失评估对均衡策略的影响

隐藏信号策略下,实行高等防御攻击成功的概率对博弈双方均衡策略的影响(图17)。当攻击成功的概率比较低时,安防部门和攻击者都实行混合策略。随着攻击成功的概率增加到接近30%时,攻击者改变策略实行攻击,获得期望收益,此时安防部门实行高等防御。当攻击成功概率继续增加时,安防部门实行混合策略,攻击者考虑到安防部门高投资防御放弃攻击纯策略,实行混合策略。

图17 实行高等防御q对均衡策略的影响

隐藏信号策略下,实行一般防御攻击成功的概率对博弈双方均衡策略的影响(图18)。当攻击成功的概率较低时,安防部门保持警惕实行高等防御,攻击者冒险采取攻击行动,此时他的攻击收益为负值,没有达到预期。随着攻击成功的概率不断增加,安防部门和攻击者都改变行动策略,实行混合策略。在这种情况下,安防部门的防御成本由低到高,然后趋向于平衡,攻击者混合策略收益不变。

图18 一般防御攻击成功的概率对博弈双方均衡策略的影响

综上所示,在防御策略信息隐藏的博弈情形下,安防部门可以通过实行高等防御降低攻击成功的概率,使攻击者承担较大损失,但是不能阻止攻击者攻击行为。在信号隐藏策略下,博弈双方均倾向于混合策略获取最大期望收益。同时,安防部门可以通过数据分析、逆向追踪、用户画像等技术进行反击,识别攻击者的身份或其团伙大本营,利用法律手段进行制裁,威慑潜在的攻击者,降低攻击事件的发生。

4 总结

文章从城市公共安全管理的角度,以动态信号博弈为基础,构建了安防部门与攻击者之间的非合作攻防信号博弈模型,研究不同信号策略情况下,防御成本、攻击成本、反击收益、攻击成功概率等因素对博弈双方均衡策略的影响。研究结论表明,安防部门在公开防御信息情况下,博弈双方存在纯策略均衡,安防部门可以通过高等防御对攻击者进行威慑,从而使攻击者放弃攻击或者降低攻击成功的概率。但是在攻击成本较低、攻击成功概率高的条件下,攻击者依然会选择冒险攻击,以获取最大收益。在信号隐藏策略情形下,博弈双方倾向于混合策略,安防部门不能通过高等防御技术完全震慑攻击者。两种均衡策略下,安防部门均可以通过数据分析、反向追踪、身份识别等技术,利用法律手段追责或实施反制攻击,降低攻击威胁和攻击收益。

文章研究还可以进行一些拓展,例如,文章没有考虑信号动态变化对博弈双方战略的影响。此外,攻击者不可能是完全理性的,基于有限理性假设的智慧城市安全管理博弈模型尚待进一步的研究和分析。

猜你喜欢

攻击者收益损失
机动能力受限的目标-攻击-防御定性微分对策
胖胖损失了多少元
螃蟹爬上“网” 收益落进兜
玉米抽穗前倒伏怎么办?怎么减少损失?
正面迎接批判
怎么设定你的年化收益目标
2015年理财“6宗最”谁能给你稳稳的收益
菜烧好了应该尽量马上吃
有限次重复博弈下的网络攻击行为研究
损失