基于贝叶斯算法的网络安全风险评估研究
2022-09-07张伟
张 伟
(青岛市技师学院 山东 青岛 266229)
0 引言
随着计算机网络技术的迅速发展,网络系统已经普遍运用于金融、工业、航天等诸多领域,人们依赖于网络系统互通共享各类信息资源。近年来,各行业出现各类网络系统被恶意攻击的事件,造成了巨大的经济损失和不良的社会影响,因此,网络安全问题变得越来越重要,引起了社会各界的高度关注。在当今复杂的计算机网络系统中,网络安全风险管理可以有效地减少安全事故的发生,能够降低危害程度和缩小危害范围,最大限度地减少或消除网络系统中的潜在风险。网络安全风险管理主要有风险评估、风险解决和风险监控等过程,其中,风险评估是研究网络系统安全问题的基础,通过识别和评估网络安全风险,提出对应的解决策略降低风险发生的概率[1-2]。
目前用于识别和评估网络安全风险的方法主要有攻击图、粗糙集理论、隐马尔科夫、信息熵、层次分析和神经网络等。如Tavana等[3]针对金融领域流动性风险对银行造成的威胁,利用人工神经网络精确度识别和评估复杂的流动性风险,通过智能系统测试表明该方法能够有效地识别和评估金融流动性风险;Herland等[4]利用贝叶斯网络模型评估智能手机的信息安全风险和后果,研究结果表明,将近50%的用户通过智能手机与他人共享的信息,提示用户需要提高智能手机用户的安全意识。王增光等[5]提出了基于贝叶斯攻击图的网络安全风险评估方法,实现了对目标网络的动态风险评估,为实施网络安全防护策略提供依据;王纯子等[6]提出了基于粗糙集和D-S证据理论的云网络风险评估方法,通过量化网络攻击行为对虚拟机层和物理机层的影响,实现了云网络风险评估;王庭均等[7]采用模糊层次分析方法对电力通信系统网络安全进行了安全评估,实现了定量与定性相结合的指标权重确定方法,提高电力通信网络的安全风险评估准确性。
虽然这些技术有助于识别和评估安全风险,在一定程度上量化了网络风险,但在分析过程中只关注单一的风险,存在一定的局限性,如不能够提供风险被利用的概率信息,不提供风险的级别,很难评估多步攻击对网络系统安全造成的风险。贝叶斯网络结合了概率论、图论和统计学等多个学科的原理方法,可以表示各类安全风险之间因果关系和定量化的描述评估过程,能够反映安全评估的连续性和累积性[8-10]。Hudson等[11]首次在2001年恐怖主义威胁的风险评估分析中使用贝叶斯网络模型,后来,贝叶斯网络被广泛用于各种领域的风险管理,如银行、核电站、建筑火灾、地震和其他自然灾害等[12-13]。
因此,本文从资产指标、威胁性指标和脆弱性指标3个方面选取了风险评估指标因子,构建风险评估指标体系。基于贝叶斯算法进行网络安全风险评估研究,对网络安全策略及其特征进行建模,有效地处理不确定性因素,对风险等级进行量化表示,实现了网络风险安全管理的目标,对网络风险管理具有重要的现实意义。
1 贝叶斯算法原理
贝叶斯算法(BA)可以对不确定的知识类别进行预测,依据特定的数据集计算概率,利用计算得出的概率值分类不同的数据集,在大数据计算、信息处理、图像识别等领域应用广泛。计算原理见公式(1)。
式中,P(A)、P(B)分别表示事件A和B发生的概率;P(A/B)表示事件A的后验概率,P(B/A)表示事件B的后验概率。
贝叶斯网络(BN)是通过概率学与有向无环图相结合的方式来表示变量之间概率关系,主要由节点、弧线和概率组成,通过学习后验概率与先验概率之间关系解决各类问题。本文采用贝叶斯网络作为网络安全风险评估分析方法,主要是因为贝叶斯网络模型能够有效地整合原始数据和专家意见,通过简单的格式可视化变量之间因果关系,适合简单的专家咨询方法,并且对于不完全信息具有很好的鲁棒性。
设X={X1,X2,X3…Xn}代表相互独立的网络事件的变量集合,每一个事件对应的发生概率表示为P(Xi),这些变量事件节点Xi组合成为一个贝叶斯网络S,每个事件节点之间用一条弧线表示条件概率关系,见图1[14]。
图1中每一个节点代表一个网络安全事件Xi,根据条件概率表可得贝叶斯网络的表达式,见公式(2)。
2 建立风险评估模型
2.1 选取风险评估指标因子
网络安全风险的发生是受多种因素综合作用而产生的,不同应用领域的环境条件差异性会导致风险发生的影响因素有所不同。因此,在网络安全风险评估研究中,评估指标因子的选取是非常重要的,选取指标因子应具有代表性、独立性、可操作性和继承性[15]。
根据指标因子选取的原则和网络风险的形成机理,参考近年来国内外学者在网络安全风险评估研究中最常使用的指标因子,并考虑指标因子数据的可量化、可获取性,本研究从资产指标、威胁性指标和脆弱性指标3个方面,选取了实体信息、电子数据、资产遗失、非法访问、技术漏洞、人为误差、软件安全、硬件安全和管理安全9项指标因子,各类指标因子的状态收集见表1。
表1 风险评估指标因子状态
2.2 数据模糊化处理
网络信息系统结构复杂,每个指标因子之间关系复杂,获取的指标因子数据具有一定的模糊性,如果将初始数据直接用于模型分析,会降低模型计算的精确度,影响最终的评估结果。因此,本文采用模糊综合评价理论对指标因子进行处理,处理主要步骤如下所示。
(1)分析选取的评估指标因子,构建对应的评判因素集。
(2)采用专家咨询的方式构建指标评价集合。
(3)通过风险评估小组对评价因素集中的每一个因素进行描述,构建评估指标的隶属度矩阵。
(4)计算指标因子权重值,利用模糊变换计算风险评估值。
2.3 建立贝叶斯网络模型
搭建一个优化的网络结构模型是计算网络安全风险等级的关键。本文依据选取的9项评估指标因子与安全风险程度的关系建立的贝叶斯网络模型,见图2。
3 风险评估案例分析
3.1 原始数据采集
本文基于GeNIe软件进行仿真模拟实验,首先对实体信息、电子数据、资产遗失、非法访问、技术漏洞、人为误差、软件安全、硬件安全和管理安全9个网络节点信息进行独立观测,得到的观测值见表2。
表2 评估指标因子的观测值
3.2 仿真结果
利用GeNIe软件对每一时段的网络风险进行贝叶斯模型网络模型推理,结果见表3,风险数据趋势图见图3。
表3 网络安全风险评估仿真结果
由图3可知,从时段1至时段4区间内,高风险的值依次为0.652、0.718、0.766、0.808,呈逐渐增大的趋势;高风险、中风险和低风险的曲线变化趋势稳定,变化情况能够明确地表示资产指标、威胁性指标和脆弱性指标之间的关系。仿真结果表明,基于贝叶斯算法能够科学合理地评估网络安全风险等级,并且评估的结果准确度比较高。
4 结语
网络安全风险评估是大规模网络架构中网络风险管理的重要环节,评估结果是判定安全性和合理性的重要指标数据。本文参考已有的研究成果,从资产指标、威胁性指标和脆弱性指标3个方面选取了实体信息、电子数据、资产遗失、非法访问、技术漏洞、人为误差、软件安全、硬件安全和管理安全9项指标因子构建评价指标体系;基于贝叶斯算法进行了网络安全评估研究。通过仿真实验得到的风险趋势图表明,贝叶斯算法能够科学合理地评估网络安全风险等级,并且评估的结果准确度比较高,能够为网络风险管理提供一定的科学依据。