基于BA-RVM的医院网络安全量化评估预测
2022-04-20陈鹏岗方健军王科
陈鹏岗, 方健军, 王科
(1.西安交通大学第二附属医院,陕西,西安 710000;2.烟台市中医医院,山东,烟台 264000;3.山东理工大学,计算机科学与技术学院,山东,淄博 255000)
0 引言
伴随着网络基础设施的建设与通信行业的快速发展,信息化在各行各业得到了广泛的应用,促进了社会的进步与经济的快速发展。与此同时,网络安全问题也成为了各行各业都必须面对的问题,木马病毒、黑客攻击使得网络安全面临新的挑战[1]。医院网络化建设对提升医院的就诊效率、患者满意度发挥着至关重要的作用,确保医院网络安全对维护医院正常运转具有至关重要的意义。
传统的网络安全评估可以分为定量评估和定性评估2类,伴随着人工智能技术的快速发展,出现了智能化的网络安全评估方法。模糊法、德尔菲法、历史比较法是最为常见的定性评估方法,回归分析法、聚类算法、决策树模型、因子分析法是最为常见的定量评估方法。不论是定量评估法还是定性评估法,在对网络安全的评估中受到主观因素影响比较大,这导致网络安全评估的科学性与严谨性不足。基于人工智能技术的智能化网络安全评估方法,能有效地解决网络安全评估科学性与严谨性不足的问题,使得网络安全评估结果更加客观、合理[2]。相关向量机(Relevance Vector Machine,RVM)是一种新的监督学习算法,在网络安全评估中具有广泛的应用,但核函数的宽度对网络安全评估的性能影响比较大[3]。本文采用蝙蝠算法(Bat Algorithm,BA)优化RVM模型,并将其应用于医院网络安全量化评估中。将医院网络安全量化评估结果和传统RVM模型对比,验证所提出BA-RVM网络安全量化评估的有效性,这为医院开展网络安全量化评估提供了新的思路。
1 医院网络安全评估模型
1.1 评估模型
为了更好地维护网络安全,国家制定了相关的标准与技术要求,有效地确保网络传输信息的准确性、完整性、可用性,同时避免非法访问。建立网络安全评估模型就是要在此基础上,按照科学、公开、合理的原则开展网络安全评价。对网络安全评估的重点是网络安全事件的影响范围与危害程度,包含系统风险、资金风险、设备风险等多个方面的内容,具体计算式为
网络安全级别=R(L(T,V),R(Ia,Va))
(1)
式中,R为网络安全风险计算函数,L为网络安全出现的预测值,T为网络安全威胁,V为网络安全可靠度,Ia为网络安全出现风险后业务应用情况,Va为网络安全出现风险后设备资产本身的可抵抗程度。
文献[4]从资产、脆弱性、威胁等3个角度建立医院网络安全评估模型,具体如图1所示。
图1 网络安全评估模型
1.2 评价指标
医院网络安全水平的量化评估预测和评价指标的选择之间具有十分密切的关系,科学选择评价指标有助于提高医院网络安全水平量化评估的准确度。如果评价指标选择比较多,那么信息就会产生冗余和干扰,同时量化评估的效率也比较低;如果评价指标选择比较少,那么就会导致不能获取足够的信息,影响量化评估的精度。本文采用层次分析法建立医院网络安全量化评估的评价指标,具体如图2所示。
图2 医院网络安全评价指标体系
2 相关向量机
(2)
式中,N为样本数据个数,wi为设置权重值,w0为偏置,K(x,xi)为核函数。
建立RVM模型要求目标函数必须是相对独立的,同时目标函数本身包含噪声,即
yn=f(xn,w)+εn
(3)
式中,εn为噪声。
对应似然函数计算式为
(4)
式中,y=[y1,y2,…,yN]T,w=[w1,w2,…,wN]T,φ=[φ(x1),φ(x2),…,φ(xN)]T,φ(xN)=[1,K(xn,x1),K(xn,x2),…,K(xn,xN)]T。
传统方法是采用最大似然法来求解最优权值,但是往往会出现过度拟合的情况。为了避免在求解最优权值的过程中过度拟合,本文采用稀疏贝叶斯(Spare Bayesian)公式计算权重w所对应的先验概率的条件分布,即
(5)
利用贝叶斯公式来计算未知参数对应的后验概率,即
(6)
联合以上各式,权重w所对应的后验概率计算式为
(7)
其中,Σ=(δ-2φTφ+A)-1,A=diag(α0,α1,…,αN),μ=δ-2ΣφTy。
利用delta函数计算样本数据的相似性,通过样本数据的相似计算来有效解决相关联向量向超参数进行学习转化和后验概率存在的模式化问题,确保参数α取得最大值的计算式为
(8)
进行循环迭代估计,得到
(9)
式中,μi为第i个平均后验权重,Σij为第i个相对角的具体元素。
3 基于BA-RVM的医院网络安全评估
3.1 目标函数
采用RVM模型对医院网络安全量化评估预测的性能与核函数宽度g之间具有密切的关系,为了更好地提高RVM模型对医院网络安全量化评估预测的性能,采用BA算法对核函数宽度g进行优化。定义目标函数为
s.t.g∈[gmin,gmax]
(10)
3.2 蝙蝠算法
BA是依据蝙蝠借助回声实施定位的生物学原理提出的群体智能优化算法,提出BA群体智能优化算法基于以下3个方面的假设[6]。
假设1:蝙蝠群体内所有的个体均通过回声定位来进行距离的感知。
假设2:蝙蝠群体内个体的行动轨迹过程为个体在Xi位置,以Vi速度进行随机无目的的飞行,在整个飞行过程中采用固定频率fmin、可变波长λ和响应A0进行猎物的搜索,同时蝙蝠个体在飞行的过程中会自动地发射出脉冲频率以及进行波长调整。脉冲波长的调整依赖于蝙蝠个体和猎物之间的距离,频度r在区间[0,1]范围内调整。
假设3:在使用BA智能优化算法之前预先设定猎物回声的上限值Amax和下限值Amin。
设定目标函数minf(X),X=(x1,x2,…,xd)T,采用BA求解的步骤[7]如下。
步骤1:参数初始化
初始化蝙蝠种群规模NP,标识蝙蝠种群每一个个体的初始位置Xi(i=1,2,…,NP),设置搜索脉冲对应频率范围[fmin,fmax],脉冲速率r0,最大声音值A0,脉冲速率增强系数γ和声音响应衰减系数α。
步骤2:脉冲频率、速度以及蝙蝠位置更新
对脉冲频率、速度以及蝙蝠位置进行实时动态更新,即
(11)
式中,t为循环迭代次数,β为区间[0,1]上的随机向量,X*为当前全局最优解的坐标位置。
步骤3:获得最新解
由随机函数生成随机数rand,如果随机数rand>ri,那么选择最优解集中的任意值,同时在最优解附近生产局部最优解,同时结合随机扰动方程获得最新解,即
Xnew=Xold+εAt
(12)
式中,Xnew为最新解,Xold为原始解,ε为区间(-1,1)上的随机数,At为完成t次迭代运算相应结果的平均值,即平均响应值。
步骤4:脉冲响应与频率更新
如果满足rand (13) 步骤5:算法终止条件判断 判断是否满足BA的终止条件:如果满足算法终止条件,那么输出解即为最优解;如果不满足算法终止条件,那么返回步骤2。 采用BA智能优化算法对RVM参数进行优化,得到用于医院网络安全量化评估预测的BA-RVM模型。具体流程如下。 (1)对BA智能优化算法初始化,同时将医院网络安全量化数据样本按照4∶1的比例分为训练样本和测试样本,采用训练样本对BA-RVM模型进行训练,采用测试样本求证BA-RVM模型的有效性。 (2)计算目标函数适应参数值,采用式(10)计算蝙蝠种群每一个蝙蝠个体的个体适应度值。 (3)判断是否满足BA设定的终止条件。如果满足BA设定的终止条件,那么输出的解作为核函数的最优宽度g*,得到优化后的RVM模型,采用训练样本完成对医院网络安全的量化评估;如果不满足BA算法设定的终止条件,那么跳转到第(4)步。 (4)采用频率调整公式获得最新解以及所对应的蝙蝠速度与位置坐标。 (5)对接受新解与否进行逻辑判断。如果接受新解,则执行步骤(6);如果不接受新解,则执行步骤(4)。 (6)更新蝙蝠响应和发射频率,跳转到步骤(2)。 基于BA-RVM模型的医院网络安全量化评估流程[8-9]如图3所示。 图3 基于BA-RVM的医院网络安全量化评估算法流程图 实验数据来源于某三甲医院2011—2020年网络安全量化评价数据,对数据进行归一化处理,同时过滤噪声,网络安全评价指标得分如表1所示,网络安全最终得分如表2所示。 表1 2011—2020年网络安全评价指标得分 表2 2011—2020年网络安全最终得分 为了更好地评价算法的性能,采用均方根误差(Root Mean Square Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)作为衡量指标,RMSE和MAE计算式为 (14) (15) RMSE反映了模型预测值和实际值的离散程度,MAE反映了模型的误差。RMSE和MAE值越小,那么模型的预测精度越高、性能越稳定。 当满足医院网络安全评价指标的实际值和预测值相等时,将医院网络安全评价结果设置为1,该结果值是识别医院网络安全是否在高风险区的极限值之内。本文设定的医院网络安全级别评价标准如表3所示。 表3 网络安全评判标准 将由网络安全专家打分获得的11组数据样本进行划分,前7组数据样本为训练样本,后4组数据样本为测试样本。设定BA的种群规律为10,最大迭代次数为100,脉冲速率为0.5,搜索脉冲范围为0-2,声音最大响应值为0.25,响应衰减系数值为0.9,所对应的脉冲速率增强系数为0.05。分别采用RVM模型和BA-RVM进行医院安全量化评估预测,评价结果如图4所示,评价相对误差如图5所示,同时给出2种模型的RMSE和MAE,如表4所示。 表4 不同算法结果对比 (a)RVM 由图4可知:不论是采用RVM模型还是BA-RVM模型,第1组和第2组的实际得分和预测得分相差均比较小,而第3组和第4组的实际得分和预测得分相差均比较大;采用BA-RVM模型的预测得分和实际得分相差比较小,而采用BA-RVM模型的预测得分和实际得分相差比较大。 由图5可知,通过得分相对误差可以非常直观地看出采用BA-RVM模型的预测得分和实际得分相对误差明显小于采用RVM模型的预测得分和实际得分相对误差。 (a)RVM 由表4可知,BA-RVM算法的RMSE和MAE值均小于RVM算法,即BA-RVM模型相对于RVM模型,其预测精度更高、性能更稳定,即基于BA-RVM模型的医院网络安全量化评价预测具有更高的精度和稳定性,为医院网络安全量化评估提供了新的方法。 医院网络安全量化评估预测对提升网络安全性具有至关重要的意义,本文提出了一种基于BA-RVM模型的医院网络安全量化评估预测方法,从资产、脆弱性、威胁等3个角度建立了医院网络安全量化评价指标体系,同时采用BA对RVM模型核函数宽度进行优化,并将优化后的RVM模型应用于山东省某三甲医院的网络安全量化评估预测中。将预测结果和传统RVM模型的预测结果进行对比,指出BA-RVM模型对医院网络安全量化评估预测精度更高,模型性能更稳定,是医院网络安全量化评价的一种新方法。3.3 BA-RVM流程
4 实证分析
4.1 数据来源
4.2 评价指标
4.3 结果分析
5 总结