基于人工智能的互联网络数据安全优化算法研究
2021-08-26闫卫刚
闫卫刚
(陕西警官职业学院,陕西 西安 710021)
0 引 言
近年来,随着全球信息化发展越来越快,人们依赖网络的程度日渐提高,网络安全隐患越发引人关注[1]。网络系统因具有随机性、模糊性,以往的防御方式难以适应目前的安全要求[2]。网络安全态势通过预测和评估可确保网络安全稳定运行,并得到学者深入研究[3]。
目前,网络已经深入到社会经济发展、国家战略部署、人民日常生活的方方面面[4]。人们在学习、工作、生活等方面均涉及到网络,但现有防范措施的更新速度难以跟上相关网络安全威胁的变化速度[5]。由于网络安全态势预测在网络安全态势感知系统中具有举足轻重的地位,所以逐渐成为了网络安全研究的热点之一[6]。整个预测过程是建立在对态势进行完整理解以及敏锐察觉的基础之上[7]。在不断接触网络安全态势期间,采集多种多样的信息数据,也是分析网络安全态势运行方向的开端[8]。通过对其历史数据观测及相关经验分析,可对未来某段时间内网络安全态势发展趋势进行预测[9]。因而,研究网络安全态势预测会对其日后发展产生深远的影响,并为网络系统安全运行提供重要保障。在研究过程中会涉及到一些相关的算法和模型,但鉴于外部环境条件数量太多且难以参数化,所以无法将预测模型标准化、统一化,故以往的预测手段难以精确地对此类数据进行预测。因此,本文基于人工智能,对互联网络数据安全优化算法进行研究。
1 智能优化算法
常用的智能优化算法分为以下几类:差分进化算法、遗传算法、粒子群优化算法。差分进化算法、遗传算法的运算过程均含有选择、交叉、变异三个步骤。前者会使种群个体出现一个属于自身的测试向量,然后对比原始和测试2个向量,选择更合适的值进行迭代,能够很好地优化处理传统测试方程;而后者擅长确定最优解范围以及在全局范围内进行搜索,然而其在给定小范围内搜索最优解的能力有所欠缺,所得结果的精度并不高。粒子群算法的运算过程含有位置以及速度更新2个步骤。其对迁徙动物寻找食物的场景进行模拟,如果个体成功找到食物,便会告知其他种群成员,进而导致群体产生运动。粒子群算法擅长快速锁定范围并在其中迅速找出最优解。
2 粒子群优化RBF神经网络
通过神经网络理论进一步发展,研究人员对人脑神经网络系统特点研究日渐成熟。尤其是对权值的优化,已研发出不同的优化算法来确定其权值,其中最常用的是蚁群算法和遗传算法等[10]。如何确定RBF神经网络连接权值?本文主要考虑利用粒子群对其进行优化,能够使其权值高效迅速地确定为全局最优解。
2.1 粒子群优化算法及原理
粒子群优化算法的特点能将鸟群寻找食物时互助行为体现出来,通过同伴间信息交换,从而快速找到食物,将其引申到解决数学问题就是将最优解问题快速解决。该算法属于一种寻找最优解算法,通过粒子间协作、交换将全局最优解快速求出。在粒子群优化算法中,将最优解作为该算法中一个粒子,任意对每个粒子进行初始化,然后在解的范围中进行寻找。每个粒子对应一个适应度方程,该方程的解即符合问题条件的最优粒子值,通常由对象方程决定。当粒子搜寻到一个解时,比较适应度函数,若新的值比前一个值对目标函数更适应,则新位置为该粒子暂时最优解;反之,则个体最优解保持不变。个体确定最优解后,对比粒子自身的适应度方程,最恰当的就是全局最优解。再将这二者的适应度方程解进行比较,选择更加符合条件的那一个。
2.2 粒子群算法的数学描述
假设在粒子群优化算法中,有m个粒子群,且n为粒子最优问题解空间维数,则每个粒子改变个体粒子位置的规则包括:在寻找到个体最优位置时,每个粒子对自身位置进行更新;每个粒子根据自身搜索方向搜索;比较全体粒子位置,根据粒子个体最优解进行全局最优位置的更新。
2.3 粒子群优化过程的算法流程
在粒子群优化中,通过对粒子群中粒子速度、位置的更换获得新种群,进一步提高种群多样性、遍历性。离子群优化算法流程需经过如图1所示的步骤完成。
图1展现了粒子群优化算法的大致过程,其步骤包括:
图1 粒子群优化过程
步骤1:确定粒子的搜索频次、所处位置以及更新速度,并对这些参数一一进行初始化。
步骤2:对全部粒子的适应度值进行一一求解。
步骤3:分析粒子自身个体最优位置,将其与此次位置适应度值展开比较,若后者更加接近问题最优解,则用本次位置替换前者。
步骤4:依据前3步的更新数据信息,重新确定粒子群全局最优位置。个体确定最优解后,对比粒子自身的适应度方程,最恰当的就是全局最优解。再将这二者的适应度方程解进行比较,选择更加符合条件的那一个。
步骤5:对粒子位置、速度进行确定。
步骤6:若未能达到终止条件,则返回步骤2。
2.4 RBF神经网络结构
RBF神经网络结构如图2所示。输出层属于线性结构,可为神经网络输入产生对应的输出;隐含层能够训练输入层的样本,并对不同数据进行修订;输入层能够识别从外面输入的样本集,训练样本。
图2 RBF神经网络结构
3 粒子群优化RBF神经网络
粒子群神经网络是神经网络模型的一种,其兼顾了神经网络的优点和粒子群优化算法的长处。RBF神经网络擅长模仿学习,而粒子群擅长进行高效迅速地全局搜索,将二者有机结合,能够大大提高算法的性能。如今,由于样本数量不足,使用梯度法及线性最小二乘法时,RBF神经网络的权值优化难以接近最强性能。所以,转而采用粒子群优化算法来解决这一问题。
3.1 粒子群优化RBF神经网络权值
假定1台服务器主机可能遭受的攻击有以下几个方面:CSRF漏洞、CGI漏洞、XSS漏洞、应用漏洞、SQL注入,其风险等级赋值量化为W38,W48,W58,W68,W78。在权值优化上,神经网络没有求得一个适应所有情况的最优解,所以对其权值优化进行研究至关重要。本文将RBF神经网络权值进行转换,形成粒子群中粒子,在解空间中,让粒子进行全局最优权值的寻找。RBF神经网络的网络模型如图3所示。
图3 RBF神经网络的网络模型
由图3可知,需优化最优解问题解空间维度为五维。若将求解五维最优空间解在粒子群求解最优解进行映射,需进行RBF神经网络权值编码。编码方式一般来说有两种:一是对向量进行编码;二是对矩阵进行编码。前者是将所有粒子一一对应转化为向量,在图3中进行权值优化后,不同粒子所具有的编码如下:
3.2 粒子群优化RBF神经网络
采用基于粒子群优化RBF神经网络预测网络安全态势。在处理小样本数据方面,粒子群优化算法最大的特点是快速、准确,RBF神经网络进行粒子群优化过程如图4所示,优化过程具体步骤如下:
图4 RBF神经网络进行粒子群优化过程
步骤1:对其权值编码,并将编码对应到每一个粒子上;
步骤2:确定粒子的搜索频次、所处位置以及更新速度,并对这些参数一一进行初始化;
步骤3:对RBF神经网络中心、半径使用K-均值聚类算法进行计算;
步骤4:重新求解粒子群适应度值,更新相关数据参数;
步骤5:重新确认不同粒子所处的位置以及自身的速度;
步骤6:从以下两方面判断是否符合终止条件,一是对全局最优解是否在规定误差范围内进行判断;二是对更新粒子群次数是否已达上限进行判断,若符合,则完成整个优化过程,反之回到步骤4继续以上流程,直至符合为止。
4 网络安全态势的评估
在本研究中,网络安全态势评估对象为6台服务器主机,根据熵权理论风险评估模型、多维云模型将其他5台服务器主机风险值计算出来,分别为0.682 0,0.653 1,0.650 2,0.680 1,0.541 5。因网络系统主机全部为服务器主机,服务器上架设不同网站,具有同等重要作用,重要性权值均相等,且6个权值之和为1,则每个服务器主机重要性权值等于1/6,则进行加权计算后风险值为0.648 2,表明本系统网络安全态势属于较高风险。
4.1 网络安全态势的预测
在预测时,选用粒子群优化RBF神经网络模型,利用其对训练样本进行处理,最终通过训练获得有效预测模型。预测模型的流程如图5所示。
图5 网络安全态势预测流程
4.2 粒子群优化RBF神经网络预测
网络安全态势预测研究可以从两个方面入手,一是把每次遭受到的攻击看作是独立事件,进行单次预估,同时还要评估不同攻击的强度,将不同时刻对应的态势值预估出来,这样做的弊端在于评估不同攻击的强度时通常会受到评价者主观认知的左右;二是建立一个非线性时序的模型来进行预估,汇总历史数据,认真分析其内在联系和共同影响因子,以便对日后网络的发展方像向进行预估。本文选用经过粒子群优化RBF神经网络这一方式来进行预测,对来自国家级网络中心的海量数据信息进行预处理。综合考量后选取以下影响因子作为规范性指标来对网络安全态势进行预估:一是新增信息安全漏洞数量;二是被植入后门的网站数量;三是新增信息安全高风险漏洞;四是感染网络病毒主机数量;五是网站仿冒页面数量;六是网络中被篡改网站数量。将网络安全态势值进行划分,分别为危、差、中、良、优5个级别。对6个指标数据进行统计、分析,5个风险等级量化表见表1所列。
表1 安全等级表
通过本文方法对RBF神经网络进行优化,从而高效迅速地预测网络安全态势。通过对比RBF神经网络优化前后预测的数值与实际值的差异,表明粒子群优化RBF神经网络具有准确、快速的优点,具体如图6所示。
图6 算法对应的预测误差图
由图6可知,采用本文方法预测网络安全态势的收敛速度要比RBF神经网络快。预测结果误差图曲线表明,在进化次数小于10次时,本文方法预测误差下降很快,随后在较小误差附近波动。RBF神经网络预测误差图曲线表明,其进行样本训练时产生的预测误差较大,通常是由于训练次数或者样本数量不足导致的。两种方法预测误差波动表明,相比于RBF神经网络,利用本文方法进行预测,误差出现的起伏更小。鉴于网络安全态势数据具备以下三个性质:复杂性、随机性、模糊性,所以本文方法能够更好地建立相应预测模型,把误差的波动控制在较小的程度内。即便是在样本量不足的情况下,本文方法也能够在全局范围内高效迅速地锁定最优解。采用本文方法进行权值优化,能使神经网络权值快速收敛,训练出的网络安全态势预测模型更有效。算法对应的预测输出如图7所示。
图7 算法对应的预测输出
由图7可看出,在训练次数较少的情况下,本文算法的预测结果快速且与实际网络安全态势值接近,比RBF神经网络预测模型预测的网络安全态势更有效、更快速。表明本文算法预测结果更加拟合实际网络态势值。
5 结 语
本文基于人工智能对互联网络数据安全优化算法进行研究,分析了互联网络数据安全优化算法,得出如下结论:
(1)在网络安全态势预测中,预测模型建立在粒子群优化RBF神经网络的基础上,在处理信息数据量不多时,粒子群RBF神经网络算法的运算速度快、精度高,有利于粒子群RBF神经网络进行快速准确的预测。
(2)通过对比粒子群优化前后的RBF神经网络,结果表明,对RBF神经网络进行粒子群优化后,其预测误差波动能够很大程度的减小。利用这种方法进行权值优化,能使神经网络权值快速收敛,训练的网络安全态势预测模型更有效。
(3)比较粒子群优化RBF神经网络算法预测结果、实际网络态势值以及RBF神经网络预测结果,表明在训练次数较少情况下,粒子群优化RBF神经网络算法的预测结果快速且与实际网络安全态势值接近,比RBF神经网络预测模型预测的网络安全态势更有效、更快速。