基于大数据技术的软件安全漏洞自动挖掘方法研究
2022-03-23丁俊
丁 俊
(安徽工业经济职业技术学院,安徽 合肥 230051)
0 引言
随着软件的广泛应用,对软件的安全性要求越来越高,在复杂网络环境下,在网络攻击等因素的影响下或是软件设计本身的缺陷,导致软件极容易出现安全漏洞,因此需要构建优化的软件安全漏洞检测模型,结合软件安全漏洞大数据分布和挖掘结果,实现对软件安全漏洞自动挖掘,以提高软件安全性,所以相关的软件安全漏洞自动挖掘方法研究在软件开发和维护中具有重要意义[1].
对软件安全漏洞进行自动挖掘是保证软件安全运行的基础,当前,对软件安全漏洞检测的方法有很多,相关研究也受到了很多学者的广泛关注.文献[2]中提出基于关联规则的软件安全漏洞挖掘方法,该方法采用RDARF规则筛选器来获取强规则,提取安卓驱动的申请权限信息,从而建立权限特征集合,依据权限关系特征库实现软件漏洞的挖掘.文献[3]中提出基于模糊测试技术的软件安全漏洞挖掘方法,该方法首先进行软件安全漏洞信息的采集,根据采集信息结果构建分布特征量模型,对其进行融合处理从而实现关联信息提取,并采用模糊测试技术实现信息自适应聚类和挖掘.文献[4]中提出基于随机探测算法和信息聚合的漏洞挖掘方法,采用随机探测算法进行静态特征的提取,同时对参数进行信息聚合处理,运用随机森林算法构建训练模型以有效进行软件安全漏洞信息的挖掘.尽管上述方法具有有效性,但是由于上述方法的特征提取能力不高,导致软件安全漏洞挖掘的效果较差.针对上述问题,本文提出基于大数据技术的软件安全漏洞自动挖掘方法.
1 软件安全漏洞信息采集和融合分析
1.1 软件安全漏洞信息采集
为了实现基于大数据技术的软件安全漏洞自动挖掘,首先构建软件安全漏洞检测的原始信息采集模型,采用自相关匹配检测方法进行软件安全维数的信息分解[5],得到软件安全漏洞信息的指向性增益为:
(1)
建立软件安全漏洞信道容量参数估计模型,结合改进的空间信息聚类方法[6],得到软件安全漏洞的信息分解结果为:
(2)
在上述基础上,提取软件安全漏洞信息的统计参数量,结合模糊信息散射簇聚类方法,得到软件安全漏洞参数的采集模型,在t时刻得到参数分解函数为:
(3)
构建软件的多径传输信道模型,结合模糊参数融合,得到安全漏洞的传输信息采样分量:
(4)
其中,A(t)为软件安全漏洞融合的幅度.
提取软件安全信息的谱信息,通过随机泛函分析[7],得到软件的信道载波分量:
(5)
其中,N(z)是软件消息传递的分子多项式,它的零点在z=e±jω0处,D(z)为软件安全漏洞的大数据挖掘的统计特征量.分析软件安全漏洞信息输出的模糊信息匹配集,得到安全漏洞分布的残差分量[8],确定软件态势感知的幅频响应,得到软件安全漏洞信息采集的基准频率为:
(6)
在得到安全漏洞信息采集基准频率的基础上对软件安全漏洞大数据信息参量进行自适应调整[9],得到软件安全漏洞信息的采集模型为:
(7)
其中,ejπ表示软件安全漏洞的模糊贴近度.综上所述分析,实现了对软件安全漏洞的信息采集,下一步通过动态信息融合以实现软件安全漏洞信息的融合处理.
1.2 软件安全漏洞信息融合
(8)
其中,μ1,μ2分别表示耦合参数集P中的耦合参数.采用扩频序列分析的方法进行软件安全漏洞信息的分布式重组,得到软件安全漏洞信息感知传递函数为:
(9)
其中,θ1,θ2分别表示不同匹配滤波的特征参数和带宽参数.假设软件安全漏洞信息的谐振分量为v=rωr,阻抗因素为r=rr+lg,软件安全漏洞信息的动态抑制系数为B=kβk1Bg,安全漏洞信息的低频调制系数为l=lskfkcAw/Ac,构建自适应反演控制模型,得到软件安全漏洞信息融合函数:
(10)
通过级联特征匹配[11],建立软件安全漏洞的梯度空间模型,其表示为:
(11)
其中,wp,wv,wc为软件安全漏洞信息检测的输出权重,P1=Pcu+Ph+Pe+Pb+Pw为适应度函数,Vt为耦合系数,C为软件安全漏洞信息检测的阻尼系数.
在固定频率段内,得到软件安全漏洞挖掘的多普勒频移,记做ωd,采用动态信息融合的方法,结合融合函数与梯度空间模型,构建软件安全漏洞的信息融合模型为:
(12)
基于信息融合结果的基础上,结合统计特征分析方法,确定软件安全漏洞的交叉信息分布集,以提高安全漏洞的自适应挖掘能力[12].
2 软件安全漏洞信息的挖掘优化设计
2.1 软件安全漏洞信息特征提取
采用基函数集稳定分析的方法,得到软件安全漏洞信息的递归特征量为:
(13)
其中,〈g1,g2〉表示软件的安全漏洞检测的频谱特征量.
采用极限挖掘的方法,得到软件的安全漏洞的扰动特征分解结果为:
(14)
其中*G表示软件安全漏洞检测的卷积系数,统计特征分析方法,对软件安全漏洞信息的定位进行分析,得到漏洞信息定位分析方程:
(15)
采用大数据挖掘方法进行软件的传输信息采集和节点部署[13],软件安全漏洞挖掘的扩频带宽为:
(16)
结合频谱分布特性,来确定安全漏洞的交叉信息分布集,得到软件安全漏洞挖掘的信道切换控制函数为:
(17)
基于信道切换控制结果,根据模糊决策模型,构建软件安全漏洞评价指标集为Ek∈E(k=1,2,…,t),得到自适应切换控制函数定义为vm,m∈[1,n].利用频谱分布特征分析,得到软件安全漏洞信息的时域分布信息,表示为:
(18)
其中,τ为模糊度扩展的时延,φ为软件的多径特征分量.
经过“筛分”过程,获取软件的模糊概率密度函数,并结合大数据技术构建软件安全漏洞信息的特征提取模型,表达为:
(19)
其中,σV表示软件的信道差异度函数.综上所述分析,得到软件安全漏洞信息的特征提取结果,下一步需要采用大数据技术进行软件安全漏洞信息的大数据挖掘优化设计.
2.2 软件安全漏洞信息的大数据挖掘优化
基于特征提取结果,利用信息调度和大数据技术实现软件安全漏洞信息的数据挖掘优化设计.假设软件安全漏洞信息传输的模糊动态约束参数模型描述为:xj={x1j,x2j,...,xmj}T,设计大数据挖掘模型,得到软件安全漏洞挖掘的收敛性约束条件为:
(20)
式(20)中,|v|表示软件安全漏洞分布的复包络.假设Sk(t)为软件信息传输信道e上的传输数据量,采用异构有向图分析方法进行软件安全漏洞信息结构重组,软件安全漏洞挖掘的自适应分配模糊度矩阵R=(rij,aij)m×n,利用大数据信息调度,得到软件安全漏洞检测的目标函数为:
(21)
其中,区间[xmin,j,xmax,j]构成软件安全漏洞挖掘的大数据分布时间窗口,ρ为软件安全漏洞挖掘的自适应调节系数,其定义为:
(22)
结合多元交叉分布式辨识和大数据技术,得到软件安全漏洞挖掘输出的融合特征解,表示为:
(23)
利用软件安全漏洞挖掘的信息聚类模型,进行软件安全漏洞自动挖掘,输出的检测统计量为:
(24)
其中,∆t表示软件安全漏洞挖掘的时间间隔.采用大数据信息调度和多元交叉分布式辨识的方法,构建大数据挖掘的优化模型,以实现安全漏洞的自动挖掘优化设计,大数据挖掘的优化模型如图1所示.
图1 漏洞信息大数据挖掘的优化模型
3 仿真测试分析
在软件安全漏洞挖掘的仿真实验中,设定软件安全漏洞信息测试的最大负载为240 Kbps,安全漏洞信息采样的数据样本规模为2 000,测试集的模板数据匹配度为0.35,训练样本数据规模为240个,软件安全漏洞信息挖掘的阶数为5,空间分布维数为14,根据上述参数设定,在仿真平台中构建软件安全漏洞信息大数据采集模型,得到漏洞信息数据分布如图2所示.
图2 软件安全漏洞信息数据分布
以图2的数据为测试对象,为进一步验证本文方法的优越性能,将文献[2]方法、文献[3]方法、文献[4]方法设置为对照组,将本文方法设置为实验组,分别对这四种方法软件安全漏洞自动挖掘的特征提取能力和精度进行分析.
为分析四种方法的特征提取能力,测试软件安全漏洞挖掘的特征点分布情况,得到三种方法进行漏洞信息自动挖掘的特征点分布情况对比如图3所示.
图3 漏洞信息特征点分布情况对比
分析图3得知,本文方法能够有效进行漏洞挖掘的特征点提取,与漏洞信息实际特征点的分布情况最为相近,由图中可以看出,本文方法的特征点提取能力要优于传统的三种方法,表明本文方法能有效实现对软件安全漏洞挖掘和检测,有效提高了软件安全漏洞信息挖掘的特征聚类性.
测试软件安全漏洞挖掘的精度,得到对比结果见表1.
表1 软件安全漏洞挖掘的精度对比测试
分析表1得知,本文方法的软件安全漏洞挖掘的精度较高,在样本数达到240个时,本文方法的精度达到1,明显高于其他三种方法的精度,由此可见本文方法能够有效实现软件安全漏洞的挖掘.
4 结语
为了实现软件安全漏洞自动挖掘,本文提出基于大数据技术的软件安全漏洞自动挖掘方法.采用扩频序列分析的方法进行软件安全漏洞信息的分布式结构重组,挖掘软件安全信息大数据特征量,通过级联特征匹配进行软件安全漏洞分析,采用基函数集稳定分析的方法得到软件的安全漏洞检测的频谱特征量,通过大数据信息调度和多元交叉分布式辨识的方法,实现安全漏洞的自动挖掘.研究得知,本文方法的软件安全漏洞挖掘的特征提取能力较强,且准确度较高.