基于分布式数据流的大数据信息安全评估平台研究
2021-04-07潘锦锋胡小琴
潘锦锋,胡小琴
(泉州信息工程学院 软件学院,福建 泉州 362000)
随着网络信息技术的发展,对网络信息平台分布式数据流的安全性提出更高的要求,需要构建优化的分布式大数据流大信息安全评估平台,结合对分布式大数据流大信息安全特征融合和模糊信息聚类分析的方法,实现对分布式大数据流大信息安全评估和融合调度,提高分布式大数据流大信息安全性,在大数据分布式融合背景下,通过分析分布式大数据流大信息安全评估平台的融合特征量,通过自相关特征分析和统计信息评估,实现对分布式大数据流大信息安全评估平台设计[1]。
传统方法中,分布式大数据流大信息安全评估方法主要有基于模糊度融合的高效频繁集分布式数据流安全性评估方法、基于线性相关性特征分析的分布式数据流评估方法等[2-4],采用平衡度测量的方法进行高效频繁集分布式数据流安全性的模糊性控制,提取高效频繁集分布式数据流安全性管理参数,通过规则性调度方法实现高效频繁集分布式数据流安全性评估,但传统方法进行分布式大数据流大信息评估的自适应性不好,特征辨识度不高[5-6]。针对上述问题,提出基于分布式数据流的大数据信息安全评估平台。首先构建大数据信息安全评估的数据结构融合模型,实现对分布式数据流的频繁集挖掘,根据数据的特征属性值来确定大数据信息记录的位置,提取分布式数据流的候选集、事务集,对大数据信息进行安全评估。最后进行仿真测试分析,展示了本文方法在提高大数据信息安全评估能力方面的优越性能。
1 高效频繁集分布式数据流融合分析
1.1 大数据信息安全评估的数据结构分析
为了实现基于分布式数据流的大数据信息安全评估平台设计,需要构建大数据信息安全评估的统计分析模型,结合频繁项集特征分析,得到高效频繁集分布式数据流融合的状态空间分布集,在候选集支持度学习下,得到大数据信息安全评估的约束参数集,通过添加存储集合元素,得到频繁集挖掘的约束方法,得到高效频繁集分布式数据流的节点异构模型[6],通过共享资源调度和关联融合的方法,得到数据集中迭代挖掘模式下高效频繁集分布式数据流的传输模型为:
f(x)=sgn(σ1,σ2,σr)∈X
(1)
其中,(σ1,σ2,σr)∈X表示高效频繁集分布式数据流的线性融合分布特征量,σ1、σ2、σr分别表示评估约束、存储约束以及挖掘约束。采用决策性融合的方法,得到高效频繁集分布式数据流线性加权融合聚类的决策模型描述为一个具有n个输入和m个输出的多维信道均衡控制模型,采用线性加权控制的方法,得到高效频繁集分布式数据流的关联维分布矩阵形式:
φα=x{Xn,Yn-τ,Xn-2τ}×f(x)
(2)
其中,{Xn,Yn-τ,Xn-2τ}表示高效频繁集分布式数据流的Hash融合向量,采用信息聚类和融合的方法,构建高效频繁集分布式数据流的可靠性融合度参数,得到高效频繁集分布式数据流的自适应调度模型[7]。在该模型基础上,输出的像素值是核窗口内像素值的均值(所有像素的加权系数相等),其中,归一化就是把要处理的量都缩放到一个范围内,比如(0,1),以便统一处理和直观量化,得到高效频繁集分布式数据融合的线性滤波输出为:
(3)
其中,λ、μ分别表示空间匹配和自适应特征向量,r表示高效频繁集分布式数据流重复信息删除模型,根据高效频繁集分布式数据流重复信息,得到数据结构分析模型为:
(4)
其中,Kψ+η表示高效频繁集分布式数据流的信息融合模型,根据信息融合结果实现对大数据信息的安全评估[8]。
1.2 高效频繁集分布式数据流特征分析
采用闭频繁项特征融合的方法,实现对分布式数据流的频繁集挖掘,结合关联规则挖掘和结构化数据检测的方法[9],得到高效频繁集分布式数据流传输的模糊状态特征分布集为:
(5)
在优化支持度下,结合空间信息均衡和反馈调节,得到高效频繁集分布式数据流安全性评估的多源信息融合分布结果为:
s(f)|=c(v)+[s1,s2,sK]n
(6)
其中,[s1,s2,sK]n表示频繁集的事务特征分析,得到高效频繁集分布式数据流安全性评估的融合聚类参数,在t时刻得到高效频繁集分布式数据流安全性融合的状态特征分解函数为:
Pi(t)=s(f)|+(t-8ui)e
(7)
其中,(t-8ui)e表示高效频繁集分布式数据流安全性融合的幅度,提取高效频繁集分布式数据流安全性管理参数,在波动频次分布的子空间中,得到高效频繁集分布式数据流安全性分布的目标函数:
(8)
结合贝叶斯估计的方法,得到高效频繁集分布式数据流安全性评估的自相关检测模型,将两个聚类合并程度函数H(C1,C2)当做两类合并的判断依据,利用边界点与各类中具有点数的熵值构建算法模型:
(9)
公式中c1与c2分别表示C1、C2中包含的点数量,c代表C1、C2中具有的边界点数量,如果边界点数量是零,则合并程度函数值是+∞。
通过频繁项目挖掘和关联性分析,得到高效频繁集分布式数据流的特征分析模型为:
(10)
其中,b2-y2表示数据集挖掘的特征集。根据上述分析,构建了高效频繁集分布式数据流特征融合模型,提高了数据的安全评估性[10]。
2 大数据信息安全评估平台优化
2.1 大数据信息安全评估特征检测
采用闭频繁项特征融合的方法,实现对分布式数据流的频繁集挖掘,结合关联规则挖掘和结构化数据检测的方法,在云融合调度模型下,构建高效频繁集约束的分布式数据流的自适应调度和信息特征采样[11],建立高效频繁集分布式数据流的分集均衡调度集,得到频繁集分布式数据流的传输增益为:
(11)
其中x1+x2表示高效频繁集分布式数据流的融合长度,Z为数据流安全性管理参数。根据高效频繁集分布式数据流的重复信息检测结果,通过空间均衡滤波检测,得到高效频繁集分布式数据流的融合参数模型
(12)
(13)
(14)
其中,VS-VCE表示高效频繁集分布式数据。采用线性相关性融合的方法,构建高效频繁集分布式数据流解析模型,得到频繁集的安全评估方程为:
(15)
其中,xi-yi表示高效频繁集分布式的数据流,根据互相关融合结果,实现对大数据信息的安全评估和模糊特征检测[12]。
2.2 数据信息安全评估优输出
通过模糊信息空间聚类和特征分布式融合的方法,将数据集加载到数据聚类中心,根据数据的特征属性值来确定大数据信息记录的位置,采用高效频繁集分布式数据流抗干扰融合模型,得频繁集分布式数据流安全信息评估梯度信息分量和误差:
Δx=ta+F(z)
(16)
结合分组样本检测的方法,得到高效频繁集分布式数据流的安全评估参数集、事务集合的交集,随着数据集复制倍数的增大,倍数增加至3倍,得到高效频繁集分布式数据流的传输特征量:
(17)
其中,Ro-Io表示高效频繁集分布式数据流的安全评估参数,得到频繁集分布式数据流的线性相关性融合输出。根据梯度信息特征分解的方法,得到高效频繁集分布式数据流信息评估的迭代学习算子为:
(18)
采用关联规则算法构建高效频繁集分布式数据流滤波的自适应学习模型,提高高效频繁集分布式数据流的信息饱和度,得到高效频繁集分布式数据信息分布的衰减特征量为:
(19)
其中,a2+b2表示高效频繁集分布式数据流的衰减关联系数和时间延迟,根据数据的特征属性值来确定大数据信息记录的位置,提取分布式数据流的候选集、事务集,根据属性集分布实现对大数据信息安全评估,得到安全评估输出的优化函数为:
(20)
其中,U0为自适应权重分布融合调度的方法,采用高效频繁集分布式数据流的模糊关联映射特征量,得到高效频繁集分布式数据流重复信息的滤波模型,实现安全评估平台的优化设计。
3 仿真测试分析
为验证本方法的应用性能,进行仿真测试分析,将分布式数据流的测试样本设定为BMSWebView 数据集,测试样本数为2000,分布式数据流训练样本数为120,训练迭代数为500,构建大数据信息安全评估模型,测试不同方法安全评估的传输加速比,将文献[4]与文献[6]作为对比方法,得到大数据信息安全传输加速比的对比结果(见图1)。
大数据信息安全传输加速比对比分析得知,本方法进行大数据信息安全评估,提高了数据传输的加速比,主要原因在于采用高效频繁集分布式数据流抗干扰融合模型,算法执行时不必使用速度较慢的内存,存储器读写时间能大幅降低,提高了传输加速比。测试不同方法进行大数据信息安全评估的时间开销,得到的对比结果如图2所示。
图1 传输加速比 图2 时间开销对比
进行大数据信息安全评估,降低了数据传输和安全性评估的时间开销。结合不同方法进行大数据信息安全评估的准确性,得到的对比结果见表1。
表1 大数据信息安全评估准确性测试
分析表1得知,本方法明显高于文献[4]与[6]提出的方法,大数据信息安全评估的准确性较高。
4 结论
本文提出基于分布式数据流的大数据信息安全评估平台,构建优化的分布式大数据流大信息安全评估平台,结合对分布式大数据流大信息安全特征融合和模糊信息聚类分析的方法,实现对分布式大数据流大信息安全评估和融合调度。结合频繁项集特征分析,得到高效频繁集分布式数据流融合的状态空间分布集,结合贝叶斯估计的方法,得到高效频繁集分布式数据流安全性评估的自相关检测模型,采用线性加权控制的方法,得到高效频繁集分布式数据流的关联维分布矩阵形式。根据高效频繁集分布式数据流的重复信息检测结果,根据数据的特征属性值来确定大数据信息记录的位置,得到频繁集分布式数据流安全信息评估的梯度信息分量,实现大数据信息安全评估平台的优化设计。研究得知,本文方法进行大数据信息安全评估的准确性较高,可靠性较好。