AI交互终端异常数据入侵识别与仿真
2022-12-24刘明,张弘
刘 明,张 弘
(1.郑州工业应用技术学院信息工程学院,河南 郑州 450000;2.信息工程大学电子技术学院,河南 郑州 450000)
1 引言
AI交互终端具有较多的网络资源,其多功能数据库[1]使终端操作方便,并且通过研究者不断探究,终端现已能够存储较多数据。大数据安全备受关注,终端中存有用户重要身份信息和隐私[2]。应用交互终端能够让传输环境更加简洁,用户能够随时使用网络,终端在为人们生活带来更加方便的同时,也被非法人员窥视,异常入侵手段具有多样性,入侵者利用简单智能装置就能够导致网络终端重要数据丢失[3],出现不可估计的损失。
为有效识别AI交互终端的异常数据入侵,仇媛等人[4]提出了一种长短期记忆网络和滑动窗口的数据异常检测方法。该方法采用LSTM网络对数据预测,计算预测值与实际值的差值,根据差值分布的概率密度来计算数据异常可能性。何瑞江[5]提出了一种GRU-SVM神经网络的数据入侵检测方法。根据RNN神经网络与LSTM神经网络运行特征,建立GRU-SVM算法,实现对入侵数据的检测。但以上两种方法存在的较高的误检率。为此,提出了一种AI交互终端大数据异常入侵风险识别方法。
通过构建AI交互终端数据入侵模型,对数据完成测量[6]和特征提取,筛选出异常数据,通过识别方法检测入侵数据。能够准确判断数据是否具有攻击性或者存在病毒,从而作出预警,对异常数据拦截或过滤。利用入侵识别方法的同时,加入防火墙系统,更好地维护终端安全。
2 入侵数据函数的建立
通过信息化解析信号,若在入侵的候补节点nodei加入中断数据测量系数,表达公式为
(1)
利用自适应均衡[7]模型构建AI交互终端对数据异常入侵信息流模型,获得入侵参变量在终端内簇首节点布局函数公式为
fF(k+1)=fF(k)-∇fF(k)JMMDMMA
=fF(k)-∇fF(k)(JMMDMMA_R+JMMDMMA_I)
(2)
式中,fF(k)代表簇首节点布局位置,∇表示梯度算子,JMMDMMA表示为节点均衡值。
如果(a0,a1,…,am)表示为入侵信息流的路由布局点,利用特征量化追踪融合[8]评估入侵信息流频率,获得频率函数k公式为
(3)
flg-M(z)=(flg(z),flg-x(z),flg-y(z))
=(flg(z),hx*flg(z),hy*flg(z))
(4)
式中,x、y代表网络的分簇坐标,hx、hy代表簇内节点坐标,M表示信息交互总次数,flg(z)代表簇内节点衰减补偿误码率[10,11]。利用上述模型,为数据异常入侵风险识别引入原始基本信息。
3 异常入侵主成分提取
采取AI交互终端入侵数据测量,算出异常数据入侵时节点的路由拓扑模型[12],对数据量化追踪,收集一维数据向量Xn,利用多标记学习[13]构建三维约束变量预测模型,获得数据相互之间大小变换关系特征公式为
(5)
其中
(7)
式中,λ代表异常入侵特征系数,φi代表初始状态,γi代表运行平均状态,ri和θi代表入侵特征的频分复用分解数,d表示接收或传输的数量,利用空间解矢量的倍频[14]方式分析,获得终端数据入侵测量数表达式为
x0=q0p+r0
(8)
式中,x0表示为终端数据入侵测量数,q0表示为能量损耗,r0表示为主频特征。
在异常入侵信息测量模型构成的前提下,对终端大数据信息流二维信号[15]拟合和特征参变量评估。
利用主成分分析提取异常数据,筛选关联密切的数据,为防止原始数据遗失,选取标志性指标,尽可能消减网络信号的干扰,对空间变量降维[16],从而压缩简化数据。
已知p维随机变量X={x1,x2,…,xp},其线性结构组成另一个综合变量。利用F1来描述原始变量的首个线性结构产生的主成分指标,表达式为
F1=a11x1+a21x2+…+aplxp
(9)
式中,l表示主成分矩阵纵列高度,a(·)表示主成分序列指标。
所有主成分提取的数据能够利用方差描述,为了使原始变量数据尽量存在全部综合变量内,主成分方差就需要大些,则Var(F1)取值最大。一般第一主成分F1是全部主成分拥有数据量最多的,要是F1不能代表原始p个变量信息,此时就需要利用主成分F2与F3,且F1和F2需要保证相互不干扰,便得出二者协方差为
Cov(F1,F2)=0
(10)
经过推算,能够构成F1,F2,…,Fm,分别表示为原始变量指标的对应主成分,表达式为
(11)
针对所有系数a,全都应该符合标准化前提
(12)
需要算出原始变量zi和xj的关联系数矩阵
(13)
式中,rij(i,j=1,2,…,p)表示为原始变量zi和xj关联系数。
算出关联矩阵R的特征数和特征矢量。关联矩阵的特征公式为
|R-λ×I|=0
(14)
(15)
n个之前的主成分方差贡献率总和,表示为方差累计贡献率,表达公式为
(16)
按照前i个主成分的累加贡献率和大于规定阈值选择主成分的数量。
4 异常入侵识别
通过上文特征提取方法将AI交互终端中无关和冗余数据过滤之后,排列数据簇,筛选出正常数据与异常入侵数据,算出系统性能权值,对异常信息风险识别。
如果完成异常入侵识别的输出具有i个p维数据集S,还需满足条件
S=Sl∪Su
(17)
式中,Sl代表标识数据集,Su代表没有标识数据集。
综上所述,输出为数据g∈Su种类,此数据会是正常数据,也会是异常入侵数据。
如果已经把数据集S处理完毕,把得出的结果按照数据簇大小排序,再和挑选出来的最初正常数据簇、入侵数据簇用cn与cm表述,把其余数据划分给数据集cr。
针对cn内全部一维数据,利用网络发生器得到对应数系统特征数:(Eg1,Eg1);针对cm内所有一维数据,则得到(Eg2,Eg2)。由此能够算出全部系统性能权值,公式为
(18)
根据式(18)得出的结果,通过cr选择数据对象g,异常入侵风险数据μ的识别结果为
(19)
式中,ω代表异常入侵识别系数。利用网络发生器,得到对应的系统特征数(Eg1,Eg1),重新算出系统性能权值,完成所有数据风险识别。
5 仿真研究
为了验证AI交互终端大数据异常入侵风险识别方法(研究方法)的应用有效性,利用ns-3平台与Python链接构建一个节点数量为80的AI交互终端,在识别范围内平均布局30个固定路由、任意放置60个能够移动的AI客户端。数据流实验初始时间为0s,实验主要参数如表1所示。
表1 实验参数
5.1 研究方法应用结果
设定入侵信号指示频率达到1Hz时,表示为识别出来入侵风险,人为的异常入侵攻击在10s~30s、50s~80s、100s~115s时间段。研究方法的AI终端数据异常入侵识别结果如图1所示:
图1 研究方法的异常入侵数据检测结果
通过图1可知,研究方法能够识别出所有的异常入侵攻击。虽然终端节点在不停变化,在网络流量承载过重或者恶意数据节点过多时,大部分的终端节点处于活跃,容易造成漏检问题,但是在此情况下研究方法仍然保持较高的异常检测精度,验证了该方法的应用性能优势。
5.2 残差值测试
AI交互终端在传输过程中,为了保护数据的同时,加快数据传输效率,会采取重构信号压缩采样数据,通过调整压缩率来测试性能,通过压缩重构信号算出实际测量与预期情况存在差值,该差值为残差,残差越小,说明方法的异常数据识别准确性越高。
对比方法为长短期记忆网络和滑动窗口的数据异常检测方法和GRU-SVM神经网络的数据入侵检测方法。不同方法的信号重构残差值对比如图2所示。
图2 压缩率增加残差曲线图
通过图2能够看出,压缩率小于10%时,信号构建残差值为0,识别方法检测后的原始信号能够很好被重构,随着测量信号压缩率提高,残差也在不断增大,当压缩率为40-50%时,研究方法的信号重构残差值仍低于1,显著低于长短期记忆网络和滑动窗口的数据异常检测方法和GRU-SVM神经网络的数据入侵检测方法。实验结果证明研究方法受压缩影响小,能够实现高效率的大数据异常入侵识别任务。
5.3 检测率和误检率
根据图3和图4所示,随着压缩率不断增大,研究方法的AI交互终端异常大数据检测率在95%以上,误检率始终低于3%,均优于长短期记忆网络和滑动窗口的数据异常检测方法和GRU-SVM神经网络的数据入侵检测方法。说明该方法的异常数据识别性能更好。
图3 不同方法的检测率对比
图4 不同方法的误检率对比
5.4 流量开销
在识别AI终端入侵大数据的同时,终端的流量开销也是衡量方法应用性能的重要指标。流量开销是指完成一项任务时所需的流量。不同方法应用下的AI终端流量开销对比结果如图5所示。
图5 不同方法应用下的AI终端流量开销对比
通过图5能够看出,在100ms时长的AI终端异常入侵大数据识别中,研究方法的总流量开销低于40GB。相比之下,长短期记忆网络和滑动窗口的数据异常检测方法和GRU-SVM神经网络的数据入侵检测方法应用下AI终端流量开销更大,最高流量开销已达150GB。由此可知研究方法的实用性更强。
6 结论
大数据入侵威胁的多样性严重影响了AI交互终端的安全性,易泄露隐私和重要数据。为此提出AI交互终端大数据异常入侵风险识别方法。通过构建的AI交互终端数据模型,建立入侵数据的布局函数。结合主成分分析法,提取出异常入侵大数据。引入网络发生器,实现AI交互终端大数据异常入侵风险的识别。通过所设计实验测试结果证明了研究方法能够有效识别数据异常入侵情况,且效率高、操作简单,能够有效降低AI交互终端的流量开销。