APP下载

基于深度学习的交通袭击攻击方式智能识别

2021-03-07杨黎霞许茂增陈仁祥

兵器装备工程学报 2021年2期
关键词:决策树准确率神经网络

杨黎霞,许茂增,陈仁祥

(1.重庆交通大学 经济与管理学院, 重庆 400074; 2.重庆广播电视大学 管理学院, 重庆 400052;3.重庆交通大学 机电与车辆工程学院, 重庆 400074)

当前,恐怖袭击正在成为影响国际安全的重要风险源,交通袭击事件频繁发生[1]。交通工具是一种非常容易获得的非常规武器,常被恐怖分子用来进行恐怖活动[2]。据全球恐怖主义数据库[3]统计数据可知目前交通袭击采用最多的攻击方式是轰炸/爆炸,在爆炸发生后,应快速将现场封锁,进行搜爆和排爆工作,以防止二次爆炸引起更大的人员伤亡和损失,同时对爆炸现场进行分区管理和制定疏散计划直至医学救援团队到来[4]。生化袭击也曾被用来袭击人员密集的交通系统,如:“日本东京地铁沙林毒气案”[5-6]。而该袭击方式的救援与爆炸袭击的应急救援有较大差别,生化袭击具有隐蔽性、扩散性和传染性。一旦生化袭击发生需要快速锁定攻击物,针对不同攻击物采用对应的疏散和隔离措施[7-8],同时需要对疾病疫情进行追溯[9]。由此可见,不同的交通袭击方式需要采用的应急救援是不一样的,需要的救援物资也有所差别[10-11]。为了不造成社会资源的浪费,需要在交通袭击发生时快速准确进行识别,启动相应的应对预案。

1970—2017年,全球恐怖主义数据库(Global Terrorism Database,GTD)[3]收录了来自12个地区221个国家发生的182 438起恐怖袭击事件信息,其中攻击目标为交通系统有8500条数据。2008—2017年10年间该数据库收录了2 806条交通袭击数据,接近过去48 a收录总量的三分之一[12]。近年来交通袭击频繁发生使得数据量大幅增加,同时,与恐怖袭击事件相关的大量信息被收集和存储,恐怖袭击事件统计数据呈现出大容量、高维度和多样化的特点。GTD中收录的每条恐怖袭击事件最多会有135条属性对其进行诠释,如何在大数据背景下分析这些属性之间复杂的内部关系,从而快速、高效和智能的识别交通袭击事件攻击类型,为更合理的配置交通袭击防御资源提供数据和理论支撑,成为交通反恐中的关键问题。

目前,已有学者就恐怖袭击攻击方式分类进行了研究。如:Nizamani等[13]基于2001—2008年GTD的文本数据,对比分析了决策树、朴素贝叶斯和支持向量机3种分类方法,研究结果表明支持向量机能达到合理的准确率但是运行时间太长,朴素贝叶斯虽速度快而准确率低,决策树的综合表现更好,分类识别率能达到83%。Sivaraman等[14]针对恐怖袭击方式分类提出基于多分类器的集成决策树算法,利用GTD数据进行实例分析,结果表明:该算法比单一决策树算法的准确率有显著提高。肖圣龙等[15]为了提高社会安全事件分类训练速度,将神经网络的训练任务分发到多个主机同时进行训练,提出了一种基于Spark平台的分布式神经网络分类算法。已有研究工作取得了较好效果,同时也有不足之处:目前已有的算法主要从攻击方式诸多属性中人工提取特征后利对攻击方式进行识别,其将特征提取与模式识别分步进行,而特征提取与模式识别均有多种方法,两者相对独立、匹配程度难以评价,从而影响识别结果的准确性。同时,部分方法需要人工提取特征,受制于人的专业背景,智能化不够,也难以实现大数据下攻击方式的高效、准确识别。面对大数据在模型训练方面,虽然可以利用Spark平台加快计算速度,但在表征属性和攻击方式之间的复杂映射关系时分布式神经网络这种浅层模型的识别能力及泛化性能均显不足。

交通袭击攻击方式与诸多属性相关,且各属性与攻击方式类别间呈现出非线性,增大了识别的挑战性。近年来,深度学习采用一系列的非线性变换,从原始数据中提取由低层到高层、由具体到抽象的结构性特征,是通过模拟人类大脑的学习过程,构建深层次网络模型,最终提升分类精度[16]。为此,本文提出了基于深度学习的交通袭击攻击方式识别方法,利用加噪自动编码深度神经网络(denoising auto-encoder deep neural network,DAEDNN)从多样化的交通袭击事件统计数据中自动学习提取出各类攻击方式特征,并利用微调将攻击方式特征学习与模式识别融为一体,实现攻击方式的智能识别。

1 深度学习原理

1.1 加噪自动编码机

图1 自编码的模型结构示意图

编码过程可表示为[18]

h=fθ(x)=Sf(Wx+b)

(1)

式中:θ、W、b、Sf分别为编码网络参数集合、权重矩阵、偏置向量和解码网络的激活函数,其中θ={W,b};W是d′×d维的权重矩阵;Sf一般采用sigmoid和tanh两种激活函数。解码过程可表示为

(2)

式中:θ′、W′、b′、Sg分别为编码网络参数集、权值矩阵、偏置向量和解码器的激活函数,其中θ′=(W′,b′);W′为d×d′维的权值矩阵,且W′=WT;Sg一般采用线性函数和sigmoid两种激活函数。

自编码的训练过程是通过在训练样本集D上寻找参数θ和θ′的最小化重构误差,重构误差表达式为

(3)

式中,L为重构误差函数,常用交叉熵损失函数或平方误差函数,本文采用平方误差函数,表示为

(4)

首先依照二项随机噪声qD分布对样本x(d)加入随机噪声,获得含噪样本x′(d),其表达式为

(5)

然后通过优化以下目标函数完成加噪自编码的训练

(6)

加噪自动编码机(denoising auto-encoder,DAE)通过添加噪声进行编码重构,可以减少随机因素对提取攻击方式特征的影响,提升模型的鲁棒性和特征提取能力。

1.2 DAEDNN的预训练与微调

DAEDNN是将多个DAE用无监督的方法层层堆叠形成深度神经网络(deep neural network,DNN),其前一层DAE的输出作为后一层DAE的输入,如图2所示。本文在对DAEDNN进行预训练时采用逐层贪婪训练法,预训练的过程如下:

1) 训练第一层的DAE时采用无监督方法,原始输入的最小化重构误差即为其输出,其表达式为

(7)

式中,θ1为DAE1的参数集合,θ={W1,b1}。

图2 DNN的网络结构示意图

2) 以上一层DAE隐藏层作为下一层DAE的输入,训练下一层DAE:

(8)

3) 重复2),直到所有DAE训练完毕;

4) 为下一步有监督微调做准备,需要把最后一层隐藏层的输出作为分类层的输入,攻击方式类别数作为分类神经元个数。

将多个DAE连接起来,建立起加噪深度神经网络,每一层所学到的特征就是数据特征不同阶表达。对DNN参数进行微调时需在DNN最后加入具有分类功能的输出层,DNN的输出其表达式为

(9)

式中,设输出层的参数为θN+1,xm的交通袭击攻击方式类别为dm,通过最小化φDNN(Θ)来完成DNN的微调:

(10)

式中,Θ为DNN的参数集,且Θ=(θ1,θ2,…,θN+1)。

经过微调的DNN优化了对交通袭击攻击方式信息的特征表示,将攻击方式特征学习与攻击方式分类融为一体,实现攻击方式的智能识别。

2 基于深度学习的交通运输系统恐怖袭击攻击方式识别流程

本文提出了基于深度学习的交通袭击攻击方式智能识别方法,该方法有机的融合了无监督学习和将监督微调,同时结合了深度学习的优势和交通袭击事件大容量、高维度和多样化的数据特性,可同时完成大数据情形下交通恐怖事件特征自适应提取和攻击方式智能识别,将特征学习与模式识别融为一体,识别流程如图3所示。

图3 识别流程框图

该算法实现主要包括:

1) 样本获取与预处理。从GTD中筛选出交通袭击事件,对筛选出的数据进行填充后进行归一化处理,使其取值范围为[0,1],以其作为训练样本和测试样本;

2) 预训练。构建加噪加噪自编码深度神经网络,包括设置每层神经元个数,DAE的数量N,加噪比例等网络结构参数。输入训练样本,将上一个DAE的输出作为下一个DAE的输入逐层的训练N个DAE,直到所有DAE训练完毕;

3) 有监督微调。设置输出层神经元个数为攻击方式的类别数,对预训练得到的参数通过输入有标签训练样本进行微调,微调后的网络参数作为最终的网络参数。

4) 输出智能识别结果。输入测试样本,输出结果。

3 算例分析

3.1 源数据处理

本文数据来源于GTD,由于该数据库收集时间跨度大、恐怖袭击事件描述的复杂性等诸多因素,致使其数据具有不完整、描述重复、不规范、数据异常等问题。在输入DAEDNN进行训练前,需对其进行预处理,包括:

1) 数据筛选。从属性targtype1中筛选与交通相关数据。筛选数据按攻击方式分类统计,如表1所示。

表1 攻击方式分类统计信息

2) 数据预处理。GTD中恐怖袭击事件每条含有135个属性,其中部分属性解释量小、重复定义、数据缺失严重,需对部分属性剔除[20]。保留属性包括eventid,iyear,imonth,iday,extended等35个。

3) 数据填补。保留属性仍有部分数据缺失,根据不同属性的特点,采用相应处理方法对缺失值进行填补。如:利用水经注万能地图将属性latitude,longitude进行填补;用targtype1中各类的子类中被袭频率最高的类来填补targsubtype1中的空白;

4) 数据转换。需要将字符串和日期型的数据转换成数值型。本文将字符串和日期型的属性通过Excel透视表排序,其序号作为该属性的一个映射值,让其作为输入的源数据[15]。

5) 数据规范化。不同属性有不同的量纲,数值间差别较大。在此采用离差标准化法进行数据规范化处理,将数值映射到[0,1]间,便于深度神经网络的输入。转换公式为:

(11)

式中,max为样本数据最大值; min为样本数据最小值。

3.2 攻击方式识别结果分析

在DAEDNN特征学习时确定DAE层数非常关键,通常情况下,DAE层数越多网络结构越深特征学习效果会越好,但这又会加大网络训练的难度。本文通过多次试验后设置参数为:DAE的深度神经网络中含3层DAE,对应的神经元个数是35-19-35,19-15-19,15-10-15,分类层神经元个数与攻击方式识别类别相同为8,加入噪声比例为20% GTD收录攻击方式为9种类型,其中1类为unknown。由于未知攻击类型有可能是其他8种类型中的某一类,因此在其特征提取的时候可能干扰其他类别,故在做试验时剔除了该类数据。对于编号为1、5、8的3种攻击方式,由于样本数过少不利于深度神经网络的训练,在原来样本基础上增加适当的噪声后将样本数量进行扩展。所增加噪声的标准差相对于原始样本标准差倍数k=0.1~0.2,以使加噪后的样本相对于原样本差异明显又不至于被噪声湮没。以此原则,取k=0.1对编号1类扩展1倍使其样本量为170,取k=0.1和k=0.2对编号5、8类扩展2倍使其样本量分别为150和156。

对每类攻击方式分别随机抽取70个样本作为训练样本,剩下样本中随机抽取70个作为测试样本。模型训练完成后,得出交通袭击攻击方式识别的结果,所提方法的识别准确率如表2所示(随机抽取10次,即共做10次试验,识别结果进行平均)。

同时,应用主成分分析方法分析所提出方法对原始数据进行自学习得到的特征,选取所得到前3个主分量作为特征向量,图4为特征提取结果示意图,观察图4,所学习的特征聚集性非常好,各攻击方式之间区分明显,说明了所提方法可以有效自动学习提取攻击方式的特征。

表2 几种算法的准确率

图4 特征提取结果示意图

本文算法与决策树算法[13]、集成决策树算法[14]和分布式神经网络分类算法(DNNC)[15]的计算结果如图5和表2所示。

图5 不同方法结果直方图

观察图5和表2。决策树算法每次只用一个属性进行分叉,没有考虑各属性见的隐含关系,所以导致其准确率平均值最低,仅74.14%,且对不同的攻击类型准确率波动非常大(对“劫持人质(绑架)”准确率达到93.63%,而对“轰炸/爆炸”只有42.46%),各类型准确率的标准差是17.28%,说明其对不同攻击类型的识别稳定性差;集成决策树算法相对于单一决策树算法准确率有提高(平均值为81.80%),但其仍然忽略了各属性间的隐含关系准确率不高,且各攻击类型的准确率波动也大(标准差达到12.38%);DNNC方法考虑到了不同属性间的隐含关系,其准确率平均值比决策树算法和集成决策树算法都有提高为89.22%,各攻击类型识别准确率波动减小(标准差为5.48%),但其属于浅层神经网络模型,相对于本文所提DAEDNN方法相比,学习特征能力不足,所以准确率低于所提方法。

本文所提方法DAEDNN算法平均准确率达到94.86%,较决策树算法、集成决策树算法和分布式神经网络算法在攻击方式智能识别时的准确率总体具有明显优势,比决策树算法、集成决策树算法和DNNC算法分别提升了20.72%、13.06%和5.64%。这是因为DAEDNN通过深度网络关联各个属性,在每层之间进行变换,能自动学习提取出各属性与被识别目标之间的关系,将特征提取与模式识别融为一体。同时,DAEDNN相对于DNNC网络层数更深,可以学习得到更深层次的特征,特征学习提取效果更佳,提升到更高的准确率。另一方面,DAEDNN使得网络的鲁棒性更好,各攻击类型识别准确率波动值相对于前3种方法最小,仅为3.50%。

4 结论

1) 本文提出利用加噪自编码深度神经网络从大容量与多样化的交通袭击事件统计数据中自动学习提取恐怖袭击特征和识别攻击方式识别。

2) 所构建的深度神经网络通过添加噪声进行编码重构,从而减少随机因素对提取共计方式特征的影响,提升了特征提取能力。

3) 本文采用GTD的数据进行了验证,同时与决策树算法、集成决策树算法和DNNC算法进行了对比分析,结果表明所提方法在攻击方式智能识别时准确率有所提升,同时具有良好的特征自提取能力。

4) 本文为交通袭击攻击方式智能识别提供了一种新的思路和方法。

猜你喜欢

决策树准确率神经网络
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
简述一种基于C4.5的随机决策树集成分类算法设计
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
决策树学习的剪枝方法