APP下载

基于卷积神经网络的智能识别方法∗

2020-12-23龚承君蒲宇清

计算机与数字工程 2020年11期
关键词:辐射源池化准确率

龚承君 蒲宇清

(武汉市交管局科技管理处 武汉 430000)

1 引言

目标识别[1]问题是数据融合中的基本问题之一,将系统中多个数据源提供的目标身份信息综合处理,产生比系统中单一信源更有效、更精确的身份估计和分类判决。物理模型法主要有卡尔曼滤波[2~3]、最大似然估计、最小二乘法[4];基于特征的推理技术主要有贝叶斯推理[5]、D-S证据理论[6];基于知识表示技术[7]的方法主要有专家系统、模糊集合论[8]和逻辑模板[9]。在实际检测中,传感器数量大且种类繁多,返回量测数据各式各样,传统目标识别方法计算较复杂且鲁棒性较低。本文提出一种基于卷积神经网络[10]的智能识别技术,利用卷积神经网络直接从大量复杂传感器数据中提取特征进行推理的能力,构造固定大小的目标识别决策矩阵,输入卷积神经网络进行身份判别。

2 基于卷积神经网络的智能识别算法

2.1 目标识别问题建模

目标信息综合了运动特征信息和辐射源特征信息,其中运动特征信息包括目标高度、速度、加速度、最大爬升率,辐射源特征信息包括目标载频、重复频率、脉冲宽度、天线扫描周期,共8 种可识别属性,将其记为ai(i=1,2,…,8)。目标待识别种类有防爆运兵车、机要指挥车、通信指挥车、装备输送车、布障车、运犬车、攀登突击车以及防爆水炮车共8 类,记为bj(j=1,2,..,8)。目标待识别的种类和属性按上述顺序排列,依次计算各个特征信息与身份向量的欧氏距离dxi,yj,根据匹配度计算公式计算匹配度:得到目标识别决策矩阵i=1,...,8,j=1,...,8。

2.2 智能识别算法流程

根据2.1 节建立的目标识别问题模型,算法综合不同类别的传感器上传的运动特征信息和辐射源信息,计算每种数据与每个待识别目标的匹配度,形成目标识别决策矩阵输入卷积神经网络,由卷积神经网络判别后输出身份识别结果。算法流程如图1所示。

图1 基于卷积神经网络的目标识别方法流程

算法将系统接收到的同一运动特征信息与目标身份的匹配度以及辐射源特征信息与目标身份的匹配度合并为一个目标识别决策矩阵。通过各个卷积核对目标识别决策矩阵进行特征提取,使用池化层对提取的特征图进行压缩,使用全连接层将卷积核学到的特征映射到样本标记空间,然后交给Softmax 分类器获得分类输出。基于卷积神经网络的目标识别算法分为训练和推理两部分:1)训练阶段:设计卷积神经网络,调整网络结构,以建立模型复杂度与识别问题复杂度匹配的网络模型,引入Dropout策略[11]防止网络出现过拟合,保存模型;2)推理阶段:将待识别的传感器数据输入保存的网络模型,输出身份识别判决结果。

2.3 特征参数处理

1)标准化处理:数据的标准化处理是将数据按比例缩放,将其转化为无量纲的纯数值,使得不同量级或单位的数据具有可比性。本文采用最大最小值标准化对仿真生成的数据进行预处理,使其分布在区间[0,1]之间,其公式如下:

xi为待归一化数据,yi为归一化后的输出。

2)One-hot 编码:基于卷积神经网络的目标识别算法将识别问题转化为分类问题,标签的类别(8类车辆)为离散型字符变量,在计算损失函数即神经网络输出和真实标签值的相似度时,需要通过one-hot 编码将标签转化为数值型变量,将离散特征的取值扩展到欧氏空间。

2.4 卷积神经网络结构

本文使用的卷积神经网络结构如图所示,对于本文构造的目标识别决策矩阵,每一列数据代表某一类待识别目标的运动征和辐射源特征,这些数据本身存在一定的关联性,因此目标识别决策矩阵的基本特征比较少,所以我们选取网络层数相对较少的Alexnet[12],参数量更少,网络训练速度更快。

图2 本文使用的CNN网络结构

网络的输入为8×8 大小的目标身份决策矩阵。第一层卷积层采用2×2 卷积核进行特征提取,输出特征数为8 个。使用Relu 激活函数[13]对输出值引入非线性,强化特征表示能力。每一层卷积层后对输出的特征图进行周边补0(padding模式),使特征图始终保持8×8 大小。通过多层卷积层进行特征提取,最后输出特征图[14]数量为64。在第4层和第8 层,我们尝试使用不同的池化方式来减少网络参数,加快训练速度。最后将提取的特征图交由全连接层映射至样本的标记空间,最后由Softmax分类器输出分类结果。再调整网络的参数包括卷积核参数,根据网络在测试集上的识别准确率对以上参数进行优化。

3 仿真试验

数据集由剧情仿真生成。对于运动特征信息,待识别目标对应的目标高度、速度、加速度、最大爬升率如表1所示。

对于辐射源特征信息,假设存在4 种型号的雷达,分别为雷达1、雷达2、雷达3、雷达4,其对应的目标载频、重复频率、脉冲宽度和天线扫描周期范围如表2所示。

假设防爆运兵车、攀登突击车和防爆水炮车装备辐射源为雷达1,布障车装备辐射源为雷达2,装备输送车和运犬车装备辐射源为雷达3,通信指挥车装备辐射源为雷达4。辐射源探测系统对目标载频的量测精度随目标载频大小变化,取目标载频的量测精度一般值为5MHz,即载频量测误差的值由均值为0,标准差为5的正态分布随机产生;对于目标重复频率,其量测误差的值由正态分布产生,其中均值为0,标准差计算公式如下:

其中,PRF 为目标重复频率的值,σPRF为目标重复频率误差的标准差。

对于目标脉冲宽度,其量测误差值由正态分布产生,其中均值为0,标准差计算公式如下:

其中,PW 为目标脉冲宽度的值,σPW为目标脉冲宽度误差的标准差。

假设其误差分布满足区间[-0.1T,0.1T]上的均匀分布,其中T 为天线扫描周期的真实值。仿真时每次生成一个目标的运动特征与辐射源特征的量测信息,运动特征信息中最大高度在20m~10000m,最大速度在0~3000km/h,最大加速度在0~90m/s2,最大爬升率在0~500m/s 内随机生成,随机分布模型采用均匀分布。辐射源特征信息中,载频、重复频率、脉冲宽度和天线扫描周期由表中的真实值和误差相加而成。计算所有特征信息的值与各待识别目标的特征真实值的匹配度pij,其中i=1,2,…,8,j=1,2,…,8,获得一个目标识别决策矩阵。通过以上仿真剧情产生样本集,并划分训练集和测试集,其中训练集数据与测试集数据比例为4∶1,训练集数据共16w 组,测试集数据共4w组,每一类待识别目标各占样本总数的1/8。

4 结果分析

在卷积神经网络中,池化层[15]的作用主要是通过降低特征图的大小以减少计算量,同时保留主要的特征来防止过拟合。以下主要讨论两种池化方法以及不使用池化对算法性能的影响。图3 为在使用dropout 比例为0.5 时,分别使用平均池化、最大池化以及不使用池化采样时测试集准确率变化趋势对比。

图3 平均池化、最大池化以及无池化采样时的测试集准确率对比

采用平均池化还是最大池化采样表现较不采用池化时均有下降。表3 为性能对比。由于使用2×2 池化降低需要训练的参数量,平均单步训练时间较无池化采样时低,池化丢失了部分特征使得网络收敛速度以及最终的测试集表现都较无池化采样低,故使用网络模型在原有基础上去掉池化层。

表3 无池化、平均池化以及最大池化性能对比

Dropout 可以起到防止过拟合的作用,本节主要讨论选择不同比例p 时对网络表现的影响,以选择较优的p 值。图4 为p 值分别为0.1、0.3、0.5、0.8和1(p=1 表示不使用dropout)时,测试集准确率变化趋势对比。

图4 p值分别为0.1、0.3、0.5、0.8以及1时的测试集平均准确率变化趋势对比

表4 为使用不同dropout 比例时的测试集平均准确率对比,对于使用的神经网络而言,当p=0.1即每次仅使用10%的全连接层节点用于参数更新时,网络难以充分训练,使得模型在训练集和测试集上的表现较差。p=0.5 时,网络在测试集上的表现最佳。最终的模型参数选取随机失活比例为0.5,其识别准确率可达86.71%。

表4 使用不同dropout比例时的测试集最大准确率对比

5 结语

本文对目标识别问题进行建模分析,提出一种基于卷积神经网络的目标识别方法。通过计算特征信息与目标身份向量的匹配度构造固定大小的目标身份决策矩阵,作为卷积神经网络输入,并针对该矩阵的特性修改了网络结构。仿真产生目标识别算法的样本集,在样本集上设计仿真对比试验优化了池化方式以及随机失活比例等参数。当传感器量测误差在一定范围内随机变化时,基于卷积神经网络的目标识别算法在该数据集的识别准确率达到86.71%,证明了算法的有效性。

猜你喜欢

辐射源池化准确率
基于高斯函数的池化算法
基于单站干涉仪测向法的未知辐射源定位技术*
卷积神经网络中的自适应加权池化
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
基于博弈论的GRA-TOPSIS辐射源威胁评估方法
基于多参数联合模糊处理的雷达辐射源威胁等级判定
用于手写汉字识别的文本分割方法