APP下载

超宽带雷达人体姿态识别方法研究

2021-10-08李俊侠张秦郑桂妹

现代电子技术 2021年19期
关键词:超宽带姿态卷积

李俊侠,张秦,郑桂妹

(1.空军工程大学 研究生院,陕西 西安710051;2.空军工程大学 防空反导学院,陕西 西安710051)

0 引言

近些年,人体姿态识别在安防监控、人机交互、安全驾驶、医疗健康和体育健身等领域都有着重要的意义和广泛的应用前景[1-4]。根据传感器的种类,现有的人体姿态识别方法可分为可穿戴式和非接触式两类。可穿戴式传感器类似手镯、脚踝监视器等[5],必须贴身佩带,存在普适性小、便携性差、损坏率高、功能单一、误报率高等问题。摄像头作为传统的非接触式传感器,对存储空间和信息处理能力要求较高、对光照等条件也较为敏感,存在视力盲区且易泄露个人隐私。

尽管基于雷达的人体识别系统仍处于发展初期,但已有众多学者验证了其鲁棒性、隐私性和安全性。文献[6]利用连续波雷达提取多普勒特征,从多普勒图中提取4个特征训练支持向量机(SVM),以识别6种有节奏的人体运动,分类准确率达到90%以上。文献[7]利用调频连续波雷达提取人体动作的动态范围多普勒轨迹(DRDT),结合机器学习分类方法,将连续运动分离为单个事件进行处理,平均准确率为91.9%。文献[8]率先将深度卷积神经网络(DCNN)应用于基于微多普勒特征的人体活动分类,并将其转化成图像分类问题。文献[9]在文献[8]的基础上,利用多普勒雷达并结合DCNN方法和转移学习方法,进行五种常见的人体水上活动的分类识别,达到了SVM近2倍的精度。

综上,基于雷达的人体姿态识别可以在简单架构中实现高度相似动作的分类识别,故此方案是可行的。同时UWB雷达具有高分辨率、强穿透性和功耗低等特点,可全天候、全天时进行工作,能有效克服摄像头存在的光照和隐私问题。因此,利用UWB雷达系统进行人体姿态识别是一个更好的选择。

1 超宽带雷达系统

1.1 组成与定义

超宽带(Ultra-Wideband,UWB)雷达的概念是美国Los Alamos国家实验室在1990年3月召开的超宽带雷达会议上首次提出的[10]。超宽带是针对信号的相对带宽而言的,即:

或满足:

式中:μf表示相对带宽;μr表示频段比;fh和fl分别是信号的上限频率和下限频率。

信号相对带宽与频段比的定义如表1所示。

表1 信号相对带宽与频段比的定义

典型的超宽带雷达是由波形产生器、发射机、接收机、收发天线和信号处理器等部件组成[11]。其中,波形产生器产生超宽带信号波形,超宽带信号波形具有下列两个特征之一:有极短的持续时间或有复杂的波形(包含许多频率分量)[12]。目前广泛采用的超宽带雷达信号主要有两类:冲激信号和非冲激信号。其中,非冲激信号主要是指LFM、随机噪声等。冲激信号是一种无载波信号,主要通过采用基带波、单周波及多周波发射脉冲宽度为纳秒量级的信号,从而获得超宽带。冲激体制的超宽带雷达的系统结构比较简单,无需任何变换和放大,信号处理系统也较为简单,因此在实际应用中被广泛采用。

1.2 超宽带脉冲信号

目前,基于脉冲形式的无载波信号是超宽带雷达系统中采用最多的信号,其中常见的超宽带雷达脉冲信号的形式主要有多周期脉冲信号、升余弦脉冲波形、高斯脉冲等。

1)多周期脉冲信号

多周期脉冲信号是最直观的一种超宽带脉冲信号。它是用一个矩形信号或窗函数与正弦函数相乘,然后截取N个周期的正弦信号,即:

式中:f0是正弦波频率;T是正弦波周期;u(t)是阶跃信号。该信号的优势在于以正弦波频率为中心,频谱配置较为灵活;但载波调制形式对于频率稳定性要求较高,不利于系统简化。

2)升余弦脉冲信号

该信号是从频域发出的信号,需满足:

式中:B为 脉 冲 带 宽;fΔ=B-f6dB,f1=f6dB-fΔ,f6dB是-6 dB频率点。假设系统带宽为7.5 GHz,f6dB=3.75 GHz,故fΔ=3.75 GHz,f1=0。可以得到相应的时域信号为:

对h(t)进行搬移,设搬移后的中心频率为fc=6.85 GHz,则最终传输形式为:

3)高斯脉冲

基本的高斯信号表达式为:

式中σ控制脉冲有效宽度,是高斯信号的均方差,即脉宽因子。

对式(8)进行傅里叶变换:

则相应的功率谱密度为:

基本高斯脉冲的微分形式为:

则其对应的功率谱密度为:

由上式可知,高斯信号具有以下特点:微分形式相对简单,有利于建模分析;在时频域都有较好的分辨率;通过调整σ和微分次数n就可调节发射信号的中心频率和带宽;物理实现相对简单,可近似表示多种超宽带信号。因此,高斯脉冲是在人体姿态识别中采用最多的超宽带信号。

2 超宽带雷达人体识别研究方法

基于雷达的人体姿态识别与基于计算机视觉领域的人体姿态识别区别较大,但本质都是提取人体姿态特征。在雷达领域的目标特征量不如视觉图像领域丰富,所以更侧重于对分类识别算法的创新与改进。下面将根据分类识别算法的不同,对超宽带雷达人体姿态识别的研究方法进行概述,详见图1。

图1 超宽带雷达人体姿态研究方法分类图

2.1 传统的机器学习方法

早期的人体姿态识别方案主要采用传统的机器学习方法,如支持向量机(SVM)、K近邻法(K-NN)等。这些分类识别方法是基于统计学理论,主要依靠从原始回波数据中提取的浅层特征如均值、方差、欧氏距离、傅里叶变换和短时傅里叶变换(STFT)等[13]。而后根据采用的特征提取方案如主成分分析(PCA)法、离散余弦变换(DCT)法等,选择突出的浅层特征进行人体姿态识别。如文献[14]使用超宽带雷达研究对不同人体活动进行分类识别的可行性。作者分别采集8位参与者8种典型的人体活动,然后利用PCA提取回波信号的主要分量,并结合SVM进行分类识别,最后达到85%的识别率。文献[15]通过小波包分解方法提取8种人体姿态的超宽带雷达信号的能量分布特征,然后利用改进的混沌自适应遗传算法(Improved Chaos Adaptive Genetic Algorithm,ICAGA)对SVM参数进行优化,最终得到97.6%的识别正确率。文献[16]对原地姿态和非原地姿态进行分层处理,通过集成学习方法进行分类识别,得出:K-NN法对6种原地姿态识别准确率达到94.4%,Bagged决策树法对6种非原地姿态识别率高达95.3%。文献[17]引入多层分类方法,提出加权距离-时间-频率变换(WRTFT)方法获得相应的频谱图,然后提取基于PAC的特征以进行机器学习,得到原位运动的平均准确率为85%,非原位运动的平均准确率为90.5%。文献[18]首次搭建无载波超宽带雷达人体姿态识别系统,创新性地利用改进的网格搜索算法(Improved Grid Search,IGS)优化SVM的参数,最终利用优化的SVM对10种人体动作的识别准确率高达99%。

尽管如此,由于浅层特征的多样化会潜在地增加不同特征之间的冗余度,获取更多的浅层特征不一定会提高识别的精度,因此基于传统的机器学习方法的人体识别方案,为了确保识别的效果通常会提取大量的浅层特征,而不去管这些特征是否最终真的用于识别。另外,传统的人体姿态识别方案对于涉及到过渡动作的复杂人体姿态的识别效果一般。

2.2 深度学习方法

深度学习源于人工神经网络的研究领域,其概念最早由Geoffrey Hinton等人于2006年提出[19],主要是通过构建很多隐含层的机器学习模型和海量的训练数据,自动学习隐含的有用特征并生成用于识别的虚拟特征,从而提升分类识别的自动化和准确化。而这些由深度神经网络探索的虚拟特征被认为是深度学习特征,典型的深度学习算法包括卷积神经网络(CNN)、递归神经网络(RNN)等。基于上述原因,近些年基于深度学习的超宽带雷达人体姿态识别模型吸引了众多研究者的关注。如文献[20]研究了使用深度卷积神经网络(DCNN)进行人体手势的微多普勒特征识别的可行性,对10种手势的识别准确率为85.6%,对其中7种手势的识别准确率为93.1%。文献[21]通过SIR-20高速探地雷达获取8种典型的人体姿态的回波信号,然后提取回波中距离随时间变化的特征信息生成距离-时间二维特征矩阵,并将特征矩阵输入到CNN进行训练识别,最终达到99.2%的识别准确率,提高了多种相似动作的识别准确率。文献[22]设计了9种经典的体育动作,利用超宽带雷达获取高分辨率距离信息,采用CDNN自动学习时间-距离像的分层特征并进行分类识别,平均识别精度达到96.67%,远高于常用的传统机器学习方法,如随机森林(RF)、K-NN、SVM。文献[23]利用超宽带雷达测量的微多普勒特征频谱图识别人体活动,提出分段卷积门控递归神经网络(SCGRNN),并使用门控循环单位沿时间轴对特征图进行编码,最终验证该方法在噪声鲁棒性和泛化性能方面均优于现有模型。

3 分类识别算法

3.1 支持向量机

SVM是文献[24]根据统计学习理论提出的,它建立在VC维理论和结构风险最小原理基础上,主要任务就是确定最优分类面的参数w和b,使分类间隔ρ最大化。假设训练数据集为:

式中:N为训练样本数;y是样本类别标号。w为权重向量;b为最优分类面偏移,那么d维空间的分类面判别函数为g(x)=w·x+b,分类面可定义为:

则样本x到最优分类面的几何距离为,将g(x)归一化,那么r=,分类间隔,图2为最优分类面示意图,则构造最优分类面等价于:

图2 最优分类面示意图

但是在线性不可分的情况下,样本数据无法满足式(15)。通过引入惩罚因子C,放宽对线性可分的约束条件,使得线性不可分变成线性可分,如图3所示。因此,增加一个松弛项ξi≥0,则式(15)就变成:

图3 原始数据非线性映射到特征空间

这是一个凸二次优化问题,该优化问题的拉格朗日函数为:

且满足αi≥0,μi≥0。对式(17)中w,b,ξ求偏导数且使其为0得:

由式(18)可得到:

将式(19)代入式(17),得到:

这样就将线性不可分问题转化成线性可分问题了,只需求解Q(α)的最大值即可。线性不可分SVM在实际应用中远比线性可分SVM要广泛,SVM的复杂程度取决于支持向量的数目,而非输入数据空间的维度,图4为SVM结构示意图。

图4 SVM网络结构示意图

图4中引入的K(xi,x)为核函数用来代替最优分类面中的点积运算,表2中给出了几种常见的核函数的相关表达。高斯核可以将样本数据映射到无限维,这里选择高斯核作为核函数。如图5所示,将UWB雷达人体回波信号进行预处理之后分成训练集和测试集,利用测试数据集提取的特征训练SVM模型,从而达到分类识别的目的。

3.2 卷积神经网络

深度学习[25]在学习执行分层任务、特征提取以及识别等方面具有很好的优势,尤其是卷积神经网络(CNN)是深度学习中最常用的模型,已成为图像处理和识别领域的主流方法。与传统的特征提取方法相比,它通过数据自动学习有效特征提取方法的机制,无需人工设计提取特征环节,减少了很多工作量,还能一定程度地提高识别的准确率。因此,可初步验证卷积神经网络算法应用于人体姿态识别的可行性和有效性。

卷积神经网络一般可分成输入层、卷积层、采样层(池化层)和输出层,它的训练过程是将处理好的数据在卷积层与采样层的作用下交替训练,即一层卷积层后接一层采样层,采样层后再接一层卷积,循环反复,随着数据卷积和采样的进行,逐步提取出特征,形成最后抽象的深度特征[26]。输入层可直接接收二维图像,无需人工参与提取合适特征环节。卷积层主要用于特征提取,可理解为加权求和的过程,它通过预设的卷积核对输入的数据进行特征映射。原始数据作为第一层卷积层的输入,第一层输出的特征图作为第二层的输入,以此类推,每层的输入都会与卷积核进行卷积运算输出一个特征图作为下一层的输入,卷积核按照预设的步幅滑动。图6为卷积神经网络的卷积运算演示,卷积核K是一个2×2的矩阵,步幅为1。

假设原始输入为A(m,n),卷积核为K,步长为1,那么该卷积层的输出S为:

式中,K亦称权重过滤器,相当于对输入数据进行特征提取的滑窗。卷积操作的局部连接方式大大减少了网络参数,同时,具有的权值共享性质可以提高网络学习与位置无关的鲁棒性。卷积计算的输出需要通过激励函数实现非线性变换,常用的激励函数包括Sigmoid函数、Tanh函数、ReLU函数,如表3所示。

表3 激活函数相关表达

表3中,Sigmoid函数把实数(-∞,+∞)压缩到(0,1)之间,且两端无限趋近于0和1,能很好解释神经元的激活。但当函数值趋近于0或1时,它的饱和特性会导致梯度消失,网络无法进行有效学习。Tanh函数将实数值压缩到(-1,1)之间,相当于放大平移后的Sigmoid函数,也存在饱和区域,但是输出是零中心的,学习效果比Sigmoid函数要好。ReLU函数具有很好的分段特征,当x≤0时,输出恒为零;当x>0时,函数为线性且输出等于输入。相比于Sigmoid和Tanh函数,ReLU函数采用随机梯度下降法进行优化,不仅能够克服梯度消失的问题,同时可以加快网络训练速度,因此往往选择ReLU函数作为激活函数,具体形式为:

在每次卷积之后都要经过池化层,池化是降采样和压缩过程,目的是为了让输入的特征更具有健壮性,降低其空间尺度,同时保持深度维度不变。池化的一般做法是将前一层的局部区域值映射为单个数值,即在滤波器算子滑动区域内取最大值或平均值,减少网络训练参数,加快训练速度,同时增强模型的泛化能力。假设上一层卷积输出为f(i,j),选择最大池化,则池化之后的特征为:

式中:L为池化尺度;s代表步长。这样可以减少数据量,同时保持特征平移不变。在一系列的卷积池化操作后,一般会添加Dropout层。Dropout是指在深度学习网络训练过程中,按照一定的概率(一般在20%~50%)将神经网络单元暂时从网络中丢弃,只用部分的神经元构建神经网络,让网络模型学习样本共性而非个别特征,从而防止网络模型过拟合,提高模型的鲁棒性和泛化能力。当然,针对大规模神经网络存在的过拟合问题,也可以通过增加数据量或添加正则化项(L1,L2)进行改善。

在Dropout层之后,多采用多项Logistic回归方法,利用Softmax函数进行分类识别。Softmax函数将训练得到的特征向量作为函数的输入,得到判为各个类别的后验概率结果,并选取概率最高的类别作为最终判别结果,从而完成动作的分类识别。对于给定的一组向量Zi(i=1,2,…,N),向量Zi的Softmax值可表示为:

图7 CNN结构示意图

4 超宽带雷达人体姿态识别模型

基于UWB雷达人体姿态识别系统包含人体回波数据采集、回波数据处理和特征提取、识别算法这三个关键部分,详见图8。其中,回波数据处理和特征提取方法可分为四类:一是基于传统统计学的方法,包括雷达回波包络的均值、方差、最大值、最小值等统计学特征;二是基于时频变换的方法,主要包括短时傅里叶变换、傅里叶变换(STFT)、伪维格纳分布(PWVD)、小波变换等;三是基于组件分析的方法,主要包括主成分分析法(PCA)和独立成分分析法(ICA)等;四是基于深度学习的方法,主流模型包括卷积神经网络、递归神经网络、深度置信网络等。目前,主流思想认为深度学习方法是一种识别分类算法,但本质上深度学习也是一种特征提取方法[27]。它通过多层卷积、池化等操作提取特征,然后将提取的特征通过全连接层类似Softmax分类器进行分类识别。

图8 超宽带雷达人体姿态识别通用模型

5 结语

本文基于超宽带雷达系统特性,将超宽带雷达人体姿态识别方法分成传统机器学习方法和深度学习方法两大类进行综述,重点对两类方法中具有代表性的SVM和CNN的原理进行分析和介绍,并分别给出了相关结构示意图,最后提出了超宽带雷达人体姿态识别的通用模型。目前,基于雷达的人体姿态识别的数据集鲜有公开数据,且数据采集和处理较为繁琐,存在样本量不足的现状,而深度学习的网络模型训练基于强大的数据库,如何在小样本数据量的基础上实现较高的识别准确率是当前研究的难点。此外,人的肢体复杂且灵活,当频繁出现相似复杂动作时,很难进行精准识别,这也是超宽带人体姿态识别的一大挑战。

猜你喜欢

超宽带姿态卷积
基于多模谐振器的超宽带滤波器设计
基于3D-Winograd的快速卷积算法设计及FPGA实现
攀爬的姿态
从滤波器理解卷积
全新一代宋的新姿态
跑与走的姿态
超宽带雷达建筑物结构稀疏成像
基于傅里叶域卷积表示的目标跟踪算法
一种基于射频开关切换的伪随机编码超宽带多发多收雷达设计
一种脊波导超宽带滤波器