APP下载

基于局部熵描述子的步态性别识别方法*

2019-08-14

传感器与微系统 2019年8期
关键词:步态像素点样本

张 德

(北京建筑大学 电信学院,北京 100044)

0 引 言

步态识别近年来已经成为计算机视觉和生物特征识别领域的研究热点。与指纹、虹膜和人脸等传统生物特征识别技术相比,步态识别具有非接触性、非侵犯性、可远距离识别和难以伪装等优势。因此,步态识别在视频安全监控、人机交互、门禁系统和医疗诊断等领域具有广泛的应用前景。步态识别主要是通过人们走路的姿态进行身份识别,而个体的一些身份属性,如性别、年龄和种族等,也是身份识别技术中重要的组成部分。

在步态识别发展的初期阶段,就有学者进行了步态性别识别的研究。文献[1]中提出了椭圆模型,从步态轮廓图提取特征信息,然后进行了身份识别和性别分类的实验。近年来,研究人员更多的关注于非模型的方法,这样可以减小步态特征提取时的计算复杂度和数据存储量,加快整个识别系统的处理速度。文献[2]中使用步态能量图,通过类间的协同表示进行分类识别。文献[3]提出了改进对数Gabor相位一致性特征,并比较了视角变化情况下的步态识别正确率。文献[4]提出一种质心角约束条件下加速特征点匹配的步态识别方法,有很好的时间效率。文献[5]使用动态特征和静态特征融合的方法,并分析了视角和衣着变化对识别率带来的影响。文献[6]使用HOG特征改进步态能量图,实验效果良好。文献[7]提出了修正步态能量图(modified gait energy image,MGEI)进行步态识别,采用熵来描述MGEI特征,并以此进行了步态视角的检测。熵可以有效描述图像的纹理,在文献[8]和文献[9]中也应用了熵的概念,计算步态熵图(entropy image),然后基于此

特征进行识别实验。

近年来的文献中关于身份属性识别的研究较少,因此,本文主要进行基于步态的性别识别研究。另外,近期的国内外文献大多数都分析了视角变化对步态识别率的影响[3,5,7,10,11],所以本文也研究了不同视角下步态性别识别率的变化。考虑到步态的运动特性,本文采用文献[12]提到的运动历史图像(motion history image,MHI)作为基础特征,然后使用像素点邻域的局部熵进行进一步的特征描述。通过熵信息的提取,可以更加准确地表达行走过程中人体不同姿态之间的运动变化特征。最后,使用CASIA B步态数据库,进行了基于局部熵描述子特征的性别分类实验,并讨论了视角变化对性别识别率的影响。

1 基于步态的性别识别

步态识别一般包括数据预处理,步态周期检测,特征提取和分类识别几个步骤。首先从步态视频中提取每一帧步态图像,然后通过背景减除得到步态轮廓图像,并进行归一化处理。接下来检测步态周期,提取出一个周期的步态图像,基于此生成步态运动历史图像,再通过局部熵描述子的计算得到相应的熵信息图像表示,最后进行性别分类。

归一化处理的目的是保证在特征提取阶段从不同个体提取到的特征的一致性。本文归一化后步态轮廓图像的大小为,首先把轮廓区域的重心与整个图像的中心对齐,然后把轮廓区域按照自身的比例进行缩放,让所有的轮廓区域达到相同的高度。归一化后来自不同视角的步态轮廓图像如图1所示。

图1 归一化步态轮廓图像

1.1 步态周期检测

步态是一种周期性的运动,所以,步态特征的提取一般使用一个周期内的数据。这里用Ngait表示步态周期的大小,即一个周期内包含的图像帧数。对Ngait的估算,本文采用一种传统有效的方法。在人们的行走过程中,双腿交替前进,一个完整的步态周期实际包含两步行走。并且,对于同一个步态序列的不同视角而言,步态周期的大小是一样的。在侧面90°视角下,可以清楚地观察到双腿从重叠到分开的循环过程。因此,采用侧面视角的步态数据进行周期检测非常方便。给定步态轮廓图像序列,计算每帧图像中人体轮廓腰部以下的前景像素点个数,并以此作为统计信号,用Nf(t)记录其随时间变化的过程,如图2(a)所示。该信号在双腿分开到最大程度时达到最大值,当双腿并列重叠时达到最小值。两个值的差值就是半个步态周期的大小。但是,由于数据预处理产生的噪声的影响,Nf(t)的变化曲线并不平滑,难以准确判断最大值和最小值出现的时刻。因此,这里使用自相关进行去噪处理,然后准确估计出步态周期的大小。

首先,使用下式得到一个新的信号ω(t)

然后,计算ω(t)的自相关函数,如式(2)所示

Rω[m]=E{ω(t)ω(t+m)}

(2)

式中E{·}为数学期望运算。这时,使自相关函数Rω[m]取得局部最大值的最小m值(m不能是0)就是半个步态周期的大小。从图2(b)中可以观察到自相关函数的平滑性。由此,Ngait=2m,步态周期的大小估计完成。

图2 前景像素点数量及自相关函数曲线

1.2 MHI构建

MHI以一种累计的方式来描述运动过程的整体模式,记录的是时空信息。MHI把连续的动作图像序列集成在一个静态图像上,紧致有效,实时性强。步态是人体的基本运动过程之一,因此本文使用MHI进行步态基础运动特征的提取,以此进行不同性别群体的分类。

MHI构建的基本公式如下所示

从中可以看出,MHI图像中每个像素点的值表示的是时间戳信息τ,可用来表示运动历史特性。函数φ是用于检测τ的判断函数,可以是背景减除、光流或者帧差等。这里,考虑到输入图像序列是步态轮廓图像,因此选用连续两帧间的帧差法进行函数φ的计算。对于一个周期的步态图像序列,帧数从1开始编号,帧差不为0的点在MHI中的像素点值τ就是当前帧的序号。还有,δ作为延时参数,实际表示的是MHI记录的历史图像总帧数。由于本文使用一个周期的步态图像进行MHI的计算,所以这里把设为步态周期的大小,即δ=Ngait。由此生成的步态MHI图像如图3所示,分别来自不同视角下的男性样本和女性样本。

1.3 局部熵描述子特征提取

如上节所述,MHI包含着随时间变化累计的运动变化特征,在MHI图像中(如图3(a)所示),较亮的区域表示人体运动发生的地方。运动发生区域内部的纹理结构同样反映在MHI中。本文通过探究运动区域的纹理信息来寻找不同性别群体之间的步态差异。

信息熵可以应用于图像纹理特征的分析,由于图像像素点的灰度值可看作离散随机变量,该变量的熵可按照下式计算

式中 (x,y)为像素点的坐标,pk(x,y)为该像素点取第k个灰度值的概率。文献[8]基于香农公式和灰度直方图计算图像的熵。文献[9]使用了基于香农公式扩展的Renyi熵进行图像特征提取。

为了更进一步地分析纹理信息特征,本文提出了局部熵描述子的思路。首先,计算每个像素点邻域的香农熵,然后把该熵值作为该像素点的灰度值,从而生成一个新的基于邻域熵值的图像,称为局部熵描述子图像。这里,比较关键的是邻域大小的选择,一般根据输入图像的大小来确定。本文归一化后步态轮廓图像的大小为100×155,所以选取100和155的公约数5来确定邻域的大小,即邻域为5×5。由此生成的局部熵描述子图像如图3(b)所示,它们分别来自不同视角下的男性样本和女性样本,和图3(a)所示样本是一一对应的。

图3 MHI图像与局部熵描述子图像

2 分类器选择

在分类识别系统中常用的分类器有最近邻算法[3,4,6,7]和支持向量机[13]。支持向量机在解决小样本、非线性及高维模式识别中有很大优势,并且它是一个二类分类器。因此,本文采用支持向量机进行性别分类识别。

假设给定一组来自两个不同类别的训练样本(xi,yi),其中xi∈RN,yi∈{-1,1},yi是样本的类别标签。支持向量机要找到一个最佳超平面,把这些样本数据分为两个部分,并且,这个超平面到每部分最近数据点的距离是最大的,即最大间隔超平面。支持向量机的关键在于核函数,所以,本文采用不同的核函数进行了实验。

3 实验结果与分析

使用中科院自动化所提供的CASIA B步态数据库进行了实验。该数据库是一个大规模,多时间的步态库。共有124个人,其中男性63人,女性31人。每个人有11个视角(0°,18°,36°,…,180°)和3种行走模式(普通,背包和穿大衣)的数据。其中,普通行走模式下有6个步态图像序列。本文选取了31个女性样本,并随机选取了31个男性样本进行性别识别的实验。每个样本都使用了其11个视角和6个普通行走模式序列的数据。

本文分别对每个视角进行了实验验证,然后比较不同视角下的性别分类结果。实验过程采用了留一校验法,每次选取1个男性样本和1个女性样本的普通行走模式序列(共12个)作为测试集,余下的30个男性样本和30个女性样本的行走序列数据(共360个)作为训练集。这样,共循环31次,采用平均识别率作为最后的识别结果。支持向量机的核函数选取Linear和3阶Polynomial分别进行了实验,结果如表1所示。

表1 不同核函数类型下的步态性别识别结果

从表1中可看出,线性核函数(linear)下识别结果优于非线性核函数(polynomial),所以,可以认为基于步态的性别分类更具有线性的特点,和文献[1]给出的不同核函数的表现一致。另外,不同视角下性别识别正确率之间的差异比较大,其中正面0°和18°视角下效果最差,侧面视角90°和侧背面视角162°效果最好。综合来看,侧背面的几个视角下性别识别的表现比侧正面明显要好。

接下来,选取了识别效果较好的6个视角(分别为36°,72°,90°,126°,144°,162°)的数据进行了不同方法比较的性别识别实验,比较的方法包括MHI、步态能量图(gait energy image,GEI)和本文提出的局部熵描述子图像。都使用了主成分分析法(PCA)对图像进行降维处理,然后使用linear核函数的支持向量机进行分类识别。实验结果如图4所示。

图4 不同特征提取方法的性别识别率比较

由图4可以直观的看出,本文方法优于基础的MHI和经典的GEI两种方法。说明通过局部熵对运动区域内部纹理特征进一步的描述,不同性别群体之间的步态差异得到了更全面的表达。在多个不同视角下,步态性别识别的准确率都可以得到有效的保证。

4 结束语

本文进行了基于步态的性别识别研究,在提取步态运动历史图的基础上,借鉴了步态身份识别中使用的信息熵方法,通过对MHI像素点邻域信息熵的计算,生成了局部熵描述子图像。为了得到更有效的特征并减少计算量,采用主成分分析(principal component analysis,PCA)进行降维处理。然后使用支持向量机作为分类器进行了性别识别的实验。在CASIA B步态数据库上的实验结果表明,本文方法具有较高的正确识别率,优于对比方法。然而,由于增加了熵计算的步骤,影响了运算效率,有待进一步改善。

猜你喜欢

步态像素点样本
基于步态参数分析的老年跌倒人群步态特征研究
用样本估计总体复习点拨
基于局部相似性的特征匹配筛选算法
基于面部和步态识别的儿童走失寻回系统
基于5×5邻域像素点相关性的划痕修复算法
推动医改的“直销样本”
基于Kinect的学步期幼儿自然步态提取
基于canvas的前端数据加密
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
随机微分方程的样本Lyapunov二次型估计