基于HMM的嵌入式人脸识别系统研究
2012-09-06崔绍华王怀友
崔绍华,王怀友
(承德供电隆化分公司,河北承德 068150)
由于不需要特殊的采集设备,基于嵌入式的人脸识别系统,相比传统鉴别身份的系统,具有很强的优势,它成本较低,并且使用简单;同时,由于人脸识别不对使用者造成干扰,并不去侵犯使用者的个人隐私,容易被用户所接受。
本文以嵌入式ARM11系统设计为主线,以HMM数学模型为图像处理理论基础,描述了完成视频采集、面部检测与人脸识别等功能相对应的硬件平台研发和软件功能的开发及实现过程;以及并对图像预处理的相应浮点算法进行了优化,从而提高了该嵌入式系统的性能。
1 系统硬件架构
本系统采用了S3C6410作为处理器,它是Samsung推出的以ARM 11 76JZF-S为内核的芯片。它的优秀的处理能力已成为设计便携式设备的首选。设计中为了满足智能终端对图像视频采集的要求,人脸识别系统硬件结构图如图1所示。
图1 人脸识别系统硬件结构图
2 图像采集硬件设计
OmniVision公司生产的图像传感器OV7640 CMOS芯片,是一款高灵敏度、低电压(2.5V)、高性能的图像传感器。
由于图像采集系统需要对数据进行实时采集并存储,因此需要系统的数据传输速率较高,需要硬件之间的搭配尽量合理。本系统硬件设计中,在采集和传输设备中间加了相应的缓存器件。即采用OV511芯片扩展OV7640的DRAM,OV511是一个专用的数字摄像IC的USB接口芯片,它能够起到缓存作用,从而实现高速USB数字视频图像采集并存入嵌入式处理器。
3 图像采集程序
本设计使用Linux做为操作系统开发平台,关于操作系统的移植方法在此不再介绍。Video 4 Linux(简称V4L),是Linux操作系统内核中关于视频设备的驱动模块,它有专门针对视频设备的接口函数,为进行图像编程提供方便。在程序设计时,Linux内核开放了Video4Linux接口,所以在图像处理时,我们首先做的设计程序是基于Video4Linux的API函数编程。
图像采集的程序框图如图2所示。
图2 图像采集的程序框图
4 识别算法设计
视频采集、数字图像处理、传送和HMM识别算法等多个技术都在这个设计中得到应用。面部识别过程,第一步要判断输入的视频单帧图像中是否包含人脸信息,如果有,就进一步判断人脸的具体位置、尺寸和每个主要面部器官的具体位置,并根据这些数据,再计算每个人脸范围内所包含的个人身份特征。通过将其与数据库中的已有人脸信息进行对比,判断并识别人的身份[3]。
人脸识别的算法过程包括视频预处理、图像面部区域检测和人脸识别等部分。
从待识别图像中确定人脸区域中各特征目标的区域,并将此区域分割开称为人脸检测。根据现有的人脸数据库,完成待测人脸所对应人脸库中的唯一标号称为人脸识别。人脸检测和人脸识别互为前提和目的。鉴于HMM同时可完成人脸检测和人脸识别,因此在程序设计中我们将这两者同时处理。
4.1 隐马尔可夫模型描述
隐马尔可夫模型是一组针对特征化信号进行特性统计的数学模型,这其中包括两个相关的过程:第一个是有限状态马尔可夫链,它是是隐藏的、不可见的,由初始状态概率分布函数和状态转移概率矩阵组成,第二个是一组概率密度函数,它是与状态有关的。
一个HMM的基本组成元素如下:
(1)HMM模型的状态个数N,如果假设S是状态集合,那么S={S1,S2,…,SN}。模型在时间t的状态记作qt∈S,其中1≤t≤T,此处T为所被测序列的帧数(又称长度)。模型历经的状态序列记为Q={q1,q2,…,qT}。
(2)设被测符号数为M,V是所有模型的Codebook(又称为被测符号的集合),则V={v1,v2,…,vm}。
(3)状态转移概率矩阵A={aij},aij=P(qt=Sj|qt-1=Si),1 ≤i,j≤N。对它的约束条件为0 ≤aij≤1,而aij
=1。
(4)被测符号概率矩阵B={bj(k)},bj(k)=p(ot=vk|qt=Sj),1≤j≤N,1≤j≤M。其中ot是时间t下的被测符号(被测矢量序列为O={o1,o2,…,oT})。
(5)被测符号初始状态概率分布∏={πi},πi=P(qi=si),1≤i≤N。
因此一个HMM可以表示为λ={A,B,∏}。由于其输入V={v1,v2,…,vm}是有限元集合,因此称其为离散隐马尔可夫模型[4]。
4.2 人脸识别HMM模型设计
根据状态转移的过程,HMM可分为ergodic(遍历的)和1eft-right(从左到右的)。遍历表示其状态转移是随意的,可以到自身和所有可能的状态,从左到右的状态转移只限于本身和下一个状态。由于人脸垂直方向(由上至下)和水平方向(从左至右)各个特征具有自然不变的顺序,所以用由上至下的1D-HMM来模拟人脸,如图3所示。
图3 用于人脸识别的HMM模型
4.3 面部特征提取
我们将宽度定义为W,高度定义为H的人脸图像,划分为可重叠的块。块的高度定义为L,重叠深度定义为P。因此,从该图像提取的总分块数做为被测矢量数T,则T=(H-L)/(L-P)+1。其中参数L和P的选取会影响系统的识别率,L的选择应该比较谨慎,因为较小的L值会使被测矢量不能得到有效鉴别;过大的L会增加剪切时的相交特征概率。过大的重叠深度值P会增加垂直特征向量的数量,能够提升系统的识别率。经过检验当P大时,L的变化对最终识别率影响不大。文献[6]详细阐述了与HMM使用的状态数与参数P和L之间的相互作用关系。面部特征提取分割算法流程如图4所示[5]。
图4 人脸区域提取流程图
4.4 隐马尔可夫模型的训练
我们为人脸数据库中每个图像建立一个HMM模型,使用同一个人的6张不同面部照片对模型进行训练。方法是:采用子块划分的方法,得到了被测矢量序列——2D-DCT变换系数矢量。采用被测矢量序列O={o1,o2,…,oT}对人脸HMM模型进行训练,得到参数。
首先需要我们对HMM模型λ={A,B,∏}进行初始化工作,通过对人脸图像数据自上而下均匀分割,我们能得到训练数据。模型状态数N对应照片数,等于6,被测概率矩阵B的初始估计就是每一个状态有关的被测矢量序列。A和Π的初始估计按自左到右的人脸模型结构给出。通过使用Baum-Welch估计算法 (最大似然估计方法)重新估算模型参数,用它来检测P(O/λ)的收敛条件。
当满足式(1)时,表面模型收敛,结束迭代训练过程,不然继续对模型进行训练。
式中,C为预先设定的阈值。
4.5 人脸识别
和训练过程相同提取被测矢量序列的方法相同,被测矢量序列的概率由人脸图像HMM模型计算得出,即:
当被识别人脸图像和对应数据库中第k个人的特征信息相同时,则被识别出[6]。
试验证明,此算法简单,易于在嵌入式系统上实现实时处理。由于不受脸部表情变化的影响,因此错误率低,鲁棒性好。研究中也发现,在人脸识别过程中的光照影响和姿态问题需要解决,问题还有待于深入研究。
5 结论
具有硬件体积小、算法计算简便、运算性能高,性能突出等特点,基于嵌入式ARM11硬件平台和隐马尔可夫的人脸识别系统,可以满足识别设备微型化的需要。随着技术的发展,在不久的将来,基于人脸识别的嵌入式系统将在各种安检、楼宇门禁、身份验证、工作考勤等场合得到广泛应用。
创新点:
人脸识别是人类特征识别中一个主要的研究方向,是无侵犯式、非接触身份识别的重要方法。在嵌入式系统能够实现人脸识别设备的便携化,通过它进行人脸识别,能够极大地拓宽识别设备的使用范围,为工作提供便利。使用HMM算法实现识别功能,可以有效降低识别算法难度,提高效率,为实现实时地识别提供了一种可能。
[1]Wang Zhiliang,Zhao Yanling.An Expert System of Commodity Choose Applied with Artificial Psychology[J].IEEE International Conference on Systems,Man and Cybernetics,2001:2326-2330.
[2]李侃,廖启征.基于S3C2410开发平台与嵌入式Linux的视频采集应用[J].微计算机信息,2006,22(3-2):125-127,168.
[3]徐毅琼,李弱程,王波.基于隐马尔可夫模型的自动人脸识别方法[J].计算机应用,2004,24:225-227.
[4]黎冰,吴松,曾凡涛.人脸识别在智能终端中的实现[J].计算机工程,2006,32(7):272-274.
[5]NEFIAN AV,HAYES MH.Face Detection and Recognition Using Hidden Markov Models[A].Proceedings of the International Conference on Image Processing[C].1998.141-145.
[6]Samaria F,Young S.HMM Based Architecture for Face I-dentification[J].Image and Computer Vision,1994,12(4):537-543.
[7]Samaria F.Halter A.Parameterization of Stochastic Model for Human Face Identification[C].USA:Proceedings of the Second IEEE Workshop on Application of Computer Vision,1994.