APP下载

基于谷歌眼镜的人脸识别系统设计与实现

2016-06-30梁永睿

物联网技术 2016年6期
关键词:增强现实人脸识别

梁永睿

摘 要:可穿戴技术的飞速发展为生活带来了极大便利,本研究致力于将人脸识别技术应用于一款可穿戴设备——谷歌眼镜,以充分发挥其解放双手的优势,使得人脸识别可以在不影响其他工作的基础上随时随地地进行。为了实现在谷歌眼镜上的人脸识别,文中采用GDK原生开发方式,并利用LBP特征的Adaboost分类器进行人脸检测和Fisher特征的分类器进行人脸识别,从而实现了这一系统的应用。

关键词:人脸识别;谷歌眼镜;可穿戴技术;增强现实

中图分类号:TP391.41 文献标识码:A 文章编号:2095-1302(2016)06-00-02

0 引 言

基于面部特征的人脸识别技术成为模式识别和人机交互领域的研究热点。它在智能视觉物联网、以人为中心的普适计算、公共安全、金融服务和视频会议系统等众多领域有着广泛的应用[1]。

谷歌眼镜是Google于2012年推出的一款头戴式智能电子设备, 它以免手持、与智能手机类似的方式显示各种信息[2]。穿戴者通过自然语言语音指令与互联网服务联系沟通。与手机相比,谷歌眼镜操作更加快速、直观并且解放了双手,可让人们与互联网时刻互联[3]。谷歌眼镜作为增强现实设备,其使用的小屏幕可以在眼前的真实世界上叠加信息,实现信息世界与真实世界的无缝连接,从而形成增强现实的场景[4]。而这一巨变将引发一场新的、深刻的信息技术革命。谷歌眼镜鲜明的优势为人脸识别带来很大方便,相关人员不需要安置专用的识别机器,或是占用双手来进行操作[5]。

基于谷歌眼镜的人脸识别系统将人脸识别技术在保证性能的基础上,以更贴合嵌入式设备的方式在谷歌眼镜上实现,谷歌眼镜作为可穿戴设备解放了双手,使人脸识别的应用场景得到了极大扩展,可在不影响本身工作的基础上进行身份识别验证等功能[6-8]。

1 系统结构设计

本系统的结构图如图1所示。完整的人脸识别需要经过图像获取、图像预处理、人脸检测器检测、人脸识别器识别以及最后的结果显示几个过程。其中,人脸检测器和人脸识别器需提前训练获得,系统在使用过程中可通过特定身份的人脸图像进一步训练完善人脸检测器。

人脸检测器的训练过程如下:选取一定数量的人脸和非人脸图像,首先进行缩放、直方图均衡等预处理步骤,通过LBP特征提取得到弱分类器,通过Adaboost循环训练获得最终的强分类器。

人脸识别器的训练过程与人脸检测器的训练过程类似,首先是对人脸图像的预处理,包括几何变换、剪裁、直方图均衡、平滑、椭圆掩码等步骤,接着利用Fisher特征对图像信息进行降维处理,计算出最佳分类器,进而得到最终的人脸识别器。

2 人脸识别技术

2.1 人脸预处理

人脸预处理后把图像的外界影响因素尽量降低,如光照,角度等[9],人脸预处理各步骤的结果如图2所示,主要涉及的操作有以下内容:

(1)几何变换、剪裁:缩放、旋转和平移图像,使眼睛对齐,删除额头、下巴、耳朵和背景;

(2)直方图均衡:标准化左右两侧的亮度和对比度;

(3)平滑:使用双边滤波器减少噪声;

(4)椭圆掩码:去掉一些剩余头发和人脸图像背景。

2.2 人脸检测

人脸检测器的主要训练过程如下:

(1)选定正负样本,提取其LBP特征,并用直方图表示,LBP算子如图3所示。

LBP相较于haar等其他特征运算速度更快,便于在嵌入式等平台运行。LBP(Local Binary Pattern, 局部二值模式)用来提取图像的局部纹理特征,计算方式如下:

P为邻域等距分布P个点,gc为中心像素点灰度值,gp为邻域像素点灰度值。

(2)训练多个弱分类器,为每个LBP特征都训练一个弱分类器。

(3)利用Adaboost分类器训练得到最终的强分类器:循环多次进行人脸分类判断,更新权值,提取出错误率最小的弱分类器,并用这些弱分类器组成强分类器。用多个上述得到的强分类器组成级联分类器,即最终的强分类器。

具体计算过程分为如下几步:

(1)初始化每个样本的权值ωi= 1 / N, i = 1,2,…,N。

(2)对每个样本利用弱分类器的学习算法训练弱分类器ft (x)∈{-1,1},并计算错误率εt=Eω [I(y≠ft(x))]和加权系数αt=log[(1-εt)/εt]。

(3)更新权值ωi←ωiexp[αt.I(ft(xi)≠yi)],并重新归一化,使得∑iωi=1。

(4)输出分类器F(x)=sgn[∑Tt=1αtft(x) ]。

检测器通过大量的人脸和非人脸图片进行训练,存在XML文件中。在得到每个像素的LBP编码描述后,采用统计直方图方法可得到图像的LBP直方图描述。

2.3 人脸识别

Fisher是典型的分类技术,在降维之后的空间中,样本的类内间距变小,而类间间距变大,使得空间能实现最大限度的分离。Fisher是一种基于LDA(Linear Discriminant Analysis,线性判别分析)的将映射到低维空间的降维方法。

Fisher最佳投影平面求取方法如下[10]:

其中,Sω为类内散度矩阵,Sb为类间散度矩阵,||x||2代表x的欧氏距离,是第c 类数据的均值向量,是所有训练数据的均值向量。

得到最佳投影平面后,判断某人脸和数据库内人脸相似的方法如下:将此人脸在前k个最大特征值的特征向量上做投影,得到k维的列向量或者行向量,将其和已有的投影求得欧式距离,根据阈值来判断是否匹配。

3 人脸识别系统实现

猜你喜欢

增强现实人脸识别
人脸识别 等
揭开人脸识别的神秘面纱
基于(2D)2PCA-LBP 的人脸识别方法的研究
人脸识别在高校安全防范中的应用
照片建模与增强现实实验在三维软件基础课程中的应用
增强现实技术在职业教育中的应用
虚拟现实技术和增强现实技术在建筑业的应用初探
虚拟现实技术和增强现实技术在建筑业的应用初探
基于类独立核稀疏表示的鲁棒人脸识别
基于K-L变换和平均近邻法的人脸识别