CLAHE融合低频DCT系数重变换的人脸识别算法
2015-03-14江东林龙岩学院数学与计算机科学学院福建龙岩364000
江东林(龙岩学院 数学与计算机科学学院,福建 龙岩,364000)
CLAHE融合低频DCT系数重变换的人脸识别算法
江东林
(龙岩学院数学与计算机科学学院,福建龙岩,364000)
摘要:针对人脸识别中由于伪装(如围巾、太阳镜和头发)或其他物体引起的面部遮挡而严重影响识别率的问题,提出了CLAHE融合低频DCT系数重变换的人脸识别算法。首先将图像划分成多个互不重叠的局部小块,使用受限直方图均衡化对局部子块进行局部对比拉伸以实现去噪;然后,通过缩减适当数目的低频DCT系数来消除人脸图像中的光照变化;最后,利用核主成分分析进行特征提取,最近邻分类器完成最终的人脸识别。在扩展Yale B、FRGC V2.0及一个户外人脸数据库上的实验验证了所提算法的有效性及鲁棒性。实验结果表明,相比几种线性表示算法,本文算法在处理鲁棒人脸识别时取得了更高的识别率。
关键词:人脸识别;自适应直方图均衡化;低频离散余弦变换;系数重变换
0 引言
人脸识别[1]是模式识别中最重要的研究领域之一,它已经在执法、安全、选民验证和建筑区、门、汽车或网络访问等行业发挥了非常重要的作用。在复杂背景下的人脸识别技术虽已提升了一个质的飞跃[2],但其性能往往会因光照、表情、姿态、遮挡等条件的影响而大大降低[3],因此,为自动人脸识别规范化这些变化是非常有必要的[4-5]。
针对局部区域代替全局特征引起特征提取识别率不高的问题,文献[6]提出了基于鲁棒主成分分析的人脸子空间重构算法;文献[7]提出基于低秩子空间恢复的联合稀疏表示算法;文献[8]提出稀疏表示的重构算法;文献[9]提出基于分类的协同表示,这类方法要求每个人有足够多的样本来形成探针图像(即查询人脸图像),但实际的情况往往是脸部在受光照等影响,导致识别率低,因而这些方法在现实环境中并不总是可行的。也有学者首先将遮挡图像划分成子块,在子块中提取特征,然后基于每个成对块的相似度执行匹配过程,为了减小因遮挡块造成的匹配误差,通过训练产生不同的权重值分配给不同的块,如文献[10]提出了一种局部匹配的人脸识别算法,文献[11]提出部分相似性算法;然而,训练过程通常是数据依赖的。文献[12]提出了分块PCA(BPCA)将图像划分成许多块,使用PCA提取每个块中的特征,2DPCA就是BPCA的一种特例。文献[13]使用核函数可有效地计算高维特征空间的主成分。文献[14]指出,线性判别分析(linear discriminant analysis,LDA)方法旨在寻找类特定线性投影,目的是最大化投影图像类间散射矩阵与类内散射矩阵的比率,但是它需要的训练时间比主成分分析(principal compo⁃nent Analysis,PCA)多,因为它使用PCA作为预处理步骤。在现有研究的基础上,为了提高降低光照变化对人脸识别的影响,更好地解决鲁棒人脸识别问题,提出了CLAHE融合低频DCT系数重变换的人脸识别算法。
1 系统设计
本文算法的人脸识别系统如图1所示,具体步骤如下:
(1)首先将原始图像顺序地分割成一系列连续均匀且不重叠的8×8的子块,经过CLAHE处理后,图像灰度差别增大,对比度增强,更多细节被分割出来,所含噪声也相应减少;
(2)对每个经过CLAHE处理后的8×8的子块进行DCT,可相应地得到8×8的系数矩阵,然后通过重新变换缩减低频DCT系数消除光照变化的影响;
(3)得到规范化图像(即自由光照变化)后,使用KPCA提取图像特征;
(4)最后,最近邻分类器完成最终的人脸识别。
图1 本文所设计的系统架构Fig.1 System framework
本文所设计的系统各部分详细介绍如下。
1.1对比度受限自适应直方图均衡化
图像的直方图是指图像内的强度分布,直方图均衡化均匀调整图像的强度值,从而提高图像的全局对比度,这是非常有用的预处理步骤,能够给出增强的规范化图像,但是图像内感兴趣的特征需要局部加强,所以要想规范化人脸图像,应该局部增强对比度。
于是,系统没有使用传统的直方图均衡化,而是使用对比度受限自适应直方图均衡化(CLAHE)[15],受限直方图均衡化在图像的小范围内操作,称为瓦片。该方法是对HE法的一种改进,结合了对比度受限和自适应直方图均衡化两项技术的优点,在增强图像对比度的同时能有效抑制噪声干扰,更好地突出图像细节,而且实现过程不复杂。因此,系统设计采用CLAHE技术增强图像的对比度。如图2所示,将原始图像分别经过直方图均衡化和对比度受限自适应直方图均衡化后的对比效果图。
图2 采用HE和CLAHE法的对比图Fig.2 Images contrast of HE and CLAHE
1.2离散余弦变换
DCT中,用一系列的有限多个数据点来表示不同频率下余弦函数震荡总和,DCT有4个类型,分别是DCTⅠ、DCTⅡ、DCTⅢ和DCTⅣ,DCTⅡ大多数用在信号处理中,通常简称为DCT。2D MXN DCT定义如下:
其中u=0, 1, 2,…, M-1;v=0, 1, 2,…, N-1,被称为频域变换因子;C( u, v)为变换结果,也称为DCT系数。α( u)、α( v)分别定义为:
相应的2D离散余弦反变换(IDCT)由下式给出:
所设计的系统中,DCT应用在完整的人脸图像上,将其转换为人脸图像的频率成分,由于低频DCT与光照变化有关,所以光照变化通过缩减低频DCT系数来补偿,缩减的DCT系数数目和因子由实验得到。图3所示为不同数目的低频DCT系数重新变换的DCT规范化结果。
图3 不同重变换系数的对比图Fig.3 Images contrast with different retransformed coefficients
1.3核主成分分析(KPCA)
主成分分析(PCA)技术的表示形式是基于图像集的第二次序统计,这个方法不能表示图像集依赖的高阶统计,图像的高阶统计包括像素强度值的非线性关系,包含了识别的重要信息。本系统使用核主成分分析(KPCA)提取高阶统计,算法过程描述如下:
第一步是集中给定的n个样本集xk,其中,xk=[ xk1, xk2, ..., xkn]T∈Rn。PCA旨在找到最大化方差的投影C,即从协方差矩阵中找到特征值,问题变成求解式(7)的特征值:
上式中,λ≥0是特征值,v∈Rn是特征向量。
核PCA中,输入空间的每个向量都通过非线性映射函数ϕ: Rn-Rf被投影到一个高维特征空间Rf中。因此,核PCA的特征值可以计算如下:
vϕ的所有λ≠0的解都位于ϕ(x1), ...,ϕ(xn)范围内,存在系数αi如:
定义N×N核矩阵K,由
将式(7)乘以ϕ( xj),代入式(8),得到:
该特征值问题的解可表示为更简单的特征值问题:
特征空间的投影由下式执行:
因此,不需要大量计算,使用核函数就能提取k个非线性主成分。
1.4最近邻分类
特征提取完成后,本系统计算测试样本特征与每个训练样本特征之间的欧氏距离,然后利用最近邻分类器完成最终的分类、识别。
2 实验结果与分析
公开数据库扩展Yale B、FRGC V2.0(人脸识别大挑战)[13]及一个户外人脸数据库[15]上进行了大量的实验。使用扩展Yale B数据库测试本文算法对光照变化的鲁棒性,FRGC数据库中,为了仿真不同级别(从0%到50%)的连续遮挡,使用一个随机位置的方块代替有黑框的每个测试图像,遮挡的位置随机选择。户外人脸数据库包含光照、表情、姿态变化以及不同遮挡源的面部图像。
2.1规范化分析
扩展的Yale B数据库[3]包含38个对象在64种不同光照条件下的图像,每个对象在不同光照条件下有5个子集,子集1包含每个人的7幅图像,子集2、3、4和5分别包含每人12、12、14、19幅图像,子集数目越大,光照变化就越明显。实验将所有的图像统一剪裁为64×64大小,如图4所示为扩展的Yale B人脸数据库上剪裁后的人脸图像示例。
图4 扩展的Yale B数据库裁剪后人脸图像示例Fig.4 Facial images after extended Yale B database cutting
实验中,子集1用于训练,因为它接近于正面光照,子集2、3、4、5用于测试,DCT系数数目设置为27KPCA的主成分数,设置为50,高斯核函数k(x, y)参数设置为γ=2(n-20) 2.5γ0,n=0, 1, ..., 20,其中γ0是训练集的标准差,除了对本文算法进行测试外,还对3种技术进行了实验,分别为“不进行任何光照规范化”、“仅使用直方图均衡”、“使用重新调节低频DCT系数与直方图均衡化”,表1为几种规范化技术在扩展Yale B数据库上的识别结果。
表1 不同光照规范化技术的识别率Tab.1 Recognition rate with different illumination technologies /%
从表1可以看出,没有进行任何规范化时,对子集5的识别率为6.509 7%,这是非常低的,由此也能看出对这个测试集的识别实际上是很困难的。通过使用IN技术,如直方图均衡化,识别率提高至38.080 3%,这个识别率也是具有挑战性的。通过使用有HE的重新变换低频DCT系数,识别率提高为94.763 2%,表明该方法有巨大的改善能力,通过使用所提的CLAHE结合DCT对光照规范化,子集5的识别率可高达98.160 9%,这个识别率已经非常高了。
所提出的规范化技术对子集2和子集3给出了最佳的100.000 0%的识别率,对子集4的识别率为97.556 4%,通过使用CLAHE结合DCT,将子集5的识别率从6.509 7%提高至98.160 9%,这是显著的改进,表明了本文算法的有效性。
2.2光照变化人脸识别
为了体现本文算法的优越性,将本文算法的识别率与其他几种较为先进的算法进行了对比,包括对数转换[2]、伽马射线强度校正[4]、同态过滤[8]、单尺度Retinex[7]、小波规范化[9]、小波去噪[10],各比较算法的参数设置分别参照各算法所在文献。实验仍然以子集1作为训练集,剩下的子集2至5用于测试,识别结果如表2所示。
从表2可以看出,本文所提方法在识别非常困难的子集4、5上识别率仍然保持在97%、98%以上,而对数转换、伽马射线强度校正、同态过滤的识别率却以降至50%以下,甚至低至31.615 0%,由此充分说明了本文算法的稳定性及鲁棒性。
表2 各算法在扩展Yale B上的识别率比较Tab.2 Comparison of recognition rate of different algorithms on extended Yale B /%
2.3合成遮挡人脸识别
首先使用有合成遮挡的FRGC数据库对本文算法进行评估,FRGC Ver2.0人脸数据库包括465人的4 000幅图像,这些图像包含有6类差异:脸部表情变化(无表情、微笑、生气、尖叫)、不同的光照变化、遮蔽(太阳镜和围巾)。本文从原始FRGC Ver2.0数据库选择100个对象(50名男性和50名女性)用于实验,所有图像均裁剪成64×64大小。
将本文算法的识别率与对数转换、伽马射线强度校正、单尺度Retinex、小波规范化进行了比较,如图5所示为每个人不同训练数目下各个算法的识别率。
图5 在FRGC数据库上每个人不同训练图像数目的识别率Fig.5 Recognition rate of different training image number of each person on FRGC database
综合图5中的4幅图可以看出,不论K取何值,本文算法的识别率明显高于其他各个算法。
2.4户外人脸识别
实验选择包含55个对象的一个图像集,图6所示为户外人脸图像示例,对于每个对象,分别选择K=1, 3, 5, 8幅未遮挡的图像作为训练集,有不同遮挡类型的110幅图像用于测试,每个训练集与探针集均不相交。从每幅图像的背景中裁剪出人脸区域,调整大小为64×64,识别结果如表3所示。
图6 户外人脸数据库中的图像示例Fig.6 Images example of outdoor face database
表3 户外人脸图像上的识别率Tab.3 Recognition rate of outdoor face images /%
从表3可以看出,由于户外环境的整体复杂性,各比较方法的识别率都不太理想,但本文算法仍能获得相对较好的识别率,由此可见其可靠性及强鲁棒性。
2.5性能比较
仅识别率高于其他算法还不足以说明本文算法的优越性,因此,实验记录了各算法的运行时间,包括训练总完成时间、测试一张图像的时间,记录结果如表4所示。
表4 各算法在扩展Yale B上的运行时间比较Tab.4 Comparison of runtime of each algorithm on extended Yale B /s
从表4可以看出,本文算法的训练总完成时间仅高于小波规范化0.013 2s,比其他几种算法耗时都少很多,测试一张图像所用时间仅有2.894 1s,明显低于其他各个算法,由此体现了本文算法的优越性。
3 结语
为了改善“恶劣”条件下人脸识别正确率,提高算法的鲁棒性,本文提出了CLAHE融合低频DCT系数重变换的人脸识别算法。在三大通用人脸数据库上的实验结果表明,本文算法即便在识别非常困难的扩展Yale B子集5也给出了高达98.160 9%的最佳识别率,充分表明了本文方法的有效性及优越性。
参考文献(References)
[1]苏煜,山世光,陈熙霖,等.基于全局和局部特征集成的人脸识别[J].软件学报,2010,21(8):1849-1862.
[2]田玉敏,云艳娥,马天骏.判别近邻保持嵌入人脸识别[J].西安电子科技大学学报,2011,38(3):24-28.
[3]李晓莉,达飞鹏.基于排除算法的快速三维人脸识别方法[J].自动化学报,2010,36(1):153-158.
[4]李晓莉,达飞鹏.基于侧面轮廓线和刚性区域的3维人脸识别[J].中国图象图形学报,2010,15(2):266-273.
[5]尹洪涛,付平,沙学军.基于DCT和线性判别分析的人脸识别[J].电子学报,2009,37(10):2211-2214.
[6]葛微,李桂菊,程宇奇,等.利用改进的Retinex进行人脸图像光照处理[J].光学精密工程,2010,18(4):1011-1020.
[7]孙劲光,李扬,孟祥福,等.改进的单尺度Retinex及其在人脸识别中的应用[J].计算机应用研究,28(12):4790-4793.
[8]焦竹青,徐保国.基于同态滤波的彩色图像光照补偿方法[J].光电子·激光,2010,21(4):602-605.
[9]ZHANG T,FANG B,YUAN Y,et al.Multiscale facial structure representation for face recognition under varying illumination [J].Pattern Recognition,2009,42(2):251-258.
[10]LI Y,MENG L,FENG J.Lighting coefficients transfer based face illumination normalization[J].Pattern Recognition:Communi⁃cation in Computer and Information Science,2012,321:268-275.
[11]李建科,赵保军,张辉,等.DCT和LBP特征融合的人脸识别[J].北京理工大学学报,2010,30(11):1355-1359.
[12]VISHWAKARMA V P,PANDEY S,GUPTA M N.An illumination invariant accurate face recognition with down scaling of DCT coefficients[J].Journal of Computing and Information Technology,2010,18(1):53-67.
[13]卢桂馥,林忠,金忠.基于核化图嵌入的最佳鉴别分析与人脸识别[J].软件学报,2011,22(7):1561-1570.
[14]邹建法,王国胤,龚勋.基于增强Gabor特征和直接分步线性判别分析的人脸识别[J].模式识别与人工智能,2010 (4):477-482.
[15]TURGAY C,TARDI T.Automatic image equalization and contrast enhancement using Gaussian mixture modeling[J].IEEE Transactions on Image Processing,2012,21(1):145-156.
(责任编辑:范建凤)
Face Recognition Algorithm Based on Fusion CLAHE and Low Frequency DCT Coefficients Retransformation
JIANG Donglin
(School of Mathematics and Computer Science,Longyan University,Longyan 364000,Fujian,China)
Abstract:Towards the problem that serious affect the recognition rate of face, such as disguise(e.g., scarves, sunglasses and hair)and facial shade by other objects, the face recognition algorithm based on fusion CLAHE and low frequency DCT coefficients transformation was proposed.Firstly, divided the image into several non-overlapping local patches, used the histogram equalization to do local contrast stretching on local sub-block and realized denoising.Secondly, with the appropriate number of low frequency DCT coefficients to eliminate the illumination change in face image.Finally, with kernel principal component analysis, to carry out feature extraction, and with the nearest neighbor classifier, completed the final face recognition.The effectiveness and robustness of the proposed algorithm were experimentally verified in extended Yale B, FRGC V2.0 and an outdoor face database.The experimental results showed the proposed algorithm achieved higher recognition rate when dealing with robust face recognition, compared with several kinds of linear algorithms.
Keywords:face recognition;adaptive histogram equalization;low frequency discrete cosine transform;coefficients retransform
作者简介:江东林(1971—),男,讲师,硕士,研究方向:虚拟现实技术、图像处理技术。
收稿日期:2015-05-05
DOI:10.16389/j.cnki.cn42-1737/n.2015.04.012
中图分类号:TP391.41
文献标志码:A
文章编号:1673-0143(2015)04-0345-08