APP下载

基于特征分类器的研究与优化的人脸年龄分类

2014-11-14任明罡陈岳林蔡晓东

科技创新导报 2014年21期
关键词:支持向量机

任明罡++陈岳林++蔡晓东

摘 要:由于人的年龄特征具有较强的个体差异性和不可控制性,现有的年龄估计结果和实践经验表明,年龄估计的研究还需要对特征分类器进行更深入的研究。本文提出了对特征分类器进行研究与优化,通过比较LBP和AAM两种特征提取法,选用支持向量机分类器,利用网格搜索的交叉验证法搜索高斯径向基核函数最优参数,用“一对一”的多分类方式实现对人脸年龄分类。实验结果表明,实现对年龄段的分类,同时总结了不同特征分类器的基本应用规律。

关键词:年龄分类 特征分类器 支持向量机

中图分类号:TP391.41 文献标识码:A 文章编号:1674-098X(2014)07(c)-0025-02

人脸包含的丰富的信息,如身份、年龄、性别、健康状况等。基于特征分类器的研究与优化的人脸年龄估计的研究,无论是对实用价值还是科学意义都很重要。1990年以来,涌现出很多技术方法,每年都有大量的学术论文发表到各种期刊杂志,1994年Kwon和Lobo所发表的论文[1]是这方面最早的研究论文,但是2002年Lanitis的研究[2]才能算的上真正意义的研究这个领域。年龄问题也引起了国内研究者的广泛关注,清华大学王俊艳,苏大光等[3]人通过多尺度主动形状模型(ASM)自动获取特征点标注得到相应坐标等实现对年龄的估计,这需要多幅不同年龄段进行训练,而采集这样一个人脸库比较困难。

由于不同年龄段的人有不同的年龄特征,这里我们主要对特征分类器的优化结合着人类年龄成长的规律划分为5个年龄段来分析:婴儿、儿童、少年、青年、中老年。

1 人脸纹理特征提取

1.1 人脸图像预处理

该文选用的是FG-NET标准人脸库,这些图片都是通过旧相片扫描得到需要预处理。该文主要通过人脸检测、灰度化处理、几何归一化对原始图片进行处理。最终结果如图1所示。

可以看出处理之后的图像摒除了衣领、头发、背景等的干扰,图像姿态归一化,几何归一化,并且补偿了光照不均带来的影响,图像细节变得更加清晰。

1.2 人脸年龄特征提取

(1)建立主动外观模型。

随着年龄的增长,人的脸型轮廓和纹理都会发生变化。主动外观模型AAM算法主要包含模型的建立和模型的匹配两个过程,包括建立形状模型、纹理模型和组合模型三个部分。

先按相同顺序手动在人脸图片上选择68个特征点,接着采用Procrustes分析法[4]使所有的形状向量对齐到统一的坐标中,接着建立AAM的形状建模,通过PCA主特征提取,任意一个人脸形状向量可以表示为式(1)所示。

其中S0表示平均形状,Pi表示对应个特征值的特征向量,bs表示形状参数。

将平均形状的特征点的人脸图像进行Delaunay三角化[5],利用分段线性仿射方法将人脸形状区域内的皮肤纹理信息映射到基准模板形状网格中,进行一致的纹理采样就可以获得归一化处理后的人脸皮肤纹理样本数据;最后通过PCA分析,实现对皮肤纹理的建模如式(2)所示。

其中A0(X)表示平均纹理向量,Pg表示维的纹理特征向量,bg表示时纹理特征参数。

由于形状特征参数是用坐标集合度量的,而纹理特征参数是用像素灰度集合度量的,他俩不能直接进行组合,而所以我们需要引入一个权重组合到一起,建立组合外观模型。对人脸图片组合外观模型如图2所示。

(2)局部二值提取。

局部二值模式LBP由Ojala[6]首先提出,是一种有效的纹理提取算子。本文采8邻域的LBP算子提取纹理特征。设中心灰度值为gc,周围8个像素点灰度值为gi,其LBP计算过程为(3)式。

对一副人脸图片提取其LBP特征以后,得到的LBP特征必须是一副人脸图片,上面记录着每个像素点的LBP值,提取效果如图3所示。

接着进行分块直方图统计,关于分块的具体分法没有统一的要求,本文以人脸分为3×2块为例,图像的每个区域的LBP直方图定义如式(5)所示。

2 人脸年龄分类器设计

2.1 典型特征分类器选用

支持向量机SVM分类,针对有线训练样本,可以寻求的最好中和结果在模型的复杂性和学习能力之间。通过非线性变换将输入空间变换到一个高维空间,求取一个最优的超平面作为决策面,使得正样本和负样本之间的隔离边缘被最大化。

2.2 核函数的选择与分类

该文选用RBF核函数,关于其参数的优化选取,本文具体方法为:本文中的范围设置在[2-10,27],的范围设置在[2-10,23],步距均为0.1。本文将搜索范围分为两级,先在较大范围内进行粗网格搜索,如果最小的对应多组,就选取搜索到的第一组参数作为最优参数;接着不断缩小参数递增步长的方式,利用传统的细网格搜索来确定最优参数。

常用的级联方式有:“多级分层”分类器、“一对多”分类器以及“一对一”分类器。对于一个类分类问题,对比如表1所示

结合本文研究的内容,本文采用“一对一”多分类,需要构造个判别函数,选择其所对应的向量作为训练样本,然后得到10个训练结果,采取投票的形式,然后得到一组结果。

3 实验结果与分析

3.1 实验结果

该文对特征分类器的研究与优化,经过网格搜索的交叉验证后,本文参数取2.8384,取0.0323时,识别率最高,而且训练和识别速度也比较快。本文在每一个年龄组类别中选择100个样本进行测试。

(1)AAM形状和纹理模型。

这组实验主要针对形状和纹理特性,将形状向量参数和纹理向量参数降维后利用权值进行融合,结果如表2所示。

(2)LBP-AAM形状和纹理模型。

这组提取LBP-AAM组合外观模型通过PCA降维后,分类的结果如表3所示。

3.2 实验分析

通过表2和表3数据比较,整体年龄段的分类都得到了提高。对于AAM组合外观模型能提取脸部的形状和纹理信息,由于人脸包含的信息太多,简单的全局特征如全局形状或纹理特征,并不能很好的反映出人脸的年龄特征,仅是将全局的形状特征与纹理特征组合。而且AAM纹理特征对光照敏感,只是用图像的亮度,不能很好的反应图像深层次的信息,也不能很好的描述脸部的纹理信息,所以缺少足够的脸部纹理信息。而LBP直方图纹理特征的提取简单高效,所以我们最后用LBP直方图特征与AAM组合模型结合建立LBP-AAM模型,整体年龄段的分类都得到了提高。

该文通过两组实验来优化特征分类器,提高了分类准确率,但是总是有不足,每一组分类都有一定的误分类,其原因总结如下:该文用的是FG-NET标准人脸库,当中有的表情过于夸张或者侧脸超过一定角度等;实验中每组实验训练和测试样本均含有男女图片,女性由于化妆等原因,对提取特征带来影响;本实验用的网格搜索法,为了节省搜索的时间,这个过程也会忽略掉一些年龄特征,对分类准确率带来影响

4 结语

该文通过实验得出用LBP提取分块直方图特征,用AAM提取形状和纹理特征,最后用LBP-AAM进行特征提取进行训练和分类,通过实验比较得出组合模型比用单一局部纹理特征提取分类准确率高,实验显示本文提出的优化的特征分类器具有更高的分类准确率。但是由于年龄分类的复杂性和选择的样本原因,以及本文采用的实验算法等原因,实验总是有一些误分类。

参考文献

[1] Y.H.Kwon,and N.V.Lobo.Age classification from facial images[C]//Proceeding of IEEE Conf.on Computer Vision and Pattern Recognition.Seattle, Washington,U.S.A,1994:762-767.

[2] Lanitis A,Taylor CJ,Cootes TF.Toward automatic simulation of aging effects on face images [J].Pattern Analysis and Machine Intelligence,IEEE Transactions on.2002,24(4):442-455.

[3] 王俊艳,苏光大,林行刚.人脸图像年龄估计[J].清华大学学报(自然科学版),2007,47(4):526-529.

[4] 杜克勤.Procrustes问题的若干研究[D].浙江大学,2005.

[5] Gary Bradski,Adrian Kaehler著.学习OpenCV[M].于仕琪,刘瑞祯,译.清华大学北京,2009.

[6] T.Ojala,M. Pietikinen,and D.Harwood.A comparative study of texture measures with classification based on featured distribution[J].Pattern Recognition,1996,29(1):51-59.

3.2 实验分析

通过表2和表3数据比较,整体年龄段的分类都得到了提高。对于AAM组合外观模型能提取脸部的形状和纹理信息,由于人脸包含的信息太多,简单的全局特征如全局形状或纹理特征,并不能很好的反映出人脸的年龄特征,仅是将全局的形状特征与纹理特征组合。而且AAM纹理特征对光照敏感,只是用图像的亮度,不能很好的反应图像深层次的信息,也不能很好的描述脸部的纹理信息,所以缺少足够的脸部纹理信息。而LBP直方图纹理特征的提取简单高效,所以我们最后用LBP直方图特征与AAM组合模型结合建立LBP-AAM模型,整体年龄段的分类都得到了提高。

该文通过两组实验来优化特征分类器,提高了分类准确率,但是总是有不足,每一组分类都有一定的误分类,其原因总结如下:该文用的是FG-NET标准人脸库,当中有的表情过于夸张或者侧脸超过一定角度等;实验中每组实验训练和测试样本均含有男女图片,女性由于化妆等原因,对提取特征带来影响;本实验用的网格搜索法,为了节省搜索的时间,这个过程也会忽略掉一些年龄特征,对分类准确率带来影响

4 结语

该文通过实验得出用LBP提取分块直方图特征,用AAM提取形状和纹理特征,最后用LBP-AAM进行特征提取进行训练和分类,通过实验比较得出组合模型比用单一局部纹理特征提取分类准确率高,实验显示本文提出的优化的特征分类器具有更高的分类准确率。但是由于年龄分类的复杂性和选择的样本原因,以及本文采用的实验算法等原因,实验总是有一些误分类。

参考文献

[1] Y.H.Kwon,and N.V.Lobo.Age classification from facial images[C]//Proceeding of IEEE Conf.on Computer Vision and Pattern Recognition.Seattle, Washington,U.S.A,1994:762-767.

[2] Lanitis A,Taylor CJ,Cootes TF.Toward automatic simulation of aging effects on face images [J].Pattern Analysis and Machine Intelligence,IEEE Transactions on.2002,24(4):442-455.

[3] 王俊艳,苏光大,林行刚.人脸图像年龄估计[J].清华大学学报(自然科学版),2007,47(4):526-529.

[4] 杜克勤.Procrustes问题的若干研究[D].浙江大学,2005.

[5] Gary Bradski,Adrian Kaehler著.学习OpenCV[M].于仕琪,刘瑞祯,译.清华大学北京,2009.

[6] T.Ojala,M. Pietikinen,and D.Harwood.A comparative study of texture measures with classification based on featured distribution[J].Pattern Recognition,1996,29(1):51-59.

3.2 实验分析

通过表2和表3数据比较,整体年龄段的分类都得到了提高。对于AAM组合外观模型能提取脸部的形状和纹理信息,由于人脸包含的信息太多,简单的全局特征如全局形状或纹理特征,并不能很好的反映出人脸的年龄特征,仅是将全局的形状特征与纹理特征组合。而且AAM纹理特征对光照敏感,只是用图像的亮度,不能很好的反应图像深层次的信息,也不能很好的描述脸部的纹理信息,所以缺少足够的脸部纹理信息。而LBP直方图纹理特征的提取简单高效,所以我们最后用LBP直方图特征与AAM组合模型结合建立LBP-AAM模型,整体年龄段的分类都得到了提高。

该文通过两组实验来优化特征分类器,提高了分类准确率,但是总是有不足,每一组分类都有一定的误分类,其原因总结如下:该文用的是FG-NET标准人脸库,当中有的表情过于夸张或者侧脸超过一定角度等;实验中每组实验训练和测试样本均含有男女图片,女性由于化妆等原因,对提取特征带来影响;本实验用的网格搜索法,为了节省搜索的时间,这个过程也会忽略掉一些年龄特征,对分类准确率带来影响

4 结语

该文通过实验得出用LBP提取分块直方图特征,用AAM提取形状和纹理特征,最后用LBP-AAM进行特征提取进行训练和分类,通过实验比较得出组合模型比用单一局部纹理特征提取分类准确率高,实验显示本文提出的优化的特征分类器具有更高的分类准确率。但是由于年龄分类的复杂性和选择的样本原因,以及本文采用的实验算法等原因,实验总是有一些误分类。

参考文献

[1] Y.H.Kwon,and N.V.Lobo.Age classification from facial images[C]//Proceeding of IEEE Conf.on Computer Vision and Pattern Recognition.Seattle, Washington,U.S.A,1994:762-767.

[2] Lanitis A,Taylor CJ,Cootes TF.Toward automatic simulation of aging effects on face images [J].Pattern Analysis and Machine Intelligence,IEEE Transactions on.2002,24(4):442-455.

[3] 王俊艳,苏光大,林行刚.人脸图像年龄估计[J].清华大学学报(自然科学版),2007,47(4):526-529.

[4] 杜克勤.Procrustes问题的若干研究[D].浙江大学,2005.

[5] Gary Bradski,Adrian Kaehler著.学习OpenCV[M].于仕琪,刘瑞祯,译.清华大学北京,2009.

[6] T.Ojala,M. Pietikinen,and D.Harwood.A comparative study of texture measures with classification based on featured distribution[J].Pattern Recognition,1996,29(1):51-59.

猜你喜欢

支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
基于改进支持向量机的船舶纵摇预报模型
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究