APP下载

基于改进的稀疏描述和降维人脸识别方法

2023-12-02程鸿芳

绵阳师范学院学报 2023年11期
关键词:训练样本降维维数

程鸿芳,祝 军

(1.芜湖职业技术学院,安徽芜湖 241000;2.安徽工程大学,安徽芜湖 241000)

0 引言

稀疏描述是计算机视觉、人脸识别、模式识别等研究领域的一种新的研究手段.稀疏描述人脸识别是用训练样本的稀疏的线性组合近似表示测试样本,并进行分类和完成识别,是压缩感知理论的核心内容之一[1].将维数较高的图像降成低维数,可以避免“维数灾难”[2].目前比较流行的算法有常规降维法、线性判别分析(LDA)和主成分分析(PCA)[3]等.

刘子渊等[4]提出利用快速稀疏描述与协同描述分类方法融合进行人脸识别,Naseem等[5]提出线性回归分类法进行人脸识别,简彩任等[6]提出利用主成分分析和核主成分分析完成降维图像,陈丽霞等[7]提出融合稀疏描述和半监督降维完成人脸识别,蒋科辉等[8]提出基于局部约束字典学习的非线性降维人脸识别方法.

以上各学者从不同的角度提出了不同的人脸识别的方法,最终达到识别的效果各异.本文将稀疏描述和常规降维两者结合,能够很好地表达每个测试样本.稀疏描述得出的测试样本的维数与原样本向量维数相同,而常规降维方法得到的样本向量维数降低.常规降维方法通过变换轴,得出每个训练样本和测试样本的特征,然后使用分类器对测试样本进行分类[4].将两者结合,能取得较低分类错误率[5].

1 改进的常规降维方法

改进的常规降维方法又称为基于描述和降维的人脸识别方法(Routine reduction dimensionality face recognition,简写为RRDFR),RRDFR不仅可以使训练样本进行降维,而且能够很好地表达测试样本.方法如下:第一步,利用稀疏的线性组合全体训练样本得到测试样本,获得相应的表达系数;第二步,获得降维需要的投影轴;第三步,利用投影轴将所有的样本变换到新的低维空间,并利用基于描述的方法进行分类.根据以上步骤,将RRDFR设计了两个算法,分别称为算法1和算法2.

2 RRDFR算法

假设测试样本y,第i个训练样本xi(i=1,2,...N),所有的样本均为列向量.

2.1 算法1

第一步:利用线性组合确定测试样本,获得相应的表达系数.根据该组合确定一个和测试样本间差异最小的训练样本.

第二步:利用投影轴进行降维.令w1,w2,...wd表示前d个投影轴(利用常规降维方法得出).该步骤利用xi'=WTxi(i=1,2,...,N)得到每个训练样本的特征,其中W=[w1,w2,...wd].通过y'=WTy获得测试样本的特征.y'和xi'都是d维向量.

第三步:计算测试样本特征y'和第j类样本特征的偏差.计算公式为

2.2 算法2

算法2在算法1的基础上,首先选取能够“最佳”表示测试样本的较少训练样本,然后利用这些“最佳”训练样本进行最后的分类,算法2的主要步骤如下所示.

第一步:同算法1中的步骤1.

第三步:利用RRDFR得到投影轴,通过投影轴获取测试样本和”最佳”训练样本的特征.特征抽取方法和算法1中的步骤2相同.

3 合理性分析

RRDFR与常规的基于描述的人脸识别方法都会产生相似的表达误差,证明如下:

4 RRDFR和DR+RM方法的比较

RRDFR不同于常规降维方法加基于描述的方法(DR+RM).首先,在人脸识别中,噪声会影响识别的正确率.该方法对噪声具有较强鲁棒性.所以该方法非常适合基于图像的识别应用.其次,在样本维数较低时,RRDFR在分类性能上大大优于DR+RM方法.相对于低维样本,基于描述的方法更适合应用于高维样本.假设训练样本是非常低维的数据并且训练样本的数量比样本向量的维数大得多,则通常基于描述的方法能够用训练样本准确、零误差地表示测试样本.但是在在利用训练样本表示测试样本时,真正来自测试样本类的训练样本可能无法发挥主导作用.基于描述的方法难以对测试样本得出正确分类.

5 实验结果

实验将用Python3.9验证文中算法.在验证过程中分别使用ORL、Yale、AR三个免费人脸图像库.同时分别选择有遮挡的数据集和无遮挡的数据集进行实验.其中ORL人脸数据库中人脸基本没有光照、遮挡干扰.Yale人脸数据库中人脸表情、脸部细节、时期不同.AR人脸数据库中人脸图像,表情、姿态、光照、遮挡不一.如图1、图2、图3所示:

图1 ORL人脸库部分图像Fig.1 Partial image of ORL face library

图2 Yale人脸库部分图像Fig.2 Partial image of Yale face library

图3 AR人脸库部分图像Fig.3 Partial image of AR face library

5.1 γ取值

图4 不同数据库中λ值对识别率的影响Fig.4 The influence of λ value on recognition rate in different databases

5.2 变换轴的个数对算法的影响

算法中利用常规降维方法得出变换轴的个数.利用xi'=WTy(i=1,2,...,N)得到每个训练样本的特征,其中W=[w1,w2,...wd],w1,w2,...wd表示d个投影轴.图5显示了在AR人脸库中随着变换轴数量的变化,分类精度也随之变化.实验中,每个人前4张图片作为训练样本,剩下的为测试样本.结果表明,改进后的性能明显优于常规的LDA(PCA).

图5 分类正确率Fig.5 Classification accuracy rate

5.2 ORL人脸库中的实验

ORL人脸数据库共有40个人不同表情、不同穿戴的图像,每人10幅共400幅图像.ORL人脸数据库中原始图像大小112×92,实验中采用下采样至32×32大小,每类随机选取2,4,6,8幅作为训练样本,其余的作为测试样本.首先归一化处理每一幅图,部分图像如图4所示.实验分成两类进行.一组将LDA、RRDFR1(基于LDA)、RRDFR2(基于LDA)进行实验,一组将PCA、RRDFR1(基于PCA)、RRDFR2(基于PCA)进行实验,测试结果如表1所示.降维处理人脸图像,将高维的人脸图像降为不同的低维度数据,在不同维数下,测试得出不同的分类正确率,如图6和图7所示.

图6 ORL数据库中LDA、RRDFR1、RRDFR2在不同维数的识别率比较Fig.6 Comparison of recognition rates of LDA,RRDFR1 and RRDFR2 in different dimensions in ORL database图7 ORL 数据库中PCA、RRDFR1、RRDFR2在不同维数的识别率比较Fig.7 Comparison of recognition rates of PCA, RRDFR1, RRDFR2 in different dimensions in ORL database

在图6中分别表示了采用LDA、RRDFR1(基于LDA)、RRDFR2(基于LDA)算法将ORL人脸图像降到从10到100不同的低纬度的准确性.在图7中分别表示了采用PCA、RRDFR1(基于PCA)、RRDFR2(基于PCA)算法将ORL人脸图像降到从10到100不同的低维度的准确性.从图6和图7所示的ORL数据库中三种降维算法对不同维数的识别准确率比较结果中可以看出,相比常规LDA和PCA算法而言RRDFR算法的识别率要优.

5.3 Yale人脸库中的实验

Yale人脸数据库共有15个人不同光照、不同脸部表情的图像,每人11幅共165幅图像.Yale人脸数据库中原始图像大小100×100,实验中采用采样至48×48大小,每类随机选取2,4,6,8幅作为训练样本,其余的作为测试样本.首先归一化处理每一幅图.实验分成两类进行.一组将LDA、RRDFR1(基于LDA)、RRDFR2(基于LDA)进行实验,一组将PCA、RRDFR1(基于PCA)、RRDFR2(基于PCA)进行实验,测试结果如表2所示.在不同维数下,测试得出不同的分类正确率,如图8和图9所示.

在图8中分别表示了采用LDA、RRDFR1(基于LDA)、RRDFR2(基于LDA)算法将ORL人脸图像降到从10到100不同的低纬度的准确性.在图9中分别表示了采用这PCA、RRDFR1(基于PCA)、RRDFR2(基于PCA)算法将ORL人脸图像降到从10到100不同的低维度的准确性.从图8和图9所示的Yale数据库中三种降维算法对不同维数的识别准确率比较结果中可以看出,相比常规LDA和PCA算法而言RRDFR算法的识别率要优.

图8 Yale数据库中LDA、RRDFR1、RRDFR2在不同维数的识别率比较Fig.8 Comparison of recognition rates of LDA,RRDFR1, RRDFR2 in different dimensions in Yale database图9 Yale数据库中PCA、RRDFR1、RRDFR2在不同维数的识别率比较Fig.9 Comparison of recognition rates ofPCA, RRDFR1, RRDFR2 in differentdimensions in Yale database

5.4 AR人脸库中的实验

AR人脸数据库共有100个人不同光照、不同脸部表情、不同遮罩的图像,每人26幅共2 600幅图像.AR人脸数据库中原始图像大小120×165,实验中采用采样至48×48大小,每类随机选取4,6,8,12幅作为训练样本,其余的作为测试样本.首先归一化处理每一幅图.实验分成两类进行.一组将LDA、RRDFR1(基于LDA)、RRDFR2(基于LDA)进行实验,一组将PCA、RRDFR1(基于PCA)、RRDFR2(基于PCA)进行实验,测试结果如表3所示.在不同维数下,测试得出不同的分类正确率,如图10和图11所示.

图10 AR数据库中LDA、RRDFR1、RRDFR2在不同维数的识别率比较Fig.10 Comparison of recognition rates of LDA, RRDFR1, RRDFR2 in different dimensions in AR database图11 AR数据库中 PCA、RRDFR1、RRDFR2在不同维数的识别率比较Fig.11 Comparison of recognition rates of PCA, RRDFR1, RRDFR2 in different dimensions in AR database

在图10中分别表示了采用这LDA、RRDFR1(基于LDA)、RRDFR2(基于LDA)算法将ORL人脸图像降到从10到100不同的低纬度的准确性.在图11中分别表示了采用PCA、RRDFR1(基于PCA)、RRDFR2(基于PCA)算法将ORL人脸图像降到从10到100不同的低维度的准确性.从图10和图11所示的AR数据库中三种降维算法对不同维数的识别准确率比较结果中可以看出,相比LDA和PCA算法而言RRDFR算法的识别率要优.

6 结论

RRDFR同时具有常规降维方法和基于描述的分类这两类方法的优点.该方法可以使每一个测试样本都能够被全部或部分训练样本的线性组合很好地表达,而且当RRDFR方法将样本变换到另一个低维空间时,该方法仍能像普通降维方法那样具有统计上的一些属性.

猜你喜欢

训练样本降维维数
混动成为降维打击的实力 东风风神皓极
β-变换中一致丢番图逼近问题的维数理论
一类齐次Moran集的上盒维数
人工智能
降维打击
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
关于齐次Moran集的packing维数结果
基于稀疏重构的机载雷达训练样本挑选方法
涉及相变问题Julia集的Hausdorff维数