基于相关投影分析的特征提取研究及在图像识别中的应用
2016-06-04王怡田
王怡田
摘 要:特征抽取是模式识别研究中的基本。就图像识别而言,抽取有效的图像特征在完成识别任务中十分重要。线性和非线性投影分析在特征抽取中是比较经典且应用范围最广的方法,且取得了成功,在线性和非线性投影分析中主要是处理模式中的特征,不适合大量的表示数据特征中的融合与抽取。
关键词:图像识别;特征提取;图像识别
中图分类号: TP391 文献标识码: A 文章编号: 1673-1069(2016)14-158-2
0 引言
主成分分析的基本思路是找出最优的单位正交矢量集,在线性组合下重建原始样本,重建后样本和原样本间会出现比较小的误差。一般情况下会采用训练样本协方差矩阵方法作为开展基,选择适合的若干最大非零特征的特征向量最终成为主成分或是主分量,模式样本在主成分中的投影系数被称为主成分特征。
1 非线性投影分析
1.1 在流形基础上的特征提取
复杂高维模式样本可能会通过一组维数中出现严重低于样本特征维数实现确定。就几何学而言,上述属性数据简称为流形。将流形假设当成基础,利用流形中的基本性质,研究高维空间数据并简化数据,降低维数,对复杂式的内在规律学习方法进行探寻叫作流形学习。更加严格的表述是:假设数据是均匀采样在一个高维空间中的低维流形,求得对应的嵌入映射,目的是实现维数约减或者是对其可视化需求进行满足。Seung等人在2000年站在的认知角度上对流形角度开展了讨论,确定感知是在流形的方式下存在,并在实验中证明了人脑的确存在稳态流形,这就是在模式识别以及人类的感知中构架其连同桥梁,使得流形学习存在了较为坚实的理论基础。主流行、谱分析以及变分法在本世纪初流形的学习研究中是三个热点,具有代表性的方法是同构映射、局部线性嵌入和拉普拉斯本征映射等。通过以上方法会获取较好的低维可视效果,针对映射非线性,如何得到测试样本低维将会存在一定的困难,对此不适合对特征降维实现直接性的应用。
此时需要注意,若将流形的学习映射转为限制线性投影,流形学习方法线性化方式,取得测试样本低维表示形式会更加容易。在如此的初衷基础上,He等人提出了局部的保持投影以及邻域保持嵌入等,分别通过LE和LLE的线性化方法的基础上,成功应用在人脸识别当中。
1.2 稀疏学习上特征中的提取
针对以上线性投影方法,学习投影向量在所有原始特征变量基础上实现线性组和,做出特征和变量层方面的解释含义较为困难,这是其不能说明什么变量在数据中的表示和分类中的十分关键作用的原因。实践性利用线性投影抽取特征,不但会获取最有效低维特征,还能更清楚了解什么样的维数在压缩中的作用更加关键,进而对未来的数据特征的采集当作指导和参考,同时也可以进一步加深人们对数据的更深层次的理解。一方面可以对关键特征进行少量的收集,降低工作难度及强度;此外还能对算法的时间以及空间效应进行提升。也就是在这一应用背景下,提取样本稀疏特征,正确方式是模式的识别舞台。[1]对系数特征进行提取,在一定基础上引入L0和L1范数同时对其实现优化,其中的一部分表征变量权重系数将0作为目的。0元素对应的变量在特征提取中未做到贡献,因此,稀疏特征就提取本质上可看作特征选择。
2 相关投影分析
2.1 典型相关分析的基本理论和研究
典型相关分析属于经典的多元统计方法,该方法的首次提出者是Hotelling,CCA在很多的领域中都被进行了应用,除了应用价值,在理论上也存在着较为深刻的意义,因而被研究学者所重视,多元回归分析在某种意义上,可以判别分析等数据,被看作归结典型分析的特例。
典型相关分析主要是研究两组的随机矢量数据相关性问题,具体来讲,已经存在的两个已被去掉的均值随机矢量样本X=[x1,x2,…,xn]∈Rp×N和Y=[y1,y2,…,yn]∈Rp×N,CCA的目的是要找出一对投影的方向w和u,对投影后的样本特征进行满足后,z1=wTX和z2=uT之间是存在最大相关性的。通常情况下,投影方可以在最大化准则下将得到函数:
2.2 偏最小二乘基本理论
偏最小二乘的回归分析是在应用领域中对新型多元数据分析法来提取,该理论是Word等人在1983年提出的。近20年后,PLS通过方法、理论、应用取得了十分快速的发展。PLS模型的鲁棒性使得其出现了回归性的分析以及维数压缩分类中的有力工具,在最近几年被广泛应用在了程序控制、图像处理等领域内。
偏最小二乘的基本思想是对两个去掉均值的随机样本X=[x1,x2,x3,…,xN]∈Rp×N和Y=[y1,y2,y3,…,yN]∈Rq×N,找出一对投影方向上w和u,对于投影后样本特征z1=wTX与Z2=uTY相互的最大协方差系数。在投影的方向选择中,可以在最优化情况获得最优的目标函数:
JPLS(w,u)=Cov(z1,z2)=wTSxyu
上式中的约束条件为:wTw=uTu=1,Sxy表示的为两组特征相互间的协方差矩阵。对函数极值准则进行优化,转为两组特征矩阵下SxyTSxy和SxySxyT最大本征值同本征向量的求解相关问题。[3]
3 图像识别中的应用
3.1 人脸识别
人脸识别是在计算机作为辅助手段下,对静态人脸图像以及动态序列图像实现各种人脸图像的匹配和分类。人脸识别技术可以被看做是模式识别研究中的重点研究内容,这是图像处理、模式识别和计算机视觉较差影响的最为积极的研究方向。人脸识别中的关键性问题是如何在人脸图像中抽取稳定有效的个体特征,并且使其可以和其他个体之间进行区别。这一方式存在多种运用优势。
无侵犯性是人脸识别技术中最大的优点,该技术可在不被识别察觉中实行,基本上不需要被识别者进行合作,更不会造成反感情绪,进而被广泛的运用在安全监控和嫌疑人认定等场景内。
较为自然,人脸识别方式和人类识别特征相互之间有着较高相似度。日常生活中人们相互间的身份识别最直接且对常用的手段就是人脸识别。因此对于其他的生物特征,该方式更易被人接受。
性价比高,在人脸识别中运用的硬件设备十分简单,基本上只需要对普通摄像头进行使用就可以,并且可以利用人脸识别的数据库资源,这种情况下引起的系统成本往往比较低。
交互性强,就人脸识别来看,授权用户交互和配合可有效提升系统可靠性与可用性,就虹膜和指纹等识别系统而言,一般的用户识别并不会发挥正常的作用。
3.2 手写字体识别
在获得字符的特征表示之后,我们可以对投影分析实行二次特征抽取和分类,通过这一方式可以消除原始特征变量的相关性,随后降低特征空间的维数,并且在识别的过程中可以在低维特征空间内实施,进而提升识别的速度。
3.3 图像集的匹配和分类
汇总识别图像的过程,就单复图像的目标可能会遭遇各种问题引起的结果不稳定情况,并且图像会受到光照、视觉以及姿态和距离等多种因素的影响,进而出现鉴别信息不稳定的情况,或是在出现突发事件后造成目标特征不显著的问题。在现实的生活中总是会出现大量的图像资源,并且多数场合是在视频序列下通过多模态的形式而出现的,常见的有多方位以及全天候的视频监控,就相同的监控以及考察对象而言,其中是会存在各种不同的视角以及多个成像方式的问题的。[4]传统的识别方法是在多个图像资源中选取比较高的成像质量,且目标十分明确的一张或者是多个图片,实现分别判断。
4 小结
文章在投影特征的分析基础上开展深入的研究与分析,同时对图像识别在一般情况下的运用进行了详细的介绍,希望可以为相关工作者和研究者提供一定的参考。
参 考 文 献
[1] 施展.图像特征提取与识别的迹空间投影方法研究[D].华南理工大学,2012:10-24.
[2] 侯书东.基于相关投影分析的特征提取研究及在图像识别中的应用[D].南京理工大学,2012:15-29.
[3] 胡俐蕊.非负矩阵分解方法及其在选票图像识别中的应用[D].安徽大学,2013:21-39.
[4] 汤德俊.人脸识别中图像特征提取与匹配技术研究[D].大连海事大学,2013:14-27.