基于属性学习的图像识别研究与实现
2016-11-18李华盛宁建红吴成柱汪巧巧上海电机学院电子信息学院
李华盛 宁建红 吴成柱 奉 轶 汪巧巧 /上海电机学院电子信息学院
基于属性学习的图像识别研究与实现
李华盛宁建红吴成柱奉轶汪巧巧 /上海电机学院电子信息学院
图像中所蕴含的属性对于图像识别有着重要作用,以往的传统分类方法往往忽略了这些特征。视觉属性能够展现人们识别事物时所定义的语义概念,更符合人类识别图像的过程。因此,本文主要研究基于属性学习的图像识别,提出一种将属性和对象类别同时用于构建分类器的方法。通过提取图像底层的基本特征,构建属性分类器和类别分类器。属性分类器采用了直接预测模型。类别分类器SVM是一种线性化和升维的方法,在SVM方法中使用了核函数,通过核函数把低维空间的非线性映射到高维空间的线性,经过这个转化,大大提高了学习机器的非线性处理能力。同时,建立SVM模型所需要的先验干预较少。将这两种分类器运用到图像识别过程中,获得了较好的效果。
属性学习; 属性分类器;类别分类器; 多目标分类
1.引言
一直以来,目标对象识别是计算机视觉领域的研究热点之一,由于采用机器学习技术和概率或然表示使得这一问题的解决取得了长足的发展。对于一幅图像,简单地识别如车、熊猫或夹克衫等这样的对象类别有许多行之有效的方法。但是通常的方法都是提取图像底层特征,通过训练分类器,达到识别图像类别的目的。然而,一个视觉对象除了它所属的类别还有许多其他的属性。比如,汽车是灰色的,熊猫是黑白相间的,夹克衫是带条纹的等。这些视觉属性对于理解和描述视觉对象十分重要,视觉属性能够展现人们识别事物时所定义的语义概念,搭建了低层特征到高层语义之间的桥梁。
2.属性
属性被定义为一种描述一个对象的特征或性质的量,其具体取值既可以是离散值,也可以是连续值,属性通常具有明确的值。属性不同于如灰度值图像梯度方向方向直方图等这样的低维度特征,它是建立在这些特征之上的一种对对象的中间级表示。各种属性描述可以相互组合,在描述能力上具有比低层特征更强的灵活性和更高的描述效率。不同的对象类别有许多公共属性,对这些属性进行建模刻画有助于将以往学习到的关于某种属性的知识迁移到新的对象或类别上,从而减少对训练数据的需求。通常属性特征在语义级别描述对象,从而有利于人类知识的继承,有利于人机交互,比如可以用长期以来人们约定的描述某种对象的方式来定义属性,从而使图像检索查找等工作更方便。
3.直接属性预测模型属性分类器
在直接属性预测模型中,类别-属性关系是固定的,通过蕴含了对属性值训练的样本与类别之间的训练,获得了相应的参数,这些参数都是关于分类器的参数。在测试阶段,可以通过获取测试样本的属性值,然后作为输入,来推测出样本的所属类别在直接属性预测模型分类器中,样本类别为未见样本的目标类别为以及属它们的属性之间通过一个二值矩阵给出相应的关系,其中形成的编码表示对于给定的y或者z,属性am对于分类的有效性,而这个二值矩阵编码是由人工监督给出的。
属性分类器训练的是可见样本x和类别标号y。在测试阶段,图像的有效属性am可以通过之前训练的分类器给出的后验概率表征,而且这些属性可以和待测试的类别z的后验概率联系起来,如公式(1)所示。
4.类别分类器
4.1类别分类器SVM
SVM的方法就是线性化和升维的方法。首先,升维就是把样本向高维空间作映射,在高维空间中可以通过一个线性超平面实现线性划分。然后,线性化就是在变换后的高维空间中应用解线性问题的方法来进行计算。SVM由于应用了核函数展开和计算理论,而核函数解决的正是非线性问题,关于核函数的非线性映射在下文中提到。这样就使得计算的复杂性取决于支持向量的数目,而不是样本空间的维数,可以避免了“维数灾难”。 另外,SVM方法具有较为严格的统计学理论作为保证,应用SVM方法建立的模型具有较好的推广能力的确定的上界,这是目前其它任何学习方法所不具备的。在建立数据模型时,人为的干预越少越好,而与其它方法计较时,建立SVM模型所需要的先验干预较少。
4.2核函数
SVM支持向量机是通过核函数进行低维空间的非线性映射到高维空间的线性,通过这个转化,能大大的提高学习机器的非线性处理能力。在高维空间中,原空间的核函数参与了所有向量的内积运算,升维后,核函数仅仅改变了内积运算,并没有增加算法的复杂度。
目前研究最多的核函数主要有三类,多项式类核函数,高斯径向基(RBF)核函数和双曲正切(S形)核函数。各种实验的观察结果的确表明,某些核函数处理某些问题时效果不错,但用另外一些就效果很差,通常,径向基核函数是不会出太大偏差的一种核函数。除此之外,还可以根据Mercer条件构造混合核函数。
5.结束语
本课题主要研究基于属性学习的图像识别,提出一种将属性和对象类别同时用于构建分类器的方法。通过提取图像底层的基本特征,构建多个属性分类器,利用训练集对属性分类器进行属性学习,对测试集进行属性的分类,完成测试集的属性分类。利用得到的属性训练集对类别分类器进行学习,属性作为输入,对测试集进行图像类别分类。基于属性学习的图像识别应用领域广泛,一般应用在目标识别,图像检索,人的身份识别,商品推荐等。
[1] 张志涌.精通MATLAB R2011a[M]. 北京:北京航空航天大学出版社,2011.
[2] 周建兴,岂兴明,矫津毅,张延伟. MATLAB从入门到精通[M].2版. 北京:人民邮电出版社,2012.
[3] (美)穆尔 著,高会生,刘童娜,李聪聪 译. MATLAB实用教程[M].2版. 北京:电子工业出版社,2010.
[4] (美) 刚萨雷斯,(美)伍兹 著,阮秋琦 等译. 数字图像处理[M].3版。 北京:电子工业出版社,2011.
[5] (美) 利昂 著,张文博,张丽静 译. 线性代数[M].8版. 北京:机械工业出版社,2010.
课题项目:
A1-5701-14-006-08-40上海市大学生创新活动计划项目。