图像分类识别方法研究
2014-12-16赵重阳王松会夏文杰
赵重阳 王松会 夏文杰
摘要:图像分类识别是用计算机对图像进行一系列操作来识别不同的图像,包括图像预处理、图像的分割、图像的特征提取,最后是图像的分类。图像分类识别方法多来源于模式识别,近年来随着计算机技术发展和分类算法提出,图像分类识别方法越来越多。该文分析的分类算法是在模式识别基础上进行图像分类识别,首先介绍图像分类识别国内外研究现状,然后分析几种分类识别算法的优点和缺陷,便于更好地深入研究图像的分类算法。
关键词:分类识别;模式识别;图像分类
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)32-7731-03
1 概述
图像分类识别根据图像的不同特征对图像进行分类,有相同特征的对象归为一类。图像分类识别方法随着数学算法的不断进步而不断发展。目前,图像分类识别的主要方法主要有六种:模糊集识别、统计识别、神经网络识别、结构识别、模版匹配和支持向量机。这几种方法各有优缺点,根据具体情况来具体分析和应用,也可以多种方法相结合使用。
图像分类识别系统包括几个步奏[1],如图 1所示,一是获取原图像的信息,二是对图像预处理,三是图像分割,四是图像特征提取,五是图像分类识别。
1) 统计识别法
统计识别的理论基础是数学的决策理论,在决策理论基础上建立统计识别模型,统计识别模型对要分类的图像进行统计分析,统计出图像的各类特征,找出准确反映图像类别的特征,最后进行分类。其主要的技术有聚类分析法、统计法、KNN等。但是,统计识别法不能识别图像空间相互关系(即结构关系)。如要分类图像的结构特征是主要特征,用统计识别就不能识别图像。
在进行分类时需要大量图像样本,先统计图像样本特征,设定图像识别的一系列参数(即统计学习)。
统计识别法流程如图2[1],输入的图像信息是原始图片;图像处理是对样本图像滤波、分割和特征提取;最后是图像分类,输出结果。
2) 结构识别法
结构识别法即是句法识别,是对统计识别法不能识别图像结构特征的补充,因为统计算法不能统计图像的结构信息,只能统计图像的数字特征。结构识别法用符号表现图像的特征。结构识别采用的结构是层次结构,把复杂图像分解成单子图像,而子图像又可以分解为更简单的子模式,一直分解下去,直到分解为最简单的子模式,即模式基元。通过对模式基元的识别,进而识别子模式,最终识别该复杂的模式。结构识别法流程如图3所示。
3) 神经网络法
神经网络法是通过我们学习的神经网络算法对图像进行分类。神经网络方法与统计识别方法在很多方面是有联系的,都利用样本数据完成图像的分类识别,并且在有的算法上还可以看作是一定的等价关系。神经网络算法的结构由一个输入层、若干个中间隐含层和一个输出层组成。神经网络法通过学习,能够从原始图像的复杂数据中找到相识的图像特征,对图像进行正确的分类。神经网络法克服了统计识别算法过程中的复杂性,以及模型选择的一些困难,是一种非线性建模过程,不需要分清图像中存在的非线性关系,给图像分类带来的极大方便。
神经网络算法有不同的网络结构,所以构造神经网络时首先要选择合适的网络结构。神经网法图像分类时首先要输入图像的文理特征和结构特征等一系类参数;中间经过图像的预处理和特征提取,最后输出的是图像类别。神经网络分类识别的流程图如图4所示。
4) 模糊集识别法
模糊集识别法在模式识别、医学图像识别,车牌识别等方面的应用比较广泛。在图像分类时,有一些图像的特征不是很明显,不能准确的确定图像属于哪一类别时,模糊集识别法能很好地解决这一问题。先模糊地对图像进行判别,这时图像可能属于两个或多个类别,等到再找到另外的特征时再进行精确的判别。模糊数学是模糊集识别法的理论基础,模糊数学在判别事物时一般不是准确的去判断这事物到底属于什么,而是用不太精确的方式来判别事物,用更适合人的思维方式去判别。
模糊集识别法是在模式识别方法的基础上采用模糊逻辑的方法。在图像分类时,采用模糊理论对图像特征模糊化和模糊分类。
模糊集识别法根据一定的模糊化规则将图像的纹理或形状等特征分成多个模糊变量,虽然每个模糊变量不能准确的判别图像,只能判断原图像的一部分特征,但是这能更进一步地判别图像。我们用先前判别出的部分特征去替代原来的特征再进行图像判别,这样我们又能精确的判别图像类别。虽然模糊集识别法识别时图像的特征变多了,但是却使得判别更加,也使分类器设计趋于简单。
5) 支持向量机
支持向量机(SVM)是一种新的人工智能学习算法,现在已经成为模式识别领域新的研究热点[3] 。支持向量机有学习效率高、抗噪声性能强和推广性好等优点。支持向量机是在原先统计学习理论的基础上,解决传统统计学习理论不能解决的一些问题(如神经网络结构选择问题,局部极小点问题等)而形成的一种新的学习方法。在图像识别时,支持向量机将图像特征向量映射到一个更高维的空间,在新的空间中重新建立一个最大图想参数阈值。首先判断图像的大类别,在阈值的两边再建立重新建立新的阈值,再进行分类,对图像不断判别。最后相差最大的就是图像属于不同类别。
6) 模板匹配法
模板匹配法是对要识别的图像做出一个典型的标准模板,作为将要判别其他图像的标准,然后将要分类的图像与标准模板相比较,从而判断出图像属于哪一类别。其实模版匹配法是一种比较算法,将要识别的图像与标准模版放在一个分类器中做相关运算,根据我们学习的相关运算知识可以知道,如果两个信号出现自相关,就表示出现了主峰值(即阈值),这就表示模版图像和要识别的图像匹配,将这个阈值作为分类器的一个判决规则,即可实现图像的匹配。所以模版匹配法的首要任务就是先进行模版的创建,如果创建的模板很正确精确,那么我们在匹配的时候也会更加的精确。endprint
模版匹配法的流程图如图5所示。
3 图像分类识别算法的优缺点
统计识别法的优点是以数学上的决策理论为基础的,能够比较快的建立出统计识别模型。通过建立出的模型,对图像进行大量的统计分析,能够准确的判断出图像的类别,并且统计出的特征都是数字特征,对计算机的性能要求较小。缺点是统计识别法不能统计图像在空间上的相互关系(即结构关系)。如果图像的结构特征为主要特征时,用统计方法不能进行准确的判别。
结构识别法:对统计识别识别方法的补充,统计识别法不能统计图像的结构信息,统计方法一般统计出来的图像特征都是以数值表示,结构识别法描述图像的特征时则是用符号来表示。
神经网络法优点是神经网络非线性拟合能力很好,可以映射图像的非线性关系;而且神经网络的学习能力强,也方便计算机实现;神经网络还具有很强的非线性映射能力,记忆能力以及自我学习能力。神经网络法的缺点是不能解释自己的推理过程和推理依据;神经网络需要大量的模板数据,并且个模板特征数据要近似相等,当数据不充分或各类别差别很大的时候,神经网络的识别就不太准确;神经网络的输入也是图像的数字特征,不能表示识别图像的结构关系,和统计识别法一样,当结构特征为主要特征时,图象的识别就不准确。
模糊集识别法的优点是模糊识别法虽表现为图像的不确定分类,但是随着更高可靠性的特征能使图像分类越来越准确;采用多级分类,能为下级分类提供分类信息。缺点是模糊识别不能准确确定图像的类别,如果不能找到跟准确的特征,图像的分类将不准确。
支持向量机(SVM)优点:1.对模板样本要求低,如果模板数量少,得到的分类结果是在现有模板信息下的最优解;2.支持向量机通过非线性变换将图像的特征转换到高维的特征空间,然后在高维空间构造线性函数替代原图像的非线性关系,更利于计算机去判别。缺点: SVM是通过二次规划来求解特征向量,里面涉及到m阶矩阵运算,对计算机要求高,并且运算时间长。
模版匹配法的优点是如果模板做的比较准确,匹配不正确的概率就会很小,并且模板不匹配的情况也很少。缺点是因为图像上的每一个点都要进行匹配计算,对计算机配置要求高,并且对噪声比较敏感,如果识别时有很大的噪声,将不利于图像的识别。
4 总结
本文深入分析了统计法、句法识别法、神经网络法、模糊集识别法、支持向量机法和模版匹配法等几种主要图像分类识别方法,并对各种分类识别方法的优势与缺陷做了深入的总结。通过分析各类图像分类识别方法,明确各类识别方法的优势与缺陷,为图像分类识别方法的具体应用奠定基础。
参考文献:
[1] 常俊.基于特征提取及神经网络的图像分类识别与目标跟踪[D].西安:西安电子科技大学,2008.
[2] 赵诚.图像识别方法与实现技术研究[D].西安:西安电子科技大学,2008.
[3] 翁代云,杨莉.人工智能技术在遥感图像分类中的应用[J].计算机仿真,2012,6(29).endprint
模版匹配法的流程图如图5所示。
3 图像分类识别算法的优缺点
统计识别法的优点是以数学上的决策理论为基础的,能够比较快的建立出统计识别模型。通过建立出的模型,对图像进行大量的统计分析,能够准确的判断出图像的类别,并且统计出的特征都是数字特征,对计算机的性能要求较小。缺点是统计识别法不能统计图像在空间上的相互关系(即结构关系)。如果图像的结构特征为主要特征时,用统计方法不能进行准确的判别。
结构识别法:对统计识别识别方法的补充,统计识别法不能统计图像的结构信息,统计方法一般统计出来的图像特征都是以数值表示,结构识别法描述图像的特征时则是用符号来表示。
神经网络法优点是神经网络非线性拟合能力很好,可以映射图像的非线性关系;而且神经网络的学习能力强,也方便计算机实现;神经网络还具有很强的非线性映射能力,记忆能力以及自我学习能力。神经网络法的缺点是不能解释自己的推理过程和推理依据;神经网络需要大量的模板数据,并且个模板特征数据要近似相等,当数据不充分或各类别差别很大的时候,神经网络的识别就不太准确;神经网络的输入也是图像的数字特征,不能表示识别图像的结构关系,和统计识别法一样,当结构特征为主要特征时,图象的识别就不准确。
模糊集识别法的优点是模糊识别法虽表现为图像的不确定分类,但是随着更高可靠性的特征能使图像分类越来越准确;采用多级分类,能为下级分类提供分类信息。缺点是模糊识别不能准确确定图像的类别,如果不能找到跟准确的特征,图像的分类将不准确。
支持向量机(SVM)优点:1.对模板样本要求低,如果模板数量少,得到的分类结果是在现有模板信息下的最优解;2.支持向量机通过非线性变换将图像的特征转换到高维的特征空间,然后在高维空间构造线性函数替代原图像的非线性关系,更利于计算机去判别。缺点: SVM是通过二次规划来求解特征向量,里面涉及到m阶矩阵运算,对计算机要求高,并且运算时间长。
模版匹配法的优点是如果模板做的比较准确,匹配不正确的概率就会很小,并且模板不匹配的情况也很少。缺点是因为图像上的每一个点都要进行匹配计算,对计算机配置要求高,并且对噪声比较敏感,如果识别时有很大的噪声,将不利于图像的识别。
4 总结
本文深入分析了统计法、句法识别法、神经网络法、模糊集识别法、支持向量机法和模版匹配法等几种主要图像分类识别方法,并对各种分类识别方法的优势与缺陷做了深入的总结。通过分析各类图像分类识别方法,明确各类识别方法的优势与缺陷,为图像分类识别方法的具体应用奠定基础。
参考文献:
[1] 常俊.基于特征提取及神经网络的图像分类识别与目标跟踪[D].西安:西安电子科技大学,2008.
[2] 赵诚.图像识别方法与实现技术研究[D].西安:西安电子科技大学,2008.
[3] 翁代云,杨莉.人工智能技术在遥感图像分类中的应用[J].计算机仿真,2012,6(29).endprint
模版匹配法的流程图如图5所示。
3 图像分类识别算法的优缺点
统计识别法的优点是以数学上的决策理论为基础的,能够比较快的建立出统计识别模型。通过建立出的模型,对图像进行大量的统计分析,能够准确的判断出图像的类别,并且统计出的特征都是数字特征,对计算机的性能要求较小。缺点是统计识别法不能统计图像在空间上的相互关系(即结构关系)。如果图像的结构特征为主要特征时,用统计方法不能进行准确的判别。
结构识别法:对统计识别识别方法的补充,统计识别法不能统计图像的结构信息,统计方法一般统计出来的图像特征都是以数值表示,结构识别法描述图像的特征时则是用符号来表示。
神经网络法优点是神经网络非线性拟合能力很好,可以映射图像的非线性关系;而且神经网络的学习能力强,也方便计算机实现;神经网络还具有很强的非线性映射能力,记忆能力以及自我学习能力。神经网络法的缺点是不能解释自己的推理过程和推理依据;神经网络需要大量的模板数据,并且个模板特征数据要近似相等,当数据不充分或各类别差别很大的时候,神经网络的识别就不太准确;神经网络的输入也是图像的数字特征,不能表示识别图像的结构关系,和统计识别法一样,当结构特征为主要特征时,图象的识别就不准确。
模糊集识别法的优点是模糊识别法虽表现为图像的不确定分类,但是随着更高可靠性的特征能使图像分类越来越准确;采用多级分类,能为下级分类提供分类信息。缺点是模糊识别不能准确确定图像的类别,如果不能找到跟准确的特征,图像的分类将不准确。
支持向量机(SVM)优点:1.对模板样本要求低,如果模板数量少,得到的分类结果是在现有模板信息下的最优解;2.支持向量机通过非线性变换将图像的特征转换到高维的特征空间,然后在高维空间构造线性函数替代原图像的非线性关系,更利于计算机去判别。缺点: SVM是通过二次规划来求解特征向量,里面涉及到m阶矩阵运算,对计算机要求高,并且运算时间长。
模版匹配法的优点是如果模板做的比较准确,匹配不正确的概率就会很小,并且模板不匹配的情况也很少。缺点是因为图像上的每一个点都要进行匹配计算,对计算机配置要求高,并且对噪声比较敏感,如果识别时有很大的噪声,将不利于图像的识别。
4 总结
本文深入分析了统计法、句法识别法、神经网络法、模糊集识别法、支持向量机法和模版匹配法等几种主要图像分类识别方法,并对各种分类识别方法的优势与缺陷做了深入的总结。通过分析各类图像分类识别方法,明确各类识别方法的优势与缺陷,为图像分类识别方法的具体应用奠定基础。
参考文献:
[1] 常俊.基于特征提取及神经网络的图像分类识别与目标跟踪[D].西安:西安电子科技大学,2008.
[2] 赵诚.图像识别方法与实现技术研究[D].西安:西安电子科技大学,2008.
[3] 翁代云,杨莉.人工智能技术在遥感图像分类中的应用[J].计算机仿真,2012,6(29).endprint