APP下载

图像识别技术概述

2018-08-30李啸天

中国科技纵横 2018年14期
关键词:匹配图像识别特征提取

李啸天

摘 要:本文概述了图像识别技术的一般流程,分析比较了图像识别技术的技术特点与优缺点,概括了图像识别的应用,并对图像识别技术的重要步骤与原理进行了举例和讲解。

关键词:图像识别;图像区域分割;特征提取;匹配

中图分类号:TP3 文献标识码:A 文章编号:1671-2064(2018)14-0050-02

1 引言

图像识别技术是目前应用十分广泛的一项技术,它以图像的形状、颜色特征为基础,通过聚类的思想和方法从中获取图像的信息,进而实现图像的识别。近几年,图像识别的研究与应用日益增多,尤其体现在生物识别与卫星云图识别方面。生物识别譬如指纹识别、人脸识别、虹膜识别及视网膜识别具有非常良好的发展前景;条码、二维码的扫描,翻译软件常使用的文字识别及图片文字录入,车牌捕捉,苹果充值卡所用的文字扫描等技术,也是图像识别在日常生活中的常见应用。图像识别研究不断拓展和深入,其应用领域会愈加广泛。图像识别需要经过预处理、区域分割、特征提取等步骤,其算法种类繁多而且不同算法间差别巨大,但一般流程基本相同。本文将会以其一般流程为基础,对图像识别技术的技术特点与技术原理进行简要介绍。

2 图像识别的一般流程

2.1 图像的采集

图像识别的第一步是使用合适的方法采集图像,通过计算机进行下一步的处理操作。

2.2 预处理

图像的预处理也是图像识别的必要步骤。图像预处理能够加大算法的精简度与可行度,提高识别算法运行的效率,增强特征提取和特征匹配的精确度。预处理主要分为图像增强、二值化和细化三个步骤。图像增强能恢复图像的原结构,为算法运行提供较好的环境,也能够提高图像质量;二值化是将输入的灰度圖像转化为二值图像;细化是在二值化的基础上,将不是很均匀的二值图像转化为一像素宽的点线图像,以便实现算法。

2.3 图像区域分割

经过预处理后的图像已经可以开始识别,但还不适宜直接处理。图像作为一个整体,具有我们需要和不需要的部分,尤其是所需的目标部分和它的背景融成一体,不利于算法处理。因此我们先将输入的图像划为几个对应目标部分的区域,称为感兴趣区,再利用目标与背景的经验区别来进行标识与定位,经过一次或多次运算,将目标部分与背景和无用部分分离。感兴趣区包含了分区与分区的描述信息,特定的特征可以区别不同目标部分和非目标部分,其中可用的特征差别有灰度、色调、纹理和频谱特征等等。因为特征具有特定性,所以这种分割方法还不具有通用性。目前大部分航空航天、军事、医用、通讯技术和工业自动化等的图像识别技术都使用了图像区域分割技术。

2.4 特征提取

图像的原始特征数量可能很大,这时可以通过映射或变换的方式在低维空间中表示样本特征。特征提取能够用数值形式表达目标图像的特征,在设计算法时应注意尽可能地保留真实特征,滤去无用的特征。

2.5 判断匹配

图像的判断、分类与匹配是图像识别技术最需要,也是最热门的一个研究方向。在图像识别的处理系统中,输入的图像可能要和成百上千的其他图像进行匹配,为了降低运算量和提高算法精确度与可行性,需要精确及通用的方法对图像进行分类。图像匹配则是基于预处理、区域分割和特征提取,通过查找其共有特征来比对二者相似程度,从而判断图像是否一致。当前,细节匹配算法是主流的匹配算法,如利用纹理特征进行图像识别。寻找具有更强表达图像特征能力的图像识别方式及其算法,至今仍是图像识别和人工智能领域的热点。

3 图像识别的技术特点和优点

3.1 图像识别技术的特点

3.1.1 信息量大

相对于文字信息,图像信息占用内存更大,频带更宽。计算机对图像进行存储和处理通常以二维的形式进行,图像的输入、传输、存储和处理过程,都需要计算机性能与存储量等相关方面的技术支持。

3.1.2 关联性大

关联性是指计算机系统本身与图像的像素(或图像信息)之间的关联,很多时候只有通过压缩技术才可以实现图像的分类匹配。尤其是(客观上)三维的图像,图像本身当然不具备三维物体的特质,无法再现其三维几何信息,此时应进行适当的假设与重新测量,利用映射或变换等方式,引导识别解决问题。

3.1.3 人为因素大

后期的图像处理及修正可能需要人为处理和评价。人容易受到光线环境和知识限制等的影响,有时不能保证图像识别的精确性。因此为提升图像识别的质量,现在正致力于让计算机对人的视觉进行模仿,模仿人对图像进行评价的方式。

3.2 现有图像识别技术的优点

3.2.1 精确度高

计算机扫描仪可以实现32位图像像素的数字化处理,提高了图像识别技术的精确度。

3.2.2 表现性高

图像识别处理过程中,计算机可以对几乎任何情况下的图像进行图像还原,能够对储存、输入等相关因素进行准确处理,保证处理的像素信息。

3.2.3 灵活性高

在图像输入时,无论是显微镜下的亚微观图像还是天文望远镜下的小视角图像,计算机都能以客观情况为依据进行放缩,并以线性的运算和数学处理实现识别处理。图像识别技术利用二维数据对图像的某些颜色特征进行组合,从而实现高质量显示图像,整个识别过程统一而又灵活。

4 图像识别技术的关键步骤

4.1 图像区域分割方式

4.1.1 利用灰度值

目前最常用的、效率最高的区域分割方式就是利用目标区域和非目标区域的灰度值,进而识别图像。例如,设定合适的阈值,对图像的每一个像素点的灰度值与阈值进行大小比较,将图像的像素归类为灰度值较大与较小的两部分,这样的方法适用于图像只有目标和背景的情况。但如果直接从具有多目标的原图中提取灰度特征,则容易输入大量的伪特征信息。

4.1.2 区域生长与分裂合并

区域生长的具体过程为:从每一个图像的像素开始,一步步合并形成感兴趣区。分裂合并则是从整个图像出发,逐步执行分裂和合并两个步骤,最终分割形成感兴趣区。这两种方法能够考虑像素在“空间”中的连续性和临接性,能够有效消除单像素灰度的干扰,且具有很好的鲁棒性。

4.1.3 利用边缘

不同區域之间往往在边缘处灰度值变化非常剧烈。可以先找到目标与非目标区域的边缘点,再逐步构成轮廓,最后找出感兴趣区。

4.2 使用局部细节特征进行特征提取

直接提取灰度特征的方法和直接利用灰度值分割图像的方法具有相似性,效率高但易输出伪特征信息。若采取模仿人类的做法,即采用边缘区域规划全图特征,提取方向图、奇异点进行分类的方法,则具有很好的鲁棒性,但在图像质量较差时结果不可信。

目前业界常利用特定的局部细节特征进行特征提取,大致的算法如下:

我们采用一个3×3的框架来进行图像端点和分支点的特征提取,用A表示需要检测的目标像素,邻域点用到表示,这八个像素的灰度值则用到表示(表1)。

若A为端点,则邻域点的特征公式为:

若A为分支点,则邻域点的特征公式为:

通过这样的方法,图像特征点被确定,与此同时,图像的类别和位置信息也能够得到确认和记录。

4.3 细节匹配

现在最常用的图像匹配方式是细节匹配,算法步骤如下:

模板细节点模式的细节点(具有特定特征)特征向量集合如下:

输入细节点模式的细节点特征向量集合如下:

M有m个细节点,N有n个细节点,寻找M、N中点的最佳对应关系,并按照此关系下对应的细节点数目,可得匹配理论分值,与阈值比较。若,则说明两模式匹配,若,则两模式不匹配。

5 结语

图像识别技术的原理依据人类对图像的识别原理不断发展而来,本质上并不深奥,只是计算机所需要处理的信息十分复杂。图像处理技术其实是运用程序,使模拟在人类脑海中进行的图像识别过程的算法得以实现。目前,利用计算机实现图像识别主要是利用图像特征的描述对其进行处理。图像识别技术以其广泛的应用与研究领域,必将会在日新月异的当代社会中更好地崭露头角,创造更多的经济与社会价值。

参考文献

[1]张家怡.图像识别的技术现状和发展趋势[J].电脑知识与技术:学术交流,2010,06(7X):6045-6046.

[2]于丽颖.图像识别方法技术分析与应用[C]//中国煤矿信息化与自动化高层论坛,2014.

[3]陈云平.数字图像识别在人脸检测中的应用[J].计算机时代,2012,(5):37-38.

[4]翁和王.关于人工智能中的图像识别技术的研究[J].信息通信,2016,(10):191-192.

[5]刘芳.计算机智能化图像识别技术的理论性探究[J].信息系统工程,2017,(4):16-16.

猜你喜欢

匹配图像识别特征提取
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
基于Daubechies(dbN)的飞行器音频特征提取
图像识别在物联网上的应用
图像识别在水质检测中的应用
Bagging RCSP脑电特征提取算法
工程车辆柴油机与液力变矩器的功率匹配及优化分析
基于MED和循环域解调的多故障特征提取
Walsh变换在滚动轴承早期故障特征提取中的应用