基于人工智能的图像识别研究

2022-04-20聂莉娟

无线互联科技 2022年2期

聂莉娟

(金肯职业技术学院,江苏南京 210000)

0 引言

伴随着现代计算机技术及信息化技术的快速发展,图像识别技术受到了更多领域的关注。图像识别技术的产生以及更新成为当下十分重要的发展方向,同时表现出了良好的发展前景,在信息收集、医疗以及产品安全等方面,都已经开始广泛运用图像识别技术,发挥了非常大的作用。简单来说,图像识别技术即是依托于计算机结合对象目标处理系统前端捕获图片,在现代人们日常生活中也有着普遍的运用,比如说条形码识别、指纹识别等。另外,随着我国全面进入到信息化时代,图像识别技术成为了一项十分重要的技术手段,作为时代发展下的产物,图像识别技术运用的主要价值是依托于计算机取代传统人工劳作,进而完成对庞大物理信息的处理。在现代计算机技术水平不断提升的背景下,图像识别技术的运用价值也越来越大。为此,从人工智能视域出发探究图像识别技术十分有必要。图像识别技术在实际运用过程中,首先获取相关信息,之后对获取的信息进行预处理,紧接着提取信息特征并进行选择,最后实现分类决策及分类器设计功能。本文重点对图像识别技术的流程进行分析和探究。

1 图像识别流程概述

图像识别主要指依托于计算机对目标图像进行处理,之后准确识别相关图像信息的计算机技术[1]。一般来说,在进行图像识别时,主要分为以下几个步骤:即图像采集、图像预处理、特征提取以及图像识别[2]。

1.1 图像采集

通俗来说,图像采集即针对识别目标建立数字化图像,要保证图像采集工作的顺利完成,通常需要利用多个采集设备进行协作。现阶段,在进行图像采集时,一般使用的图像采集设备为CCD,CMOS摄像机等,摄像机通过镜头中的光感部件得到目标物体图像的模拟信号,紧接着利用A/D转化实现模拟图像向数字图像的转变,最后通过相应的解编码将数据信息传输到计算机中完成图像处理[3]。在进行图像识别中,图像采集品质直接关系到最终的识别效果,所以在完成图像的采集之后,需要对图像品质进行评估,重点衡量图像的清晰度、对比度以及噪点等多个因素,而图像的这些因素往往受到CCD,CMOS摄像机传感器精密性的影响。相比较于其它图像采集方式,通过CCD,CMOS摄像机开展的图像采集拥有像素密集性好、噪点低等优势,同时还能够支持动态对比度调整,也能够有效简化后期的图像处理流程,因此在现阶段图形处理中有着非常广泛的应用。图1为CCD摄像机,该摄像机一般适用于规模较大、稳定性高的摄像环境中,相应的CMOS摄像机通常使用在规模较小的设备中,比如说智能手机、笔记本电脑等。

图1 CCD摄像机

1.2 图像预处理

图像预处理是获取图像特种的重要组成部分。因为在实际图像采集过程中,会受到外界环境以及图像采集设备等因素的影响,使得导入到计算机中的图像会产生较大的偏差,常见问题有图像亮度较低、对比度较差以及噪点多等[4]。图像预处理能够有效解决这样的问题,可以实现对采集数字图像的不同转化,对图像进行相关处理,为改善后期图像算法速度奠定基础。第一步降低采集图像的噪声,图像噪声的降低主要是通过不同的滤波来实现的,比如说常见的线性滤波、中值滤波等,该环节的工作原理是借助图像的灰度连续性特征,将图像中的任意一个像素当作是由多个像素平均合成的,从而使得图像中的各个噪声被平均,完成噪声处理工作。第二步,开展图像分割工作。图像分割的主要目的是将图像中可识别区域与不可识别区域分离开来,在多数情况下,要求识别的图像仅仅是整个图像中的局部,因此为了提高图像识别的准确度与效率,要提前对图像进行分割处理,图2为分割图像示意图。通常情况下图像分割能够通过多种途径实现,如一般分割、语义分割以及Kmeans分割等,其中Kmeans分割拥有较高的智能性,能够自主完成分类[5]。

图2 分割图像示意

1.3 特征提取

特征提取表示为将图像中涵盖的所有信息转变成相应的计算机向量特征,通常情况下,特征能够准确反映图像的各项信息,是图像识别中至关重要的一部分。根据图像的不同,其表现出的特征也有较大差异,从图像粒度层面来划分,可以将图像特征划分成结构性特征与浅层特征[6],其中,浅层特征通常表示为靠近图像边缘的像素特征;而结构性特征通常较为复杂,同时相互之间的关联性也非常强,可以更好地识别出图像中的目标。浅层特征主要涵盖了识别目标的外形、颜色、纹理以及大小等信息,该部分特征信息相互独立,同时较为简单,一方面可以通过浅层特征来确定图像,另一方面也可以基于浅层特征形成结构性特征。在实际开展特征提取时,应当要先进行特征的过滤,依托于相应算法挖掘出真实特征,并且删减掉无意义的特征。

1.4 图像识别

完成特征提取工作之后,目标图像的全部信息都有与之相对应的特征向量,图像识别的最终目的便是完成对未识别目标图像特征向量的识别[7]。通常来说,计算机视觉系统要在非常有限的时间内完成对图像的反馈,同时要将目标图像与数据库中庞大的图像信息进行比对,当未识别图像特征较为繁琐时,不仅会消耗较长的时间,同时对计算机软件与硬件配置要求都非常高。现阶段,主流图像识别技术有模板匹配法、神经网络法、贝叶斯法等,在这些方法中绝大部分均是以人工智能技术为载体,在选取图像识别方法时,需要依照具体图像特征进行确定,当下还没有一种能够全面满足各种图像特征的图像识别方法。

2 基于人工智能的图像识别技术优势

2.1 智能化

基于人工智能开展的图像识别技术,其显著优势便是能够提高图像处理过程的智能化水平,与传统图像处理方式不同的是,基于人工智能的图像处理技术可以实现图像的智能化选取及分析[8]。在现代人们生活当中,基于人工智能的图像识别技术也有着广泛的运用,比如说人脸识别解锁系统,该系统功能的实现主要是依托于人工智能识别系统中的智能识别功能,利用人脸识别技术识别各种人脸信息并进行储存,紧接着将不同人脸特征信息挖掘出来,并将其视为安全密码,当人们运用人脸进行解锁时,通过与数据库中的人脸特征信息进行比对,即可完成自动解锁,这种功能的实现也是建立子人工智能中的图像识别技术基础上。通过将人工智能运用到图像识别中,一方面可以实现简单的图像识别,另一方面也可以实现图像信息的自动处理、存储以及特征提取等,这些图像处理操作在以往图像识别中几乎不可能完成。

2.2 便捷化

图像识别技术的运用不单单拥有智能化优势,同时也表现出了较高的便捷化,依托于对图像识别技术的广泛运用,给人们日常生活与工作带来了极大的便利。通过图像识别技术的运用,在以往十分困难的图像处理过程都可以变得十分简单,比如说现代十分流行的智能手机人脸解锁、刷脸支付等,使用者不再需要记忆各种密码,同时双手也不需要进行任何操作,就能够完成手机的解锁、线上支付以及刷脸开门等。换言之,依托于基于人工智能的图像识别技术,可以为人们生活与工作带来较大的方便,很好的解决了一些传统人们生活中不好解决的问题,为此从图像识别技术的功能性层面来审视,基于人工智能的图像识别技术表现出了非常高的实用性,同时该技术慢慢变得大众化、普遍化,所能够实现的功能也趋向于简便与实用。

3 基于人工智能的图像识别技术运用探究

3.1 模式识别

模式识别是基于人工智能的图像识别技术中的关键性模型,这种模型的创设是以海量数据信息为载体的[9],换言之模式识别的产生是建立在人们已经掌握的图像识别技术与大量实践研究经验的基础上,紧接着利用计算机电脑的一系列计算过程来达成和数学原理的紧密融合,进而可以自主的进行目标图像特征识别,并在识别的同时产生客观、公正的评价。正常情况下,模式识别能够划分为两个过程,分别是实现过程与学习过程,其中学习过程主要表现为将图像数据信息存储到相应的数据库中,该过程的实现需要建立在图像信息采集的基础上,之后按照计算机存储水平与识别特性完成对获取图像信息的分类与识别工作,最后产生可以进行图像识别的计算机程序。而实现过程一般表示为图像和模板之间的匹配程度,识别过程也是建立在该过程之上。在进行实际运用时,计算机识别与人脑识别有着非常大的区别,然而计算机能够依托于已有的数据来完成图像信息的识别与匹配,假如可以依照某种规律顺利实现匹配,则表明图像识别可以成功完成,然而该识别过程表现出了较强的限制性,难以有效辨别特征相似的情况,极易产生误差。

3.2 神经网络

为了更好地探究基于非线性降维的图像识别技术,首先应当要掌握什么是神经网络。神经网络技术一般表示为将传统图像识别技术和现代神经网络算法联系起来的一种新型图像识别技术,神经网络的计算过程主要是模仿人脑中的某项特征开展的,实际上神经网络并不是原原本本的依照人类的神经网络进行的,更多的是依托于对人类神经网络的抽象、简化以及模拟来优化计算结构,从而改善计算速度。

基于神经网络的图像识别计算,其实现原理主要是依托于神经网络学习算法,在使用神经网络实施图像识别过程中,先要对图像的色彩等进行预处理。为了有效提高基于神经网络的图像识别效率与准确率,还应当要面向图像识别的领域及目标开展相应的神经网络设计,重点涵盖了输入与输出层设计、隐含层设计、初始权值的确定以及期望误差的确定等部分[10]。各个部分设计完成之后,还应当要对设计完成的神经网络进行实践训练,从而确保其能够很好的满足图像识别需求。笔者以MATLAB 9.3软件为平台,通过函数newff构建一个双层网络,涵盖了1个输出神经元、9x9个输入以及18个单元的隐含层,学习函数选择learngdm,设定学习速率为0.009~0.5。紧接着开展实验,笔者书写26个英文大写字母进行实践识别,如表1所示为识别结果,图3为隐含层为18时的神经网络训练误差指标与时间曲线图。可见,基于神经网络的图像识别技术能够很好的完成字母识别,并能够延伸到相关应用中。

表1 隐含层不同节点数下的识别结果

图3 隐含层为18时的神经网络训练误差指标与时间曲线图

3.3 非线性降维

基于神经网络的图像识别技术与非线性降维图像识别技术都是当下常用的技术方式。对以往计算机开展的图像识别技术进行分析可以看出,传统图像识别技术一般是高维识别技术,正因为拥有高维特性,使得计算机在进行图像识别过程中面临着较大的负担,会降低图像识别的效率与品质,通过非线性降维图像识别技术的运用就可以很好的完成图像识别的降维,解决传统图像识别中的问题。

在以往非线性降维图像识别技术还未研制出来时,使用较为普遍的是线性降维图像识别技术,该技术拥有使用简单、操作便捷的优势,然而在具体运用时,基于线性降维的图像识别技术会导致计算十分复杂,不仅消耗时间较长同时也消耗了大量的空间资源,无法满足现代图像识别领域应用需求。而基于非线性降维的图像识别技术可以在维持图像原本架构的基础上完成降维工作,从而有效推动了图像识别效率与精度的提升。比如说人脸识别系统中,在以往该系统识别速度较慢、成功率较低,这是因为该图像识别是在高维环境下进行的,而通过非线性降维图像识别技术的运用,可以很好的提高自身的紧凑性,极大改善了人脸识别系统的工作速度。

4 结语

图像识别技术在我国许多行业领域中有着非常广泛的运用,并发挥了十分重要的价值,拥有良好的发展前景。在将来图像识别技术将会获得进一步的发展,可以更加智能化的融入到人们的平时生活中,从社会发展层面来看,加强对图像识别技术的研究有助于提高其社会和经济价值,基于人工智能的图像识别技术也将成为未来必备的关键性技术之一。