面向人工智能算法下图像识别技术分析*
2021-11-19南京大学苏州高新技术研究院徐自远
南京大学(苏州)高新技术研究院 徐自远
人工智能是当今科技时代的宠儿,促进了国家与社会的快速发展,为人们的生活出行提供便利。图像识别技术在人工智能领域已经有了广泛的应用,如利用指纹、面部特征识别身份信息、快速搜索图片、监测环境等。图形识别是在图形特征的基础之上,通过算法在互联网上进行快速识别的技术。在此背景下,文中首先简要介绍图片识别的基本原理,然后对网络识别技术展开分析,最后重点分析了图形识别的实现过程。
0 引言
图像识别,顾名思义,就是对采取到的图片信息进行处理,根据图像的特征进行识别。作为人工智能的代表技术之一,图像识别与人们的生活息息相关,包括人脸扫描、指纹识别、条码扫描等。图像扫描有着光明的发展前景,可以极大地提高企业的服务效率、改善人们的生活方式。因此,深入研究基于人工智能算法的图像识别技术具有十分重要的现实意义。
1 图像识别原理
图像识别技术,最早只能识别一些文字、数字和符号,识别对象仅限于文字印刷体和手写文字。1965年,图像识别发展进入到数字图像处理与识别阶段,此时的图像识别技术初步具备存储、可压缩、传输失真低、便于处理等优势。如今,图像识别为高级计算机建立了对三维世界的感知和认识,为人工智能的发展作出了巨大贡献[1]。
图像识别的基本原理是利用计算机软件程序图片进行信息处理,由人工智能算法对图片信息进行特征提取,经智能处理之后达到图像识别的目的。图片识别的整个过程原理较为简单,可以将计算机看成一个人,人的眼睛可以对图像进行识别,人的大脑经过分析对比可以得出眼前图像的基本特征,并与人脑中的信息进行对比和分析。图像识别技术和这一过程类似,只不过该技术是让计算机模仿人类的行为和思维,利用人工智能算法处理图像的信息和分类,达到实现人工智能图像识别的目的。然而值得一提的是,计算机提取的图像信息和特征和人类大脑相比存在着不稳定性,这些不稳定因素会影响图像识别的效率和准确性,所以基于人工智能算法的图像识别技术需要不断地学习和训练来减小误差。
2 图像识别技术分析
2.1 神经网络的图像识别技术
神经网络图像识别[2],是传统图形识别与网络神经算法结合的一种新型识别方式,BP神经网络算法通过模仿生物的神经网络分布进行图像识别,可以提高图像识别过程的稳定性,使得高级计算机的行为和思维更接近于人类。神经网络的图像识别技术实现较为复杂,成本相对较高,但是识别效果更加精准和高效。目前神经网络的图像识别技术在各大领域应用广泛,如道路交通领域中的交通管理系统、车辆视频安全检测等,可以快速识别道路上行驶的车辆信息,便于交通管理。
神经网络是模拟人类的神经元进行数据处理,同时具备自主学习的功能。如表1所示,神经网络会在训练后明显提升识别率。神经网络图像识别技术可以识别和处理更为复杂的图像,由于其性能卓越使得该技术的应用成本较高。
表1 神经网络隐含层节点数目不同时的识别结果Tab.1 Identification results of different number of hidden layer nodes in neural network
2.2 非线性降维的图像识别技术
非线性降维在图像识别技术中是常用的手段之一。计算机对复杂图像的处理成本较高,且在计算机识别高维图像的特性时会存在因一些外在风险影响图像识别的效率的准确性,通过对图像的降维技术可以有效解决这些问题。
降维是通过将高维的图像数据转化成高维空间中的数据集合。非线性降维的图像识别技术可以根据一维的特征表达量进行数据识别。理论上,线性降维的图像识别技术具有简单和易于理解的优点。但是人们通过采用线性降维的方法进行图像识别,发现该技术的计算过程较为复杂、耗费空间和时间资源,不能很好地满足各大领域对于图像识别技术的需求,于是人们便采用了非线性降维进行图像识别(如图1所示)。非线性降维的图像识别技术不仅精准高效,且不存在线性降维存在的问题。以人脸识别系统为例,识别这种高维度的复杂图像需经过大量的时间进行运算,通过非线性降维的图像识别技术可以较好地提高人脸识别系统的工作效率。
图1 非线性降维技术Fig.1 Nonlinear dimensionality reduction technique
2.3 模式识别
模式识别在图像识别方面的应用效果非常显著,一般多应用于医疗行业中的器械、医学和实验检测等。在模式识别的技术基础上,我国研究学者提出了仿生模式识别理论,其是从数学角度进行推理,结合图像特征的一种图像识别技术。以临床医学检测为例,识别X射线以及核磁共振等图像可以科学地辅助医生完成诊断,根据图像特征的数据情况,快速匹配病症。
当前,模式识别分为两个阶段:第一阶段是学习阶段,在此阶段中,是对信息图像进行信息特征的采集和存储,通过计算机将特征信息进行分类,并根据特征规律进行快速识别。第二阶段是实现阶段,在此阶段中,通过识别程序识别图像的特征信息,需与规定的模版完全符合,避免计算中出现误差。识别模式的系统框图如图2所示。
图2 识别模式的系统框图Fig.2 System block diagram of pattern recognition
2.4 贝叶斯
贝叶斯分析是整个机器学习的基础框架[3],其以概率学理论对模式识别方法进行推理,根据被识别图像的特征和类型进行观测和学习。贝叶斯定理具有方法简单、计算效率高等优点,在近年来得以快速发展,并衍生出了贝叶斯分类算法,其已广泛应用于多个领域。
3 基于人工智能的图像识别技术的主要过程分析
随着人工智能的发展,图像识别技术自诞生后发展愈发成熟,目前该技术具有和人脑相似的图像识别过程,其识别过程如图3所示。
图3 图像识别过程图Fig.3 Image recognition process diagram
3.1 获取图像信息特征
首先通过传感器获取数据信息的基本图像。在信息数据传递的过程中,传感器将声音或光信号转换成电信号,即完成计算机不被识别的信号转换成可识别信号的过程。计算机在接收到信号之后与计算机内储存的特征数据对比,然后进行特征提取和处理。
3.2 图像的预处理
图像预处理,是指图像数据传输到计算机内部后的抗干扰处理过程,包括滤波、平滑、增强等。经过抗干扰的处理过程可以排除掉图像中不必要的干扰因素,快速提取到有效数据,提升图像识别过程的准确性。
3.3 图像特征提取
图像特征提取是指计算机程序通过对获取的图像特征进行分类、计算和处理,最后得出图片与计算机内部储存相匹配的特征。特征提取是图像识别最为重要的一个环节,提取和选择到的特征是否精准将直接影响到图像识别的匹配程度。特征提取的算法包括有卷积神经网络、深度残差网络、深度残差收缩网络等。
3.4 图像匹配分类
图像匹配分类需利用有效程序制定标准的识别规则,避免盲目识别造成的数据误差[4]。按照标准的识别规则可以突显出相似的特征种类。对图像匹配分类需要图像识别过程具有很好的辨识度,不仅需要标准的识别规则,还需要设计合适的分类器。
常用的分类器有Adaboost分类器和SVM分类器。前者利用迭代的分类方法,自适应组合精度更高的弱分类器,合成一个功能强大的分类器;后者利用二分类算法,获取小数据集的分类精度,同时可以支持线性和非线性分类。
4 结语
图像识别技术作为科技发展的新生力量,伴随着该技术的完善和普及,人脸识别和指纹解锁已经成为人们日常支付和验证的常规安全手段,极大提高了用户的信息安全服务体验,提高了大众的生活质量[5]。在未来,伴随着人工智能技术水平的不断提高,图像识别技术也会愈发趋于完善,在各领域得到推广和应用,满足广大人民的生产、生活需求。
引用
[1] 蒋树强,闵巍庆,王树徽.面向智能交互的图像识别技术综述与展望[J].计算机研究与发展,2016,53(1):113-122.
[2] 李萍,徐安林.基于BP神经网络的智能制造系统图像识别技术[J].现代电子技术,2016,39(18):107-109.
[3] 葛玮,吴佳.关于计算机智能图像识别的算法及技术分析[J].无线互联技,2014(10):82.
[4] 陈波光,刘姝姝,蔡扬亚.计算机的智能化图像识别技术的理论性突破[J].电子制作,2013(15):69.
[5] 张家怡.图像识别的技术现状和发展趋势[J].电脑知识与技术,2010,6(21):6045-6046.