计算机智能化图像识别技术探讨
2023-09-20薛荣辉刘星星
薛荣辉,刘星星,王 楠
(西安汽车职业大学汽车工程学院 陕西 西安 710600)
0 引言
随着数字化计算快速发展,信息技术与智能化计算机图像识别技术得到了融合,在此背景下,神经网络算法在图像识别领域也发挥了重要作用。当下,计算机图像识别在智能算法领域得到广泛应用,从本质上来讲,它是一种融合了智能化计算机技术和现代图像识别、处理技术的新兴数字影像技术,该技术经过全面的技术革新,已经被广泛应用图像识别与数字化技术处理等领域[1]。例如目前在很多场合都应用到了智能化技术,经过对计算机图像进行低照度处理,即可提高摄像机、数字化监控设备的传感器五色彩质量,图像经智能化识别与处理,清晰度较高,同时采用高感光度技术,有效提高暗光下拍摄出的图片、图像识别度,正是因为有了智能化图像识别技术,才使得图片的清晰度大大提高,在保证图片质量的同时,无需使用阵列红外灯补光也能够保留住原来的图像色彩和清晰度。
1 计算机智能化图像识别技术的基本原理与模式
计算机智能化图像识别技术的核心是基于机器对图像进行识别,经过对相关景物进行处理,收集和处理文字、图像等图片信息,经过计算机智能化图像模式识别,能够由机器取代传统的人工处理技术,可对某些计算机智能化图像数据信息进行自动化识别、处理、辨别与分类,在此过程中,系统还能够对相关图像中的具体图形进行快速、准确识别分类[2]。目前,在我国发展的计算机智能化图像识别模式主要包含三个环节,分别是对计算机智能化图像进行分类,对计算机智能化图像特征进行数据提取以及对计算机智能化图像进行预处理。在前期处理环节,主要目的是采用计算机智能化图像识别模式对图像进行增强处理、平滑处理、数据恢复、图像分割、图像边缘检测等,从而使图像输入计算机中即可将上述几种不同模式转换为分段处理模式。其中,计算机智能化图像特征提取主要是借助计算机智能化图像识别模式有效提取图像主要特征信息,由此为计算机智能化图像中的少部分特征进行识别和有效分类。在这几个环节中,最为关键的步骤就是计算机图像模式分类,对于计算机用户而言,他能够通过图像映射,将计算机智能化图像类型空间、部分特征向量空间进行图像归属映射,进而使图像模式分类归属为某一类模式,计算机智能化图像识别技术基本模式[3]如图1所示。
图1 计算机智能化图像识别技术基本模式框图
1.1 获取计算机智能化图像数据
在获取计算机智能化图像数据时,首先需要通过扫描仪、传真机、数码摄像机、数码相机等设备,将图片、景物、照片或图像等经过数字化传感器传入,然后再将这些图像转换为相应的物理量,用于计算机测量和处理[4]。
1.2 处理计算机智能化图像数据
在计算机智能化图像数据处理过程中,分别需要经过三个不同的步骤,一是选择计算机智能化图像的基本特征,二是抽取计算机智能化图像的基本特征,三是对计算机智能化图像的基本特征信息进行预处理。经过图像数据预处理之后,可以有效改善计算机智能化图像的质量,与此同时,还能够通过图像数据处理,彻底消除因传输介质所引起的图像退化现象[5]。在这几个环节中,抽取计算机智能化图像基本特征的实质就是有效提取出计算机智能化图像的图像性基本元素和图像特性数字值,而在选择图像基本特征时,首先需要抽取特征元素,然后方能选择特征原图像进行图像智能分类识别。
1.3 分类判别计算机智能化图像
计算机智能化图像判别分类,核心是通过建立图像智能分类基本规则,根据规则,对图像模式进行分类选择,在此基础上,借助智能神经网络模式进行图像识别,进而实现图像的智能判别分类[6]。
2 计算机智能化图像识别技术基本方法
现阶段,研究者主要基于神经网络计算方法,对计算机智能化图像进行神经网络识别,通过神经网络识别图像,能够提高图像识别效能,这种神经网络技术具有数据大规模处理、计算机智能化图像分布式存储以及图像识别自组织并行等诸多功能。
2.1 神经网络识别
在采用神经网络计算方法进行图像智能识别时,首先需要进行机器学习,而学习特性即是神经网络学习算法的基本特性,它能够基于神经网络计算方法,对神经网络的具体权值以及网络阈值进行有效调节,从而可以实现计算机神经网络学习与训练。目前,计算机神经网络学习算法主要分为监督学习算法和无监督学习算法两种基本模式,其中对于计算机神经网络监督学习算法而言,在神经网络学习训练时,必须要有一定量的输入矢量和目标矢量作为训练样本。而在学习训练过程中,计算机神经网络能够实时输出目标训练结果,并进行数值比较,根据比较情况,可有效调节网络权值与相关阈值,由此经过循环往复的学习和训练,最终使计算机神经网络输出结果更加靠近目标训练值[7]。当下,最为典型的计算机神经网络算法为BP算法,它是一种常见的计算机神经网络监督学习算法。现如今,也有学者通常采用计算机神经网络无监督学习算法进行智能图像识别,这种技术相比于监督学习算法,它在整个学习训练过程中,均无需学习样本即可实现自我学习,系统只需要输入相应的网络信号,即可反复调节计算机神经网络的相关权值和阈值,最终形成一种有序的监督学习状态。图2所示为基于神经网络算法的计算机监督学习流程。
图2 基于神经网络算法的计算机监督学习流程框图
2.2 改进的GA-BP算法
在算法领域,BP算法往往具有良好的自学习性,但是其收敛速度较差,尤其在基于BP算法进行梯度下降计算时,机器学习训练时长较长,且非常容易陷入局部极小的困境之下。对此,本研究为了改进上述BP算法缺陷,将传统BP算法模式与GA遗传算法模式相结合,形成了经改进的GA-BP算法,该算法模式能够有效避免以往算法模式所带来的未成熟收敛算法缺点,同时还可进行全局最优解搜索与收敛,相比于普通的BP算法而言,经过改进的GA-BP算法基于神经网络算法思想,可使遗传算法的鲁棒性显著得到增强,同时还可以充分发挥神经网络算法的非线性学习能力、收敛速度与映射能力[8]。
2.2.1 基于改进的GA-BP算法思想
改进的GA-BP算法采用遗传算法思想进行神经网络权值学习,首先确定GA-BP算法的神经网络结构,然后列出遗传算法神经网络神经元之间的连接关系,在此基础上,通过连接权编码,分别形成实数码串个体与群体,与此同时,进行算法优化计算分析,最后基于遗传算法对最优个体进行解码处理,由此有效确定神经网络具体权值。在本研究中,分别通过三个不同步骤的神经网络学习,获得遗传算法的神经网络权值。本研究通过一定次数的BP算法学习,有效选取学习结果初值,进而利用遗传算法模式对收敛速度较慢的算法权值进行网络学习,由此完成给定精度的算法初始值赋权,这种基于BP优化算法的网络模型记忆力较强,稳定性良好,且具有较强的算法推广能力,同时还可以提升算法网络模型的全局收敛速度。
2.2.2 构建GA-BP算法网络分类器
在计算机智能化图像识别过程中,可基于GA-BP算法识别模型,分析双隐层数字图像BP网络分类器样本构成及其训练方式。在对数字图像进行去噪与分割处理之后,可对数字化图像进行逐行、逐列进行扫描,在此过程中,分别将黑色、白色像素特征记为“1”和“0”,当算法扫描结束之后,即会构建一个具有和图像相同个数的特征向量矩阵,该矩阵维数为3维,构建起网络分类器之后,还需进行GA-BP网络训练,整个算法学习训练过程分别包含学习速率选择,输入层/输出层/隐层设计,训练算法初始化网络选择及训练样本数选择。
2.2.3 网络层数选择
BP神经网络设计的首要原则是降低算法误差,通过增加线性输出层与S型隐含层网络的实际隐层数,可以大幅提高全部有理函数的算法精度,并使其进一步逼近BP神经网络算法精度。在本文中,所选择的BP神经网络总共包含4层,分别是网络层,输入层,输出层和运算层,首先在网络层进行第一层运算,然后将输出量信号输入到输入层首层,在此基础上,进行第二层算法运算,经过训练之后,将机器训练学习结果输出到第二层和第三层进行算法运算,在整个算法模式中,第一层的主要功能是对输出量信号进行线性分类,然后通过第二层进行算法逻辑运算,从而使非交凸集合分类的“与”逻辑同“或”逻辑运算得以实现,进而完成整个非交集合分类过程。
2.2.4 输入层设计
主要根据数据表示方式类和求解问题确定算法输入层单元数,在对计算机智能化图像信息进行识别时,首先需要输入处理后的图像特征空间维数,在此基础上,对特征分量维数进行提取并确定神经单元数,此时算法输入层的图像像素数和网络神经元数为“N”。
2.2.5 隐含层单元数选择
BP神经网络隐层单元输入间属于单调上升的非线性函数,而输出时间对算法隐藏单元的要求是单元数要合理,如果在基于算法进行计算机智能化图像识别时,由于隐层单元数较少,此时BP网络层隐层单元的准确样本特征和网络可能提取及训练不出来,在这种情形下,未训练样本容错性就会大大提升,同时计算机智能化图像就无法得到有效识别。相反,若BP神经网络隐层单元数过多,此时其整体的结构复杂度就会上升,在这种状况下,如若BP网络层隐层单元的网络规模过于庞大,则隐层单元数网络的训练时间就会显著增多,同时由于算法训练特征不收敛,则会导致计算机智能化图像特征空间划分过细,如果训练样本网络泛化能力不强,从而会使训练以外样本识别率大大降低。
3 实验仿真及结论
综上分析,本研究基于GA-BP四层神经网络进行神经学习算法训练学习,将隐含层节点数分别设置为6、12、18、24、30,而将输入/输出节点依次设置为“251”和“4”,然后分别通过对比分析不同的训练时间、训练次数,收集和计算实验数据,对比结果发现,通过GA-BP神经网络算法智能化识别的图像正确率最高为96.7%,而算法识别正确率最低为86.3%,两者相差10.4%,由此表明,采用改进的GA-BP算法进行计算机智能化图像识别,当GA-BP四层神经网络隐含层节点数设置为24,机器学习训练时间为8.49 s,且学习次数达到81次时,可以最大程度上减少和避免普通算法训练收敛速度缓慢的问题发生,并取得最佳的算法识别效果。表1所示为神经网络识别数据。
表1 基于GA-BP算法的计算机智能化图像识别数据
4 结语
综上研究,数字影像技术已经伴随我国信息技术发展逐步渗透、融合和应用到我们日常生活和生活的各个领域,尤其随着计算机技术和互联网技术、智能算法等不断发展,计算机智能化图像识别技术传输与存储已变得十分先进。但由于传统图像识别方法具有很大的技术局限性,因此对现代化新兴计算机智能化图像识别技术的研究一直以来都是国内外学者广泛关注的研究的重点所在。在此背景之下,针对传统图像识别技术和算法搜索过程中存在的训练时间过长、样本冗余性大、不便于机器学习从而导致算法识别结果不精准等问题,本研究在分析问题基础上,提出了一种经改进的GA-BP四层神经网络学习算法,借助GA-BP神经网络识别模型进行计算机智能化图像识别,研究分析表明,该算法模型和图像识别新方法是高效的。数据显示,基于GA-BP四层神经网络算法分析识别下的图像识别率为96.7%,而传统方法识别率仅86.3%,因此实验充分表明该方法有效,且能通过GA-BP算法基于不同类型目标样本有效解决图像识别失真率高、检测率低、稳定性差等问题。