浅析人工智能时代视觉系统中的目标识别技术
2023-11-16周夕翔
周夕翔
重庆市科源能源技术发展有限公司,重庆,400020
0 引言
在现代社会建设发展中,智能机器人作为日常生活和工作处理的先进技术手段,由于它具备与人类相同的感官能力,能在接收分析感官信息的基础上,调节改善应用环境或复杂背景,所以目前各国学者在加强智能机器人技术理论研究力度的同时,针对不同领域的应用需求提出了多项实践课题。在人工智能时代,面对呈现爆炸式增长的网络信息数据,智能机器人如何运用大量图像信息提高目标识别率,是目前国内外科研学者探究的主要问题。而目标识别作为计算机实现人类视觉感知的有效方法,能在目标物体中获取所需的图像特征,综合运用分类器构成相应模型,最终有序完成图像识别检测分析,确保机器人拥有图像识别功能。因此,本文主要研究智能机器人视觉系统中的目标识别技术方法,以期为新时期人工智能技术发展提供有效依据。
1 机器人视觉系统和目标识别技术的基本概念
1.1 机器人视觉系统
机器人视觉系统是指运用计算机对客观的三维世界进行识别分析。通常来讲,机器视觉系统包含了照明、镜头、摄像、图像处理等系统内容,在实践应用中要充分考虑系统运行速度和图像处理速度,准确判断检测目标的尺寸以及是否存在缺陷等问题,只有这样才能保障机器人视觉系统可以正常运行。从应用功能角度来看,典型的机器视觉系统主要分为三部分内容,首先是指图像采集部分,其次是指图像处理部分,最后是指运动控制部分[1]。现如今,机器人视觉系统的应用领域越发广泛,已经深入到社会居民的生活生产和工作的方方面面,按照视觉传感器的数量和特征通常可以分为单目视觉、双目立体视觉、全景视觉、混合视觉等多种类型。
1.2 目标识别技术
从本质上讲,这项技术主要是运用雷达和计算机对遥感目标进行辨别分析,通过掌握雷达回波中的幅度、频谱、相位等目标特征信息,利用数学领域提出的多维空间变化估算目标的大小、重量、形状等物理特征参数,最终在大量训练样本后确定鉴别函数,在分类器中实现识别判断。
2 目标识别基本方法及关键技术
2.1 目标识别
以机器人视觉为核心的目标识别就是图像识别,要先收集处理所需图像信息,而后在提取特征的基础上,将特征向量运送到模型中,最终经过分类识别输出结果。从整体操作角度来看,由于摄像头拍摄的图像信息会受外界因素影响,直接提取特征和有效识别的效果并不能达到预期要求,所以要想掌握更多有价值的原始资料,要先做好预处理工作。根据实践操作累积经验来看,图像预处理工作分为两方面:一方面,注重优化图像的原始特征信息,确保原始信号具有真实性;另一方面,要降低噪声产生的干扰信号,进一步提高图像呈现的清晰程度,保障提取识别工作具有较高的准确度[2]。
现如今,科研学者经常使用的图像预处理方法有很多,其中最常见的就是图像降噪,它能有效提高机器视觉理解能力。而在图像分类过程中,要在提取原始特征信息后,有序完成网络训练、目标模拟等操作,其中特征信息的有效性直接影响着最终识别效果。面对当前高维度图像信息输入网络训练速度较慢、信息使用率过低等问题,学者通过特征提取简化图像信息和降低图像维度、掌握更多有价值的特征信息,来提高网络系统的识别概率。
2.2 深度学习
在人工智能时代背景下,深度学习具有模拟训练和目标识别等独特优势,但极容易出现过度拟合问题,因此在研究应用期间很容易出现过度拟合现象。通常来讲,部分拟合现象的解决方案如下所示:首先,在深度学习框架训练期间,要利用调节分类器的乘法参数等方式处理拟合问题;其次,要运用增加训练数据集合的方式来避免过度拟合现象。在训练数据不充足的情况下,可以通过随机剪裁、尺度变化等方式处理原始训练图像,以此扩充现有数据集合;最后,利用Dropout方法降低深度学习出现过度拟合的概率。在训练迭代期间,在概率值为0.5的情况下,随机将部分隐层神经元连接的相应数值归零,这样不仅能控制训练参数和向量,而且可以让每次训练的网络框架随机应变,以此提高网络系统的鲁棒性和泛化能力[3]。
3 基于AlexNet模型激活函数层特征提取的目标识别方法
3.1 目标识别
根据经典深度学习框架的目标识别和传统分类器目标识别的对比分析结果来看,本文主要研究以AlexNet模型为核心的目标识别方法,其中AlexNet具备训练分析和准确识别大批量图像信息的独特优势;而ReLU能进一步提高网络训练的速度。AlexNet框架可以看作是分类前的特征提取,整体操作是利用多层卷积形成的,真正体现了深度学习算法的核心。具体操作流程如图1所示。
图1 AlexNet 框架的流程图
结合图1分析可知,在预处理数据集合时,一方面要平衡图像的数量,这是因为数据集合中的所有图像集合数量并不一致,为了保障网络训练图像数量具有公平性,要将图像数量最少的集合看作基本依据,每个图像的随机抽取基数为实验图像;另一方面要做好图像大小归一化处理,有效保留原本图像的高宽比。在AlexNet模型训练过程中,深度学习训练包含两大阶段,一种是指正向传播,另一种是指反向传播[4]。其中,前者是指将训练集合输送到AlexNet框架中训练生成AlexNet模型,而后者是利用原本数据和输出数据准确计算两者之间的误差,同时利用反向传播准确掌握误差调节的权重数值,最终可以得到预期设定的训练效果。在图像预测时,要利用收集到的测试图像和训练AlexNet模型,在Softmax分类器中掌握分类数量的概率分布情况,由此明确掌握各类图像信息。
3.2 识别方法
所有卷积都具备一个激活函数层,它主要是利用激活函数实现特征映射,有效清除数据当中的冗余。将Sigmoid看作是非线性激活函数,在输入内容接近无穷大或无穷小的情况下,输出的神经元梯度趋向于零。在这一状态下,激活函数的训练时间较长,而且具有梯度弥散的特征。现如今,利用深度学习的多层网络框架识别分析,会将ReLU函数看作激活函数,既要控制模型训练时间,又要提高网络学习效率。因此,本文在研究机器人视觉系统目标识别技术时,提出了以AlexNet模型为核心的ReLU层特征提取目标方法,这种方法在获取全新的网络模型之后,要在激活函数层中掌握特征向量,重新构成适宜的训练分类器,同时还要选择全连接层作为特征提取层进行分类识别,具体结构如图2所示。
图2 基于AlexNet 模型的目标识别框架图
结合图2分析可知,图像集合被输入训练网络模型中后,经过有效处理提取特征向量。从实践应用角度来看,这种技术方法可以强调有效特征,提高特征提取的工作效率,在训练期间有效控制梯度弥散对AlexNet模型收敛性构成的影响,降低数据冗余数量,确保最终得到的特征向量具备说明性[5]。
3.3 实验分析
在明确目标识别技术框架后,将训练数据输入AlexNet中,经过30次迭代训练就可以生成AlexNet模型;将训练和测试图像数据集合输入AlexNet中提取特征向量,在特征向量输入分类器中后训练测试;在多分类测试分析后记录相应结果,并利用训练集合和测试集合进行三者交叉验证,计算求取实验的平均数值,依据数据结果综合评估。最终实验结果证明,AlexNet模型不仅能保障数据特征向量的识别效率,还可以提高整体训练数据操作的灵活度。如果网络系统具有充足的鲁棒性,那么针对不同目标识别任务提出的图像范围,系统用户只需要提取输入图像的网络特征,就能在训练多分类SVM中掌握有效结果。由于特征提取向量和图像维度会持续下降,所以多分类SVM的训练测试速度会越来越快,进而提高机器人视觉系统的图像识别效率。
4 新时期机器人视觉系统及识别技术应用分析
4.1 基本原理
从本质上讲,机器视觉作为智能机器人感知周围环境的有效途径之一,能利用视觉传感器获取周边环境的二维图像,依据视觉处理器分析转换成符号,让智能机器人可以准确识别物体并确定位置。在智能机器人视觉系统和目标识别技术研究初期,科研学者提出的光电成像技术只能获取二维信息,无法准确掌握距离信息,而随着社会经济和科学技术的不断发展,以三维立体视觉为核心的解决方案得到了全面推广,其中包含时间差法、狭缝光投影法、双目立体视觉等多种方法。现如今,各国学者在研究移动机器人视觉系统时,一方面会利用传感器获取图像信息,另一方面会利用计算机处理器完成图像操作。虽然目前我国掌握的理论知识和技术手段相对较少,但随着经济技术的不断发展,未来必然可以根据行业发展需求不断创新,持续完善机器视觉、计算机视觉等基本理论,充分展现智能机器人信息感知的独特优势。
4.2 路径规划
现如今,科研学者在掌握智能机器人视觉系统和目标识别技术后,基于规避障碍和寻找最优路径问题,提出了全新的路径规划方法,主要是运用格栅法构建机器人工作平面的坐标系,整体系统分为两部分内容,一方面是指全局路径规划,另一方面是指局部避碰规划。从实践应用角度来看,全局规划要运用改进之后的蚁群算法得到初步全局优化路径,而局部避碰规划要在跟踪全局优化路径之后,通过环境探测和碰撞预测提出解决策略,以此确保智能机器人可以安全有效到达目标位置。这种方法不仅可以在短时间内帮助机器人寻找最佳的运输路径,还能有效掌握路径周边的动态障碍物。在这一过程中,视觉处理程序的功能主要体现在以下几点:首先,在USB摄像头中实时读取视频信息,针对图像信息进行简单的预处理;其次,在图像处理期间实现图像增强,在应用背景下提取目标小球;最后,准确计算目标位置和旋转角度,利用驱动程序控制机器人头部对目标物体进行跟踪调查。移动机器人作为目前智能机器人领域研究的重难点,其中包含了计算机科学、传感器技术、控制理论、人工智能等多门学科知识。
4.3 发展趋势
我国机器人技术发展主要经历了三个阶段,首先是指简单个体机器人,其次是指群体劳动机器人,最后是指类似人类的智能机器人。现如今,面对持续增加的机器人研究应用要求,机器人技术理论开始向着智能化和拟人化的方向稳步发展,而机器人视觉系统作为计算机学科研究的重要分支,在整合运用计算机软硬件、电子、机械、光学等理论知识的同时,被广泛运用在机电一体化、信号处理、人工智能、模式识别等多个领域中。现代科技创新推动了社会经济高速发展,转变了传统城市建设发展模式,为实现可持续发展目标奠定了基础保障[6]。尤其是在进入知识经济一体化发展时代后,人工智能技术理论的高效性、自主性、先进性等特征越发显著,不仅摆脱了传统人们对人工智能的预期想象,还在电子科技、机器人研究、金融领域等方面发挥着重要作用。虽然目前我国针对机器人的学习研究还处于摸索前进阶段,但随着社会经济和科学技术的不断提升,未来智能机器人将会拥有更加广阔的发展空间。现如今,人工智能领域开始逐步拓展创新,智能机器人的应用技术手段越来越高,很多智能产品都在生活和工作中充当重要角色,对城市建设和行业创新具有积极作用。人工智能与计算机技术等现代科技的有效结合,既推动了人工智能理论技术研究,为人工智能企业创新发展奠定了坚实基础,又提高了社会经济发展的综合水平,切实改善了智能机器人的应用效率和质量。
5 结语
综上所述,在社会经济和科学技术飞速发展中,我国人工智能的理论研究和技术应用取得了优异成绩,大量先进有效的智能机器人产品被应用到生产生活和现实工作中,逐渐转变了传统经济建设发展模式,充分体现了人工智能技术的实用性和可行性。因此,未来我国科研学者要继续整合研究人工智能和机器人技术,注重结合各行业发展要求研究推广机器人视觉系统和目标识别技术,有效解决数据分析的高效性、故障诊断的准确性、运行路径的最优化等问题。