基于计算机视觉技术的手势识别步骤与方法研究

2020-04-09罗国强李家华左文涛方斌

无线互联科技 2020年3期

罗国强李家华左文涛方斌

摘要：计算机视觉技术在现代社会中获得了非常广泛的应用，加强对手势识别技术的研究有助于促进社会智能化的快速发展。目前，手势识别技术的实现需要完成图形预处理、手势检测以及场景划分以及手势识别3个步骤。此外，手势特征可以分为动态手势以及静态手势，在选用手势识别方法时要明确两者之间的区别，通常情况下选用的主要手势识别技术有运用模板匹配的方法、运用SVM的动态手势识别方法以及运用DTW的动态手势识别方法等。文章对此展开研究。

关键词：计算机视觉;手势识别;方法

随着现代科学技术水平的不断发展，计算机硬件与软件部分都获得了较大的突破，由此促进了以计算机软硬件为载体的计算机视觉技术的进步，使得计算机视觉技术广泛地应用到多个行业领域中。手势识别技术就是其中非常典型的一项应用，该技术建立在计算机视觉技术基础上来实现人类与机器的信息交互，具有良好的应用前景和市场价值，吸引了越来越多的专家与学者加入到手势识别技术的研发中。手势识别技术是以计算机为载体，利用计算机外接检测部件（如传感器、摄像头等）对用户某些特定手势进行精准检测及识别，同时将获取的信息进行整合并将分析结果输出的检测技术[1]。这样的人机交互方法与传统通过文字输入进行信息交互相比较具有非常多的优点，通过特定的手势就可以控制机器作出相应的反馈。

1 基于计算机视觉技术的手势识别主要步骤

通常情况下，要顺利的实现手势识别需要经过以下几个步骤：

第一，图形预处理。该环节首先需要将连续的视频资源分割成许多静态的图片，方便系统对内容的分析和提取;其次，分析手势识别对图片的具體要求，并以此为根据将分割完成的图片中的冗余信息排除掉，最后，利用平滑以及滤波等手段对图片进行处理[2]。

第二，手势检测以及场景划分。计算机系统对待检测区域进行扫描，查看其中有无手势信息，当检测到手势后需要将手势图像和周围的背景分离开来，并锁定需要进行手势识别的确切区域，为接下来的手势识别做好准备[3]。

第三，手势识别。在将手势图像与周围环境分离开来后，需要对手势特征进行分析和收集，并且依照系统中设定的手势信息识别出手势指令。

2 基于计算机视觉的手势识别基本方法

在进行手势识别之前必须要完成手势检测工作，手势检测的主要任务是查看目标区域中是否存在手势、手势的数量以及各个手势的方位，并将检测到的手势与周围环境分离开来。现阶段实现手势检测的算法种类相对较多，而将手势与周围环境进行分离通常运用图像二值化的办法，换言之，就是将检测到手势的区域标记为黑色，而周边其余区域标记为白色，以灰度图的方式将手势图形显现出来[4]，图像二值法分离出的常见手势图形如图1所示。

在完成手势与周围环境的分割后，就需要进行手势识别，该环节对处理好的手势特征进行提取和分析，并将获得的信息资源代入到不同的算法中进行计算，同时将处理后的信息与系统认证的手势特征进行比对，从而将目标转化为系统已知的手势。目前，对手势进行识别主要通过以下几种方法进行。

2.1 运用模板匹配的方法

众所周知，被检测的手势不会一直处于静止状态，也会存在非静止状态下的手势检测，相对来说动态手势检测难度较大，与静态手势检测的方式也有一定的区别，而模板匹配的方法通常运用在静止状态下的手势检测。这种办法需要将常用的手势收录到系统中，然后对目标手势进行检测，将检测信息进行处理后得到检测的结果，最后将检测结果与数据库中的手势进行比对，匹配到相似度最高的手势，从而识别出目标手势指令[5]。常见的轮廓边缘匹配以及距离匹配等都是基于这个方法进行的。这些办法都是模板匹配的细分，具有处理速度快、操作方式简单的优点，然而在分类精确性上比较欠缺，在进行不同类型手势进行区分时往往受限于手势特征，并且能够识别出的手势数量也比较有限。

2.2 运用SVM的动态手势识别方法

在21世纪初期，支持向量机（Support Vector Machine，SVM）方法被发明出来并获得了较好的发展与应用，在学习以及分类功能上都十分优秀。支持向量机方法是将被检测的物体投影到高维空间，同时在此区域内设定最大间隔超平面，以此来实现对目标特征的精确区分。在运用支持向量机的方法来进行动态手势识别时，其关键点是选取适宜的特征向量。为了逐步解决这样的问题，相关研发人员提出了利用尺度恒定特征为基础来获得待检测目标样本的特征点，再将获得的信息数据进行向量化，最后，利用支持向量机方法来完成对动态手势的识别。

2.3 运用DTW的动态手势识别方法

动态时间归整（Dynamic Time Warping，DTW）方法，最开始是运用在智能语音识别领域，并获得了较好的应用效果，具有非常高的市场应用价值。动态时间归整方法的工作原理是以建立可以进行调整的非线性归一函数或者选用多种形式不同的弯曲时间轴来处理各个时间节点上产生的非线性变化。在使用动态时间归整方法进行目标信息区分时，通常是创建各种类型的时间轴，并利用各个时间轴的最大程度重叠来完成区分工作。为了保证动态时间归整方法能够在手势识别中取得较好的效果，研究人员已经开展的大量的研发工作，并实现了5种手势的成功识别，且准确率达到了89.1%左右。

3 结语

通常情况下许多手势检测方法都借鉴人们日常生活中观察目标与识别目标的思路，人类在确认目标事物时是依据物体色彩、外形以及运动情况等进行区分，计算机视觉技术也是基于此，所以在进行手势识别时也要加强人类识别方法的应用，促使基于计算机视觉技术的手势识别能够更快速、更精准。

[参考文献]

[1]童欣.一种基于OpenCV的手势轮廓识别与指尖定位跟踪方法[J].福建电脑，2018（12）：96-97，109.

[2]张忠军.基于肤色椭圆边界模型和改进帧差分算法的手势分割方法[J].福建电脑，2018（5）：8-10.

[3]张春燕.基于计算机视觉的可变形手势跟踪算法改进研究[J].计算机测量与控制，2016（11）：219-221，225.

[4]季越.基于计算机视觉的手势识别人机交互技术探讨[J].电脑迷，2016（9）：39.

[5]张毅，刘钰然，罗元.基于视觉的手势识别方法及其在数字信号处理器上的实现[J].计算机应用，2014（3）：833-836，856.