家居系统中手势识别技术的探讨*
2020-11-29
(广东工业大学华立学院,广东 广州 511325)
当今社会计算机信息技术的高速发展使得人们对生活品质的要求越来越高,在家具体验中智能化的需求也不断增加,即希望创造出更加舒适、安全和智能的家居环境。近些年来,终端设备快速普及使得移动互联网技术无时无刻不改变着人们的传统生活习惯,借此希望一旦有需求,即可凭借自身携带的终端设备控制家用设备,例如热水器的开关、监控煤气管道的密封性等。而这两年来,智能家居不断上升的需求也吸引了大批房地产公司积极寻求解决方案,希望以此开发出大规模的具有示范效应的智能家居群。目前,能够拥有良好用户体验、节能、环保及健康功能的智能家居系统研究迅猛发展。在智能家居系统中手势作为一个直观的交互体验媒介起着至关重要的作用,它不仅能够和设备交流信息,而且在高质量示范学习中必不可少。本文探讨了家居系统中的各种手势识别技术,分析手势识别技术的优缺点,通过对比研究发现家居系统中手势识别能提升用户体验效果。
1 智能家居
智能家居的概念最早源于1996 年日本东京大学HASHIMOTO 实验室提出的“智能空间”一词,智能空间是融入了信息设备、计算机设备和传感器的工作空间,其目的是使用者能通过通信信息技术访问信息获得计算机的服务,进而高效地实现个人目标和协同工作。而智能空间在家居环境中的实现与运用衍生出了智能家居。
智能家居融合了现代科学技术和居住环境特征,以家用住宅为平台,规划安装具有实时操作性能的家居控制系统,可以根据不同用户的不同需求提供个性化空间,让家居生活更加舒适。与普通的家居空间相比既保留了家居原始传统的居住功能,还能够通过设计和自身需求增加智能化设备,来提高家居环境的安全度和舒适度,使家居生活不再单一,它将原来静止的建筑物变为具有生命力的生存环境,让人们在家里也能够体会到信息技术带来的便捷。智能家居系统中拥有强大的人与智能机器的信息交互功能,可以保证内部间、家庭与外部间信息畅通,以最有效、最节能的方式改善用户的生活,节约各种能源消耗,打造节能环保的家居空间。
2 手势识别
智能家居的商业化发展程度依赖于智能家居设备的人机交互程度。手势识别技术在家居系统中是增强人与机器相互沟通的有效途径,手势识别主要包括手势设计、手势分析和手势匹配三个过程。手势设计的过程是建立模型的过程,在这个过程中选取什么样的模型来描述手势尤其重要,这个数学模型可能只是一个基于表象的平面图,也可能同时包含手势的空间属性和时间特征。目前用于实现手势识别的有效方法主要有基于二维图像的手势识别技术和基于三维加速度的手势识别技术。
2.1 二维手势识别
早期手势识别技术多数指二维静态图像识别技术,一般分为两种方式,即二维的手型识别和二维的手势识别。这种识别是采集图像后通过计算机对图像信息进行加工,一般采集图像信息的方法通过摄像机来完成,得到的图像输入计算机进行预处理再加入各种图形算法,最终达到识别的目的。家居系统初建时,多数采用的就是这种识别方法,效率较高,效果明显。
2.1.1 二维手型识别
二维手型识别技术能够识别计算机提前预设好的静态动作,主要完成手势在某一时刻静态表现的识别,不能完成连续变化手势的识别,本质来讲这种技术就是一种图像匹配技术,是手势识别技术中最基础也最简单的方法。
2.1.2 二维手势识别
二维手势识别是在识别静态手型图像的基础上加入简单手势动作的一种识别方法。它使图像识别技术拥有了动态的特性,捕捉追踪运动的手势经过计算机算法处理,把手势识别的范围真正拓展到了二维平面。这种技术能够快速发展得益于计算机视觉算法,它通过优化算法整合静态动作,形成较为复杂的连续动态手势,从而获得更加丰富的人机交互内容。
总的来说,目前基于图像的手势识别技术起步比较早而且研究比较成熟,多种多样计算机算法研究很大程度上为这种识别技术的广泛应用产生了影响,但是这种手势识别技术有一个明显的缺陷是在图像获取过程中数据采集要求信息完整且无失真。目前而言,多数采用摄像机采集数据信息,由于硬件设备的影响使采样结果不可能无失真,而且重要的是外部环境的变化也会带来信息的失真,从而导致原始的信息采集结果出现缺陷,所以在采集信息过程中尽量避免环境失真带来的影响,比如图像获取时要有充足的光线和环境条件等支持。而三维加速度的识别技术就解决了这个问题,它在获取信息的过程中不容易受到外部条件的限制。因此在变换交互模型下,加入传感器技术的识别方法能有效地避免这种缺陷,能够较好完成信息采集,然后通过采集的信息建立手势识别模型,加入计算机算法研究手势动作,最终完成人与机器之间的交流。
2.2 三维手势识别
三维的手势识别从表面来看,是把坐标从XY二维坐标变成了XYZ三维坐标,但实际上是通过加入Z轴信息使这种技术能够识别各种各样的连续手势动作。它不仅仅包含手型状态的识别,而且对复杂手势动作的研究更有深度意义。三维手势识别成为现在手势识别发展的主流方向,目前多数家居系统的识别技术,增加的那部分信息量主要依靠特殊的硬件来完成,三维手势识别中最关键的是连续手势动作捕捉跟踪的同时加入动作的持续性深入研究,因此计算机处理过程不再是单一的图像识别,是有深度的可持续的连续性研究,通过建立手势模型为后续手势识别做准备。
2.2.1 手势建模
手势建模是根据手势的动作建立模型。根据有无运动可将手势分为静态和动态两种,这种方法将人的手部形态和运动时的状态分别建立一个有效集合,采集相同状态下大量样本供识别应用;根据动作连贯与否将手势分为离散和连续两种,以手势轨迹建立动态运动原语系统(DMP),对连续的手势在时间上进行分割然后分别进行识别。该模型计算量较大,应用过程中允许使用样本对分类器进行训练,并且提供反馈结构来提高交互的性能;根据动作的复杂程度将手势分为单元原子手势和复合手势两种,这种方法考虑到了手势和应用程序相互独立性,通过建立手势库Glib 形成规则,由子手势复合形成复合手势,应用这种方法最大的特点是复杂的计算机算法能完整地建立手势模型,准确地完成识别匹配。
2.2.2 三维加速度传感器的手势识别
手势识别已经广泛应用到手机、Pad 等各种手持移动设备中,尤其是现在智能家居系统中注重交互方式的自然性和灵活性,在终端上的操作工具不应局限于一种设备,而是需要再此基础上为系统体验提供新的方式。手势识别的本质是根据手势模型将手势动作分类,基于三维加速度传感器的手势识别方法提高捕获手势动作的加速度来识别手势,由于其不断变化,必须采用专门的设备——加速度传感器来完成。手势在执行过程中XYZ三个方向轴都会产生不同加速度信息,且会随着频率不同和幅度不同而产生变化,因此需要研究手势的每一个动作特点,将动作分成若干单元,每个单元对应加速度中的一段曲线,整合这些手势单元即可得到不同的手势动作,经过预处理记录下来,然后根据这些量为每个单元手势建立模型,利用模型识别手势,被识别的手势又可组合成连续且复杂的手势动作。
结果证明,基于三维加速度的识别方法,能够借助硬件的条件采集动作信息。相对于图像识别技术,虽然增加了建立模型的难度,但是信息采集更加接近原始数据,再加之计算机算法整合动作信息对比识别,能够很好完成人与机器之间的信息交流。
3 总结
在家居系统设计中,识别是家居系统能否广泛应用的关键,好的系统识别方法能给用户带来更加便利的体验。本文通过对常用识别方法的探讨,得出现在家居系统的识别方法基本上分为基于二维图像的手势识别方法和基于三维加速度的识别方法,目前前者技术相对比较成熟,识别成功率也比较高,同时算法的复杂度也比较理想,应用较为广泛,主要原理是对采集图像进行计算机视觉处理,但是此方法的缺陷是对外部环境的依赖性比较大;后一种方法不受外部条件的限制,并且这种方法在应用中可以用已有的原子单元手势建立较为复杂的手势模型,拓展了手势动作的可持续性,总体研究更有普遍意义,具有广泛的应用前景。