基于多光源红外传感技术的手势识别系统*
2015-07-07鲁姗丹周松斌李昌
鲁姗丹周松斌李昌
(1.广东省自动化研究所 广东省现代控制与光机电技术公共实验室广东省现代控制技术重点实验室 2.广东工业大学自动化学院)
基于多光源红外传感技术的手势识别系统*
鲁姗丹1,2周松斌1李昌1
(1.广东省自动化研究所 广东省现代控制与光机电技术公共实验室广东省现代控制技术重点实验室 2.广东工业大学自动化学院)
手势识别是一种有效的人机交互手段,针对识别算法复杂或适用范围窄等问题,设计一种基于多光源红外传感技术的手势识别系统。首先获取手势动作数据,然后结合不同手势的运动特征,采用区间概率算法识别手势类型,最终完成动作指令输出。通过实验对常见6种手势进行识别,平均识别率达93.67%。该系统操作简单、成本低,可用于多种智能交互场合。
红外传感;手势识别;人机交互
0 引言
随着计算机技术的发展,人机交互技术越来越成熟,人们希望能够以更自然的方式与计算机交流,其中肢体形态语言,如手势、体势和表情等是人们常用的交流方式,而手势在人机交互中具有生动、形象和直观等特点[1],成为人机交互的重要交流手段。
传统的手势识别主要有基于可穿戴传感器的接触式和基于计算机视觉的非接触式两类[2-4]。基于可穿戴传感器的识别方式需要用户佩戴专业设备,适用范围窄、应用性差。基于计算机视觉的识别方法虽然解决了适用范围问题,但对设备、环境要求较严,且算法较复杂,实时性较差。目前,非接触式的红外传感技术因其具有很高的敏感度和受环境光干扰小等特点,正逐渐成为新一代手势识别的研究热点。
红外传感技术发展到现在已有多种应用[5],除文献[5]中提到的应用外,还可完成一些特殊的人机交互任务,如手势识别。本文设计了一种基于多光源红外传感技术的手势识别系统,可识别多种手势,操作简单安全、成本低,可应用于家庭娱乐设备控制或平板电脑屏幕操作等方面。
1 多光源红外传感手势识别原理
红外光是一种不可见光,波长在750 nm~1 mm之间,与可见光一样具有反射、折射、吸收等性质。红外传感器是利用红外光的物理性质进行测量的一种传感器。
基于红外传感的手势识别原理如图1(a)所示,红外传感器与红外LED同方向放置,当手挡在红外LED的前面时,红外传感器会检测到反射过来的红外光,检测到的红外光强与手到红外传感器的距离成反比关系,检测距离和范围与红外LED的选择有很大关系,如图1(b)所示。从LED射出的红外光是一圆锥状,圆锥顶角称作LED视角(大多数LED能量从这里输出),视角越小表示能量越集中,检测范围越远。
图1 红外传感原理
本文设计的基于多光源红外传感的手势识别原理如图2(a)所示,光源分布不完全共线。以LED1单光源传感为例,可检测有无手势出现,检测波形如图2(b)所示,没有探测到手时,输出信号基本成一条直线,探测到手时,信号输出明显增大。以LED1和LED2双光源传感为例,可检测来回的2种手势,若检测波形如图2(c)所示,根据不同红外光源反射信号上升的时序与手遮挡红外光源的顺序一致原理,判断此手势的移动方向是从LED1到LED2。以LED1、LED2和LED3三光源传感为例,可检测3种以上手势,若检测波形如图2(d)所示,LED1和LED2的信号几乎同时上升,然后再到LED3,可判断手势的移动方向与图2(c)检测的方向正好相交。由上可知,若要实现多种手势,红外光源应不少于3个。
图2 红外传感示意图及不同光源检测波形
2 手势识别系统组成
基于多光源红外传感技术的手势识别系统结构如图3所示,主要由红外传感模块、信号调理与采集模块和信号处理模块3部分组成,可实现多种目标手势的识别输出。
图3 基于多光源红外传感技术的手势识别系统结构图
3 硬件设计
3.1 红外传感模块
本系统红外传感模块由8个红外LED(满足红外光源不少于3个的要求),1个红外传感器和1个温度传感器组成。其中红外传感光源分布阵列如图4所示,红外传感器位于第2行第2列,行列间距相等,保证了平面每90°方向有相同的红外辐射量,可更有效地对手的运动方向进行区分。其中红外LED选用红外波长是875 nm,发射半角等于±5 deg的TSTA7100,其方向性强,适用于短距离;红外接收器选用接收波长在870 nm ~1050 nm,接收半角等于±60 deg的BPV23F,可有效接收LED红外光。
图4 红外传感光源分布图
为排除非目标物体的误动作,采用温度传感器测量目标物体与周围环境的温度,计算温差。温度传感器选用高精度非接触式的红外温度传感器MLX90614,有效检测-20℃~120℃的温度变化,视角范围约100°,可检测视角范围内所有物体的温度值。
3.2 信号调理与采集模块
信号调理与采集模块主要包括红外发射电路和红外接收电路,部分电路如图5所示。由于红外传感在有目标出现时会得到一个非常微弱的光信号,且信号容易淹没在背景噪声中,因此需要在红外接收电路中,设计具有去噪滤波和电压放大功能的信号调理电路。通过一个反向偏置的光电二极管MCP6022将光信号转换为电压信号,再经低通滤波器、电压放大器输出。红外传感信号经信号调理后,
通过MCU内部集成的12位ADC模块采集相应电压信号。
循环驱动8个红外发射电路,采集相应红外LED电压信号,采用这种方式不仅可区分采集信号且各路的采集不会发生干扰。每循环一个周期即采样一次,可得到8个红外LED反射光强电压信号和1个温度检测信号,采样N次,便获得N×9维参数矩阵。
3.3 信号处理模块
本系统采用基于Cortex-M3内核的STM32103RC作为控制核心MCU,采用哈佛处理器结构,取值同时可进行读取/存储数据。该MCU主频速度高达72 MHz,内置高速存储器(高达128 k字节的闪存和20 k字节的SRAM),还包含2个12位的ADC、3个通用16位定时器、1个PWM定时器、2个I2C、2个SPI、3个USART、1个USB和1个CAN等[6]。
STM32103RC主要运行内部手势识别算法软件程序,对手势动作检测、存储、识别并将识别结果实时发送给外源设备,实现对外源设备的控制。
4 软件设计
图5 红外收发部分电路图
系统的软件设计在KeiluVison4软件平台进行,采用C语言开发,手势识别流程图如图6所示。首先系统初始化后开始采集红外信号和温度信号;动作自检,并自动存入寄存器中,直到手势完成。然后MCU读取寄存器中数据,为排除非目标物体的误动作,温度变化需大于ΔT(ΔT=0.5℃);对数据进行预处理,包括归整和滤波。接着根据不同手势的运动特征采用区间概率算法识别手势类型,提取不同手势同一运动区间的红外信号与所有区间红外信号的比值,即区间概率,解算完整动作的区间概率矩阵;再根据提取的区间概率矩阵获取每次采样概率最大时刻对应的运动区间序列,从而判断手势运动路径,即手势类型。最后输出显示。
图6 手势识别流程图
其中手势识别过程采用区间概率算法,该算法简单、无监督学习过程,存储空间小,适用实时的在线识别。区间概率矩阵模型如表1所示。
表1 区间概率矩阵P[S,M]模型
5 实验结果
为验证本文设计的基于多光源红外传感技术手势识别系统的有效性,针对6种常见手势从左到右、从右到左、从前到后、从后到前、从上到下和从下到上进行识别,实验中对每类手势重复识别50次,共300个手势样本,识别结果如表2所示,平均识别率为93.67% 。从以上识别过程看,多光源红外传感手势识别方法简洁、快速,可提高常见手势在线识别的实时性。实验中一些误识别的手势可能受手臂或周围物体的影响,下一步应考虑识别优化的问题。
表2 6种手势动作的识别结果和识别精度表
6 结论
针对传统手势识别存在识别过程复杂、适用范围受限等缺点,本文设计基于多光源红外传感技术的手势识别系统,简化了识别过程,识别成本低。实验结果表明,该系统对识别3种及3种以上的常见手势准确率高、抗干扰能力强、兼容性好且具有操作简单安全等优点,适用于现有智慧家庭人机交互界面,实现对电视、照明、风扇和空调等设备的舒适、方便控制,具有广泛的应用前景。
[1] 张毅,刘钰然,罗元.基于视觉的手势识别方法及其在数字信号处理器上的实现[J].计算机应用,2014(3):833-836,856.
[2] 顾伟宏,闵昆龙,张晓娜.新型数据手套及其手势识别研究[J].自动化仪表,2011,32(2):56-58,62.
[3] 王万良,杨经纬,蒋一波.基于运动传感器的手势识别[J].传感技术学报,2011,24(12):1723-1727.
[4] 邓瑞,周玲玲,应忍冬.基于Kinect深度信息的手势提取与识别研究[J].计算机应用研究,2013(4):1263-1265,1274.
[5] 杜永苹.浅谈红外线传感器的应用[J].中国科技信息, 2013(18):131.
[6] STM32F10xxx_Reference_Manual.pdf[Z].http://www.st.com.
Gesture Recognition System Based on Multi-Source of Infrared Sensing Technology
Lu Shandan1,2Zhou Songbin1Li Chang1
(1. Guangdong Institute of Automation Guangdong Provincial Key Laboratory of Modern Control Technology Modern Control and Light Mechanical and Electrical Technology Public Laboratoryof Guangdong Province 2. Automation College, Guangdong University of Technology)
Gesture recognition is an effective means of human-computer interaction. Aiming at the problems of complex of recognition algorithm or narrow applicable scope, this paper designs a gesture recognition system based on multi-source of infrared sensing technology. Firstly, by acquiring the gestures data, the algorithm of interval probability recognizes gestures type according to the motion characteristics of the different gestures. Finally, the movement command output is completed. The experiments identify six kinds of common gesture, the average recognition rate is up to 93.67%.The system has the advantages of simple operation and low cost. It can be used for a variety of intelligent interaction applications.
Infrared Multi-Sensor; Gesture Recognition; Human-Computer Interaction
鲁姗丹,女,1991年生,硕士研究生,研究方向:模式识别。E-mail: 15622108384@163.com
广东省科技计划资助项目(2012B010100059,2013B060100013,2013B091100013);广州市科技计划项目(2013J2200062);佛山市科技计划项目(2014HK100265)。
周松斌,男,1978年生,博士,研究员,研究方向:智能传感、网络化测控、仪器仪表。
李昌,男,1985年生,硕士,助理研究员,研究方向:控制理论与控制工程研究。