APP下载

SVM在人机交互中的应用研究

2018-03-21曹望成徐洪国于立洋

数字通信世界 2018年10期
关键词:手势人脸语音

曹望成,徐洪国,于 波,于立洋

(1.牡丹江师范学院计算机与信息技术学院,牡丹江 157011;2.哈尔滨理工大学软件学院吗,哈尔滨 150040)

随着社会的信息化程度越来越高,人类对计算机的智能水平有了越来越高的需求。人机交互的方式也也不仅局限于原本的基于硬件进行交互,一些相对更智能的交互方式逐渐出现在人们的生活中,譬如通过人脸识别、手势识别以及语音识别等一系列更加智能的方式建立人类与计算机之间沟通。这些更为方便的交互方式的出现已经成为当前人机交互领域的一大发展趋势,人机交互方式发展的目标自然是让计算机服务并适应人类的需求,以人为中心,而非强迫人去适应计算机。

1 人机交互概述

人机交互(HCI:Human-Computer Interaction)是一门研究人、计算机以及两者之间相互交互方式的学科。随着社会的信息化程度越来越高,人机交互方式的发展也会促进我们的日常生活的便捷,越来越多方便新颖的交互方式推出。

2 人机交互方式及SVM在其中的应用

2.1 语音交互

语音交互是人机交互中的一个主要的交互技术,也是最为常用的交互技术。语音识别技术本质上来说是一种分类问题,而SVM(Support Vector Machine)是一种机器学习里最为经典的分类模型,很容易可以将这种模型应用到语音识别这一领域。通过提取输入的语音流中的某些特征,对这些特征进行分类,根据参考模型的匹配结果判定输入的语音是由哪一位说话人所发出。

2.2 人脸及表情识别

人脸作为区分人与人之间的主要特征,现在也被广泛应用到人机交互中。越来越多的解锁模式采用人脸解锁,方便快捷,节省时间,错误率低。随着SVM在语音识别中的应用,SVM也渐渐被运用到了人脸识别中,并在基础的SVM的基础上,融合无监督聚类来进行多分类。

表情识别现在也已经在日常生活中比较常见,譬如笑脸相机,通过检测笑脸自动拍照。这些功能都可以通过SVM模型来实现。

2.3 手势及动作识别

基于手势和动作识别的人机交互方式十分自然且易用,也成为了当前人机交互中研究的一个热点。根据手势和动作输入的方式不同,我们将这类识别方式分为两种:一种是基于数据手套等传感器捕捉设备的方法,另一种是基于视觉的方法。基于数据手套等传感器捕捉设备的方式,设备通常比较昂贵,布置穿戴也比较麻烦,通常在日常生活中不太常用,多被用于影视制作和科学研究。基于视觉的手势和动作识别是对视频采集设备拍摄到的包含手势或动作的图像序列采用各种技术进行处理。

2.4 脑-机接口

近些年来,脑-机接口技术的研究在国际上引起了广泛的兴趣并获得了快速的发展。这种模式需要一些硬件设备来获得脑电信号来实现无动作的人机交互,也就是利用脑电信号来表达自己的意思,并让相应的外界设备做出一定的动作反应。这种新的模式可以为神经肌肉损伤患者提供一种新的沟通方式,也可以为正常人提供辅助控制通道或在特殊环境下的控制通道,这一人机交互的新方式具有巨大的社会价值和应用前景。

3 基于SVM的研究方法

3.1 预处理

预处理截断是对数据进行简单的过滤操作,降低噪声干扰。这一步主要进行信号的放大、防混叠滤波、自动增益控制、模数转换、消除噪声、端点检测等操作。

3.2 特征提取

模式识别技术中,特征提取是最为关键的一步,选择适合的特征来表达数据才能有效地通过分类技术准确识别。语音数据大致包含一下几个常用特征:时平均能量、线性预测系数、频谱、短时过零率、三个共振峰频率(F1、F2、F3的频率值、带宽、幅值)、LPC倒谱和Mel倒谱、HMM的概率函数、矢量量化的矢量等。人脸数据的以下几个特征经常被使用作为模式识别的依据:全局特征和局部特征。在进行手势和动作识别之前,需要先进行定位操作。而定位又根据使用的线索不同分为:基于颜色的定位、基于运动的定位和多种模式定位。

从输入数据提取多维特征或单维特征作为SVM模型的输入,进行后续的匹配操作。

3.3 后处理

后处理是模式识别的最后一步,也是系统识别效果的最终表现。根据参数模式库判决选择出可能的结果中最好的作为识别系统的输出。

4 结束语

现阶段的研究中,SVM方法在人机交互的研究中展现出了良好的性能,也被越来越多的学者采用。研究者应该立足实际,本着科学实用的目标,不断推进人机交互这一学科的发展。

猜你喜欢

手势人脸语音
有特点的人脸
一起学画人脸
挑战!神秘手势
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
V字手势的由来
对方正在输入……
三国漫——人脸解锁
胜利的手势