情境感知的多区域分类器和基于ASSL的非接触式界面
2021-01-07金松国
金松国
(江苏大学京江学院,江苏 镇江 212013)
1 研究背景
非接触式界面技术已被广泛的应用在于残疾人的通信和交互工具手段。但是,在当前的大流行情况下,作为非接触,非面对面界面的功能似乎也开始发挥了重要作用。此外,由于近几年在不断地研究诸如残疾人的导航之类的技术的开发,因此期望通研究过视线追踪提高非接触界面技术。
过去开发的一些系统是将电极放在脸上以监视眼睛的运动的阶段[1]。随着计算机硬件和AI技术的最新进展,视觉的人机界面(HCI)解决方案变得越来越流行,通过基于面部或面部特征跟踪的非接触式HCI[2]开始支持残疾人。这些解决方案可以提供高精度和低成本,从而减少了用户与硬件的直接接触。眼位技术还应用于残障用户的应用程序,例如眼部鼠标和键盘,移动用户界面(UI)[3,4]和日常生活辅助系统[5]。预计它将在最近的社会现象中作为控制系统发挥重要作用。
本文所提出的情境感知多分类器检测并跟踪眼睛特征,跟踪眼睛运动来预测图像帧的视线。为稳定跟踪,应用了高斯滤波器并对其进行了后处理,采用ASSL来测试各种情况下的眼睛鼠标功能,并在眼睛特征跟踪中提供了有效的界面功能以进行屏幕上的光标控制。
2 眼动追踪与矫正
在本文中,我们提出了一种基于眼睛跟踪方法的眼睛鼠标系统,该方法使用空间情境感知的多区域识别算法。为了进一步提高准确性,本论文当中采用了ASSL方法。本文主要包括以下三部分:眼睛区域检测,注视跟踪和鼠标控制。此外,为提高眼睛区域检测的准确性,将所提出的方法应用于眼睛区域检测单元。本文提出了一种基于情境识别的AdaBoost多域分类器算法,将其作为眼动光标控制的精确定位和检测方法。输入图像时,将执行图像预处理,并通过应用高斯滤波器来消除噪点。并且,通过逐步比较图像的各个区域,找到用于凝视跟踪的眼睛区域的位置。进而,对于实时凝视跟踪和光标控制,通过卡尔曼滤波器预测下一个位置并生成每个特征点的运动矢量,来执行眼睛区域的特征点跟踪。
对于非接触式界面的实时凝视跟踪和光标控制,在检测到眼睛区域后,将应用卡尔曼滤波器来减少下一帧中眼睛特征元素的搜索时间。眼睛鼠标的性能受跟踪区域的大小,匹配模板的大小和复杂性,预测的目标特征点的准确性,特征点的速度以及目标特征点的影响。跟踪区域的大小是根据目标跟踪点的速度来确定的。当目标特征点快速移动时,应使用较大的跟踪区域,相反目标特征点缓慢移动时,应使用较小的跟踪区域进行估计。在前几帧中,将目标眼睛特征组件的位置平均,设置为中性区域的中心,并获得该组件的大小和移动速度。当在连续帧中成功识别出眼睛区域的位置时,系统进入跟踪阶段。当估计下一帧中目标眼睛分量的近似位置时,根据当前状态向量执行该操作,并根据预期点的坐标,可将跟踪区域缩小为目标对象检测的关注区域。在该系统中,可以提高眼睛区域的跟踪速度。
3 实验结果
为了实时执行有效的实时注视跟踪功能,首先要检测眼睛的位置。收集眼睛区域样本的数据库,并从眼睛区域样本生成特征向量文件。第二是收集样本数据库,而不是眼睛区域,以设置参数并学习,通过预测用于光标指向的眼睛运动的位置来收集训练数据。为了学习情境感知的多重识别器,创建了1022个正样本图像和2000个负样本(没有眼睛),其中包括眼睛区域。图像包括112个具有摆角的图像。应用ASSL方法通过从训练数据集中删除噪声样本来提高准确性。
本文采用菲茨定律分析用户界面结果。菲茨定律用于点击和拖放图形用户界面的设计建模中,以模拟与屏幕指向相关的速度精度,其中起始对象0与目标对象0相同。用10个测试人员进行了实验,随机生成了5个目标对象图案。目标物体的宽度定义为10、20和30像素。为了简化测试,目标位置以圆圈形式表示。测试结果可以看出,目标物体越大,到达时间越短。我们可以计算到达目标物体时的难度。该值显示了到物体的距离(D)和物体的宽度(W)之间的相关性。该值可以使用Fitts的ID(Index of Difficulty)难度指数计算得出。目标对象的圆圈大小越大,难度指数(ID)越小,圆圈大小越小,ID越大。根据菲茨定律,距离越短,圆越大,界面越快。表1和表2比较了鼠标指针和眼睛鼠标指针之间的接口速度。
表1 眼睛鼠标的速度
表2 鼠标指针速度
从实验结果可以看出,当接近对象时,由眼睛鼠标产生的轨迹比常规计算机鼠标的轨迹相对快,并且有希望用作非接触界面。
4 结束语
在本文中,提出了一种多眼检测功能,用于估计视线并基于屏幕光标调整主动和半监督学习。本文使用一个多域分类器来估计眼睛区域,该分类器使用网络摄像头和ASSL算法进行眼睛跟踪的眼睛情境感知,并应用卡尔曼滤波器和高斯模型来提高实时跟踪性能。实验结果证实,它在眼指向方面表现出优异的性能,并且难度与目标尺寸成反比。当对象的大小较大时,界面响应速度会更快,并且可以看到,所提出系统的UI中的指向速度比鼠标跟踪要快。预期它不仅可以用作残疾人的导航系统,而且可以用作防御流行病中的重要技术。