基于交互设计的人脸识别技术层次化研究
2020-07-14张琼王敬泽
张琼 王敬泽
摘要:本文从交互设计的角度出发,剖析人脸识别技术的基本功能与设计可能,为设计师提供基于人脸识别技术的产品设计思路。文章通过总结人脸识别技术的六个设计影响因素,将人脸识别技术划分为易理解的四个层次:功能层、行为层、感知层和反馈层。功能层中将人脸识别的基本功能进行分解为检测功能与比对功能;行为层提出了人脸识别的交互设计流程闭环及影响用户交互行为的多种因素;感知层分别论述了机和人的感知能力所面临的诸多影响因素及基本解决思路;反馈层对比分析了直接映射和间接映射两种反馈设计方式的优势与不足,最后得到人脸识别技术的层次化分析结论。文章可为广大设计师提供基于人脸识别技术的设计方法参考。
关键词:人脸识别;交互设计;层次化分析
中图分类号:TB47 文献标识码:A
文章编码:1672-7053(2020)05-0026-03
1相关概念解析
1.1.交互设计
交互设计是定义和设计人工系统行为的领域。它定义了两个或两个以上的交互个体之间的通信内容和结构,以便它们能够相互协作以达到共同的目的。互动设计以“将信息技术嵌入充满社会复杂性的物质世界”为中心,在人、产品和服务之间创造和建立有意义的关系。交互系统设计的目标可以从“可用性”和“用户体验”两个层面来分析,重点是面向用户的需求。
1.2人脸识别技术
人脸识别是计算机视觉的重要应用之一,广义的人脸识别包含图像采集、人脸检测、人脸对齐、特征表示等过程。尽管现阶段国内外的人脸识别相关研究已经进行得较为深入,但现存的大部分相关论文均带有极强的技术性倾向,对于设计师而言缺乏阅读友好性。文章从交互设计的角度出发,以人脸识别技术(二维人脸识别技术)为例,利用层次化分析方法从设计师视角出发,对人脸识别技术的多种设计可能及限制因素进行剖析。
2影响人脸识别技术互动的因素
基于人脸识别技术的交互活动,是人与机器、环境相互作用的结果。在互动过程中,用户特征、设备性能、交互环境、交互动机、用户行为、反馈布局都是影响人脸识别互动的重要因素。
2.1用户特征
摄像头能否持续稳定地检测用户面貌,是决定交互流程能否正常进行的先决条件。摄像头检测结果受到光线条件和遮挡条件等影响。其中,遮挡条件既包括物理障碍物,也包括用户自身穿戴的具备遮挡性质的装饰物,如发型、眼镜、帽子、围巾等。此外,用户自身的生理条件也是制约摄像头检测的条件之一,如用户的身高、体态等。人脸检测设备的摆放高度、用户物理活动范围的划分、虚境互动界面的布局,都需根据目标用户群体的实际情况进行合理设计。
2.2设备性能
设备性能影响人脸识别系统的处理速度和准确度。目前,市场上的摄像头鲁棒性维持在一个稳定水平,在同等条件下,各类摄像头的检测稳定程度趋于一致,其性能的主要差别在于设备像素高低、是否具有内置麦克风支持语音功能等,主要影响人脸识别互动是否可附加、拓展设计更多样的互动形式。
2.3交互环境
交互环境是影响人脸识别互动的重要因素。交互环境由多种环境条件构成,包括光照条件、人流条件、场地条件等。昏暗的光照条件下,摄像头极易无法正常工作。人流条件和场地条件是人脸识别检测的重要干扰因素。人流量密集的场地,用户与用户的面部之间易造成遮挡,引发断检或误检情况。因此,开阔的互动场地,有助于保障用户活动范围及用户人身安全。
交互环境同时影响人脸识别的参与人数与互动形式。在光照条件与场地面积近似的前提下,人流密集的场地,一般采用多人互动、简易交互流程的交互设计方式,烘托群体互动的热闹氛围。人流较少的场地,可考虑采用单人互动、复杂交互流程的交互设计方式,增添单人互动的游戏趣味性。
2.4交互动机
交互动机是促使用户尝试、执行、维持交互行为的主观动力。交互动机受到交互环境、项目内容、交互流程、奖励机制的影响。具有趣味性的交互环境布景及项目内容能够激发用户的主观参与性与互动沉浸感,顺畅的交互流程与具有鼓励性的奖励机制能够维持长久用户的交互行为,促进用户个人成就感与满足感的达成,提供良好的参与体验。
2.5用户行为
用户面部具有高度非刚性的特点,用户的俯仰、转头、表情变化等行为都会造成其面部的形状变化与角度变化。在设备性能基本持平、技术手段尚不完善的前提下,难以由设备迭代和技术更新解决该问题,需要转而从用户行为设计入手。由于用户的行为具有随意性与不确定性,因此,在考虑到用户的自然行为习惯,选取贴合其认知的交互行为的前提下,对交互动作的动作幅度与变化角度的设计都应当有较为明显的区别,避免因雷同动作造成的误检等情况。
2.6反馈布局
1)映射反馈。直接映射符合用户的直接生活经验和物理世界认知,虽然更易被用户所理解和接受,但也缺乏了相应的游戏趣味性。而间接映射正是因为不符合用户的直接生活经验和物理世界认知,更易带给用户新鲜感,更易营造奇幻迥异的气氛和环境,实境与虚境的差异性赋予了间接映射极大的设计空间。合理地应用自然化的间接映射,能够帮助设计师融合直接映射易理解的优势与间接映射自身充滿趣味l生的优点,完成别具一格的优秀设计。
2)界面布局。人脸识别互动具有非接触性的特点。用户在物理世界产生位移时,其映射形象可能与系统界面元素产生重叠,形成断检。对引导元素、互动元素与装饰元素进行合理布局,能够最大限度避免上述问题。装饰元素的布局应当采用边缘化、弱遮挡的形式,利用虚境环境的边界限制暗示物理世界活动范围,同时将视觉呈现的中心留给具有引导意义的提示元素和具备游戏趣味的互动元素,便于用户快速获取关键反馈信息。界面元素的大小、形状、颜色、醒目程度、出现顺序也应当根据交互流程严谨设计,根据其重要程度规划其距离视觉中心的远近距离,有序显示,避免位置重叠、图像闪现、平均分布等布局问题。
3基于交互设计的人脸识别技术层次化分析
3.1功能层分析
人脸识别的交互流程主要分为三个阶段:人脸检测、人脸对齐/特征提取、面貌识别。这三个阶段可以组成一个完整的交互闭环:用户→摄像头拍摄用户面貌→数据传入计算机→处理/比对→计算机做出相应行为/信息反馈。人脸识别在这个基本的交互闭环中,显现出了它的两种基本功能:检测功能与比对功能。
3.1.1检测功能
人脸识别技术的检测功能,是指利用摄像头采集图像数据,精准辨识、定位人脸图像位置。检测功能的实质是两次判定,第一次判定有无,第二次则判定位置。检测功能的实质,是训练功能与特征拾取表达功能的集合。
1)训练功能。俗语说“千人千面”,就字面意思而言,人脸识别还存在着“一人千面”的有趣情况。由于人脸具有高度非刚性的特点,会随着其水平转动、俯仰动作、表情变化等产生各类遮挡或形变,摄像头拍摄到的图像只是人脸在某一段时间内的连续定格,每一时刻的定格图像都可能会存在差异。计算机需要自行判断这一系列的图像是否为均为人脸,才能维持检测功能的有效性,这时就需要训练功能的帮助。“训练”的过程,就是让计算机根据已有的人脸特征进行自主学习,提取、对比、判断其他图片是否也存在相似特征,从而判断出该图片是否也属人脸。人脸识别往往拥有许多数据库或图片库,库预先将数张“人脸”与“非人脸”的图片提供给计算机进行辨认和学习。大量对比后,计算机最终能够智能地总结、提取“人脸”类图片的特征。
2)特征拾取。二维人脸识别技术的特征拾取表达方式目前主要有三种。其一,以“点”定位表现人脸位置;其二,以“框”定位表现人脸位置;其三,提取人脸68特征点形成特征网,定位表现人脸位置。采用点定位与框定位的人脸贴图方式时,人脸贴图不具有纵深,用户左右转动面部时,贴图的角度不变,不能随人脸水平转动角度变形适应,适合多人、面具匹配精准度要求较低的互动场所;提取68特征点的定位方式,人脸贴图具有一定的纵深,人脸水平转动一定角度时,能够自动形变,适应匹配该角度的人脸,适合少人或单人、对面具匹配精准度要求较高的互动场所。人脸是极具个性化的肢体部分,能够提供给设计师的特色信息也有多种,根据不同的应用场合及人群,合理选用不同的特征拾取办法,能够最大程度节约设计成本,提高设计效率。
3.1.2比对功能
“检测”进行的是“人”类与“非人”类的比对,“比对”则主要是进行“人”类中个体的差异l生比对。在检测功能中,计算机需要自主判断图像数据是否为人脸,如是,则在屏幕上定位人脸的位置,如否,则不进行定位;在比对功能中,(已经确认摄像头采集的图片数据A与图片数据B均为人脸)则需要重点判断人脸图像A与人脸图像B究竟是不同的人,还是同一人脸在不同时间段的位置变化。在强调安全职能领域的应用中,看重检测和比对结果,强调真实性与一致性,弱化美观性;在泛娱乐领域的应用中,人脸识别的比对职能弱化,检测职能放大,检测结果的严谨性要求降低,美观性和娱乐性的要求提高,允许设计师对人脸识别结果进行形象美化设计。
3.2行为层分析
用户的每个交互动作都是一段“过程”。“过程”意味着“变化性”和“不确定性”。“变化性”与“不确定性”又为设计师提供了设计与规划的空间。最大限度考虑“变化性”带来的多种可能,就可以最大限度地减少“不确定性”造成的干扰,提升人脸识别系统的可用性,交互流程的稳定性,保证用户的交互体验。
3.2.1交互行为
部分体感检测设备,如Kinect,交互肢体物理位移或角度变换的幅度较大,其交互肢体的运动角度、纵深深度、位移速度等均可能成为触发交互指令的条件,易被传感器捕捉和精确检测。而人脸识别技术将主要的交互肢体设定为面部。面部交互行为存在位移幅度小、旋转角度细微、肢体特征提取方式特殊等特点。设计师需要在全面了解人脸识别的交互流程的基础上,精确分析和解构交互流程,考虑到不同的干扰因素。
3.2.2无意识行为
在人脸识别互动过程中,除去必要的交互行为,用户还可能出现的多种其他无意识行为,这就要求设计师需要尽可能全面地考虑到用户行为的多种可能,每一种被设计师遗漏的用户行为可能性都有可能导致交互的瘫痪。设计师可以利用视觉符号、美术形象、交互引导等,对用户的多种行为可能进行预估、设计、规划,减少用户的误操作,引导用户顺利、正确地完成预期的交互流程。
3.2.3行为限制因素
从客观角度来说,用户行为的规划空间,可以以交互过程中用户行为受到的限制性因素多少来进行判定。用户行为的限制性因素可能来源于场地干扰、人群流量及检测设备等,原因与表现的映射大体为:(1)设备检测功能——限制用户互动部位;(2)设备检测范围——限制用户移动区域;(3)场地光照——设备灵敏程度——限制用户动作快慢;(4)场地人流——设备抗扰能力——影响用户交互耐心;(5)设备即时反馈灵敏度——影响用户停留时长。
此外,其他一些主观因素也同样会影响用户的交互行为。用户自身是否遵循场地规则、是否跟随预设的引导提示进行交互、在同一场交互体验中是否多次反复出入检测区等等,都可能会阻碍交互流程的顺利进行。此时就要求设计师结合前文所剖析的计算机比对功能综合考量,灵活设计。
3.3感知層分析
3.3.1计算机感知
是指设备能够感知到外部信息的多少,受到设备检测功能、设备检测范围、设备灵敏程度、设备鲁棒性等多种条件的制约。但在同种条件下,同种设备的感知能力总体处于一个较为稳定的水平。在人脸识别的检测环节,摄像头对人脸的检测结果受光照条件和遮挡条件的影响较大。遮挡条件包括障碍物遮挡、人脸水平转动遮挡等多种遮挡形式。在交互环节,受摄像头检测速率和准确程度的影响,摄像头检测速率越快、准确程度越高,计算机的感知能力就越好,越能快速、准确地操作反馈。设计师的设计往往受到设备实际性能的限制,应当根据实际需求合理规划互动场所,科学选择相应设备,规避上述影响因素可能带来的不良后果。