HMI体验评价方法研究与应用
2022-05-04蔡艳波肖美临吴泽民
蔡艳波,徐 萌,肖美临,李 凤,吴泽民
(东风汽车公司技术中心,湖北 武汉 430058)
1 背景介绍
随着科技的发展,手机等移动端设备的使用人群越来越多,对于大屏触摸的交互体验方式认知程度越来越高。汽车HMI体验顺势而起,成为车企竞争的又一个重要维度,众多车企相继推出了或横或竖的大屏体验。从图1中可以看到,目前自主品牌主流屏幕尺寸为10英寸左右,起步尺寸也在8英寸。如果以苹果iPad作为参照物的话,普通iPad的尺寸为9.7英寸,iPad mini为7.9英寸,iPad Pro为12.9英寸,由此可见主流车机系统的屏幕尺寸基本与前两者比较接近。
图1 5款主流车机屏幕尺寸
除此之外,由于驾驶过程操作HMI会引起驾驶分心,威胁驾驶者和乘客的安全,主机厂商通过和语音服务商合作,提供给驾驶者语音的交互体验方式,目前主流的语音服务商有Nuance、科大讯飞、百度、思必驰等。Nuance自2005年与ScanSoft合并后,成为全球最大的语音技术厂商,凭借自身先进的语音识别、自然语言理解技术以及优秀的语音解决方案在2012年全球语音市场中占据62%,加上谷歌、微软合计占据超过85%。2015年Nuance全球市场份额虽大幅下降至31.6%,但仍位列第一。目前国内智能语音市场被科大讯飞、百度和苹果占据绝大多数市场份额,2015年3家合计达79%。其中,科大讯飞市场份额为44.2%,处于市场领先地位。百度进入势头强劲,市场份额增长快速。
除视觉、触觉、听觉交互体验外,近几年消费者对于出行环境更加重视,不只是表现在居家使用的净化器选择上,选购车型时空气净化功能也成为了一个参考因素,这方面的认知也对嗅觉的体验提出了要求。综合上述论断,笔者认为各种感知体验将成为用户评价一台车体验好坏的主要维度,通过对全国标准信息公共服务平台进行信息检索,我们分别输入HMI、HMI评价、HMI体验评价、汽车体验、汽车评价、汽车界面评价、汽车设计评价,并对QC汽车行业465项标准进行一一比对,未得到汽车领域的相关标准。图2为多感官体验图。
图2 多感官体验
不限领域的用户体验,我们从中国工信出版集团《用户体验度量》一书中,得到作者在评价WEB体验的SUS可用性量表,所指方法和工具主要集中在交互体验,关注系统可感受性、可操作性、可理解性、鲁棒性等,缺少对于驾驶环境其他因素的考虑。《汽车静态感知质量设计与评价》一书则把该课题放在了第8章,列为了前瞻性研究并没有展开讨论。《汽车HMI产品用户满意度测试评价与愉悦引导方法研究》对HMI评价有了深入的研究,通过分析用户操作后的情绪表现及ASQ问卷,综合分析用户情绪low点对应的界面,能够反馈给设计人员问题出现的界面,但问题产生的原因没有具体拆分,用户语言与设计师语言存在很多不同之处,设计师并不能直观理解迭代修改的设计细节,可能产生数次的设计修改,该方法解决了评价满意度的问题,但在实际项目迭代时效率不高。由于目前评价测试的研究都是针对用户,而车企该部门的从业者大多是工程师出身,对设计并没有深入学习,同时汽车行业没有可以参考的标准,笔者提出专家+用户评价的方法,一方面希望从业人员能够从专业的维度进行评价,另外一方面希望能够内外兼修,专家和用户共同推动体验的升级,并搭建专家评估模型。
2 专家评价流程及模型
笔者区分全局评价和功能评价,针对性地归纳出用户评价全局体验的量表,量表适用于仪表、中控显示屏的操作体验,基于设定的任务,待完成后,从交互、视觉、听觉等维度对体验进行评价。整体的专家评价流程如表1所示。
表1 HMI专家评价任务流程
第9步测试任务,全局评价需要完成的任务如下:设置、快捷页面、声音调节、亮度调节、嘈杂环境语音识别、语音控制等。全局任务列表见表2。
表2 全局任务列表
用车过程中,存在影响用户体验的外部不可控因素,本文执行上述任务中总结了影响用户体验的外部不可控因素为:明环境、暗环境、联网、未联网、驾驶状态、非驾驶状态、主驾驶身份、副驾驶身份8个方面;根据以上8要素完成上述任务后,专家需要完成量表打分并将修改意见反馈在表格的备注栏,调研人员统计时能够基于每一个板块进行横纵对比,找出体验薄弱的环节,同时也能对应到薄弱体验差的原因。整体HMI评价量表如表3所示。
表3 HMI评价量表
评价量表测评完成后,发现该测试系统的待优化方向和亮点部分,根据记录结果,能够直观发现当前存在的具体问题。待优化方向列表详见表4。
表4 待优化方向列表
进行不同功能评价时,笔者针对不同功能的独特性,归纳出适用于不同功能的评价量表,例如:在仪表测评模块,专家完成设定的任务后从视觉、听觉、屏幕亮度及交互体验维度对仪表体验进行评价,具体评测任务如表5所示。
表5 仪表测评任务列表
仪表的专家评价量表如表6所示。执行完上述任务后,与全局评测相同,由专家完成量表打分并将修改意见反馈在表格的备注栏内,挖掘仪表界面内体验薄弱的部分及体验差的原因。
表6 仪表评价量
针对现阶段汽车行业没有可以参考的标准以及缺少完善的HMI专家测试评价模型,笔者建立了全局评价和功能评价相结合的专家评估模型,从交互、视觉、听觉等维度对整个用车体验进行评价,并通过量表备注栏内的打分及反馈意见,挖掘体验薄弱环节,从而确定更有针对性的修改意见。
3 用户评价方法
HMI产品人机交互眼动测试、表情识别测试、绩效度量、和行为观察-需求挖掘联合测试在近几年变得普遍,是由仪器实时记录用户行为,在测试完成后,分析用户测试数据,从而获得用户测试结果。
Sauro和Lewis(2012)提出在Web端进行可用性测试现有的标准化可用性问卷有:SUS、QUIS、ASQ、SUMI等;网站评估量表有WAMMI、SUPR-Q等。在《用户体验度量》一书中,详细叙述了其特点,而量表的标准化表明量表不会存在信度缺失的问题,能客观反映用户的主观感受,提高数据的可信度,便于研究人员快速分析整理数据,得出结论。
为了解用户日常使用HMI信息显示系统的操作习惯,挖掘现阶段存在的可用性问题。笔者在进行用户测试阶段,选用了评估整体可用性的标准化量表SUS可用性测试量表。
SUS量表由作者Brooke(Digital Equipment Corporation,UK)1986年发表,共10个问题,采用双数问题为反面语气,奇数问题为正面语气,使最终结果更为客观。同时,题目中除了4和9为测试易学性及易用性外,其余题目均为测试系统的可用性,具体SUS量表详见表7。
表7 SUS可用性测试量表
现阶段计算SUS原始分值找到的对应评级是根据Lewis和Sauro(2009)所提供的SUS分数转化表进行查看对应评级和百分等级的,具体SUS评分表格如表8所示。
表8 SUS评分表格
但是当前汽车行业并没有完整的HMI信息显示系统数据库,故存在无法使用该转化表,查看评级和百分等级的问题。SUS为便捷的可用性测试量表,但由于汽车行业当前没有可以参考的标准,一定程度上减缓了用户测试的发展路径,笔者希望能够推动HMI信息显示系统数据库被搭建。
在此次用户测试过程中,可用性测试任务从功能相关操作和控制、设置相关操作的角度,主要对音乐、电台、电话、空调、座椅加热、降温和车辆控制和设置的体验对被测试demo整体进行了评价。用户体验测试任务清单详见表9。
表9 用户体验测试任务清单
根据用户体验测试,发现了一些亮点功能,如:配色协调,在车机上有很好的效果;操作简单,容易上手;车机系统内功能明确;系统内图标设计的简单、易懂;系统整体简约、大方,很符合车主喜好;以及发现了一些待优化的方向,如听歌识曲、电台扫描的图标无法明晰;切歌位置与使用习惯不一致;部分功能入口隐藏较深,寻找有难度等。用户体验测试结果见表10。
表10 用户体验测试结果列表
进行用户体验测试过程中,笔者运用了SUS可用性测试量表,希望从易用性、易学性和可用性等维度对整个用车体验进行评价,并通过用户反馈意见,了解用户日常使用HMI信息显示系统的操作习惯;以及找出解决现存可用性问题的解决方案。但由于现阶段缺少完整的HMI信息显示系统数据库,导致无法精准得出具体结论,故希望HMI信息显示数据库尽快搭建,为SUS等标准化量表应用建立标准。
4 结论
由于汽车HMI用户体验对消费者购买决策的影响越来越大,而设计师与用户关注的维度存在专业认知差异。笔者结合移动端和汽车体验场景,从交互体验、视觉、听觉、触觉、嗅觉等维度提出评价HMI体验方法,对某车型进行评测,分别从专家和用户角度进行评测HMI的研究。该评价方法对车型有一个量化的评分和设计修改意见,笔者希望它能够为汽车行业建立评价HMI信息显示系统标准提供参考;同时,现阶段仍然缺少HMI信息显示系统数据库,导致标准化量表无法完整应用到用户测试中,笔者希望能推动HMI信息显示系统数据库创建,从而推动标准化量表在HMI领域发展。