HMI体验评价方法研究与应用

2022-05-04蔡艳波肖美临吴泽民

汽车电器 2022年4期

蔡艳波，徐萌，肖美临，李凤，吴泽民

（东风汽车公司技术中心，湖北武汉 430058）

1 背景介绍

随着科技的发展，手机等移动端设备的使用人群越来越多，对于大屏触摸的交互体验方式认知程度越来越高。汽车HMI体验顺势而起，成为车企竞争的又一个重要维度，众多车企相继推出了或横或竖的大屏体验。从图1中可以看到，目前自主品牌主流屏幕尺寸为10英寸左右，起步尺寸也在8英寸。如果以苹果iPad作为参照物的话，普通iPad的尺寸为9.7英寸，iPad mini为7.9英寸，iPad Pro为12.9英寸，由此可见主流车机系统的屏幕尺寸基本与前两者比较接近。

图1 5款主流车机屏幕尺寸

除此之外，由于驾驶过程操作HMI会引起驾驶分心，威胁驾驶者和乘客的安全，主机厂商通过和语音服务商合作，提供给驾驶者语音的交互体验方式，目前主流的语音服务商有Nuance、科大讯飞、百度、思必驰等。Nuance自2005年与ScanSoft合并后，成为全球最大的语音技术厂商，凭借自身先进的语音识别、自然语言理解技术以及优秀的语音解决方案在2012年全球语音市场中占据62%，加上谷歌、微软合计占据超过85%。2015年Nuance全球市场份额虽大幅下降至31.6%，但仍位列第一。目前国内智能语音市场被科大讯飞、百度和苹果占据绝大多数市场份额，2015年3家合计达79%。其中，科大讯飞市场份额为44.2%，处于市场领先地位。百度进入势头强劲，市场份额增长快速。

除视觉、触觉、听觉交互体验外，近几年消费者对于出行环境更加重视，不只是表现在居家使用的净化器选择上，选购车型时空气净化功能也成为了一个参考因素，这方面的认知也对嗅觉的体验提出了要求。综合上述论断，笔者认为各种感知体验将成为用户评价一台车体验好坏的主要维度，通过对全国标准信息公共服务平台进行信息检索，我们分别输入HMI、HMI评价、HMI体验评价、汽车体验、汽车评价、汽车界面评价、汽车设计评价，并对QC汽车行业465项标准进行一一比对，未得到汽车领域的相关标准。图2为多感官体验图。

图2 多感官体验

不限领域的用户体验，我们从中国工信出版集团《用户体验度量》一书中，得到作者在评价WEB体验的SUS可用性量表，所指方法和工具主要集中在交互体验，关注系统可感受性、可操作性、可理解性、鲁棒性等，缺少对于驾驶环境其他因素的考虑。《汽车静态感知质量设计与评价》一书则把该课题放在了第8章，列为了前瞻性研究并没有展开讨论。《汽车HMI产品用户满意度测试评价与愉悦引导方法研究》对HMI评价有了深入的研究，通过分析用户操作后的情绪表现及ASQ问卷，综合分析用户情绪low点对应的界面，能够反馈给设计人员问题出现的界面，但问题产生的原因没有具体拆分，用户语言与设计师语言存在很多不同之处，设计师并不能直观理解迭代修改的设计细节，可能产生数次的设计修改，该方法解决了评价满意度的问题，但在实际项目迭代时效率不高。由于目前评价测试的研究都是针对用户，而车企该部门的从业者大多是工程师出身，对设计并没有深入学习，同时汽车行业没有可以参考的标准，笔者提出专家+用户评价的方法，一方面希望从业人员能够从专业的维度进行评价，另外一方面希望能够内外兼修，专家和用户共同推动体验的升级，并搭建专家评估模型。

2 专家评价流程及模型

笔者区分全局评价和功能评价，针对性地归纳出用户评价全局体验的量表，量表适用于仪表、中控显示屏的操作体验，基于设定的任务，待完成后，从交互、视觉、听觉等维度对体验进行评价。整体的专家评价流程如表1所示。

表1 HMI专家评价任务流程

第9步测试任务，全局评价需要完成的任务如下：设置、快捷页面、声音调节、亮度调节、嘈杂环境语音识别、语音控制等。全局任务列表见表2。

表2 全局任务列表

用车过程中，存在影响用户体验的外部不可控因素，本文执行上述任务中总结了影响用户体验的外部不可控因素为：明环境、暗环境、联网、未联网、驾驶状态、非驾驶状态、主驾驶身份、副驾驶身份8个方面；根据以上8要素完成上述任务后，专家需要完成量表打分并将修改意见反馈在表格的备注栏，调研人员统计时能够基于每一个板块进行横纵对比，找出体验薄弱的环节，同时也能对应到薄弱体验差的原因。整体HMI评价量表如表3所示。

表3 HMI评价量表

评价量表测评完成后，发现该测试系统的待优化方向和亮点部分，根据记录结果，能够直观发现当前存在的具体问题。待优化方向列表详见表4。

表4 待优化方向列表

进行不同功能评价时，笔者针对不同功能的独特性，归纳出适用于不同功能的评价量表，例如：在仪表测评模块，专家完成设定的任务后从视觉、听觉、屏幕亮度及交互体验维度对仪表体验进行评价，具体评测任务如表5所示。

表5 仪表测评任务列表

仪表的专家评价量表如表6所示。执行完上述任务后，与全局评测相同，由专家完成量表打分并将修改意见反馈在表格的备注栏内，挖掘仪表界面内体验薄弱的部分及体验差的原因。

表6 仪表评价量

针对现阶段汽车行业没有可以参考的标准以及缺少完善的HMI专家测试评价模型，笔者建立了全局评价和功能评价相结合的专家评估模型，从交互、视觉、听觉等维度对整个用车体验进行评价，并通过量表备注栏内的打分及反馈意见，挖掘体验薄弱环节，从而确定更有针对性的修改意见。

3 用户评价方法

HMI产品人机交互眼动测试、表情识别测试、绩效度量、和行为观察-需求挖掘联合测试在近几年变得普遍，是由仪器实时记录用户行为，在测试完成后，分析用户测试数据，从而获得用户测试结果。

Sauro和Lewis（2012）提出在Web端进行可用性测试现有的标准化可用性问卷有：SUS、QUIS、ASQ、SUMI等；网站评估量表有WAMMI、SUPR-Q等。在《用户体验度量》一书中，详细叙述了其特点，而量表的标准化表明量表不会存在信度缺失的问题，能客观反映用户的主观感受，提高数据的可信度，便于研究人员快速分析整理数据，得出结论。

为了解用户日常使用HMI信息显示系统的操作习惯，挖掘现阶段存在的可用性问题。笔者在进行用户测试阶段，选用了评估整体可用性的标准化量表SUS可用性测试量表。

SUS量表由作者Brooke（Digital Equipment Corporation，UK）1986年发表，共10个问题，采用双数问题为反面语气，奇数问题为正面语气，使最终结果更为客观。同时，题目中除了4和9为测试易学性及易用性外，其余题目均为测试系统的可用性，具体SUS量表详见表7。

表7 SUS可用性测试量表

现阶段计算SUS原始分值找到的对应评级是根据Lewis和Sauro（2009）所提供的SUS分数转化表进行查看对应评级和百分等级的，具体SUS评分表格如表8所示。

表8 SUS评分表格

但是当前汽车行业并没有完整的HMI信息显示系统数据库，故存在无法使用该转化表，查看评级和百分等级的问题。SUS为便捷的可用性测试量表，但由于汽车行业当前没有可以参考的标准，一定程度上减缓了用户测试的发展路径，笔者希望能够推动HMI信息显示系统数据库被搭建。

在此次用户测试过程中，可用性测试任务从功能相关操作和控制、设置相关操作的角度，主要对音乐、电台、电话、空调、座椅加热、降温和车辆控制和设置的体验对被测试demo整体进行了评价。用户体验测试任务清单详见表9。

表9 用户体验测试任务清单

根据用户体验测试，发现了一些亮点功能，如：配色协调，在车机上有很好的效果；操作简单，容易上手；车机系统内功能明确；系统内图标设计的简单、易懂；系统整体简约、大方，很符合车主喜好；以及发现了一些待优化的方向，如听歌识曲、电台扫描的图标无法明晰；切歌位置与使用习惯不一致；部分功能入口隐藏较深，寻找有难度等。用户体验测试结果见表10。

表10 用户体验测试结果列表

进行用户体验测试过程中，笔者运用了SUS可用性测试量表，希望从易用性、易学性和可用性等维度对整个用车体验进行评价，并通过用户反馈意见，了解用户日常使用HMI信息显示系统的操作习惯；以及找出解决现存可用性问题的解决方案。但由于现阶段缺少完整的HMI信息显示系统数据库，导致无法精准得出具体结论，故希望HMI信息显示数据库尽快搭建，为SUS等标准化量表应用建立标准。

4 结论

由于汽车HMI用户体验对消费者购买决策的影响越来越大，而设计师与用户关注的维度存在专业认知差异。笔者结合移动端和汽车体验场景，从交互体验、视觉、听觉、触觉、嗅觉等维度提出评价HMI体验方法，对某车型进行评测，分别从专家和用户角度进行评测HMI的研究。该评价方法对车型有一个量化的评分和设计修改意见，笔者希望它能够为汽车行业建立评价HMI信息显示系统标准提供参考；同时，现阶段仍然缺少HMI信息显示系统数据库，导致标准化量表无法完整应用到用户测试中，笔者希望能推动HMI信息显示系统数据库创建，从而推动标准化量表在HMI领域发展。