基于用户测评的导医助手语音交互设计研究
2023-03-07方馨悦王玫刘茜茜郑心怡王鑫蓉邓雪梅
方馨悦,王玫,刘茜茜,郑心怡,王鑫蓉,邓雪梅
基于用户测评的导医助手语音交互设计研究
方馨悦,王玫,刘茜茜,郑心怡,王鑫蓉,邓雪梅
(四川大学,成都 610065)
通过研究门诊导医助手的交互程度、音调、性别对拟人化程度、有效性、满意度的影响,为未来导医场景及更多公共场合的语音助手的形象与话术设计提供参考。让12位被试在模拟导医场景下与不同交互程度、音调、性别的语音助手进行对话任务,通过绿野仙踪测试法(Wizard of Oz)进行实验。使用七分李克特量表获取拟人化程度、有效性、满意度评分并进行开放性访谈,再通过弗里德曼检验(Friedman Test)、威尔克尔森符号秩检验(Wilcoxon Signed Rank Test)与最小二乘回归分析对结果进行量化分析,以探索用户对导医助手的形象与话术偏好。最后根据研究结果,对导医系统展开了多模态用户界面的设计实践。在导医场景下,用户更偏好交互程度高的导医助手,音调为女低音或男高音的导医助手评分更高,用户对导医助手的性别没有明显偏好。导医助手的用户满意度随着拟人化程度的增加而增加。对于公共场合的语音交互设计,应深入调研各类用户的偏好,设计出更受用户喜爱的语音助手,并发挥出多模态用户界面的优势。
门诊导医;语音交互设计;语音助手;语音用户界面;多模态;用户测评;用户体验
门诊服务是医院与患者之间的重要连接通道,直接关系到患者对医院的印象与就诊体验。在传统的就诊过程中,挂号、排队等流程花费了用户大量的时间[1],大大降低了用户的就诊体验。为了提高服务质量,许多医院构建起了智能化的自助导医服务系统[2–4]。但直至现在,诊疗服务的人性化仍有很大的进步空间。自助导医服务系统的一个重要升级方向便是应用智能语音技术提升操作的自然性、易用性。当下,语音助手已渐渐遍布人们的生活,语音交互设计成为了国内外的研究热点[5]。但是对于语音助手的研究仍集中在已广泛使用的智能手机、家居、车载等较为私密场景的语音助手方面[6],对公共场合(尤其是导医场景)的语音助手的研究较少。本研究针对导医语音助手,通过实验探索了用户对其交互程度、音调、性别的偏好,并进行了设计实践。本研究有助于进一步了解公共场合语音助手的形象与对话设计原则,为未来的语音交互设计及多模态用户界面设计提供了指导与参考。
1 语音交互研究现状
相比于图形用户界面,语音用户界面有以下优势:高效,说话速度相较于打字速度更快;易学,语音是最自然的交互方式,语音交互几乎不需要学习成本;释放双手;情感交互,大量的情感信息可以通过语气、语调、语速、音量等因素传达[7-8]。
语音交互赋予了智能系统以人物形象。无论设计师是否对产品的人格进行设计,用户都会为产品赋予某种人格特质,因此在设计时应确定好语音助手的人物形象[7]。设计师在设计过程中需要考虑语音助手的人物形象设定是否有助于发展用户与机器的关系、是否与工作环境相匹配。用户对语音助手人物形象的感知主要受语气与语调的影响,其次是表达方式与内容[9]。
李璟璐等[10]指出在进行智能交互设计时,应尽量贴近人与人的交流方式。Niculescu等[11]的实验显示,在公共服务领域,用户更喜爱具有幽默感与同理心的语音助手。孙妍彦等[9]提出,在家庭场景下,女性、18~25岁、开放聪慧、与用户关系类型为助手或朋友的语音助手最受欢迎。王尔卓等[12]研究发现,在智能家居场景下,经验用户和家庭用户偏好建议者风格的语音助手,直率的沟通方式获得了更高的满意度、舒适度评分。Lutfi等[13]认为在语音助手的设计中加入情感可以有效减少用户的挫败感,提高用户满意度。
声音会让用户对人的背景作出预判,并在此基础上施加刻板印象[14-15]。音调、音调范围、音量、语速这四个基本特征关系到用户对语音助手人格的感知[16–18]。Niculescu等[11]发现,高音调的女性助手被认为社交技巧更好、更令人愉悦;低音调的女性助手被认为更强大;男性用户认为低音调的女性助手听起来更专业、语速更快、更有魅力。
不同性别的声音会引发人们的刻板印象[19]。Pak等[20]发现,用户对男性虚拟医生更加信任。Costrich等[21]提出,当语音助手进行主导行为时,男性助手被认为自信,而女性助手则被认为咄咄逼人。Yu等[22]认为,与男性助手相比,用户更可能对女性助手透露个人信息。Chang等[23]通过实验发现,对于护理助手,人们更偏好外向的女性声音,这与对承担护理工作的角色的刻板印象一致。Heilman[24]发现用户认为男性助手对男性话题更了解,女性助手对女性话题更了解。
不同类型的产品在功能和使用场景上各不相同,可用性和感知有用性设计的亮点可能也不尽相同[12-13]。Liao等[6]研究发现,用户对手机语音助手与家居语音助手有不同的偏好:用户期望手机语音助手更高效、与家居语音助手进行更多的情感交流。Pearl等[8]认为对于通用产品,应该设计不那么让人爱憎分明,而是更为含蓄、普适的人格。
现在,越来越多的服务机器人被应用于公共场所,例如博物馆[25]、机场[26]、车站[27]、酒店[28]、购物中心[29]等。对于不同场景的语音助手,应分别对用户偏好展开研究。但是,目前少有针对公共空间语音助手的研究,尤其是对于需求日益增长的导医语音助手的关注度较小。相较于目前语音交互研究较为丰富的智能手机、家居、车载等个人语音助手,导医语音助手具有其独特性。首先,导医语音助手处于公共空间中,所面对的用户更为复杂,用户的年龄、文化程度、个性、情绪等各不相同[30-31],无法如个人语音助手一般根据用户设置个性化的形象、话术,因而需要更具普适性。其次,在与个人语音助手进行交互时,用户大多处在熟悉的私人环境中,故用户并未习惯在公共环境下与语音助手进行互动[32]。在导医场景下,陌生的环境及周遭大量的陌生人会使部分用户感到尴尬、不安。同时在首次使用时,用户对于语音助手的工作能力并不了解,容易存在不信任的因素[33]。此外,在导医场景下用户的目的性较强,对于对话效率的要求更高。由于导医场景的特殊性,用户对导医语音助手的偏好仍有待进一步探究。
大量研究表明,人格、音调、性别等特征可以塑造语音助手的人物形象,影响用户体验[11]。因此,本次研究拟从交互程度、音调、性别三个维度入手,探索导医场景下用户对语音交互的偏好。
2 研究方法
2.1 实验设计
本次研究分为导医场景下的交互程度偏好、音调偏好、性别偏好三个维度,探索这三个维度对导医语音助手拟人化程度、有效性、满意度的影响。
实验使用的语音材料通过百度AI开放平台的在线语音合成系统生成,图形用户界面见图1。实验使用了语音交互设计中广泛使用的绿野仙踪测试法[34],主试与被试分别处于不同的房间内,主试可以听见并看见被试与导医助手的互动过程。在被试不知情的情况下,主试根据被试的回答选择相应的交互进程。
图1 图形用户界面
根据合作原则[35],实验设计了交互程度为低、中、高的三类导医助手。不同交互程度的导医助手只在对话模式和脚本上不同,语气、音调、音量都保持不变,见表1。实验任务为询问科室位置的场景。为避免性别对用户主观感知的影响,每种交互程度的导医助手设置男性、女性各一组。
表1 导医助手的交互特征及对话示例
Tab.1 Interaction features and dialogue samples of outpatient service assistants
音调偏好实验设计了女低音、女高音、男低音、男高音四个导医助手,对话脚本、音量保持不变,实验任务为询问医院工作时间。
性别偏好实验中的导医助手除性别外,对话脚本、音调、音量保持不变,实验任务为挂号。
2.2 实验人员
本次研究共招募了12位被试,其中包括6位女性与6位男性,年龄为20~53岁,平均年龄为29.17岁。每位被试完成所有实验所需的时间为25~35 min。
2.3 实验流程
如上所述,研究共分为三个部分:交互程度偏好、音调偏好、性别偏好。每位被试需要与9位导医助手进行对话。在实验开始前,被试需要阅读实验任务剧本,了解本次实验所处的场景与任务目标。完成任务后,被试需填写一份七分李克特量表来评价导医助手。量表包含15道题,题干表述从已完成信度、效度检验的量表[36-38]中选取,测量被试对导医助手的拟人化程度、有效性、满意度评价。最后,对被试进行开放性访问。访问内容包括对导医助手的印象、喜爱度排序、喜欢或不喜欢某个导医助手的原因等。
3 数据分析
本次实验的数据分析通过IBM SPSS 26.0软件完成。
3.1 问卷信度检验
问卷中拟人化程度、有效性、满意度3个维度的科隆巴赫系数(Cronbach's Alpha)均超过0.9,表明该问卷的内部一致性与信度较高。因此,可以对数据进行进一步分析。
3.2 交互程度偏好
交互程度偏好实验共收集到11组数据,采用弗里德曼检验(Friedman Test)进行分析。结果显示,交互程度为低、中、高的导医助手的拟人化程度(2(2)= 35.671,<0.001)、有效性(2(2)=14.262,=0.001)、满意度(2(2)=39.127,<0.001)存在显著差异。
成对比较结果见表2。交互程度为低与中(= 0.029)、低与高(<0.001)、中与高(=0.049)的拟人化程度具有显著差异。交互程度为低与高(=0.013)的有效性具有显著差异,而低与中(=0.950)、中与高(=0.189)的有效性差异不显著。交互程度为低与高(<0.001)、中与高(=0.042)的满意度具有显著差异,而低与中(=0.058)的满意度差异不显著。交互程度对导医助手拟人化程度、有效性、满意度的影响,见图2。
在前期用户访谈中,半数的用户提到希望导医助手不用先开口说话或只说“您好”,希望导医助手的道歉越简短越好。但是在实际使用后的访谈中用户表示,只说“您好”的低交互程度的导医助手常让用户感到困惑。在实验后的访谈中,有用户提到低交互程度的导医助手话术过于机械化,给人不可靠的印象,而高交互程度的导医助手则令人放松、安心。当导医助手无法识别用户的话语时,高交互程度的导医助手的道歉能减轻挫败感与烦躁感。在询问科室地点时,高交互程度的导医助手提示可以拍下地图这一行为让用户感到非常惊喜。
表2 不同交互程度的导医助手的弗里德曼检验成对比较
Tab.2 Pairwise comparisons of Friedman test of outpatient service assistants of different interaction levels
图2 不同交互程度的导医助手的平均得分
3.3 音调偏好
音调偏好实验共收集到12组数据,采用弗里德曼检验进行分析。弗里德曼检验结果显示,音调为女低音、女高音、男低音、男高音的拟人化程度(2(2)= 13.109,=0.004)、有效性(2(2)= 22.878,<0.001)、满意度(2(2)=55.062,<0.001)的差异皆具有显著性。
成对比较结果见表3。女低音与男低音(=0.021)的拟人化程度具有显著差异,其他组之间的差异则不具有显著性(>0.05),其中男低音的拟人化程度低于其他音调。女低音与男低音(=0.020)的有效性具有显著差异,其他组之间没有显著差异(>0.05)。女低音与女高音(<0.001)、女低音与男低音(<0.001)、女高音与男高音(=0.005)、男低音与男高音(=0.027)的满意度具有显著差异,其他组之间不存在显著差异(>0.05)。音调对导医助手拟人化程度、有效性、满意度的影响见图3。
在实验后的用户访谈中,用户的喜好各不相同。喜欢女高音的用户认为其声音“温柔”“甜美”,而不喜欢的用户则表示女高音听起来“太年轻”“不可靠”“有攻击性”。喜欢男低音的用户认为其“沉稳”“可靠”,而不喜欢的用户认为男低音“声音低沉”“清晰度差”。但是,对于男高音,大部分用户认为它“年轻阳光”;对于女低音,大部分用户认为它“沉稳专业”“成熟可靠”。
3.4 性别偏好
性别偏好实验共收集到12组数据,采用威尔克尔森符号秩检验(Wilcoxon Signed Rank Test)进行数据检验。分析结果显示,女性与男性导医助手的拟人化程度(=0.564)、有效性(=0.068)、满意度(=0.302)差异不显著,见表4。
表3 不同音调的导医助手的弗里德曼检验成对比较
Tab.3 Pairwise comparisons of Friedman test of outpatient service assistants of different pitch
图3 不同音调的导医助手的平均得分
表4 不同性别的语音助手的威尔克尔森符号秩检验
Tab.4 Wilcoxon signed ranks test of voice assistants of different gender
在实验后的用户访谈中,用户对男性、女性助手的偏好也比较平均。偏好女性导医助手的用户认为“导医人员多为女性”“符合用户对导医人员的固有印象”“女性的声音更加温柔亲切”。偏好男性导医助手的用户则认为男性导医助手“听起来更加专业”,“让人联想到医生的形象”。这其中仍存在一些对性别的刻板印象。
3.5 拟人化程度对有效性、满意度的影响分析
采用最小二乘回归分析处理,探索了拟人化程度如何影响有效性、满意度,结果如图4所示。拟人化程度与有效性间存在线性关系(1,29)=17.246,<0.001。拟人化程度可以解释有效性变化的37.3%。回归方程为:有效性= 3.016+(0.501×拟人化程度)。拟人化程度与满意度间存在线性关系(1, 31)=32.433,<0.001。拟人化程度可以解释满意度变化的51.1%。回归方程为:满意度=1.770+(0.674×拟人化程度)。有效性与满意度随着拟人化程度的增加而增加。
3.6 其他用户行为分析
在实验过程中,青年用户说出的命令大多基于屏幕上已显示的功能文字说明(如:“科室导航”),而中年用户的命令则更接近于自然语言(如:“我想问一下血液科要怎么走”)。在实验中还观察到,当任务为需要穿透用户界面的操作(即当前屏幕上没有该功能)时,青年用户容易受限于当前界面显示的功能,出现疑惑的状态,而中年用户则会直接、自然地对导医助手进行询问。
图4 拟人化程度对有效性与满意度的影响
4 结果讨论
研究发现,高交互程度、音调为女低音的导医助手的拟人化程度、有效性、满意度最高,用户对于导医助手的性别没有明显偏好。另外,导医助手的拟人化程度与有效性、满意度正相关。在交互程度方面,虽然低交互程度的对话文本更加简短,但用户并不认为其有效性更高。相对于单纯的缩短时间,优化对话体验会更明显地提高用户满意度。在音调方面,女低音与男高音的满意度显著高于女高音与男低音。
总体来说,用户偏好高交互程度、高拟人化程度、音调为女低音或男高音的导医语音助手。从用户访谈可知,用户期望导医助手具有专业、可靠、亲切、贴心的特质。
5 设计应用
根据研究结果设计的导医助手的人物模型如图5。导医助手小慧是一位女性护士,35岁,有12年的工作经验。小慧的声音选择了音调较低、语速适中、音量较大的女声。依据研究结果与大五人格理论[39],小慧的责任心、外倾性、宜人性较高,而开放性、神经质性较低。
用户偏好交互程度、拟人化程度高的导医助手。因此,在对话设计中,将通过插入适当的温馨提示、礼貌性语句、语气词等方式提升互动性与用户体验,如:当插入就诊卡后,导医助手会礼貌地称呼用户(如:张先生、陈女士),以提示用户读卡成功并拉近与用户的心理距离;在用户完成挂号后,导医助手会提示预计需要等待的时间;在显示导航地图时,导医助手会提醒用户可以拍照记录;当选择退卡时,导医助手会提示用户取走就诊卡等。
图5 导医助手人物模型
同时,因为导医系统使用于公共场合,在语音交互设计过程中也应注重用户隐私问题。对于涉及隐私的疾病信息、个人信息等,不应通过语音播报,而应使用视觉模态进行信息输出。
以挂号功能为例,对话设计见图6。语音与图形相结合的多模态用户界面将会发挥出各自的优势,提高信息输入和输出的效率,优化产品的易用性与自然度。导医系统的多模态用户界面设计示例见图7。
图6 导医助手对话设计
图7 多模态用户界面设计
6 结语
本研究的目的是探索语音助手在导医场景中的人物模型与对话设计,通过实验研究,为未来的公共场合语音助手设计提供了参考:在交互程度上,用户更喜欢交互程度高、互动性强、贴心的导医语音助手;在音调上,用户更偏好女低音与男高音;在性别上,用户的偏好没有统计学差异;导医助手的拟人化程度与有效性、满意度正相关;根据实验结果,进一步完善了导医助手的形象、话术设计,使用多模态用户界面提升了导医助手的可用性与用户体验。
对于各类的智能语音助手设计,需要依据具体功能与应用场景进行考虑,不能一概而论。对于公共场合的语音助手,应平衡各类用户的需求,使语音助手的形象、话术更具普适性。
医疗领域在未来的发展不会仅仅停留在追求医治水准的进步上,还将致力于服务水平的提高。最新技术的融入会使就医服务更加人性化,逐渐解决患者在就诊流程上浪费过多时间的问题。随着未来科技的发展,语音交互将会结合人工智能的各项技术,提升自然度、真实性和交互效率,让用户的操作路径更短,系统更加智能。
[1] 刘鑫, 万振, 孙昕, 等. 基于信息化技术的智慧门诊发展现状[J]. 医疗装备, 2019, 32(15): 56-59.
LIU Xin, WAN Zhen, SUN Xin, et al. Development Status of Intelligent Outpatient Service Based on Information Technology[J]. Medical Equipment, 2019, 32(15): 56-59.
[2] 徐冬. 门诊导医机器人的应用及探索[J]. 医学信息, 2019, 32(1): 28-30.
XU Dong. Application and Exploration of Outpatient Medical Robot[J]. Medical Information, 2019, 32(1): 28-30.
[3] 刘红彦, 闻智. 智能导诊机器人在综合性医院门诊的应用[J]. 中国卫生产业, 2017, 14(26): 55-57.
LIU Hong-yan, WEN Zhi. Application of the Intelligent Guidance Robot in the Modern Comprehensive Hospital Outpatient Service[J]. China Health Industry, 2017, 14(26): 55-57.
[4] 张金慧, 徐慧雁. 智能导诊机器人在门诊患者就诊流程中的应用效果[J]. 名医, 2020(3): 279.
ZHANG Jin-hui, XU Hui-yan. Application Effect of Intelligent Guided Robot in Outpatient Consultation Process[J]. Renowned Doctor, 2020(3): 279.
[5] PORCHERON M, FISCHER J E, REEVES S, et al. Voice Interfaces in Everyday Life[C]//Proceedings of the 2018 CHI Conference on Human Factors in Computing Systems. New York: ACM, 2018: 1-12.
[6] LIAO Qing-lin, ZHANG Shan-shan, WANG Mei, et al. Comparing the User Preferences Towards Emotional Voice Interaction Applied on Different Devices: An Empirical Study[C]//Kurosu M. International Conference on Human-Computer Interaction. Cham: Springer, 2020: 209-220.
[7] COHEN M H, GIANGOLA J P, BALOGH J. Voice user interface design[M]. Boston: Addison-Wesley, 2004
[8] PEARL C. Designing voice user interfaces: principles of conversational experiences[M]. Sebastopol, CA: O’Reilly Media, 2016
[9] 孙妍彦, 李士岩, 陈宪涛. 情感化语音交互设计——百度AI用户体验部门人机交互研究地图与设计案例[J]. 装饰, 2019(11): 22-27.
SUN Yan-yan, LI Shi-yan, CHEN Xian-tao. Emotional Voice Interaction Design: Human Computer Interaction Research Map and Design Case of Baidu AI User Experience Department[J]. Art & Design, 2019(11): 22-27.
[10] 李璟璐, 孙效华, 郭炜炜. 基于智能交互的汽车主动响应式交互设计[J]. 图学学报, 2018, 39(4): 668-674.
LI Jing-lu, SUN Xiao-hua, GUO Wei-wei. Proactive HMI Design Based on Smart Interaction[J]. Journal of Graphics, 2018, 39(4): 668-674.
[11] NICULESCU A, VAN DIJK B, NIJHOLT A, et al. Making Social Robots more Attractive: The Effects of Voice Pitch, Humor and Empathy[J]. International Journal of Social Robotics, 2013, 5(2): 171-191.
[12] 王尔卓, 袁翔, 李士岩. 智能家居场景中会话智能体主动交互设计研究[J]. 图学学报, 2020, 41(4): 658-666.
WANG Er-zhuo, YUAN Xiang, LI Shi-yan. Proactive Interaction Design of Conversational Agent for Smart Homes[J]. Journal of Graphics, 2020, 41(4): 658-666.
[13] LUTFI S L, FERNÁNDEZ-MARTÍNEZ F, LORENZO- TRUEBA J, et al. I Feel You: The Design and Evaluation of a Domotic Affect-Sensitive Spoken Conversational Agent[J]. Sensors (Basel, Switzerland), 2013, 13(8): 10519-10538.
[14] TOLMEIJER S, ZIERAU N, JANSON A, et al. Female by Default? - Exploring the Effect of Voice Assistant Gender and Pitch on Trait and Trust Attribution[C]// CHI EA '21: Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems. Yokohama, Japan. New York: ACM, 2021: 1-7.
[15] SUTTON S J, FOULKES P, KIRK D, et al. Voice as a Design Material: Sociophonetic Inspired Design Strategies in Human-Computer Interaction[C]//Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems. Glasgow, Scotland Uk. New York: ACM, 2019: 1-14.
[16] APPLE W, STREETER L A, KRAUSS R M. Effects of Pitch and Speech Rate on Personal Attributions[J]. Journal of Personality and Social Psychology, 1979, 37(5): 715-727.
[17] COLLINS S A, MISSING C. Vocal and Visual Attractiveness are Related in Women[J]. Animal Behaviour, 2003, 65(5): 997-1004.
[18] RIDING D, LONSDALE D, BROWN B. The Effects of Average Fundamental Frequency and Variance of Fundamental Frequency on Male Vocal Attractiveness to Women[J]. Journal of Nonverbal Behavior, 2006, 30(2): 55-61.
[19] LEE E J, NASS C, BRAVE S. Can Computer-Generated Speech Have Gender? : An Experimental Test of Gender Stereotype[C]//CHI EA '00: CHI ’00 Extended Abstracts on Human Factors in Computing Systems. The Hague, The Netherlands. New York: ACM, 2000: 289-290.
[20] PAK R, MCLAUGHLIN A C, BASS B. A Multi-Level Analysis of the Effects of Age and Gender Stereotypes on Trust in Anthropomorphic Technology by Younger and Older Adults[J]. Ergonomics, 2014, 57(9): 1277-1289.
[21] COSTRICH N, FEINSTEIN J, KIDDER L, et al. When Stereotypes Hurt: Three Studies of Penalties for Sex- Role Reversals[J]. Journal of Experimental Social Psychology, 1975, 11(6): 520-530.
[22] YU Qian, NGUYEN T, PRAKKAMAKUL S, et al. "I almost Fell in Love with a Machine": Speaking with Computers Affects Self-Disclosure[C]//CHI EA '19: Extended Abstracts of the 2019 CHI Conference on Human Factors in Computing Systems. Glasgow, Scotland Uk. New York: ACM, 2019: 1-6.
[23] CHANG R C S, LU H P, YANG Pei-shan. Stereotypes or Golden Rules? Exploring Likable Voice Traits of Social Robots as Active Aging Companions for Tech-Savvy Baby Boomers in[J]. Computers in Human Behavior, 2018, 84: 194-210.
[24] HEILMAN M E. High School Students' Occupational Interest as a Function of Projected Sex Ratios in Male- Dominated Occupations[J]. Journal of Applied Psychology, 1979, 64(3): 275-279.
[25] SHIOMI M, KANDA T, ISHIGURO H, et al. Interactive Humanoid Robots for a Science Museum[C]//IEEE Intelligent Systems. IEEE, 2007: 25-32.
[26] RAMÍREZ O A I, KHAMBHAITA H, CHATILA R, et al. Robots Learning how and where to Approach People [C]//2016 25th IEEE International Symposium on Robot and Human Interactive Communication (RO-MAN). New York, NY, USA. IEEE, 2016: 347-353.
[27] HAYASHI K, SAKAMOTO D, KANDA T, et al. Humanoid Robots as a Passive-Social Medium: A Field Experiment at a Train Station[C]//Proceedings of the ACM/IEEE international conference on Human-robot interaction. Arlington, Virginia, USA. New York: ACM, 2007: 137-144.
[28] PAN Ya-dong, OKADA H, UCHIYAMA T, et al. On the Reaction to Robot’s Speech in a Hotel Public Space [J]. International Journal of Social Robotics, 2015, 7(5): 911-920.
[29] CHEN Ying-feng, WU Feng, SHUAI Wei, et al. Robots Serve Humans in Public Places—Robot as a Shopping Assistant[J]. International Journal of Advanced Robotic Systems, 2017, 14(3): 172988141770356.
[30] 曹国忠, 苏建华, 杜雪清, 等. 基于用户体验的导医机器人设计研究[J]. 艺术与设计(理论), 2019(S1): 99-101.
CAO Guo-zhong, SU Jian-hua, DU Xue-qing, et al. Research on the Design of Guided Robot Based on User Experience[J]. Art and Design, 2019(S1): 99-101.
[31] MUBIN O, AHMAD M I, KAUR S, et al. Social Robots in Public Spaces: A Meta-review[C]//International Conference on Social Robotics. Cham: Springer, 2018: 213-220.
[32] THUNBERG S, ZIEMKE T. Are People Ready for Social Robots in Public Spaces? [C]//HRI '20: Companion of the 2020 ACM/IEEE International Conference on Human-Robot Interaction. Cambridge, United Kingdom. New York: ACM, 2020: 482-484.
[33] TIAN Lei-min, CARRENO-MEDRANO P, SUMARTOJO S, et al. User Expectations of Robots in Public Spaces: A Co-design Methodology[C]//International Conference on Social Robotics. Cham: Springer, 2020: 259-270.
[34] STEINFELD A, JENKINS O C, SCASSELLATI B. The Oz of Wizard: Simulating the Human for Interaction Research[C]//2009 4th ACM/IEEE International Conference on Human-Robot Interaction (HRI). La Jolla, CA, USA. IEEE, 2012: 101-107.
[35] GRICE H P. Logic and Conversation[M]//Speech Acts. New York: Brill, 1975: 41-58.
[36] 廖青林, 王玫, 冯战. 基于情感交互的智能家居产品语音交互设计[J]. 包装工程, 2019, 40(16): 37-42, 66.
LIAO Qing-lin, WANG Mei, FENG Zhan. Voice Interaction Design of Smart Home Products Based on Emotional Interaction[J]. Packaging Engineering, 2019, 40(16): 37-42, 66.
[37] TOM T, BILL A. 用户体验度量收集、分析与呈现(第二版)[M]. 北京: 电子工业出版社, 2018.
TOM T, BILL A. Measuring the User Experience: Collecting, Analyzing, and Presenting Usability Merics (Second Edition)[M]. Beijing: Publishing House of Electronics Industry, 2018.
[38] HONE K S, GRAHAM R. Towards a Tool for the Subjective Assessment of Speech System Interfaces (SASSI)[J]. Natural Language Engineering, 2000, 6(3-4): 287-303.
[39] 罗杰, 戴晓阳. 中文形容词大五人格量表的初步编制Ⅰ: 理论框架与测验信度[J]. 中国临床心理学杂志, 2015, 23(3): 381-385.
LUO Jie, DAI Xiao-yang. Development of the Chinese Adjectives Scale of Big-Five Factor PersonalityⅠ: Theoretical Framework and Assessment Reliability[J]. Chinese Journal of Clinical Psychology, 2015, 23(3): 381-385.
Voice Interaction Design of Outpatient Service Assistants Based on User Measurement
FANG Xin-yue, WANG Mei, LIU Xi-xi, ZHENG Xin-yi, WANG Xin-rong, DENG Xue-mei
(Sichuan University, Chengdu 610065, China)
The work aims to explore the effects of interaction level, pitch and gender on perceived anthropomorphism, usefulness, and satisfaction of the outpatient service assistant to guide the image and speech design of voice assistants in outpatient service scenarios and more public places. Twelve participants performed conversation tasks with voice assistants of different interaction level, pitch and gender in simulated outpatient service scenarios. Experiments were carried out by Wizard of Oz technique. A seven-point Likert scale was used to obtain ratings of perceived anthropomorphism, usefulness, satisfaction, and interviews were conducted. The results were analyzed by Friedman test, Wilcoxon signed rank test, and least square regression to explore users' preferences on image and speech of outpatient service assistants. Finally, according to the research results, the design of a multi-modal user interface of the outpatient service system was carried out. The results showed that in the outpatient service scenarios, users preferred outpatient service assistants with high interaction level. In terms of pitch, low-pitched female voice and high-pitched male voice were rated higher. Yet, there was no significant difference in the user's gender preferences. Satisfaction increased with the increase of perceived anthropomorphism. For voice interaction design in public places, all kinds of users should be considered to design the voice assistant that can be accepted by most users, thus taking advantage of the multi-modal user interface.
outpatient service assistance; voice interaction design; voice assistants; voice user interface; multi-modal; user measurement; user experience
TB472
A
1001-3563(2023)04-0132-09
10.19554/j.cnki.1001-3563.2023.04.016
2022–09–10
基于互联网+的康复监测平台及服务系统研究(2019CDYB-4)
方馨悦(1998—),女,硕士生,主攻人机交互、多模态设计、用户体验。
王玫(1968—),女,教授,主要研究方向为计算机辅助制造。
责任编辑:马梦遥