手机智能语音交互功能调查及对策*
2019-07-20梁永强李培林
梁永强 ,李培林 ,王 崴 ,瞿 珏 ,2
(1.空军工程大学,西安 710051;2.西北工业大学,西安 710072)
0 引言
随着技术的进步,人与计算机的交互界面从最初的命令行发展到窗口图形界面,再到触摸屏,以及如今正蓬勃发展的融合触、听、视觉的多通道人机交互模式[1],人机交互的方式变得越来越人性化。伴随着智能手机的普及,人与手机之间的交互方式也越来越受到各大生产厂家的关注,如今的消费者早已不能满足于触屏按键式的单一交互方式[2]。苹果公司推出Siri,引发了手机装载智能语音系统的热潮,随后Google在Android平台上推出了Google Now,微软也将语音技术应用于Windows Phone系统,在国内,科大讯飞推出讯飞语音输入,百度搜狗等公司推出语音助手[3],各大手机厂商纷纷将智能语音技术应用于自己的产品。
如今,手机使用已成为人们日常生活中不可或缺的一部分,传统的触屏按键式交互方式不仅有损于人的视力、颈椎健康[4],而且长期视觉单通道交互方式对人的心理健康也非常不利[5],从心理学和工效学的角度分析,传统的人与手机交互方式造成了较大程度的“生理资源”不平衡,一方面“视觉资源”用到了极限,另一方面“听觉资源”并没有得到充分利用[6]。
语音交互是最为自然、便捷、高效的人机交互方式,它使人机界面同时具备了“听”和“说”能力,为目前的交互设计带来了广度和深度上的扩展[7]。2016年4月发布的《2015中国智能语音产业发展白皮书》[8]指出,智能语音应用需求不断扩大,以大数据、云计算、移动互联网等关键技术为基础的智能语音产业迅速发展,2015年,全球智能语音产业规模达到了61.2亿美元,较2014年增长34.2%。其中中国智能语音产业规模达到40.3亿元,较2014年增长41.0%。预计在未来较长一段时间内,智能语音产业将得到进一步的发展和扩大。
然而,由于技术的限制和用户使用习惯的固化,语音交互并未得到人们的有效利用,智能语音产业也面临着诸如“非交互刚性需求”、“只是其他智能产品中间件”、“语音信息安全隐患”等等困惑与迷局[9-10]。对于智能语音交互,目前绝大多数的研究都集中在语音识别、语音合成、语义理解等功能“可用性”技术层面,对于智能语音交互中的便捷性和满意度等“易用性”指标方面研究很少,本文通过问卷调查的方式分析研究用户智能语音交互功能的使用状况,对于当前手机语音交互技术的评价和改进均有重要的意义。
1 问卷设计与方案实施
1.1 问卷设计
本次调查采用自主设计的《手机智能语音交互功能使用状况调查》问卷。主要包括5个部分共计21道题目。其中第1部分是个人基本信息,具体包括性别、年龄、学历、职业和性格类型。第2部分是关于用户智能语音交互功能需求的调查,该部分参考蓝戈智库调查团队的《中国智能语音手机市场调查》中有关市场潜力方面的问卷题目设计,主要用于调查用户在生活场景中是否存在传统触摸按键式交互不便解决的问题。第3部分是关于用户对智能语音功能的掌控程度,具体是指用户对目前手机中存在的语音功能的了解程度和使用情况。第4部分用于调查用户眼中智能语音交互优势不足。最后一部分则是用于收集用户对于智能语音交互的改进建议。
1.2 方案实施
本次调查采用电子问卷和纸质问卷两种方式,其中电子问卷发布在专业“问卷网”上并通过微博、朋友圈、人人网等社交媒介进行广泛传播,发布时间为一个月,共收集到有效问卷688份。纸质问卷主要面向在校大学生、研究生进行,通过研究者现场指导填写、当场逐份回收的方式进行,共发布500份,收集到有效问卷427份。有效问卷数量为1 115份。
2 调查结果及分析
2.1 基本信息
表1 个人基本信息比例分布
从统计结果可知,调查样本中男女比例基本一样,符合现实情况。可以看出,18岁~34岁年龄段占被调查总人数的87.1%,事实上这个年龄段正是手机使用的主力军。本科学历的被调查人员占总人数的73.6%,职业方面学生占49.3%,性格类型中内向型和外向型所占比例差别不大。分析认为,本科学历大学生群体思想活跃,调查这部分人关于智能语音交互功能的现状对于本研究很有意义,综上所述,本次获取的调查样本符合研究需求。
2.2 功能需求
问题:您在日常生活中使用手机时是否遇到如下问题?
图1 智能语音功能需求比例分布
调查中提到的6种人们日常生活遇到的情景均可以反映出传统触摸按键式手机交互的劣势,每一种情景的调查结果均反映出绝大多数(超过70%)的手机用户都面临着手机传统交互方式带来的不便,尤其是“多人自拍合影,不方便按键拍照”和“大量文字录入,触摸按键感到疲乏”两项,功能需求人数都超过了90%。上述调查结果反映了现实中绝大多数手机用户对于智能语音交互功能需求是存在的,手机智能语音功能市场潜力很大。
2.3 掌控程度
问题1:请问您知道智能语音手机可以解决上一题中提到的问题吗?
图2 智能语音功能掌控程度比例分布
从图2的调查结果可知,301人(27.0%)知道并且正在使用手机智能语音功能,可以看出手机语音功能的普及率比较低,425人(38.1%)表示用过手机智能语音功能但不尽人意,这反映出手机语音交互在用户体验方面存在很大改善空间,121人(10.9%)不知道手机有智能语音功能,考虑这部分人可能是中老年用户,对手机的新功能尝试较少,说明手机智能语音功能存在宣传的必要性。仅有36人(3.2%)对语音功能不知道也不感兴趣,这也说明绝大多数手机用户对智能语音功能抱有使用期望。
问题2:请问您对手机智能语音的以下功能使用情况是?
图3 智能语音功能掌控程度比例分布
图3 是针对用户了解和掌握手机智能语音具体功能的调查统计结果,反映的事实与图2的数据总体一致,这也说明本次问卷调查结果是比较可靠的。对于实现上述手机操作,通过测试可知语音交互比传统触摸按键交互更加高效,但许多人几乎不使用语音这项功能,这是值得设计人员和研究人员思考的问题。
2.4 优势不足
问题1:您觉得手机智能语音交互相对于传统触摸按键交互方式有哪些优势?
图4 智能语音功能优势比例分布
图4 的统计结果可以看出,670人(60.1%)认为相对于传统触摸按键交互,智能语音交互的优势是“解放双手,方便快捷”,这是语音交互最直观的体现,也是用户对智能语音功能最迫切的期望点,分别有445人(39.9%)认为智能语音交互的优势是“自然高效”和“满足特定场景操作需求”,前者体现了语音交互的易用性,后者则体现了智能语音功能的实用性,尤其是后者可以切实解决用户的现实问题,应该加以改进并适当宣传,真正使之在手机用户中得以普及推广。另外还有338人(30.3%)认为智能语音功能拥有“个性化情感体验”的优势,调查过程中通过访谈,部分受访者认为“长期使用触摸按键操作手机使人的语言表达能力下降,严重的将导致用户的心理出现问题”,而智能语音交互方式在一定程度上可以弥补这一缺陷,使人机交互更加人性化。
问题2:请问您认为手机语音交互主要存在哪些问题?
图5 智能语音功能优势不足比例分布
从图5的统计结果可以看出,875人(78.5%)认为“手机智能语音交互操作过于繁琐,界面不友好”,以某国产智能手机为例,每次使用手机语音功能前都需要“解锁手机,打开语音助手应用,长按话筒图符,然后对着手机说话”,此过程可能出现由于用户手没有按到图符准确位置导致语音输入无效的问题,从而使用户失去耐心,放弃使用语音功能,转而使用更为习惯并且有效的传统交互方式。并且上述操作过程确实比较繁琐,不符合语音交互的自然高效。589人(52.8%)表示“习惯使用传统触摸按键操作方式,无需改变”,手机触摸屏按键交互经过多年发展已逐渐深入人心,虽然在使用过程中有时可能会遇到不便,但基本都在用户可接受范围之内。478(42.9%)人认为“手机语音功能的语义理解能力差”,458人(41.1%)则认为“手机语音识别准确度低”,语音识别和语义理解是语音交互技术的核心,笔者及相关研究人员测试发现,目前手机在语音识别普通话方面的准确度高达99%以上,之所以有部分用户认为语音识别准确度低,主要与用户自身普通话水平、语腔语调及所处环境的噪声因素有关。247人(22.1%)觉得“对着手机说话,感觉很傻”,分析问卷发现这部分人性格类型大多属于内向型。204人(18.3%)则表示“不了解手机语音交互操作”,这与本文前面的结果是相一致的。
2.5 改进建议
问题1:您觉得未来手机语音交互会取代传统触摸按键交互成为主流吗?图6(左图)。
问题2:若语音交互不断改进,相对于触摸按键你更愿意选择语音交互操作吗?图6(右图)。
图6 智能语音功能使用期望比例分布
图6 结果显示,783人(70.2%)认为未来手机语音交互会取代传统触摸按键交互成为主流,144人(12.9%)则持否定态度,若语音交互不断改进,相对于触摸按键645人(57.8%)更愿意选择语音交互操作,206人(18.5%)表示不会。可以看出绝大多数人对于手机智能语音交互的前景持积极态度,也更愿意选择语音交互方式。
问题3:您觉得手机语音交互功能最需要在哪方面加以改进?
图7 智能语音功能改进建议比例分布
针对具体改进建议,432人(38.7%)认为手机语音交互功能最需要在“更友好的操作界面”方面加以改进,有294人(23.6%)认为最需要改进的是“更智能的语义理解能力”,188人(16.9%)认为是“更快捷的操作流程”,150人(13.4%)觉得是“更准确的语音识别能力。
问题4:如果可以,请写下您认为手机智能语音交互方面存在的问题,以及提出改进建议?
考虑到本次调查问卷难免有疏漏之处,问卷最后一道题目用于收集用户建议,经笔者和相关研究人员整理讨论,选取部分有代表性的意见和建议列举如下页表2。
2.6 结果分析
2.6.1 用户特征对手机智能语音功能需求的影响
为进一步探讨用户特征对手机智能语音功能需求的影响,本文将问卷调查结果进行数字量化,对应“功能需求”6个题项的问题答案“是”和“否”的映射规则为:(是=1,否=0),因此,功能需求单个样本分值范围为(0,6)。针对性别、年龄、职业、学历以及性格特征随机选取一定数量的相同样本数进行方差分析,考虑到年龄为17岁以下和50岁以上的调查样本过少,在年龄特征差异性分析中排除这两项,事实上,17岁以下正处于初级教育阶段,使用手机机会较少,而50岁以上用户对于手机功能需求显然与其他年龄段用户存在显著差异,针对这一特殊群体相关研究文献也很多。另外由于调查样本学历为本科的占73.6%,故对用户的学历因素也不进行方差分析。
表2 用户意见和建议统计
表3 用户特征对功能需求差异性
分析表3数据结果可以看出,性别因素(F=0.694,P=0.406)和职业因素(F=0.500,P=0.735)对语音功能需求的差异性不显著,而年龄因素(F=2.275,P=0.034)、性格因素(F=6.538,P=0.011)对语音功能需求的差异性显著。可以看出年龄为26岁~34岁的用户(均值为4.943)的需求明显大于年龄为17岁~25岁(均值为4.585),分析原因可能是由于前者日常生活更丰富(如驾车、洗衣做饭等),对语音功能的需求场合更多。此外,性格为外向型(均值为4.842)比内向型(均值为4.465)对语音功能的需求更高。
2.6.2 用户特征对手机智能语音掌控程度的影响
对应“掌控程度”题项的6个问题答案量化规则为:(知道,正在使用=5、知道,偶尔使用=4、知道,几乎不用=3、用过,不尽人意=2、不知道,如果可以会考虑使用=1、不知道,也不感兴趣=0),因此,功能需求单个样本分值范围为(0,5)。具体数据统计分析结果见表4。
表4 用户特征对掌控程度差异性
分析表4数据结果可以看出,性别因素(F=6.554,P=0.719)对语音功能掌控程度的差异性不显著,而年龄因素(F=0.934,P=0.036)、职业因素(F=4.242,P=0.004)、性格因素(F=3.896,P=0.013)对语音功能掌控程度的差异性显著,其中年龄为17岁~25岁、职业为学生以及外向型性格的用户对语音功能的掌控程度明显高于其他特征的手机用户,原因可能是这部分人思想活跃,易于尝试和接受新鲜事物,具有较强的学习能力。
2.6.3 手机智能语音不同功能使用差异性分析
对应问题“您对手机智能语音的以下功能使用情况是?”答案量化规则为:(经常使用=3偶尔使用=2几乎不用=1不知道有这项功能=0),一种功能单个样本分值范围为(0,3),对10种不同语音功能的差异性进行分析,再将10种功能分为“生活帮助”、“休闲娱乐”、“调侃交流”3类,对比3类功能的差异性。具体数据统计分析结果见表5。
表5 不同功能使用差异性
可以看出,用户对10种常见语音功能的使用情况差异性非常明显,将10种功能分为3类后,依旧表现出明显的差异性,其中“生活帮助”方面的语音功能(均值为1.741)使用情况得分最高,“休闲娱乐”(均值为 1.404)其次,“调侃交流”(均值为1.129)得分最低。
3 结论
1)手机智能语音功能市场潜力大,但需引导用户转变使用习惯
问卷调查结果及数据分析显示,日常使用手机的过程中,用户普遍都遇到传统触摸按键交互不便解决的问题,导致用户手机体验满意度下降。由于受操作习惯的影响,虽然很多用户都了解语音交互可以满足手机在特殊场合的操作需求,但很少有用户去尝试。用户对手机语音功能缺乏了解,更没有认识到手机语音交互潜在的巨大操作便捷性,因此,需要商家进行宣传引导。此外,可以考虑结合自适应界面方式,通过上下文感知用户操作意图,适时提示和引导用户使用语音交互。
2)用户对智能语音功能关注度高,但使用率低
语音交互是最自然的人机交互方式,从人机界面设计的角度讲,使用语音交互有两个直接的优点,一是语言比键盘输入快且有效;二是在多通道任务情景中提供了另一附加的反应通道,使手可以腾出来做其他事[11]。相对于传统的手机交互方式,语音交互是一种个性化的操作体验,因此,普遍受到用户关注,然而用户体验满意度低和语音功能的可替代性导致其使用率低,相对于传统触控操作,语音交互在操作步骤、反应时间等人机交互效率方面并无明显优势,这是用户放弃使用语音功能的一个重要原因。
3)智能语音功能易用性差,改进空间大
如今的手机语音功能更多体现的设计理念是实用性和娱乐性,与真正意义的语音交互还有一定差距,技术的限制使手机语音一度成为“鸡肋功能”。手机语音交互要想真正得以推广,成为下一代主流人机交互方式关键要解决其易用性问题,首先是语音识别对用户的语言水平要求要更加宽松,语义理解更加智能,并且具有一定的学习能力。其次操作要更加便捷,能正确把握用户的操作意图,减少甚至不用辅助触摸按键,操作更加自然和人性化。