基于活动理论的听障骑手AI语音交互产品设计
2023-05-27王翀周龙飞张祖耀
王翀 周龙飞 张祖耀
关键词:活动理论 AI语音交互 听障骑手 参与式设计 App设计
引言
目前,我国听障人群就业情况并不乐观,截止2021年底,我国听说障碍人群将达到2780万人次,已经实现就业人数819万,就业率仅达到听障人群总人数的30%,剩余的大部分听说障碍人士仍处于无业或者失业的状态。这类人群的就业率低,很大程度上是因为沟通交流带来的问题。随着消费的升级,社会群体对外卖配送服务的需求不断增加,越来越多的听障人士加入到“外卖骑手”的行业中。但现有的外卖配送App使用逻辑对于听障骑手并不友好,严重影响了他们的配送效率。文章通过基于活动理论的AI语音交互产品设计模型构建,将AI语音技术引入到外卖配送App设计中,通过整合新兴技术并关联实际运用场景的方式解决社会问题[1]。并采用协同参与的设计方式来确保用户需求的真实性和完整性,为听障骑手优化配送流程,提高沟通效率,改善他们的就业环境和条件。
一、AI语音技术与应用趋势
随着信息化时代的不断发展,智能化技术和大数据分析成为了时代的焦点,AI语音技术也应运而生。2018年,Google创造了AI电话Duplex,此后AI语音技术的商业价值开始迅速发展[2]。通过语音识别(ASR)、语音合成(TTS)和自然语音处理(NLP)这三大AI语音技术,依托语音信号处理、深度学习、模式识别等手段来实现人机沟通和信息传递。目前,社会的运作方式已经被人工智能技术所改变,并且渗透到了各行各业之中,给社会带来了前所未有的变革[3]。AI语音技术也已经广泛地运用在社会中,提高了生活和工作的效率。尤其是针对听障人群,为他们的沟通交流带来了新的可能性。
(一)技术构成,文章在设计实践中主要运用到的AI语音技术。
1.语音识别技术(ASR)。即将机器理解和识别的人类的声音并转化为文字的过程,是语音交互中最基础的一个AI技术环节,一般包含4个基本流程:语音输入、编码、解码、文本输出,如图1。语音识别大体可分为两种识别方式,一种是“传统”识别方式,其声学模型一般采用混合高斯隐形马尔科夫模型;而另一种是采用深度神经网络的“端对端”识别方式。目前语音识别技术已经广泛运用于人于机器、人与人之间的交流和沟通,大大提高了特殊场合的沟通效率。
2.语音合成技术(TTS)。即将文本信息转化成语音的技术,其基本流程有4个环节:文本语言处理、韵律处理、发声单元拼接、语音输出,如图2。在20世纪初,科学家开始使用简单的语音单元来建立语音库,使用电子器件来模拟人发声的技术。20世纪末,随着集成电路的发展,出现了相对复杂的电子发声器,开始使用存放真人语音样本的语音库,通过适合的语音拼接来提高语音合成的输出质量。与此同时,基于统计建模和机器学习的HMM参数合成方法得到普及。随着AI技术的发展,基于深度学习神经网络的语音合成技术逐渐成为该领域的核心,深度学习的算法也可以更好地模仿人声变化的规律,使AI坐席语音更加真实。
(二)应用案例和趋势。现阶段,AI语音技术已经开始利用自身的优点逐渐优化听障人群的日常生活。音书App是一款为听障人群打造的沟通交流软件,无障碍沟通和语音训练是其主要的两大功能。通过语言识别技术(ASR)将4米以内的语音信息转化为文字,改善听障人群之间的沟通。在语音训练中,利用AI智能测评技术对听障人群的语言发音进行打分,来提升该人群的普通话水平,提高了与健听人群之间的沟通效率。但是在特殊的工作环境中,常规的听障沟通软件并不能满足工作的需求,近年来,听障人群的就业问题引起了社会极大的关注,在解决就业问题的同时,如何提高该群体的工作效率、降低他们的工作成本成为了当下新起的课题。
二、基于活动理论的AI语音交互产品设计模型构建
随着社会整体的消费升级和形态的变化,新兴产业的不断涌现催生了新的设计对象,设计者需要将不同领域的知识进行交叉融合进行再设计[4]。在外卖行业中,听障人士的加入引发了外卖配送App与他们之间的不兼容性问题,这种问题的出现是因为设计者在设计相关产品的同时,没有将听障人群视为可能的使用对象而导致的[5]。由于听力上的障碍,这类骑手不能像普通骑手一样通过接打电话的方式进行沟通和交流。在这种情况下,基于用户协作和用户需求的设计就显得格为重要。
(一)理论基础。活动理论(Activity Theory)强调人作為主体在事物发展过程中所具备的动力和目的性,并认识到工具和规则在人类活动中起到的桥梁作用[6~7]。人的活动和意识是辩证统一的整体,外部活动促进了意识认知的发展。在活动理论中,活动是最基础的分析单元,活动系统由三个主要成分和三个次要成分构成,主要成分包括主体、客体和共同体,次要成分包括工具、规则和劳动分工,主要成分之间的联系又由次要成分构成,它们的关系如图3所示。
(二)基于活动理论的AI语音交互产品设计模型。活动理论系统地将个体、工具和社会性形式整合成一个统一的整体,彼此之间都产生了紧密的联系[8]。文章提出的AI语音交互产品设计模型是在活动理论的基础上根据AI语音交互活动中可能涉及到的构成要素进行分析得出的,如图4。该模型中涉及的主体既是AI语音技术的需求者和产品使用者,在模型中简称为用户,他们是AI语音交互活动的主体,是整个活动的核心部分。客体是需要使用AI语音技术达成的目标,在对主体的需求进行分析后得到。共同体是设计者,设计者根据主体用户的需求结合AI语音技术设计出可以达到客体目标的产品,在整个模型中起到了主导作用,协调各元素之间的关系。规则是AI语音技术需求,建立在用户和设计者之间,用于给设计者的设计做出引导,以便设计出更完善的产品来提供给用户使用。工具是AI语音技术,通过关键功能的使用帮助用户达到客体的目标。劳动分工由AI语音技术载体来替代,载体是指搭载AI语音技术的输出平台,帮助用户完成交互的任务。设计者会根据用户的实际需求和目标来选择合适的AI语音技术载体。
在活动理论中,每个构成活动的要素之间都存在着紧密的联系,在AI语音交互产品设计模型中也同样适用,并影响着设计活动的先后顺序。首先是交换系统,在用户、设计者和AI语音技术需求之间形成,用户可以在这个系统中将自己的需求传递给设计者,设计者也可以通过相关定性研究来获取有价值的信息。这些需求和信息构成了AI语音交互产品设计模型中的规则成分,为设计者的设计提供方向。其次是生产系统,在用户、目标和AI语音技术之间形成,结合AI语音技术的使用,根据用户的目标生成合适的使用逻辑。然后是输出系统,在设计者、目标和AI语音技术载体之间形成,设计者会根据用户的目标和使用逻辑输出设计方案,并且寻找合适的AI语音技术载体。最后是循环系统,在用户、设计者和目标之间形成,基于用户目标的设计产出是一个循环完善的过程,在这个过程中,往往伴随着用户的体验和反馈,这就需要设计者不断对产品进行优化迭代,按顺序持续地进行其他三个系统的研究。并且在这个过程中,用户可以学习和内化AI语音产品使用方式和逻辑。
AI语音技术的出现为特殊人群的沟通和交流提供了更多的可能性,通过活动理论建立AI语音交互产品设计模型可以为AI语音产品的开发提供更好的依据,让用户充分参与到产品的设计中,提高AI语音交互产品设计的针对性和满意度。
三、基于活动理论的AI语音交互产品设计实践
在本次设计实践中,将为听障骑手设计一款更高效的外卖配送App。将上文中提出的AI语音交互产品设计模型作为设计实践的基础,把设计活动中出现的相关者填入到模型框架中。用户是听障骑手,目标是解决听障骑手在配送过程中缺乏有效沟通所带来的问题,设计者是App设计师,这三者构成了模型的主要成分,AI语音技术、AI语音技术需求以及AI语音技术载体构成了模型的次要成分来辅助产品设计的完成。
(一)基于交换系统的需求和痛点分析。通过构建用户旅程地图的方式对听障骑手的配送流程进行分析,该方法是一种以用户为中心,完整呈现行为过程中用户与服务、系统之间交互关系的可视化工具[9]。在这个过程中,听障骑手将自己的行为信息传递给设计者,设计者再对行为信息进行整理和分析,最终总结出用户的痛点以及需求。为确保用户需求的真实性,实验联系到了一个听力障碍骑手团队,该团队有1位听障骑手调度人员以及12名听力障碍骑手。在前期准备的过程中,对调度者以及每一位骑手进行了访谈,了解他们的工作流程、学习习惯以及工作状态,深入了解了本项实验的目标人群,发掘他们的实际需求。图5是根据前期调研总结出的听力障碍骑手的用户旅程地图。
用户旅程地图对听障骑手完成订单的完整流程进行了描述,根据对用户行为和用户情绪的记录,分析总结出了以下用户需求和痛点:在订单筛选阶段,用户需要快速掌握订单信息,但平台的App筛选订单的效率低下;在抢单阶段,听障骑手与商家之间存在着沟通障碍;在提醒取货阶段,骑手需要与顾客进行沟通,听力障碍的特殊性导致了沟通成本的增加,用户希望做到和顾客之间的无障碍交流;在取餐对接阶段,可能存在信息传达不及时以及无法精准表达的问题,严重影响骑手的配送效率。
传统的外卖配送App已经不能满足听障骑手的配送需求。随着越来越多的听障人士加入到外卖配送这个行业中,传统的外卖配送App缺乏针对性的优化,对于听障人群十分不友好,导致他们在外卖配送过程中的沟通成本远高于普通的外卖骑手,严重影响了外卖配送的效率。从上文中的用户旅程地图分析可以得出,缺乏有效沟通的问题贯穿了听障骑手的整个配送流程。因此,在主体和场景研究的基础上,提出了一套高效沟通的解决方案。以移动设备为载体,移动应用程序作为信息传递的工具,结合AI语音技术的支持,为听障骑手开拓新的沟通交流方式,目的在于降低沟通成本,提高沟通效率,改善就业环境和条件。
(二)基于生产系统的App使用逻辑挖掘和交互功能研究。
1.App使用逻辑的挖掘。根据前期调研中对听障骑手和普通骑手使用外卖配送App的情况进行对比,发现两者之间的使用逻辑最大的区别在于与顾客对接的阶段。普通骑手在取餐对接时,可以通过拨打电话的方式与顾客进行沟通,而听障骑手只能通过短信编辑的方式来与顾客完成对接,这种方式容易被顾客忽略,时效性低,在遇到困难时需要中间协调者的帮助,时间成本消耗大,沟通效率低,严重影响了外卖配送的效率。为此,根据前文中所提出的用户需求和用户目标,为听障骑手提供新的交互方式,注重沟通功能的设计,降低骑手的时间成本和学习成本,用精简的沟通方式连接骑手和顾客。基于前期的调研访谈分析和外卖骑手的工作特性,在避免增加学习成本的前提下,结合听障骑手使用应用程序的习惯,设计了一套涵盖大部分配送场景的沟通逻辑框架,如图6。将AI语音技术融入到整个配送流程当中,对听障骑手与外卖配送App之间的交互进行优化,满足用户对高效沟通的需求。
2.App交互功能的研究。AI语音交互功能的加入是App优化的核心,以AI语音技术为基础构建沟通逻辑,通过在线抢单、路线导航等常见交互功能的加入,完成对外卖配送App的优化,详细交互功能框架见图7。在接单阶段,听障骑手可以通过首页的抢单页面进行订单的筛选,之后便进入了每个订单的配送环节。在取餐阶段,听障骑手可以通过App的路线引导功能到达指定商家完成取餐,同时在商家详情页下方设置了众智寻店的功能,有经验的骑手可以通过评论分享寻找店家的经验,为新手提供配送线路上的引导,如提供照片、视频、地标文字描述,持续地帮助听障骑手在不需要与商家、顾客进行复杂沟通的情况下,进行快速高效的寻店以及送餐,完成骑手与骑手之间的互动,提高了送餐效率,减少误单。在送餐阶段,当听障骑手需要拨打电话时,可以在消息中心找到相应的顾客,通过文本输入的方式表达自己想要传递的信息,依托语音合成技术(TTS)开启语音转达,App会通过语音通话功能给顾客拨打电话,将骑手输入的文本信息转化成语音来告知顾客。语音拨打电话的方式更加直接且时效性高,在不需要中间协调者的情况下听障骑手也可以独立地完成配送任务,降低了工作成本,提高与顾客之间的沟通效率。在有电话呼入时,接通的电话会直接进入AI坐席的服务环节,对通话过程中的语义进行分析,再通过语音识别技术(ASR)将呼入的电话转化为文本,帮助听障骑手及时了解到顾客的需求。App还具备了快捷语音的功能,听障骑手可以提前编辑好常用的沟通模版,在需要向顾客传达信息时一键发送开启语音转达,节省不必要的文本编辑时间,提高外卖配送的效率。优化后的外卖配送交互流程见图8。
(三)基于输出系统的视觉设计研究。在原有App的基础上,将订单配送界面的信息解构简化,并且根据实际的配送流程,重新为听力障碍骑手设计基于Neuomorphism新擬物风格的UI界面。但由于该风格的界面设计缺乏对比度,不利于对听障骑士的下一步操作进行引导,所以在设计实践中通过对整体页面的扁平化设计和统一主色调的方式,提升了App界面的可读性,如图9。目的在于简化听障骑手的配送流程,去除中间的协调者,使听障骑手可以与普通骑手一样独立完成一系列的配送任务。
(四)基于循环系统的评估和反馈。循环系统是AI语音交互产品设计模型的核心部分,在该系统中,用户可以对产品的使用体验进行反馈,帮助设计者对产品进行优化和迭代,形成一个良好的设计循环。实验联系到了上文中提到的南京听力障碍骑士团队,邀请了其中5位听力障碍骑手进行了测试和评估。使用控制变量法进行研究,让5位听力障碍骑手分别使用原生的外卖配送App和上文中提出的外卖配送App进行模拟送餐实验,并采用参与式观察的方式对用户的行为进行记录,对听力障碍骑手完成每一阶段的动作数量和完成时间进行对比。最后通过里克特量表得到使用体验的反馈并进行总结。
以上4个系统组成了AI语音交互产品设计的一整套流程,从听障骑手的需求挖掘到交互功能的输出,再通过用户的使用体验反馈对App进行评估和优化,最终得到适合听障骑手使用的外卖配送App。注重听障骑手与App之间交互的流畅性,通过引入AI语音技术提高了交互效率,达到了与顾客之间无障碍沟通的目的。
结论
在智能时代,听障人群的需求具有特殊性,就现外卖行业而言,针对听障骑手的需求,外卖平台并没有对外卖配送App进行优化和改善。文章从听障骑手缺乏有效沟通的问题入手,结合活动理论和AI语音技术,提出了AI语音交互产品设计模型,对外卖配送App进行了针对性的优化,通过AI语音交互的方式提高了沟通效率,一定程度上保证了骑手与商家、骑手与顾客之间的无障碍沟通。同时对App的界面进行了简化,在不增加学习成本的前提下为听障骑手提供了更高效的使用引导。除了基于听障骑手需求的外卖配送App设计导向之外,用户的使用体验也是一个不能忽视的方面,基于循环系统的用户评估和反馈将是后续研究的重要内容。