人工智能在电视人机交互中的应用及相关分析
2023-01-14王虓成斌
王虓,成斌
(广州南方学院,广东广州,510970)
0 引言
人工智能技术作为现代技术的集大成者,其可以说是近年来最受关注的新技术之一,并且逐渐在各个领域得到了有效应用。尤其是随着万物互联时代、5G时代的到来,人工智能技术得以在无人驾驶汽车、人脸识别、机器翻译、声纹识别、智能客服机器人、智能外呼机器人、智能音箱、个性化推荐、医学图像处理、图像搜索等方面得到不同程度应用,为人们的生活与工作带来了巨大便捷,也推动着现代智慧社会建设进程的逐步推进。人工智能技术在电视上的应用,使得电视功能更加强大,能够实现语音操作、学习用户使用及搜索习惯、人性化推荐用户喜好内容等功能,带给用户前所未有的良好体验。其中人机交互是影响和决定用户体验的关键,也是人工智能技术应用效果的体现,有必要围绕其展开研究和探讨。
1 人工智能在电视人机交互中的实践方式
随着人工智能电视的快速发展,智能化人机交互已经成为消费者选择电视产品的重要因素。消费者往往十分关注个性化的交互能力,着重挑选电视搭载的实力雄厚、技术先进的AI语音系统,而且强调交互的便携性。对人工智能在电视人机交互中的实践方式进行分析,并基于此探索构建符合消费者需求的人机交互方式。
1.1 人机语音交互
(1)基本优势。对人工智能电视而言,语音交互可谓是标准配置。在移动互联网、物联网快速发展的当下,语音交互功能已经被广泛应用于智能冰箱、智能电视、智能手机、智能音箱等领域,可以说是连接智慧生活的重要方式。对智能电视而言,语音交互能够大幅提高输入效率。电视受限于遥控器这一输入装置,在文字输入方面往往速度较慢,而语音输入的速度本就比传统键盘输入速度要快得多,且具有门槛低、对用户要求低的优势,较基于电视遥控器的文字输入速度更是有明显的优势。与此同时,语音交互还能实现跨空间便捷化交互。在远场语音技术的支持下,用户即便离麦克风的距离很远,也能实现精准、便捷、有效的语音交互,进一步提高语音输入的效率,强化便捷性。而且语音交互还支持组合指令输出,即用户可以一次性下达多条指令,然后由人工智能电视识别并分别执行这些指令的意图,这使得输入效率得到进一步提升。更为关键的是,智能电视的人机语音交互能够有效解放用户的双手和双眼,用户能够在家中一边做其他事一边和电视实现有效交互,不用再到处找遥控器或者中断正在做的事,能够带给用户绝佳的人机交互体验。另外人工智能电视的语音交互往往还能实现对更多声学信息的有效处理,对用户语音中包含的声纹信息、身份信息、性别信息、年龄信息、情感信息等进行解析,从而更加全面、智能地与用户进行交互。
(2)语音对话。实际上智能电视早就上市并受到了广泛青睐,但其语音交互方式较为死板,往往只能对固定指令进行识别,无法理解固定指令之外的其他用户语音,更无法进行自我学习。而随着近年来人工智能技术在电视这中的广泛应用,智能语音交互才逐渐成为主流。智能语音交互意味着人工智能电视能够对用户的语音进行全方位识别,不仅能够理解方言内容,还能对一些复杂指令和信息进行处理,就像是真的有人在电视中和用户进行交互一样。最为关键的是人工智能电视可以实现联机自我学习,在不断学习中逐步提高智能化水平,更加有效地理解用户意图,为用户提供更具个性化的服务。现如今人工智能电视已经能够通过语音和用户实现多轮对话,即在用户发出语音指令后,电视能够在响应指令的同时对用户接下来的意图进行推测,并进一步展开对话,而非干巴巴地和用户进行一问一答,可以带给用户更为良好的语音服务体验。
(3)远场语音。近年来远场语音逐渐取代传统的按键语音交互方式,意味着用户可以真正实现“解放双手”,甚至可以在不知道遥控位置的情况下和人工智能电视进行语音交互,省去了不少麻烦。远场语音功能的实现主要是基于麦克风阵列,即通过至少两颗麦克风来对用户语音波形进行识别,再通过波束成形技术实现定向收声,达到不管用户在什么位置都能和人工智能电视进行原厂语音交互的效果。通常来说,人工智能电视中麦克风阵列的麦克风数量越多,定向精度就越高。这是由于麦克风阵列主要包含线性布局和环形布局两种布局方式,前者主要适用于2或者4颗麦克风的情况,后者主要适用于4或者6颗麦克风的情况。在麦克风数量与布局形式的双重作用下,数量较多的环形布局麦克风阵列在定向精度方面更占优势,能够更加精准地对用户位置进行定位,从而保障远场语音交互的稳定性和可靠性。
(4)人工智能语音交互应用存在的不足。虽然人工智能语音交互在电视人机交互中的应用有着巨大优势,目前在实际应用方面也受到了广大用户的青睐和推崇,但在应用中依旧有着一些亟待解决的问题。首先,噪声抑制能力需进一步加强。电视的主要使用场景为家电场景,家中的大量家电设备如冰箱、空调等都可能发出强噪音,这些噪音会对电视人机语音交互造成不小影响,导致语音识别率下降。就目前来看,部分人工智能电视在家电强噪音环境下的语音识别准确率并未达到90%,无法满足用户实际需求,也会严重影响人机交互体验。其次,远距离交互的识别准确率需进一步提高。远距离交互是智慧生活背景下人工智能电视实现人机交互的重要方式,是带给用户良好交互体验的必要形式。不过随着距离的增加,远场语音识别能力往往会逐渐削弱,识别准确率会有所下降。尤其是对一些麦克风数量较少、线性布局的麦克风阵列而言,人工智能电视的远场语音识别准确率无法达到95%的标准,自然会影响语音交互的实际应用效果。然后,回声消除能力需进一步增强。在智能音箱等喇叭发出高音量噪声的情况下,人工智能电视对人声的识别很容易受到影响。尤其是在95DB高音量嘈杂环境下,智能音箱等发出的声音以及相应的回声会产生不小干扰,导致唤醒率低于92%,严重影响用户体验。最后为提高全方位感知定位精度。随着人工智能电视的进一步发展,10°的感知定位精度已经不能完全满足用户需求
1.2 人机内容交互
从本质上来说,人机交互只是一种方式,交互的内容才是关键所在。只有通过交互满足用户需求,为用户提供令他们满意的优质内容,基于人工智能技术的人机交互才具有意义。
(1)基于语音交互的内容提供。人工智能电视给予了用户多样化的交互选择,用户可根据自身实际需求选择适合的交互方式,如遥控交互、语音交互、摄像头交互等。其中语音交互是目前最受用户青睐和推崇的方式,不但可以大幅提高用户的输入效率,也能降低使用门槛,简化使用操作。而与传统遥控交互相比,语音交互的内容提供需要更加智能化。传统遥控交互往往是基于“所见即所得”的原则进行,用户在电视界面上使用遥控选择自身需要的功能,便可得到相应内容。而在语音交互模式下,用户的输入指令可能较为模糊不清,需要基于人工智能技术实现对用户指令的智能化识别,从而提供令用户满意的优质服务。
(2)智能化、个性化内容推荐。内容推荐是人工智能技术应用于电视领域带来的用户体验飞越,其能够真正做到为用户提供、打造私人化、个性化的影音库。在人工智能技术的支持下,不少电视都能够实现对用户喜好习惯的总结,从而针对性地推送相应优质内容。例如在人机语音交互中,用户接触到了他之间从未接触过的内容类型,并不知不觉间被吸引,惊呼:“原来这个真这么好看。”此时用户自身可能都没意识到自己需要进一步获取更多同一类型的优质内容,而人工智能电视则能通过语音交互实现对用户语音内容以及情感信息进行分析、整理,并在后续的系统推荐中为用户推荐相关优质内容,满足用户实际需求。依托于人工智能技术,标签体系能够真正做到智能化,基于广大用户的实际体验对影音内容打上多元化且贴合用户需求的标签,并针对性地为用户推荐合适的相关标签内容。这种标签体系与传统依赖运营人员进行标签制定、匹配和推荐算法优化的体系相比,无疑更能贴近用户真实需求,保障个性化推荐的合理性与有效性。另外在人工智能技术的加持下,视频图谱检索+多轮对话、音乐图谱检索、短视频新闻检索、图像识别、百科知识等内容也成为了电视人机交互中的重要内容,可以满足用户不同需求。
2 人工智能在电视人机交互中的发展前景
随着智慧生活的不断发展,人工智能电视在智慧家庭中所发挥的作用不仅仅局限于提供内容,更是要作为家庭助手的大屏终端,连接家庭中的所有家电,为用户提供更加便捷、高效的服务,真正推动家庭生活智慧化发展。在此过程中,电视人机交互的发展将进一步得到创新与拓展,除了人机语音交互水平进一步提高之外,人机内容交互将得到全方位延伸。用户能够通过电视机获得需要对内容和信息,也能获得完善的服务支持,如控制智能电器设备、设置闹钟、线上购物等。