讯飞输入法“输入生态”人机交互新方向
2022-04-29沈雅
沈雅
近日,2022科大讯飞全球1024开发者节“输入生态”论坛拉开帷幕。本次论坛分设“新输入·赋万物”“讯飞输入法12.0发布”“新输入·新传承”三大主题演讲,来自讯飞输入法的演讲嘉宾与现场和线上的朋友分享技术、产品、方言文化传承方面的新进展,以及面向万物智能时代所做出的新探索。
訊飞输入法总经理程坤在会上发表《新输入·赋万物》主题演讲,作为人工智能应用的先行者,讯飞输入法深耕行业12年,始终围绕“以人为本”,创新输入体验。最新数据显示,《讯飞输入法》日活用户已突破1亿,语音渗透率达75 %,日语音调用量较2021年提升45 %,这组数字正说明《讯飞输入法》不断为亿万用户提供个性、智能的人机交互。
在中国移动互联网的发展元年,《讯飞输入法》首创语音输入人机交互模式,不断提升输入效率和用户体验,使用讯飞输入法每日可为全社会节省100万小时输入时间。程坤指出,随着“万物皆终端、终端皆互联”的时代来临,储备前沿的人工智能技术并持续产品创新是《讯飞输入法》未来的关键点和制高点。
《讯飞输入法》一直以人工智能技术作为产品升级的驱动力,基于多环境因子嗅探的动态模型延展,通过增强模型和识别模型的深度耦合,推出了解决高噪、远场混响等复杂环境下的高精度语音识别。依托于高噪识别技术能力的支撑,在家居、车载、街区、公共交通、多人说话等典型高噪场景下,《讯飞输入法》都可准确识别。
为了给用户提供更自然、智能、可靠的交互体验,《讯飞输入法》全新升级语音个性化方言免切换模型,采用Conformer Encoder音频编码和全语言专家系统,实现用户级语言个性化识别,可支持普通话与20多种方言免切换语音识别。
此外,离线方言语音识别技术也获得突破,极大降低语音交互门槛。目前,讯飞还基于多语种合成技术,利用海量文本数据对小语种数据增强,扩充支持30种语言语音识别,进一步拓宽了语音输入场景。面对万物智能时代凸显的3个新的输入问题———复杂多样的交互界面、输入场景以及用户需求。《讯飞输入法》产品总监赵明路在现场发布讯飞输入法12.0,用实实在在的产品给出了讯飞的解决方案。
据悉,基于移动终端、穿戴设备、智能家居、车载车机等交互界面的变化,《讯飞输入法》为手表等小屏设备量身定制智能手写,面向智慧屏等大屏构建了可跨端流转的新输入等,让用户能够“畅快交互”。围绕智慧生活场景,《讯飞输入法》基于输入服务与用户连接的需求根基,提出一整套输入新方案。面向愈来复杂多样的输入场景,《讯飞输入法》12.0搭载全新AI智能化输入引擎,在聊天、音乐、综艺、影视、生活服务情景下,都能赋以高效、准确、自如的表达。此外,《讯飞输入法》面向不同用户特点,加入游戏语音键盘、跨屏输入、长辈模式、无障碍输入等模式,抓稳用户体验。
作为人工智能技术的天然载体,输入法从工具到服务再发展到生态圈层,每一次的进步都离不开创新,技术的创新又为内容生产方式注入新的生机活力。数据显示,讯飞输入法个性化内容服务使用者中年轻用户占比达48 %,吸引了内容创作者超过万人,内容使用量多达100亿次。会上,赵明路发布i-Blocks输入个性化内容开放平台。该平台以《讯飞输入法》为基座,秉承生态开放的理念,助力众多创作者获得内容业务的快速增长。
据《讯飞输入法》副总经理李强军介绍,《讯飞输入法》早在2011年就启动粤语识别项目,并且用3年时间陆续上线了10种方言识别。2017年,《讯飞输入法》正式发布方言保护计划,随着该计划的持续推进,中国方言库汇集语料已超过160万条,覆盖粤语、吴语、闽语、晋语等十大主要方言区。基于方言语料的积累,讯飞输入法实现25种方言以及5种民族语言的语音识别,目前还完成13种方言合成和2种方言翻译,将应用成果普惠大众。
李强军表示,一直以来,讯飞输入法充分挖掘方言的文化内核,努力“拓圈”传承。比如讯飞输入法、讯飞苏研院联合蜃楼志STUDIO创新制作《姑苏琐记》系列公益短片,借力多种数字技术开辟方言保护和文化传承的新场景,不仅让观众听到AI方言配音,还看见虚拟人有声有色的演绎。在推进方言保护计划过程中,讯飞与新华书店、苏州博物馆、海南民生广播、中国蓝TV展开广泛合作。此外,携手中国方言研究院、苏州图书馆多家单位推出线上方言公开课、教学短片,用方言魅力增强地域文化自信。这些努力不仅有利于加大方言保护的力度,也将对文化传承产生深远的影响。
在本次论坛上《讯飞输入法》超前预判,以语音为主、键盘触摸为辅,肢体语言动作为补充的万物智能时代正在到来。在此基础上,《讯飞输入法》发布12.0,用AI赋能“新输入”,面向未来的人机交互更迈进一步,对当下具有非常强的现实意义。