Naturali奇点机智:语音对话交互体验的定义者
2018-12-06陈平
文/本刊记者 陈平
邬霄云 Naturali 奇点机智创始人兼CEO
纽约州立大学计算机博士,拥有8年Google研究院、1年Yahoo实验室工作经验,回国前负责美国应用搜索公司Quixey.com搜索部门。拥有深度学习、自然语言处理、互联网大数据、分布式计算的经验。
自主研发打造核心优势
邬霄云是一名海归,Naturali奇点机智语音对话平台“对话流”的灵感来自于一次开车发生碰撞之后。面对繁琐的车辆定损、保险索赔等流程,如果有一个平台可以用对话交互的形式获取下一步操作指示、案件进展,整个流程就会变得简单、清晰。
本着“将对话与服务连接起来,打造更加自然的语言交互体验”的初心,2015年2月,Naturali奇点机智在北京成立。
作为当前AI三种形态之一的智能语音交互技术,涉及语音识别、自然语言理解、对话管理、自然语言生成、语音合成等技术及综合运用,其中自然语言理解、对话管理、自然语言生成的流程又被称为智能对话系统,是整个智能语音交互过程中的核心技术难点。也就是说,让机器不仅仅做到识别语音中的字,还要能够理解语音表达的意思,在“听懂—理解—回答”的闭环下完成多轮对话、意图推理、个性化及情感互动。
尽管目前的语音交互尚未完全成熟,但对话式交互已是大势所趋,国内外互联网巨头普遍认为此项技术前景可期,将其作为人工智能战略的重要组成部分深度研发。
作为国家高新技术企业,奇点机智创办3年来着力深耕此项技术的研发和应用,通过在自然语言处理(NLP)、深度学习(Deep Learning)、移动搜索领域的深度探索,努力为企业、开发者提供垂直场景下的智能语音对话交互解决方案。
“生活在信息社会当中,人们需求的是服务,而非获取APP。”邬霄云说,人们并不关心服务来自哪个APP,只关心怎样得到服务。他向记者演示了企业早期开发的“语音助手”:在安装了语音助手的手机中,只需打开语音助手,说一句“我要订外卖”,手机界面就能直接打开外卖APP选择订餐。如果说“我要订麻辣烫”,则手机直接就能将外卖APP中提供麻辣烫的商家界面打开,省去了4、5步的点击流程。
奇点机智最近又研发出了功能更加强大的语音对话平台“对话流”,创造了从识别用户意图到完成相关操作的完整体验,不仅仅能够定义对话体验,也可以帮用户完成后续操作。邬霄云告诉记者,“对话流”以需求、服务为搜索对象,即搜即得、即说即用,实现了“从需求到服务”的完整闭环,为企业提供个性化、灵活、深度服务,让对话到服务快而有效。
“对话流”具有三大核心优势:
1、直达服务。目前市面上的大多数互联网产品是基于GUI(图形用户界面)的,需要用户层层点击完成相关操作。例如点外卖时,至少需要点击五步才能到达最终的服务界面。而CUI对话用户界面只需要一步就可以直达服务,用自然的语言去表达需求,没有任何学习成本。
2、降低成本。目前传统的对话开发平台普遍面向有技术背景的开发者进行二次开发,而对于NLP、机器学习技术相对薄弱的企业或是没有开发人员的企业来说,打造定制化语音交互体验是一大难题。“对话流”大大降低了开发门槛,每个企业都能定义语音对话交互体验。对话流的可视化、模块化界面操作简单,不需要写代码或自然语言处理领域专业知识即可轻松创建语音对话体验,并且创建后可以根据业务需求随时修改调整。不仅面向开发者,产品运营人员也可以定义操作。以智能客服为例,据统计,智能机器人客服可以解决85%的常见客服问题,而一个机器人坐席的花费只相当于一个人工坐席花费的10%。
3、理解精准。以订餐为例,当用户说“帮我订一份小龙虾”“叫一份小龙虾外卖”“我想点份小龙虾”时,其实都对应到了“订小龙虾外卖”这个意图。多数语音对话交互系统并不智能的主要原因,是面对用户的不同说法,无法识别用户意图,从而出现与“对不起,您说的我听不懂哦”类似的回答。表达一个含义、用户说法却千变万化,如何理解客户的意图,将各种形式的表达归一化,是奇点机智突破的一大技术难点。利用自主研发的自然语言理解NLU技术支持,攻克中文语义理解难题,准确理解用户不同的表达方式并匹配到相关意图,只需提供几个用户说法的例子,对话流即可扩展识别多种问法,使用少量数据,即可快速训练有效模型,完成意图识别、说法泛化和实体扩展,上述问题迎刃而解。
为研发人员分享机器阅读理解技术
对话式UI
灵活定制的多元化应用场景
“对话流”的出现解决了企业长期以来的痛点,在很多环节都为企业带来了事半功倍的效果,例如节约人工成本、使企业24x7在线、提升用户体验、增加转化效率、多渠道与用户互动等,让打造跨平台、跨设备的语音对话体验变得简单、高效。
邬霄云告诉记者,企业用户可以通过该平台为企业内部服务、客服、应用助手、聊天机器人等产品创建即时可用的智能对话体验。跨平台、跨设备,该体验可广泛集成于WEB、APP、小程序、微信公众号、智能硬件等终端。无需编程,企业没有自然语言处理 NLP 技术积累,也能直接创建。
“需要什么样的服务,就能用机器把意思表达出来,真正提升了用户的体验度、增强了用户黏性。”邬霄云说。
据了解,“对话流”可以为企业的各类平台打造智能客服、语音助手、聊天机器人等,并且能够在很大程度上赋能传统行业,企业用户可以通过该平台创建精准、个性化的智能对话体验。
举例来说,奇点机智正在为唯品会APP定制语音助手,除了语音快捷搜索相关商品外,还可以通过语音对话的形式获取一些隐藏比较深的服务,比如查询快递状态、开发票、申请退款、开启指纹支付等功能,一句话就能直达最终页面。
近两年,百余家银行、证券、保险公司上线智能客服系统,用户通过语音对话的形式得到了更加精准、个性化的咨询和服务,大大节省了呼叫中心人工坐席的成本。招商、中信、光大、工商银行等都能够通过语音对话完成日常金融交易。
而在医疗领域,初次就诊的患者往往不清楚就医流程,不懂怎么回答医生的问题。门诊医生看诊任务繁重,每位病人每次看诊几乎只能与医生沟通几分钟。医患信息严重不对等、就医体验差也导致了医患关系的紧张。邬霄云说,如果医院借助“对话流”,搭建一套完善的导诊服务,既可以有效引导患者挂号、分诊,也可以协助医生对患者进行“预问诊”,为医生提供“预问诊报告”,提前掌握患者的基本资料和病情,提升诊疗的准确率和效率。
目前,奇点机智已经为国内大型电商、手机厂商等企业提供了灵活定制的语音对话交互解决方案,合作伙伴包括唯品会、联想、国美、乐视、度秘等。
邬霄云表示,未来“对话流”还将继续深耕电商、金融、零售、医疗、教育等诸多领域,在推动经济高质量竞争发展中崭露头角。
布局语音交互独角兽企业
Naturali 奇点机智有一支技术驱动型精锐创业团队,在移动搜索引擎和自然语言处理领域拥有多项国际专利,团队成员来自于Google、Microsoft、Facebook等企业,其中有多位工程师获得ACM国际竞赛金牌。
邬霄云是拥有1年雅虎实验室、8年谷歌研究院工作经验的资深科学家,公司自然形成了一种轻松自由、热爱创造、挑战极限的硅谷文化。
谈起回国创业的初衷,邬霄云表示起初并没有太崇高的想法,只是觉得创业就好比做一个实验,想去做一件事情然后达到一个目标而已,很单纯。而他的目标就是基于自然语言处理技术来优化人机交互体验。
邬霄云认为,在当今的AI行业中,计算机人脸识别已经有了刚需应用场景,比如商汤、旷视等企业在安防、银行等场景中都有了颠覆性的表现,自动驾驶也出现了pony.ai等企业,唯独在大家都看好的智能语音交互和自然理解领域仍在挖掘刚需场景,独角兽企业相对较少。分析原因,他认为主要是技术距离应用场景还比较远,离真正的实用还有距离。“因为到目前为止,国内从事智能语音交互的AI公司仍然没有琢磨出到底什么样的场景下更适用这项技术,让应用更加自然。”
创办仅3年时间,Naturali奇点机智已经获得了“2017新智造成长榜50强明星企业”“NVIDIA中国人工智能初创公司挑战赛5强”等多项殊荣,语音对话平台“对话流”荣登AI企业级应用产品实力榜单。在2017年人工智能先行者大会上,奇点机智跻身于年度“最具商业价值AI公司TOP 50”中。今年5月,在目前国内最大、最具挑战性的中文阅读理解数据集“2018 机器阅读理解技术竞赛”上,凭借自然语言处理(NLP)领域多年的积累与沉淀,奇点机智从国内外 800 多支报名队伍中脱颖而出,获得了“机器阅读理解技术大赛冠军”。
多年间深耕这一领域,邬霄云越发觉得语音交互有着得天独厚的条件,从世界范围来看这都是一个前沿技术。“因为自然语言的表达对人们来说是没有学习成本的,人机交互将会变得非常舒服。”邬霄云表示,人类在当前的条件下,在尊重原理和定律的前提下,但凡有可能,我们就一定能够在这个领域做到最好。
2014年,Naturali奇点机智完成了真格基金100万美元天使轮融资,2016年完成襄禾资本、NEA 500万美元A轮联合投资,并已于近期完成了A+轮融资。目前入驻中关村智造大街,并代表智造大街参展2018北京双创周。
在资本的助力下,Naturali奇点机智将不断致力于智能语音交互的场景深度融合,努力推动自然语言理解技术的变革。随着智能语音各项技术的发展,相信将会有越来越多的产品走进人们的生活、影响人们的行为习惯,甚至带来新的产业革命。
团队2018年韩国汉拿山团建活动