抢入口还早,先把聊天机器人做好再说吧
2014-04-29李梁
李梁
聊天机器人背后的利益
事实上,从苹果的Siri开始,智能聊天机器人就渐渐受到各大互联网厂商的重视,谷歌马上做出了Google Now。而腾讯走得更远,与中科院深圳先进技术研究院、深圳市中科睿成公司组成联合团队推出了实物版的小Q机器人。在马化腾看来,小Q机器人是腾讯线上服务向线下延伸的载体,除了聊天,小Q机器人还被定位为人们的智能伴侣机器人。而百度属于后起之秀,自然不甘被落下,百度的余凯带了一队人马去硅谷,和谷歌、Facebook抢人,人工智能领域的博士生身价被爆炒到30万美元。百度在国内还推出了“少帅计划”,向30岁以下青年才俊开出百万年薪,对一流科学家更是上不封顶。
这么多顶尖互联网公司前赴后继的在聊天机器人领域抢人、抢地盘,看中的是未来一个很重要入口—移动搜索流量入口。艾瑞咨询集团研究院院长曹军波认为,用户体验、流量入口,这都是当下巨头的敏感地带。现阶段,移动搜索入口还是一块巨大的空白地带,用户在手机上搜索信息,仍然大多采用纯网页版的搜索方式。很显然,这是有悖于移动端的用户体验的,普遍不被看好。而聊天机器人有可能是未来的一个方向,除了聊天,它们还具提醒、天气、星座、交通指南和餐饮点评等实用功能,在大数据、自然语义分析、机器学习方面具有非常强大的机器学习能力,随着人工智能技术的提升,未来很有可能只需对着聊天机器人说出你想要的,它就帮你找到你需要的一切了。
人工智能技术决定了聊天机器人水平
聊天机器人说到底,其实是人工智能的一个前哨站。微软小冰的创始人张亚勤透露,微软正在进行多个人工智能研究项目,“小冰” 则是大数据、云计算、机器学习、深度神经网络等课题的阶段性成果,现阶段的聊天机器人顶多只是人工智能最粗糙的形态。
聊天机器人需要大数据支撑,通过计算机读取大量数据,以提升人工智能本身的精准度。但是,这些大数据的分析并不简单,文本挖掘需要“自然语言处理”技术,图像与视频解析需要“图像解析技术”。如今,“语音识别技术”也不可或缺。这些都是传统意义上人工智能领域的核心技术。前阵子很火的微软小冰,也完全是因为有大数据的支撑才实现了人工智能,同时也曝露出了很大问题。据微软官方数据,小冰集合了中国近7亿网民多年来积累的全部公开聊天记录,并从中精炼出1 500万条语料库,基于数据挖掘与智能搜索,通过理解对话的语境和语义而实现人机问答的自然交互,甚至相当于16岁少女的智商。
然而,微软小冰与网友互动过程中频出脏话连篇、轻佻低俗等现象,遭受众人诟病。即便是小冰合作方奇虎360董事长周鸿祎,也发出了“我要求见见小冰的产品经理,没别的意思,探讨一下小冰的设计改进思路,这要是不改问题很大,我都快受不了了”。
事后微软宣布,小冰的语料库来自于互联网页大数据的公开信息,虽经反复过滤和审核,但仍会有约十万分之四的漏网之鱼。“草泥马”等数据均非小冰制造,而都是广大网友制造的内容。这体现出人工智能中的“自然语言处理”、“图像解析”技术还任重道远,即便是做到了海量大数据支撑,不能理解对话的语境和语义,聊天机器人就不能以正常人的思维与用户交流。