APP下载

语音搜索丛林战

2012-04-29

21世纪商业评论 2012年17期
关键词:搜索引擎百度语音

即便是再小的障碍出现在用户与所需求信息之间,都会让搜索引擎大佬们“寝食难安”。如今,他们甚至觉得,用手指敲击键盘才能输入搜索关键词,这简直太影响用户体验了,应该让人们动动嘴,就能够获得最完美的信息搜索结果——这不仅仅是个愿望,它已经成为现实。

由苹果的Siri引爆的一场语音搜索技术大战正在上演,谷歌携Google Now后来居上,百度也不甘示弱,他们早就组建了自己的“特种部队”——多媒体研发团队,专门从事机器人学习、计算机视觉、信息检索和数据挖掘等人工智能技术的研发。如今,百度技术副总监余凯率领着这支“特种部队”,加入到了语音搜索的丛林之战,对手则是全球市值第一的苹果和搜索霸主谷歌。

百度良好的财务业绩让它有充裕的资金投入到技术研发之中。7月24日,百度发布2012年第二季度财报,Q2总收入为54.56亿元人民币,同比增长59.8%,净利润27.7亿元人民币,同比增长69.6%。人们注意到,百度当季研发投入达5.46亿元,同比增长82.7%,占总营收比例高达10%。

首席执行官李彦宏表示,百度在语音搜索、移动浏览器等关键创新方面已经取得重大进展,语音搜索服务已经在百度地图APP等产品中开始应用。面对强大的竞争对手,百度不敢有片刻迟疑,其财力、物力和人力的投入均已到位。凡是苹果涉足的领域,无一不将引起生态圈的重构,作为竞争对手,紧紧跟随并努力超越才是生存之道。

苹果iPhone 4S所配置的语音控制功能Siri,被称为乔布斯用来改变这个世界的“最后的礼物”。在新一代操作系统iOS 6中,Siri能够支持15个国家和地区的包含汉语在内的语音输入,具有语义理解和用户意图识别能力。你可以让它陪你聊天,搜索信息,还可以聘请它做你的私人助理,完成设置提醒、预订餐厅、查询天气以及安排日程等任务。当然,调用Siri也非常简单,只要长按住 Home 键,然后所要做的就是,对它说话。

奥斯卡金像奖最佳导演马丁.斯科塞斯(Martin Scorsese)出现在苹果Siri的一则广告中,马丁问:“我今天的日程如何?”“又是忙碌的一天。”Siri回答。“你不是开玩笑的吧?”马丁继续和它对话,Siri则很认真地告诉他:“我做事一贯非常严谨。”在帮助这位传奇导演完成了重新安排日程、寻找朋友位置以及查询曼哈顿交通路况等一系列任务后,马丁表达了对Siri的感谢之意:“我喜欢你,再也离不开你了。”“我会记住你说的这些。”Siri并没有表现出特别的激动。

苹果拓展了“搜索”的外延概念,通过Siri语音输入,语音识别、智能机器人处理和分析,调用本地或者网络的应用程序,整合出最为合适的答案或者信息呈现给用户。这个“智能”的语音助理带给世界太多想象空间,几乎为我们描绘了一个具备人工智能的全新生态系统。与其他程序结合在一起的Siri,势必成为移动互联网的最新搜索入口。

这款应用显然严重刺激了谷歌公司的神经,他们在今年2012 I/O开发者大会上发布代号为“Jelly Bean”(果冻豆)的Android 4.1版本操作系统,用Google Now这个重量级应用来向世人展示,搜索引擎颠覆时代到来的宣言理应由他们宣布。

“希望未来的搜索引擎不仅能够理解你的问题,提供相关信息,而且能够为你提供现实世界中的知识解答——将来的某天甚至能够达到智慧搜索引擎的程度。”Google高级副总裁阿米特.辛格哈尔这样阐述搜索的未来。Google每个月都要处理超过1000亿个搜索请求,每天抓取超过200亿个页面,索引库中收录了100PB的数据,是美国国会图书馆藏书量的10万倍,人们对于这个“搜索巨人”有着天然的信任感。

Google Now的颠覆性在于,除了完成回答用户语音提出的问题之外,它还可以根据记录和分析用户的搜索习惯,推测用户需要的信息,并在恰当的时候提供给他们。Google Now能够在会议开始之前的一个特定的时间向用户发出提醒,而且它已经将交通路况考虑在内;如果你是某个体育赛事的爱好者,不必刻意询问,它会将最新比分告知给你;当你前往一家餐厅用餐时,它甚至可以为你推荐那里的菜品供选择。

建立起一个让搜索引擎理解世界以及事物之间的联系的模型,这是Google努力的方向。Google Now的成功得益于Google强大的信息检索能力,这个简单搜索框的背后则保留着每一次用户搜索的记录,一个与搜索结果相关的完整的知识体系在逐渐建立的过程中,而预测特定用户的意图也就有章可循,这个庞大的数据库和复杂的计算模型的确让Siri羡慕不已。

作为中文搜索巨头的百度对这一切当然不会无视。在8月举行的第18届ACM知识发现与数据挖掘学术年会上,百度首席执行官李彦宏发表了主题演讲,向世界顶尖级研发人员提出了“希望学术界解决的九大技术难题”,其中语音识别位居前列。

与移动端相关的多媒体技术方面的研发,百度早在两年前就已开始布局,其多媒体“特种部队”来自全球招聘。围绕着语音识别与智能理解,他们已经开发和掌握了海量语言模型、复杂声学建模、高速解码等关键技术。对于语音搜索技术的产品创新,百度还有自己的打算,从应用提供商向平台开发商的转变正在推进,配合其全新的“云战略”,他们计划将包括语音在内的多媒体技术通过API接口开放给第三方开发者,动用群众的力量,建立起一个多赢的生态系统。

以搜索业务起家的百度,在自然语言处理方面,尤其是在对中文的语义理解方面有着时间和数量上的优势,拥有近400亿网页的中文语料。对数据处理,尤其是利用机器学习算法,利用大规模数据学习、训练,并且运用到语音、信号处理,语音识别模型训练,在这些方面百度有相当深厚的算法和积累。余凯说:“百度有着12年中文语言处理经验,世界上没有其他公司具有像百度这样规模庞大的自然语言处理的团队。”

目前,掌上百度、百度搜索手机客户端、百度手机地图、百度手机浏览器等产品中,都已经配置了百度语音识别和搜索的功能,而百度网页、百度图片、百度知道、百度新闻、百度MP3、百度百科、百度地图、百度视频等这些垂直搜索频道也将被整合在其中。用户可以用语音进行文字输入、发送短信、搜索信息以及查询地图,你甚至还可以对着手机说“芝麻开门”为手机解锁,通过语音指令实现对手机的智能操控。

“我们接下来不会把百度的框视为传统的搜索框,而是视为人机界面。表面上它可能提供像Google的搜索框那样的应用和服务,但是它本质上不再是传统的百度搜索,它解决一系列的问题,例如本地的服务、导航、搜索,传统的搜索,精准的框计算。”百度首席产品设计师孙云丰曾如此表示,在需求和应用之间建立起密切的联系,是百度当下最为重要的任务,而将语音交互方式和框计算的结合才能实现真正意义上的智能搜索。

人和机器最自然交互的一种方式就是语音。在移动互联网上,语音识别和人工智能技术可以解放用户的双手和眼睛,通过语音命令完成一系列任务,这几乎是全新的用户体验。中国互联网络信息中心(CNNIC)发布的《第30次中国互联网络发展状况统计报告》表明,2012年上半年,通过手机接入互联网的网民数量达到3.88亿,相比台式电脑的3.8亿,手机已经是中国互联网用户的第一大上网终端。余凯说:“语音应用,在移动互联网时代的爆发已经成为整个业界的共识,百度也持同样的判断。”(文/徐珊插图/文耀)

猜你喜欢

搜索引擎百度语音
Robust adaptive UKF based on SVR for inertial based integrated navigation
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
百度年度热搜榜
网络搜索引擎亟待规范
百度医生
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发