人工智能竞赛
2016-06-20谢丽容梁辰
谢丽容+梁辰
人工智能被认为是继电力和互联网之后又一次对人类社会产生颠覆式影响的技术。美国公司的技术遥遥领先,中国公司擅长商业化、拥有数据优势,在技术上正奋力追赶。
2015年12月,微软亚洲研究院首席研究员刘铁岩博士去蒙特利尔参加了NIPS年会(Annual Conference on Neural Information Processing Systems),这是人工智能领域的顶级学术会议。但与会期间,他印象最深的不是同行的专业进展,而是一位科学家告诉台下的与会者,早些年,他的博士生根本找不到工作,今年却被一抢而空。
这也是中国正在发生的故事。从硅谷到北京,人工智能都是热浪滚滚。这个在上世纪50年代和80年代掀起过两次高潮的技术,现在似乎真的到了产业化的临界点。互联网时代的思想家和预言家凯文·凯利宣称,人工智能是下一个20年里颠覆人类社会的技术,它的力量堪比电与互联网。
人工智能(Artificial Intelligence),缩写为AI。它是研究开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
人工智能快速进入大众视野,源于今年3月谷歌围棋人工智能程序AlphaGo战胜世界冠军李世石。人机围棋对弈只是普及人工智能的一个秀。它的背后是规模千亿级的人工智能产业市场。BBC预测,2020年全球人工智能市场规模将达1190亿元人民币。
目前看,这一数据远比不上2015年中国移动互联网的产业规模。但人工智能的意义不仅于此,人工智能技术的发展,还将带动云服务、大数据分析、移动互联网和物联网产业的升级迭代。它甚至将超越移动互联网,全面改变人类的生活和工作方式。
离人工智能最近的IT互联网公司敏锐嗅到了这一机遇。从2011年开始,包括深度学习算法、计算资源和大数据产业的成熟令人工智能技术实现飞跃,包括微软、IBM、谷歌、Facebook、BAT在内的国内外企业都开始深度布局人工智能,试图把握风口,成为下一个产业变革的巨擘。
已布局人工智能的IT和互联网巨头们,最有资格成为这一轮革命的获益者。但这终究是一个漫长的耐力游戏,除了技术布局,产业布局和战略视野也是决定成败的关键因素,短视者将随时出局。
BAT保守布局
中国的所有行业中,以BAT为代表的互联网行业在人工智能研究和商业化探索方面走得最早,也看得最远。其中,技术起家的百度走在最前端。
2012年10月,百度董事长兼首席执行官李彦宏参加了内部的一个基于深度学习的语音识别产品研究会。当时该产品的主导者余凯回忆,那是李彦宏第一次知道深度学习,他非常吃惊,并给全公司写信,让所有产品经理都要了解人工智能技术的发展。
当年12月,李彦宏开始和余凯讨论成立深度学习研究院的可行性。次年7月,这个研究院成立,李彦宏任院长,余凯为常务副院长。这是中国公司里的第一个人工智能研究院。
李彦宏很快将相关技术投入到搜索的核心业务中。2014年的百度内部统计数据显示,深度学习技术的应用,让百度和竞争对手的Diff(different,内部叫Diff)指标提升了若干倍。
但人工智能的科研,尤其是基础科学研究,是一个冗长寂寞的过程。此后,迫于财务数据和竞争压力,百度的决策者们更加注重眼前的布局和资源。
“到了后期,太长远项目,或是比较创新的项目,百度总部确实不太支持了。百度i站的项目、百度快搜这样的项目没了。”一位不愿具名的前百度人工智能研究岗位人士评价。一位现任百度相关人士对《财经》记者表示,百度前些年确实剔除了不少经过验证没有商业化前景的分支项目,但最近两三年,百度明显加大了在人工智能上的投入,包括无人驾驶汽车等长期项目。
6月8日,在2016百度联盟峰会上,李彦宏将百度无人驾驶汽车称作“一台带轮子的电脑”。他现场播放了百度无人车路测的实况录像,百度无人车已经可以像正常车辆一样加速、并线、超车,他同时表示,三五年之内,无人驾驶一定可以成为现实。
从整体来看,百度仍是BAT三家中首先完成有关人工智能技术体系整合的公司。目前,百度研究院、百度大数据、百度语音和百度图像等技术都已归入人工智能技术体系。李彦宏多次向外界强调,百度未来的发展将严重地依赖人工智能。
IBM研究院一位人工智能专家告诉《财经》记者,百度是被他们列入竞争列表的唯一中国公司。
硅谷尤其关心“百度大脑”的进展。百度大脑是百度在人工智能领域的核心。百度此前发布的诸多人工智能产品,如无人驾驶、智能搜索等,都是基于百度大脑的能力。
百度高级副总裁、自动驾驶事业部总经理王劲称,百度大脑已具备视、听、说和预测、规划决策以及行动控制的能力。在数据方面,百度有万亿级的网页、移动和行为数据可供分析。在深度学习方面,百度的万亿参数排在世界第一。
2015年,百度的研发投入超过100亿元。占百度2015年总营收663.82亿元的15%。
百度正在计划将百度大脑在金融、汽车、医疗等领域商业化。李彦宏称,人工智能的“井喷式”创新,将推动互联网进入第三幕,并将重构传统产业。比如“人工智能+金融”,可以快速地实现征信升级,实现“秒放”贷款。
阿里巴巴和腾讯的布局则更加克制。或者说,它们更代表中国公司的普遍做法,从业务驱动开始,逐渐加大档位。
阿里从2011年开始布局互联网医疗,投资收购和战略合作的公司数以百计。围绕医院、医保、医药做了大量布局。最新的统计数据显示,全国已经有超过400家大中型医院加入阿里的“未来医院”计划,覆盖全国90%省份。阿里云人工智能首席科学家闵万里博士告诉《财经》记者,阿里在健康医疗领域的布局快慢,取决于阿里在人工智能领域的技术突破。
阿里的设想是,未来,在阿里遍布全国边远山村的医院医疗点里,病患足不出户,只需拍一张CT,通过远程技术来完成专家级的诊疗过程。这种诊疗,依赖的就是基于阿里云的人工智能医疗系统。随着学习数据的不断增加,机器会变得越来越聪明,最终成为一个“永不退休的医学专家”。
多位接受《财经》记者采访的专家评价,阿里这个技术并不复杂,医疗诊断是基于经验的专家型劳动,是机器擅长的经验学习,三年内该技术便可成熟。
闵万里告诉《财经》记者,要实现这个目标,除了技术平台,还需要整个医疗体系的打通,需要政府和社会共同推动设备和资源的开放。一旦打通,聚合在一个人工智能服务平台之上,就将衍生出更多的应用服务场景,从而实现“商业和技术互为驱动”。
阿里是目前中国所有公司里,数据生态最完善、最健全的公司。iPIN创始人兼CEO杨洋认为,阿里的MaxComputer数据通道,是非常健康的数据大动脉,可以将阿里的所有数据资源非常高效地结合在一起。
此外,阿里云也是目前世界上最接近AWS(亚马逊云服务)的云计算平台。数据生态体系是做人工智能的重要基础。因此,在这场有关未来的布局中,阿里云的主导地位清晰。
阿里的人工智能研究分散在其各个业务分支之中,有待整合。闵万里说,阿里希望在算法能力上有所突破,这需要一个集中的技术机构来整合阿里的所有相关技术资源。
腾讯和阿里的情况类似。腾讯在人工智能上的布局,以IM和SNS业务为基础。例如语音识别主要是在微信部门、图片识别主要是在QQ,支付和金融业务方面植入了人脸识别,搜索部门则关注自然语言识别。
其中一些技术已在腾讯内部实现产品化。SNG(社交网络事业群)的优图团队聚焦图象识别领域,推出了黄图识别功能,并为腾讯内部产品如图片优化工具“天天P图”提供技术支持。WXG(微信事业群)则人机互动领域的拓展,也对图像和语音识别进行了原发。WXG推出了智能机器人“小微”,用户可以用自然语言与之沟通,解决此前语音助手智能机械应答的短板。对于未来,工程师希望“小微”成为一种“连接器”——与微信支付串联起来,接入微信公众号以及钱包内的各种生活服务,打造完整的微信内O2O闭环生态体系。
腾讯高级副总裁姚星在接受《财经》记者采访时表示,腾讯越来越重视在人工智能领域的技术开发,这包括两个路径:一是整合腾讯自身的技术资源,形成体系和重点;二是加快对优秀公司的收购和合作步伐。
腾讯参与了多个人工智能项目的早期投资。腾讯投资并购部一直在为公司寻找需要的标的,服务于腾讯的整体战略。腾讯日前与硅谷风投机构Felicis Ventures领头了人工智能创业公司Diffbot 1000万美元的A轮。这家公司通过人工智能技术,让“机器”抓取网页关键内容,并输出软件可以直接识别的结构化数据。
BAT的人工智能技术研发从第一天开始就是商业需求驱动的,他们从业务入手,收购甚至模仿别人的东西,这种做法避免了漫无目的研究和不必要的失败,但也无法保证在下一轮的人工智能平台大战中胜出。
今年,阿里和腾讯均有组建人工智能研究院的想法。姚星对《财经》记者说,很快,腾讯人工智能研究院就会成立。
国际巨头深入无人区
如果说BAT的人工智能布局处于对标和追赶的状态,那么以IBM、微软、谷歌、Facebook为代表的美国巨头公司已经开始深入科技无人区。
Facebook将人工智能视为未来的三大方向之一,在基础科学的研究上不遗余力。
这些公司技术和业务各有所长,面向的用户也不同,但它们的目标一致:把人工智能机器做大、做强、再做没。
IBM和微软可能没有谷歌、Facebook看起来那么酷,但在人工智能领域有深厚的技术底蕴,IBM甚至已经开始用人工智能赚钱。
IBM人工智能研究可以追溯到1997年“深蓝”战胜当时的国际象棋世界冠军卡斯帕罗夫。2011年,代表着IBM在认知计算领域最先进技术的Watson在一个电视节目中一战成名,被认为是人工智能历史上的一个里程碑。
今天可以代表IBM在人工智能领域最高技术水平的,是不断进化中的Watson系统,和已经可以量产的人脑模拟芯片SyNAPSE(超大规模神经突触计算机芯片)。
Watson是一台超级计算机,最初由90台IBM的Power 7服务器并行组成。和Google、微软的人工智能相比,它从硬件芯片构架就开始模拟人类神经元,基于IBM的“DeepQA”技术开发。2014年1月初,IBM宣布组建“Watson Group”,旨在进一步开发、商用和增强“Watson”及其他认知技术,此外还投入10亿美元用于其他相关项目。
Watson已经开始为IBM赚钱了。法国农业信贷银行预测,Watson系统创造的收入将在2018年占IBM总收入的12%以上。Watson已经被部署在IBM去年收购的云计算基础设施业务Softlayer上,成为IBM与亚马逊、谷歌、微软等大型科技公司在云计算领域展开竞争的武器。
另一个代表性产品是IBM在2014年发布的人脑模拟芯片SyNAPSE。该芯片能够模仿人脑的运作模式、低功耗,在认知计算方面要远胜传统计算架构。和其他芯片公司的纸上规划不同,这款芯片已达到量产要求。
IBM将其技术和商业实力总结为“认知计算体系”。IBM大中华区副总裁、战略部总经理郭继军向《财经》记者表示,IBM推动认知计算体系,目标是把IBM在人工智能、大数据、深度学习、模式识别等所有领域里所做的积累应用到各个行业中去,帮助各行各业客户提升效率,解决他们所面临的现实挑战。
微软人工智能技术的研究已超25年。1991年微软成立研究院,最早的五个研究组,研究方向分别是人机交互、自然语言处理和机器学习、语音识别和语音合成、计算机视觉。这些恰恰是今天人工智能的几个最重要的分支。
微软的人工智能研究方向要宽泛很多,微软研究院拥有超过1000位科学家,在包括深度学习的多个领域的技术布局处于世界顶端。
微软最新的深度学习系统在2015年ImageNet计算机视觉识别挑战赛中,将计算机视觉系统错误率降低至3.57%,相比于人眼辨识的5.1%,这是人工智能首次在识别图像的错误率上超越人类水平。这些机器由微软的Azure云服务提供支持。
微软不仅将人工智能技术应用于如Windows、Azure等核心业务中,还构建开放的平台,将多年的技术积累开放给产业界,它的目标是打造一个人工智能生态圈。
它在无人区走得最远,在现实商业世界中隐蔽得最深。
和前辈相比,年轻的谷歌在人工智能领域做的事情更让外界看得懂,也更兴奋。谷歌一方面不知疲倦地做底层人工智能技术的积累,研发更加高级的深度学习算法,增强图形识别和语音识别能力。另一方面亲力亲为布局了包括智能家居、自动驾驶、机器人(2013年收购了8家机器人公司)等领域,前者为后者带来基础技术支撑,后者为前者提供数据和反馈。
值得一提的是,谷歌在无人驾驶汽车领域的技术积累,已经远远超过传统汽车厂商和其他互联网公司。
更加年轻的Facebook,将人工智能视为未来的三大方向之一。Facebook天然拥有全球范围内的海量社交数据,但在基础科学的研究上依然不遗余力。2013年,Facebook在加州成立了Facebook AI Research (FAIR)。卡耐基梅隆大学机器人系博士、Facebook人工智能组研究员田渊栋称,FAIR的研究方向自由宽松,研究所需的计算资源(如GPU)相对丰富,同时也没有近期的产品压力,可以着眼长远做困难和本质的研究。他称,这样的学术氛围在各大公司是极其少见的。
如果说前述几大巨头都是从人工智能技术出发,结合云计算赋予技术更多势能,那么亚马逊的路径正好相反。亚马逊是全球第一大云服务提供商,它的云服务收入超过微软、IBM、谷歌、Salesforce等所有对手的总和。但亚马逊目前发布的人工智能技术,多数集中在提升购物体验的深度学习领域。
人工智能技术有两大要素:核心技术平台和数据循环。只拥有技术是不够的,需要业务和数据结合,才能打造好的技术。对循环数据的获取,巨头们也都不遗余力。
以最热衷开源的微软为例,去年,微软发布了“牛津计划”(现更名为“微软认知服务”),这是一个基于微软云平台的智能API(应用程序编程接口),涵盖了五大方向的人工智能技术,包括了计算机视觉、语音、语言、知识、搜索五大类API。去年夏天火爆的How-Old.net,就是借助该平台快速开发出来的一款应用,一共只有20多行代码。
类似的工具包微软还有很多,例如深度学习工具包(CNTK)和微软亚洲研究院主导的微软分布式机器学习工具包(DMTK)等。
这些对于创业公司和中小企业来说相当实用。他们不用从底层技术一点点学,在小集群上或者是云服务上就可以直接调用。
对于巨头来说,算法已经不再是竞争的障碍,数据和用户习惯才是山头。大量的初创企业会采用开源做很多垂直领域的业务,其中包括海量试错和验证,最终也会反馈回开源,而这正是巨头们所期望的。
做B2B生意的IBM对数据的专业度要求更高,无法仅依赖搜索引擎和大量应用的交互来训练Watson系统,因此通过深度合作和并购来获取专业数据。
以医疗领域为例,IBM和多家世界级顶尖医院合作,向医院部署Watson的智能系统,通过分析这些医院的病历、专家的治疗经验、现有的学术研究等,帮助它们制定、观察和调整癌症患者的治疗方案。在这一过程中,Watson也就有了这一领域的数据积累。
2015年4月,IBM收购了Explorys,它是一家可以查看5000万份美国患者病历的分析公司。类似的收购IBM还有不少,并且出手相当大方。
Watson已经可支持针对乳癌、肺癌和结肠直肠癌、皮肤癌等癌症的初期诊断。在皮肤癌领域,在一项对3000幅皮肤镜检查图像的研究中,Watson识别皮肤癌的准确率高达95%以上。而人类识别皮肤癌的准确率只有84%。
国内的一位人工智能业者调侃,国际巨头在人工智能领域真正有价值的是它们的那些你看不见的、没开源的、国际会议上含含糊糊一笔带过的技术。“那些才是可以颠覆未来的弹药。”
填补断层
人工智能的产业结构可以分为三层:应用层、技术层和基础层。应用层聚焦在人工智能和各行业各领域的结合;技术层是算法、模型和技术开发;基础层则是计算能力和数据资源。
BAT擅长第一层。BAT手中,天然握有全球最大的数据资源。但在第二层和第三层严重断层。中国在人工智能领域的科研水平停留在工程数学、物理算法等工程科学的创新层面,基础理论研究领域的人才和资源很少。
多位接受《财经》记者采访的中外业者认为,BAT的优势在于海量数据,和国际巨头的核心差距在技术。
腾讯高级副总裁姚星告诉《财经》记者,今年初,他和腾讯的投资并购部达成了一个共识,开始大量考察美国的机器学习平台类创业公司。一则中国这类技术公司不多;二则收购这种公司可以快速补足腾讯在算法领域的不足。
姚星向《财经》记者分析,同样提供10万个样本给机器,优秀的算法平台可能只需要几个小时,速度慢的可能需要几天时间。
对于海外收购,搜狗公司CEO王小川则更加直白:“国内适合收购的标的公司很少,因为根是断的,(技术和基础研究)源头在国外,要到国外看。”
在快速迭代的互联网世界里,即便是互联网巨头,单打独斗练独门秘籍也会错失良机。最佳方式,就是拥有数据和拥有技术的公司,通过各种结盟方式形成优势互补,快速抢占市场。
2014年11月,蚂蚁金服宣布和旷视科技战略合作,利用后者的人脸识别技术Face++软件去确认开立在线银行账号的用户身份,即“人脸支付”。
Face++在人脸检测的多项指标评测中接连拿下世界第一。2013年,在极难识别的互联网新闻图片上,获得了97.27%的准确率,这个指标高于Facebook团队。三年后,这一准确率已提高至99.5%。
进行面部识别,需要处理大量来自面部的数据信息,包括结构、五官以及肌肉等方面的数据分析。阿里云为这个合作注入自身的数据和分析能力。
“凡是花钱解决的问题都不是问题,阿里可以自己完成这些事情,但时间成本是相当昂贵的。”闵万里对《财经》记者说,“阿里有1000件同级别的事情要做,能做好的只有其中几件,剩下的用投资+合作,这是时间和资本效率最高的做法。”
技术和数据的结盟并不限于BAT,更多的公司希望通过结盟方式获得未来,新的巨头或许从中诞生。
搜狗CEO王小川的思路是社交化,做更多连接,通过建设社群关系,把人大脑里的智慧表达出来,从而解决目前搜索技术存在的内容不够精准和实用性较差的问题。2013年腾讯入股搜狗后,先后向搜狗开放了微信公众号数据和QQ兴趣部落,为搜狗输入数据资源。除此之外,搜狗还在去年11月战略投资知乎1200万美元,全面接入知乎内容。
王小川想让搜狗的人工智能机器不断学习社群数据,他对《财经》记者说,“人工智能下一个五年不在于人工智能本身,而是让机器找到人。”
李彦宏称,人工智能拥有广泛的商业用途,人工智能的“井喷式”创新将重构传统产业。
今天,技术和数据的天然开放性让各公司之间的竞争变得“我中有你、你中有我”,最终的赢家是可以将技术和数据平衡利用,达到平台效益最大化的公司。
微软亚洲研究院常务副院长芮勇认为,横向对比,中国和国际领先公司在核心技术上确实存在差距,国外更加注重基础研究和技术研发,国内企业可以将国外的研发工具化、商业化;从纵向看,中国在人工智能领域的技术积累近几年确实出现了飞跃,无论是最底层的计算机体系架构,还是智能硬件,或是上层软件应用,都有质的进步。
“只要不太急于求成,持之以恒地投入,中国的人工智能产业相当值得期待。”芮勇说。
挤出泡沫
马云在一次内部讲话中强调:“全球都在讲人工智能,到了风口浪尖,在创新面前,没有第二只有第一,创新落伍了,你就输了。”
焦虑的不仅是BAT,华为公司创始人任正非5月30日在全国科技创新大会上发言提到,“未来二三十年人类社会将演变成一个智能社会,其深度和广度我们还想象不到。如果不能坚持创新,迟早会被颠覆。”
开放趋势之下,人工智能也注定不是一场巨头间的战争。
市场调研机构CB Insights的统计数据显示,2014年风险资本对人工智能的投资增长302%,达到3.09亿美元。
中国人工智能领域已有近百家创业公司,65家获得投资,共计29.1亿元人民币,其中旷视科技、优必选、云知声、SenseTime四家公司登上艾瑞独角兽榜单。
更多初创公司只是打上了人工智能的标签。它们本质上是用国际开源的平台,用数据训练一两个模型,甚至照搬国际模型,这其实潜含危险,最大的风险是产品严重同质化,尤其在人脸识别、语音识别等成熟领域,这些公司的产品没有突破性创新,根本没有继续走下去或被收购的价值。
姚星常常为投资人鉴定真伪人工智能公司。他说,辨识伪人工智能公司有两个关键点:一是这家公司所采用的技术是否是最新、最前沿的技术,如果不是,则是用人工智能概念包装的伪人工智能。
其二,这家公司的技术和业务是否具备可扩展性?若否,则是采用部分机器学习算法或浅层人工智能技术的商业公司,而非真正的人工智能公司。
iPIN是一家拥有文本认知智能技术的公司,从去年开始,iPIN收到了不少投资机构的投资意向,该公司创始人兼CEO杨洋告诉《财经》记者,到目前为止,他还没有遇到真正有能力鉴别人工智能技术水平的投资机构。
“这对于做伪人工智能的公司绝对是一个好消息。”杨洋调侃说。
危险在于,就算是一些初创时期确实手握人工智能独特技术和商业模式的公司,也在资本的胁迫下慢慢走形。
在资本的压力之下,一些人工智能创业公司开始过早商业化,研发投入逐步降低,人员结构也发生变化,销售开始主导公司,最终技术公司变成营销公司,失去了被并购的价值。
投资人工智能公司,需要专业技术知识和长线投资眼光。根据Gartner的“智能机器炒作周期图”,由人工智能驱动的应用中,语音识别产业化最高,自动驾驶汽车和智能顾问处于炒作最高点,智能机器人、自然语言处理/生成和虚拟个人助手则处于爬坡期。这些都属于5年-10年内能广泛普及的颠覆性技术。而神经形态硬件(如神经元芯片等)属于10年以后才能普及的技术,但该技术可能还没研发成熟就被淘汰了。
需要在这一轮变革中保持耐心和恒心的还有政府和高校。人工智能涉及计算机科学、生物学、社会学、哲学、材料学、工程学等多个学科,中国高校基础学科的研究能力无法被充分利用,体制内缺乏一套产学研流畅对接的机制。这导致中国高校在这次产业变革中严重缺位。从美国的经验来看,正是其从法律、机制上保证了产学研的平滑转换,才令美国在这一轮的人工智能研究中占据上风。
一些乐观的投资人认为,技术发展本身就是驱逐泡沫的手段,“不用很长,一年或一年半的时间,很多真实情况就会暴露出来,泡沫也将逐渐散去”。