中国的人工智能革命:理解中国的结构性优势
2018-05-14
一场技术革命正席卷全世界,而能够有效利用这场革命所带来的机遇的国家将引领21世纪。这就是人工智能革命。优先掌握人工智能的国家将在制定新的全球秩序时具有至关重要的战略优势,人工智能将改变国际经济和国际关系中的势力平衡。本文通过很多证据详细地说明有关中国人工智能的情况,同时概述构成中国人工智能优势的几个主要来源。
如果说2017年是人工智能在中国引起轰动的一年,那么2018年将成为中国在人工智能领域竞争地位越来越明显的一年。有关中国人工智能发展的大多数媒体报道主要聚焦在中国的大型互联网公司及其人工智能部署、政府在人工智能技术中的巨大利益以及中美“人工智能竞赛”的可能性。还有的媒体谣传令人危言耸听的人工智能的潜在军事用途,这一方面甚至会被夸大其词。
这些分析在很多方面令人失望。他们通常不能区分人工智能的不同含义,无法辨识人工智能的运用以及如何将智能应用于更广泛的软件应用中。本文通过很多证据详细地说明有关中国人工智能的情况,同时,概述构成中国人工智能优势的几个主要来源。
人工智能不仅仅是另一种产品或服务,也是一项基础升级技术,可以增加到现有的程序和服务中,使其更智能、更有效、更准确、更有用。人工智能不是一个庞然大物,我们通常将人工智能理解为四次不同的应用浪潮:互联网智能化、商业智能化、实体世界智能化和全自动智能化。评估一个国家或一个公司在人工智能领域的现有能力和未来潜力,需要细致地理解不同的人工智能领域和其他变量,如数据数量、人才质量、尖端硬件可用性等。
通过以上分类,我们可以对中国人工智能的发展进行以下预测:
·新一代科技人才将促进中国人工智能的发展:中国目前存在人工智能人才不足的现象,但中国正处于积累大批年轻科学家的如果说2017年是人工智能在中国引起轰动的一年,那么2018年将成为中国在人工智能领域竞争地位越来越明显的一年。有关中国人工智能发展的大多数媒体报道主要聚焦在中国的大型互联网公司及其人工智能部署、政府在人工智能技术中的巨大利益以及中美“人工智能竞赛”的可能性。还有的媒体谣传令人危言耸听的人工智能的潛在军事用途,这一方面甚至会被夸大其词。
这些分析在很多方面令人失望。他们通常不能区分人工智能的不同含义,无法辨识人工智能的运用以及如何将智能应用于更广泛的软件应用中。本文通过很多证据详细地说明有关中国人工智能的情况,同时,概述构成中国人工智能优势的几个主要来源。
人工智能不仅仅是另一种产品或服务,也是一项基础升级技术,可以增加到现有的程序和服务中,使其更智能、更有效、更准确、更有用。人工智能不是一个庞然大物,我们通常将人工智能理解为四次不同的应用浪潮:互联网智能化、商业智能化、实体世界智能化和全自动智能化。评估一个国家或一个公司在人工智能领域的现有能力和未来潜力,需要细致地理解不同的人工智能领域和其他变量,如数据数量、人才质量、尖端硬件可用性等。
通过以上分类,我们可以对中国人工智能的发展进行以下预测:
·新一代科技人才将促进中国人工智能的发展:中国目前存在人工智能人才不足的现象,但中国正处于积累大批年轻科学家的阶段。我们预计该现象在一段时间后将发展为一种优势。
·人工智能数据将是一个最为主要的优势:大数据以及其在人工智能中应用的灵活性将成为中国的核心优势,而且是其他国家无法超越的。
·在四波人工智能浪潮中,中国将在其中三波中处于世界领先地位:今后,中国在互联网智能化、实体世界智能化和全自动智能化方面的能力不仅会非常强大,而且还会处于世界领先或共同领先地位。
·商业智能化在中国略显落后:由于缺乏企业软件和数据仓库,中国的商业人工智能发展得比较慢。
·中国将持续从高度有利的监管环境中受益:政府支持将大大促进中国人工智能的发展。
·中国将成为一个世界性的人工智能大国:北京等城市将超越多伦多、蒙特利尔、伦敦,成为与硅谷同级的人工智能创新中心。
人工智能应用的四波浪潮
人工智能的发展主要分为四波浪潮。这四波浪潮同步发生,但起点和速度有所不同:
1.互联网智能化——互联网网站和应用是用户标签数据的最大来源——当我们在一个电子商务网站点击购买时,我们会向人工智能提供一个学习标签。互联网巨头(谷歌、Facebook、亚马逊、百度、阿里巴巴、腾讯)是这些大型互联网数据集的最大受益者。这一人工智能浪潮开始于2010年左右。
·中国拥有庞大的数据集和强大的风险资本生态,可以向创业者提供资金,这有利于中国的创业公司占据该阶段的领先地位,或与美国保持共同领先地位。
·阿里巴巴将与亚马逊抗衡,而腾讯很可能会超过Facebook。百度可以对标谷歌,但在人工智能领域仍然落后于美国竞争对手。
2.商业智能化——拥有大型数据库的企业可以将人工智能应用于历史数据或新数据,连接业务程序,并辅助决策。比如IBM Watson(美国)、Layer 6(加拿大)和第四范式(中国),将人工智能应用于财务数据(预测商品和股票、信用卡诈骗、优化客户资产分配)。这一浪潮开始于2013年左右。
这波浪潮中,中国还需一段时间来弥补差距,因为中国企业在采用数据库和企业应用方面的步伐较慢,需要较长的数据清洗和结构化的周期。
3.实体世界智能化——指通过传感器和智能设备把实体的物理世界转为数字化,收集之前不可用的新数据,利用新数据创建新应用。例如,Amazon Echo实现了音频环境和语音输出的数字化;中国的Face++采集了包括人脸在内的大量影像数据。这一阶段要求部署大量的连网传感器、新型的多媒体设备,有时还需要新用户界面(如通过语音和手势)。 这一人工智能浪潮的应用还包括自动储存,可以识别用户面孔和产品选择,理解手势,并自动处理顾客结账和付款。这一人工智能浪潮的发展始于2015年左右。
中国拥有大量的可用数据,而中国人对于隐私相对不太纠结(如商场内的摄像头可以识别人脸,并以潜在商业信息锁定用户),故而中国将成为实体世界智能化的领头人。
4.全自动智能化——前面三波人工智能浪潮主要是由软件驱动的,但全自动智能化通过动作和触觉输出,将人工智能纳入无人驾驶汽车、机器人和各种各样的连网设备中。随着L3无人驾驶汽车和工厂机器人日渐普及,这一浪潮将很快开始。
·中国有机会在这一领域处于领先或同步领先地位。虽然中国在全自动智能化领域的技术落后于美国大约两年,但凭借政府的政策、补贴等支持,中国企业正在快速前进。
·由于中国是世界上最大的制造大国,促进自动化人工智能所需的产线提升,或新品牌机器人的全新生产线将部署实现得更快更有效率,其应用成本将越来越低。
中美人工智能巨头比较
美国有三大人工智能巨头,中国也有。
全球100名顶尖的人工智能科学家中约有一半在谷歌任职,主要关注谷歌大脑(一种新型人工智能使能操作系统)、谷歌云(为业务赋能的计算网络)以及DeepMind(产品有AlphaGo)。百度紧随谷歌的步伐,创建了Duer OS(针对语音和基于语言的操作系统)以及Apollo(无人驾驶车辆操作系统)。尽管最近出现几次高调的离职,但百度在中国拥有的人工智能专家仍然最多。除了以上相似点以外,谷歌和百度之间的人工智能人才差距仍然很大(谷歌大大超越其他公司)。
社交网络仍然吸引大量的使用数据——这是人工智能的动力,故而Facebook在很多产品上都采用人工智能技术。Facebook已经组建了一个顶级的研究实验室(FAIR)和一个应用机器学习(AML)小组。腾讯与Facebook最相似,由中央研究机构和各产品小组(如微信)组成。
亚马逊是人工智能竞赛中的一匹黑马。虽然没有知名的人工智能研究或技术,但Amazon AWS、Amazon Echo、Amazon Go以及对Whole Foods的收购均与人工智能相关,使得亚马逊处于应用人工智能领域的领先地位。Amazon Echo和Alexa API是语音驱动操作系统的核心。Amazon Go和Whole Foods已经开始线上和线下整合,成为世界上最优级巨型批发商。AWS是最普遍的云产品,目前正在通过第三方不断增长的人工智能功能发展壮大。阿里巴巴采用类似的策略,而阿里云则是增加了人工智能技术的领先云系统。阿里巴巴还创建了自身的实体店铺,展示了其自主商店,并尝试进行线上和线下融合(Online-Merge-Offline, OMO)。
在平台/操作系统方面,谷歌和百度拥有相似的目标。在云+人工智能以及OMO人工智能方面,亚马逊和阿里巴巴拥有相似的目标。而Facebook和腾讯均关注最流行的客户应用中人工智能的使用,目前没有创建大型平台的倾向。
中国的人工智能创业盛况:
从模仿到赶超
从模仿现有应用到实现超越创新,中国的创业环境在过去10年间发生了巨大的变化。这主要源于不断流向中国的资本、一大批有决心且努力的年轻企业家以及政府政策的支持。甚至在人工智能爆发之前,中国已经在移动互联网的创新和价值创造方面超越了美国。
这一发展引发了数据大爆炸,数据继而成为了人工智能发展的基础燃料。在四波浪潮中,每波浪潮都出现了大量的创业公司。互联网公司迅速拥有了人工智能功能,并获得快速发展。互联网驱动的人工智能公司包括滴滴(打车)、美团(食品配送)、今日头条(新闻推送)、美图(自拍美化)、快手(短视频、直播)以及趣店、拍拍贷(金融技术)等。
在第二波商业智能化浪潮中,出现了很多聚焦金融、健康和企业服务的人工智能公司。例如第四范式(提供银行和金融机构人工智能解决方案)、追一科技(提供智能客服,服务中国移动、滴滴、携程旅行网等)以及碳云智能(健康追踪)。
在第三波浪潮实体世界智能化中,出现很多公司从事移动设备、人脸识别、语音识别,包括Face++、商汤(人脸识别)、出门问问(语音支持)、小鱼在家和Rokid(智能家居助手)。
最好的例子是科大讯飞。科大讯飞是中国领先的语音识别公司,可以与美国的Nuance相比拟。但若仔细比较这两个语音识别公司,自2015年以来,科大讯飞的市值已经超过Nuance。2016年年底,科大讯飞的市值已是Nuance的两倍。
在第三波浪潮中,很多参与者将人工智能应用于时尚生活产品中。摩拜是中国领先的共享单车公司,目前在全球超过200个城市部署了智能单车。摩拜单车配备太阳能充电GPS、加速器、蓝牙和其他传感器。通过智能手机就能激活近场通讯和麦克风。各种传感器会将数据传输给云端服务器。每天有数以千万的骑行者在中国各大城市骑行摩拜,一天产生20T的数据量。摩拜公司使用人工智能对数据进行分析和处理,将人、单车、道路和目的地结合,形成世界上最大规模的“物联网”之一。
最后,在第四波浪潮全面自动智能化中,无人驾驶车辆和机器人快速发展。驭势科技(UISEE)由英特尔中国研究院前院长创办,目前已经开始在特定区域的慢速驾驶场景中推出全自动化车辆。初速度公司(Momenta)基于深度学习的感知软件、HD语义映射和数据驱动路径规划相结合,形成与中国和国际汽车制造商协作的自动驾驶大脑。在无人机方面,据报道,大疆创新(DJI)占有全球85%的无人机市场,估值80亿美元。相较于需要到世界的另一边生产产品的美国公司,大疆公司具有一项关键优势:在深圳有自己的全链条制造工厂,大疆的工程师可以在附近的工厂设计和测试样机,可以更快速地从创意生成落實到产品制造。
人工智能迅速成为了中国创业公司最热门的领域。从2012年到2017年第三季度,投资人共向200多家人工智能公司注资45亿美元,其中一半以上的投资是在过去两年内进行的。Face++是一家位于北京的人脸识别创新企业,在2017年11月宣布完成C轮融资(4.6亿美元),这是目前人工智能领域全球范围内规模最大的一笔融资。同样在该月,Face++在三个计算机视觉挑战中赢得第一,领先于谷歌、微软、Facebook和卡内基梅隆大学的代表团队。
中国最大资产:海量数据
更多的数据使得人工智能更加智能化。一个拥有大量数据的优秀科学家将打败拥有较少数据的超级科学家。这一点也许不是很好理解,但比较重要的一点是,这将确定哪些公司和哪些国家将处于人工智能发展的国际领先位置。
中国的人工智能技术仍然落后,但随着更多的企业家和投资人进入人工智能领域,中国正处于迅速追赶阶段。可用数据集的规模是人工智能领域竞争优势的最重要的因素之一。大多数人工智能算法是开源且众所周知的,人工智能由聪明的科学家来改进算法,但在应用时,就是数据的问题:谁先拥有,谁就会拥有更多。若你拥有更多数据,那么你将拥有一个与人工智能关联性更强的产品。这样会使你拥有更多的用户,赚到更多的钱,聘用更多优秀的科学家,购买更多的机器,进而获得更多的数据。这一良性循环已经成为Facebook、谷歌和微软以及百度、腾讯、阿里巴巴和很多其他企业成功的关键因素。正如计算机科学家Robert Mercer所说,“没有什么比更多的数据更重要”。那么,中国能生成多少数据呢?
中国拥有世界上最多的手机和互联网用户:截至2017年9月,中国有13.9亿手机用户和8亿互联网用户(大多数使用手机访问,截至8月有7.25亿),约是美国或印度的三倍。但这还只是其中的一部分。
互联网和手机的使用比差距远不止是1∶3。在中国,使用手机支付产品的人数是美国的50倍。中国的外卖食品配送量是美国的10倍。共享单车使用量是美国的300倍。这一数据是中国人工智能发展的动力:更多的人生成更多数据,远远超过任何其他国家。
缩小人才差距
虽然世界上顶级的人工智能研究人员几乎都在美國,但中国的人工智能研究员数量正在快速增长。
中国的微软亚洲研究院(前身是微软中国研究院,由李开复领导创建)培养了5000多名人工智能专业人员和实习生。这些人当中有很多已经去了其他知名企业和大学。一些已经成为中国最大型公司,如百度、阿里巴巴、腾讯和联想等公司的CTO和首席人工智能科学家。有些去了创业公司,如Face++的首席科学家孙剑,MomentaCEO曹旭东,而有些则去了中国的大学院校和研究机构。
另外,中国研究成果的质量正在提高。在全球排名前100的人工智能刊物和会议中,华裔作者发表论文的数量约占43%,这表明中国人工智能研究获得了快速的发展。
最后,年轻的中国学生正在涌入人工智能行业,使人工智能成为最热门、薪酬最高的领域。中国大学强大的计算机科学和数学课程培养了一批优秀的毕业生。
这些因素表明,虽然中国目前缺乏顶尖的人工智能人才,但由于有大量人才进入这一行业,在未来几年将克服这一问题。
硬件:机器人、自动化和
人工智能芯片
中国目前是世界上最大的机器人市场。2015年,中国的机器人产业获得了进一步的发展,在政府公布的一项题为“中国制造2025”的国家10年计划中,提出将中国打造成顶级的技术工业国家,推动中国机器人生产制造,进一步增加国内外市场份额。这一机器人革命正在为硬件、自动化人工智能和相关人才创建更为健全的生态环境,有助于中国为完全自动化做好准备。
在中国初露头角的生态系统中,半导体是另一个关键组成部分。虽然在人工智能优化硬件方面仍落后于竞争对手美国,但中国企业在专为人工智能算法设计的半导体方面实现了快速发展,如计算机语言处理和人脸识别。中国起步虽慢却不太会影响中国在这一领域的发展。从利用基于云的人工智能服务(在GPU上运行)到张量处理器(TPU,一种集成电路类型,由谷歌专为机器学习开发)到开发利用神经网络处理器(在智能手机上运行)的应用,运行高端人工智能应用的中国公司已经尝试过很多选择。中国领先的电信设备制造商华为将大量的研发工作集中于开发手机神经网络处理器系列,今年推出了Kirin970芯片。
越来越多的高技术创业公司正在追求专门的人工智能集成电路(IC)设计和开发,如寒武纪、比特大陆、深鉴科技、中星微电子、启英泰伦、地平线机器人。在知识产权、人员配备、资源和行业经验等方面,美国公司Nvidia、Intel、Xilinx、Altera和AMD相对于中国创业公司拥有很大的优势。尽管目前尚不清楚是否将大有不同,但中国政府庞大的高科技研究机构将大大助益知识产权、人员配备和资源。同时,正在追求小应用程序专用芯片的中国硬件企业可能会打入一些市场,如图像传感器芯片、图像处理芯片和针对自动汽车应用的半导体。华为、中兴等手机公司也将继续开发其智能手机的人工智能芯片,且水平与领先的西方品牌旗鼓相当。
中国的人工智能政策
中国的人工智能政策重点很明确。国务院于2017年7月发布了《新一代人工智能发展规划》(以下简称“发展规划”),提出中国将在2020年之前赶上世界人工智能技术和应用的步伐,在2030年之前成为全球人工智能创新中心。出于政治和经济原因,中国从提高管理能力到改进政策制定和监督方面高度重视人工智能。发展规划中具体号召中国开发有利的监管环境,鼓励人工智能发展,并缓和人工智能的潜在负面影响。
中国政府在实现成果方面拥有良好的记录,这些政策规划应被认真对待。举例来说,中国在2010年提出将成为高速铁路领域的世界领先者。现今,中国占有世界高速铁路的60%。2014年,中国政府提出“大众创业、万众创新”计划。几年内,中国的创业孵化器数量从2014年的1400个提升到8000个。由于在国家层面设定了明确的期限和指标,地方企业与政府会将这些指示作为重中之重,这些计划在很大程度上会成为现实。我们预测,中国人工智能相关政策也将遵循类似的轨迹。
从历史上看,中国政府对于技术发展持有较为开放的态度。当产生新技术时,政府将扶持技术的发展,而不是通过政策或无休止的争论将其扼杀。同时,中国的环境也非常有利于快速启动和迭代。人们普遍认为,“最好先启动然后再批准”。这一想法使得中国企业生成大量的实时数据,反过来在短期内提高了技术水平。例如,在美国,卡车司机工会请求交通部延迟自动化卡车测试,而在中国,雄安新区规划(北京西南方向一个智能城市开发规划)从一开始就带有全面自动化的理念。多个公路管理机构愿意拓宽道路、设置专用车道,甚至将仓库迁移到高速道路出口附近,所有这一切都为了促进自动化卡车的部署。
另外,我们也看到了各城市为响應政府号召所展开的积极举措。上海、南京、武汉和天津仅是提出人工智能方案的城市当中的几个例子。根据以往的政策,很多资源将应用于省会级城市。资源类型包括高级人才补贴(尤其是海外人才);顶级创投基金引导,政府作为有限责任合伙人(LP),但可以为基金的普通合伙人(GP)提供益处;针对顶级人工智能公司和创业公司的特别激励计划(免租、本地雇佣补贴、顶级人才的住房和私人学校);公司和个人技术奖等。
最后,美国、欧洲和中国也会在开发人工智能技术和应用的监管机制方面展开竞争。发展规划明确制定了人工智能开发和使用方面的监管、法律和道德原则的必要性,这是具有先见之明的一项举措。当然,政府对于人工智能监管、道德和经济调整的做法表示中国的管理和意识形态模式更广阔。中国面对国际问题习惯采用以国家为中心的方法。例如,中国可能会通过联合国启动一项活动,首先建立一个自动化/人工智能相关的“行为准则”或基础监管方法,然后建立相关的特别委员会,最后建立一个在联合国框架下运行的监管机构。这种做法将让中国更为前沿地站在制定问题解决方案的位置。中国试图对网络安全问题方面采用类似的方法,中国认为网络安全具有全球化的影响,故而需要有全球化的监管对策。
长远展望:人工智能的全球双寡头
局面
总的来说,中国的人工智能正在发展,主要由以下几项人工智能发展结构性优势推进:大型数据集、年轻的人才队伍、有活力的企业文化,以及有利且务实的政府人工智能政策。
·这些优势将加快四波人工智能浪潮的发展:互联网智能化、商业智能化、实体世界智能化和全自动智能化。
·中国的科技巨头和美国对手展开竞争,但目前在前沿科研以及全球平台经验方面仍然落后。
·中国技术创业生态的活力以及技术和工程人才的爆发,正在缩小中美人才差距。
·中国的数据库、机器人和计算机熟练程度正在提高,而大型数据集的规模和可用性将成为中国人工智能发展最为关键的优势。
·支持的监管环境和有利的政府政策确保中国在全国范围内具有独特竞争力。
注重技术、注重实验、注重速度的三大特性使得中国成为全球人工智能强国。在快速创新的年代,中美人工智能双寡头的局面不但不可避免,其实已悄然到来。