2019年人工智能全景报告
2019-12-27郑子亨王哲
郑子亨 王哲
人工智能研究与技术突破
强化学习开辟新天地
1.强化学习在游戏领域表现卓越。DeepMind公司使用多智能体训练算法完成的AlphaStar系统可以综合各种最为有效的策略组合并创建一个相互竞争的智能体联盟,来共同探索巨大的策略空间。
2.智能机器人训练过程更加注重与真实环境交互。强化学习模型的“驱动式学习”概念被提出,即通过“观摩游戏”的策略训练一台机器人同时执行多项复杂任务,对于每项任务无需进行单独的针对性训练。在该策略中,训练人员可以远程操控智能机器人,使之用各种方式与外界环境进行交互,从多个维度对智能机器人在真实环境中进行训练,与针对单一任务训练相比训练效率和训练效果均得到提升。在基于驱动式的训练中,智能机器人不仅能学习尽可能多样化的技能,并使每项技能均对扰动具有鲁棒性。例如,加州大学伯克利分校的机器人学习实验对BLUE机械臂进行了实际环境中的训练,使其在手动灵活性方面取得了巨大进步。
3.强化学习训练趋向于线上规划学习动态模型。谷歌训练的强化学习网络PlaNet可以从图像中学习环境动态信息,并通过准确预测数个时间段后的奖励进行线上规划,选择将要进行的动作。这种训练方式与最先进的A3C和D4PG算法相比,在训练时间大致相同的情况,使模拟环境交互作用减少了50倍。经过2000张图像训练之后,PlaNet 的表现与受过10万张图像训练的D4PG算法基本相似。
機器学习在生命科学领域
发现新应用
1.AlphaFold模型预测蛋白质的3D结构。DeepMind公司训练的AlphaFold能够使两个深度卷积神经网络协同工作,第一个神经网络预测氨基酸对之间的距离,第二个神经网络预测连接这些氨基酸的化学键之间的角度,并创建蛋白质距离图来生成3D蛋白质结构。该方法在预测蛋白质3D结构上远远超过先前最先进水平,给未来机器学习在生物学方面的广泛应用指明了方向。
2.机器学习算法合成化学分子。上海大学马克·沃勒(Mark Waller)教授团队同时使用三种不同的神经网络并结合蒙特卡洛树搜索组成了3N-MCTS算法。3N-MCTS算法通过提出有限数量的自动提取转换将搜索引向最正确的方向,并预测拟议的反应是否真正可行。在化学分子合成方面,3N-MCTS算法可解算80%以上的分子测试集,每个目标分子的时间限制为5秒,与现有先进的计算机辅助合成规划相比,合成速度大大提升。
3.深度学习与医学融合加深。随着深度学习、计算机视觉等技术的发展,人工智能被越来越多的应用于眼部疾病、心脏疾病的诊断。基于3D U-Net架构的神经网络可以进行数字光学计算机断层摄影扫描,并创建眼睛的“组织图”,并通过该组织图对患者病症进行种类和严重性的分级分类。另外,接受过5.4万名患者训练的端到端深度学习网络在心脏病诊断领域已经达到人类专家级水平,以门诊中的单导联心电图轨迹作为原始数据,深度学习网络已经可以成功分辨12种心律类别。
4.脑机接口成为发展热点。哥伦比亚大学的研究人员通过深度学习技术分析癫痫患者在连续收听语音时的脑经神信号,能够对病人想要表达内容进行语音合成,准确度达到75%。另外,神经网络被证明可恢复残疾人士的肢体控制能力。研究人员根据从患者大脑记录的原始颅内电压信号对神经网络进行训练,神经网络可以判断手臂的预期活动,并使用电刺激和神经网络解码器永久恢复四肢瘫痪患者前臂的运动能力。相比于支持向量机(SVM)技术,神经网络方法对故障更具鲁棒性,并可以通过迁移学习技术使患者掌握新的动作。
自然语言处理实现
突破式发展
1.预训练语言模型。谷歌BERT模型、艾伦研究所ELMo模型、鲁德和霍华德ULMFiT模型和微软MT-DNN模型纷纷证明预训练语言模型可大大提高各种自然语言处理任务的性能。通过使用网络上的未标记文本对神经网络进行训练,可以在自然语言处理任务中创造收益,并创建多种新的商业应用程序,就像ImageNet迁移学习驱动了计算机视觉的更多工业应用一样。
2.无双语语料情况下的机器翻译。脸书(Facebook)展示了如何充分利用单语数据,以扩大机器翻译的应用范围。该技术首先通过自动推断双语词典将模型初始化,并利用去噪自动编码器来充分利用较强的语言模型,其中,由编码器构建的表征只能在当前两种翻译语言之间共享。这项工作将若干原理应用于开发简单易懂的、基于短语的统计型机器翻译(PBSMT)系统和神经机器翻译(NMT)系统,神经机器翻译系统学习如何在无双语文本的情况下进行翻译。
3.通用语言理解评估基准。新性能基准,即通用语言理解评估(GLUE),可测试自然语言处理模型在各种语言理解任务上的表现。人类对语言的理解较为概括和灵活,通用语言理解评估基准测试为在跨逻辑、常识理解和词汇语义任务中评估自然语言处理系统提供了单一基准,基准测试旨在支持各系统共享各项任务的一般语言知识。
人工智能人才发展现状
人工智能论文发表情况
1.谷歌在人工智能领域仍占据主导地位。在2018年神经信息处理系统大会上,谷歌依旧占据主导地位,在以第一作者发表论文数量的排名中,谷歌仍旧位列榜首。
2.欧洲发表论文数量最多,中国的平均引用率不断增长。美国和欧洲在人工智能科研领域仍然具有更高的影响力,来自美国的人工智能领域研究成果被引用率比全球平均水平高出83%,来自欧洲的人工智能论文总量占据世界第一,我国人工智能领域研究成果的影响因子虽然在过去一年呈现上升趋势,但总体被引用率仍低于世界平均水平。
中美高校加大
人工智能人才培养
中美各大高校纷纷加大对人工智能研究型人才培养的力度。2018—2019年,全球人工智能领域44%的博士毕业生来自美国,中国排名第二为11%。中美各大高校纷纷加大对人工智能布局力度,麻省理工学院在计算与人工智能领域新增投资10亿美元,加速人工智能迈向新一代,与2012年相比,清华大学和斯坦福大学的人工智能课程注册人数分别增加了近16倍和5倍。
人工智能人才薪资结构
面临调整
高端人工智能人才薪资不断上升,大型科技企业内资深工程师的年薪接近100万美元。另一方面,每小时1.47美元的数据标签工作岗位却实现了巨大增长。如总部位于北京的馬达智数公司(Mada Code)将微软和卡内基梅隆视为客户,并声称拥有一支由2万多名自由职业者组成的团队,为其标注数据。
产业人才需求发生变化
从产业人才发展看,加拿大、英国和瑞士是人工智能产业人才的“平台型”国家,吸引外国人才和对外国输出本土人才的数量均较多。美国和中国是人工智能产业人才的“稳定型”国家,两国人工智能产业发展处于全球领先地位,生态系统内部更为成熟、稳定,两国人才流入和流出均趋于平缓。同时,中美两国的大型科技企业对人工智能专项人才的需求量自去年起有所下降,这说明人工智能产业发展已经从科学研究阶段向应用落地转化。
人工智能行业发展现状
人工智能领域投资情况分析
人工智能领域风险投资金额逐年扩大,2018财年的资本投资比2017财年高出80%左右,其中北美地区投资最多,占有55%的市场份额。另外,大型科技企业收购人工智能初创企业趋势愈演愈烈。自2010年以来,谷歌、苹果、Facebook、亚马逊、微软已累计收购60家人工智能初创企业。
智能机器进入落地应用阶段
1.智能机器人进一步发展成熟。各大智能机器人制造企业纷纷采取行动。艾波比集团(ABB)投资1.5亿美元,用于在上海建设全球最先进、自动化程度最高、最灵活的机器人工厂。另外智能机器人全栈初创企业发展迅猛,人工智能初创企业Bright Machines由欧特克和伟创力国际公司的元老领导,首轮融资筹集了1.79亿美元,雇员增长到300人,以催生由智能化软件定义机器自动制造产品的制造模式。
2.智能机器人与其他行业结合日益密切。美国工厂安装的机器人数量创历史新高。2018年,美国工厂新增了35880台机器人,比2017年增加了7%。智能机器人推动了制造业的智能化发展。智能机器人制造公司伯克希尔格雷(BerkshireGrey)提供了自动拣选机器人、移动式地面机器人系统以及产品包装与分拣解决方案,以提高吞吐量,并简化电子商务运营的实际供应链。
亚马逊扩大其运营基础设施
并推出仓储机器人
2016至2019年,亚马逊在美国总部的运营中心建筑面积增加了45%,数量增加了两倍。同时,亚马逊推出了更多仓库机器人,用于运营和分拣,其仓库中有20万台机器人,数量高于本年初所宣布的10万台。亚马逊近期着力对其仓库进行诸多改进,例如,防止阳光照射天花板天窗以减少眩光、在地面上安装QR码、重新定向空调等以免吹动周围的轻质物体等,方便机器人巡视。
自动驾驶汽车现规模扩大
市场前景广阔
一年来,自动驾驶汽车市场规模不断扩大并已达到数十亿美元。通用(General Electric)旗下自动驾驶汽车公司Cruise融资后估值达190亿美元,2018年Cruise预算达到7.28亿美元,2019年预算将增至10亿美元。优步方面,2016至2018年,优步每年在自动驾驶上的研发支出分别为2.3亿美元、3.84亿美元、4.57亿美元,员工人数超1000人,融资后估值达到72.5亿美元。谷歌旗下公司Waymo运营成本在10亿美元以上,目前正在寻找外部投资者。同为自动驾驶汽车公司的Nuro和Aurora,前者在三年内完成了由软银远景基金主导的B轮融资,融资金额高达9.4亿美元,后者从红杉资本、亚马逊和美国普信集团手中获得了5.3亿美元的B轮融资,增强了其资产负债表的财务实力,所筹资金已增至6亿美元。福特则为研发自动驾驶拨款40亿美元。
自动驾驶汽车测试里程和保有量增减不一。2018年Waymo无人驾驶汽车行驶100多万英里,是第二名Cruise的2.8 倍,是第三名苹果的16倍。2018年,在加利福尼亚汽车行驶里程为14435英里,自动驾驶汽车行驶里程仅占人类的驾驶里程数的0.00066%,加利福尼亚和世界各地的自动驾驶车辆有所增加,但仍有多个国家有所减少。
机器学习将推动各行业预测性需求的发展。能源领域,Invenia 公司是这一领域的早期领导者,可利用天气信息、电网运行数据和电力输送方向来预测需求。防灾预测领域,一些企业使用机器学习自动校准对了解、预测和管理水资源至关重要的水文模型。出行领域,航班和酒店需求随季节、天气或大型外部事件而波动。可将机器学习加以扩展,帮助航空公司和酒店进行需求预测。机器学习系统可帮助预测酒店潜在预订、特定航线需求,或服务中断情况。物流领域,概率模型和多智能体系统可用于学习如何最为合理地分配资源(如车队),以应对动态变化的需求,使资源利用率最大化。资源配置最优化问题一旦解决,具有广泛的应用前景。零售领域,BlueYonder人工智能平台使莫里森(英国的连锁超市)的2000万项补货决策中有99%完全自动化,同时提高了盈利能力,并减少了浪费。
改进机器的阅读能力
自然语言处理方面的突破已开始应用于需要处理大量文本或快速处理文本会带来大量经济回报的行业。机器学习非常适合于金融和情报领域,从大量在线数据中获取重要信号,机器可用分析文本的增长速度快于人工分析师,成为专业分析师的得力助手,使得机器学习广泛应用于企业领域。例如,自然语言处理公司Primer使用自然语言处理与生成来自动执行查找、阅读、交叉引用和总结等通常由分析员承担的任务。
医疗保健进展
2018—2019年,美国食品药物管理局批准了三种基于人工智能的医疗器械。2018年4月批准IDx软件通过眼睛扫描检测糖尿病视网膜病变。2018年5月批准Imagen软件通过二维X光片检测成年患者的腕关节骨折,预期用途涵盖初级保健、急救医学、紧急护理和整形外科。
2018年11月批准MaxQ软件通过对成人非造影头部计算机断层扫描(CT)病例的临床评估,优先对有颅内出血迹象的患者进行治疗。同时,制药企业与人工智能驱动的药物开发公司正在加强合作。
人工智能专利进展
2012至2017年,人工智能同族专利的增长率高于人工智能科学出版物(年度增长率分别为28%和6%)。随着机器学习的商业应用不断扩大,科学论文与专利数量的比值急剧下降。其中,计算机视觉是最为热门的专利领域,而在计算机视觉领域中,最为热门的是生物统计学(即与生物数据有关的应用)。
人工智能硬件
一年来,移动芯片组的人工智能性能基准制定工作不断推进,市场竞争压力加剧。美国高通公司的骁龙(Snapdragon)处理器通过展示浮动和量化神经网络方面的强大性能和硬件加速而获胜。基准测试任务包括分类、人脸识别、去模糊、超分辨率、分割和增强;在对手机的人工智能任务性能进行基准测试方面,三星、华为和小米手机位居榜首,谷歌的Pixel3手机排名第22位。谷歌、英伟达、亚马逊则将计算和竞争推向极致加入竞争,预计到2025年,为人工智能服务的应用可生成40万亿GB数据。
5G将成为普遍存在的
人工智能计算的支柱
5G可为人工智能计算提供更快、更稳定的信息传输。目前,中国的5G进展远远领先于美国。据估计,华为占据了全球28%的电信市场,德国专利数据公司IPlytics的数据显示,华为拥有的5G 标准专利最多(1529项),其次是芬兰的诺基亚(1397项)。华为既拥有专利优势,也有最大的商业动力,有望成为构建网络供应商、设备制造商和应用开发商生态系统的关键参与者。在欧洲,英国和德国仍在使用华为硬件,但美国则强烈抵制华为硬件。
人工智能行业政治环境现状
公众对待人工智能的态度
布鲁金斯学会(Brookings Institution)2018年8月发布了《对待人工智能的态度》调查,样本对象为美国的2000名成年人互联网用户。人类未来研究所(Future of Humanity Institute)2019年1 月发布了美国人对待人工智能的态度,调查对象为美国的2000名成年人。整体来看,人类未来研究所预测,到2028年实现高级机器智能的可能性为54%,距离实现高级机器智能只有9年。大部分美国人并不支持研发用于作战的人工智能技术,但这种态度会随着对手的研发而发生改变。大多数美国人认为,相比于法官,私营企业领导人更有资格做出决策。
大部分美国人认为企业应设立一个人工智能审核委员会,以定期处理企业的伦理决策。美国人最信任由美国军方和学术研究人员开发人工智能应用,对科技公司、非营利组织(如OpenAI)和美国情报机构的信任度稍低。美国人认为Facebook是所有人工智能开发者中最不值得信赖的,另外,人工智能治理可能面临的最大挑战来自四方面:一是人工智能辅助监视侵犯隐私和公民自由,二是人工智能被用于在线传播虚假和有害内容,三是对政府、企业、机构和个人进行人工智能网络攻击,四是保护数据隐私。
各国人工智能的顶层设计
德国公布“德国制造人工智能”战略规划。德国政府更倾向于支持现有机构和发展较慢的公司,到2025年将投资30亿欧元支持上述计划。
芬兰实施“百分之一”人工智能计划。芬兰自2017年起对其1%的人口进行基础机器学习训练,是第一个制定国家级人工智能战略的欧洲国家,通过与政府和私营企业合作,全国范围内现有5.5万人学习该课程,超过250家企业宣布将参与“人工智能挑战”计划。
欧盟在人工智能政策方面落后于美国和中国。欧洲旨在通过注重“伦理化人工智能”及其在“安全和高质量产品”方面的声誉来区别于其他经济体。2019年,欧盟委员会对“地平线2020”计划中的人工智能项目的投资增加了一倍,现计划每年对“欧洲地平线”和“数字欧洲”中的项目投资10亿欧元。
美国特朗普政府对人工智能实施出口管制。2018年11月19日,商务部表示正在考虑采取激进措施,将出口管制应用于机器学习,包括深度学习、強化学习和计算机视觉。特朗普还签署了一项行政命令,确立《美国人工智能倡议》的计划。该计划极其不明确,但要求联邦政府将现有资金用于人工智能研究和商业化。
新的安全挑战
先进技术对大众监督能力日益增强。华为新推出的P30 Pro高倍率智能手机摄像头、中国研究人员成功将神经网络应用于解读唇语,以及计算机视觉系统的进步,即可随着地理位置的变更(如出现在地铁里)对同一人员进行重新识别,这些都表明先进技术对大众监督能力日益增强。
自然语言处理技术的武器化。自然语言处理技术可能自动生成误导性新闻报道、在线冒充其他人员、自动生成可在社交媒体上发布的诽谤性或虚假内容。2018年9月,加利福尼亚批准了《2018年加利福尼亚州增强网络透明度法案》,使用机器人与加州人进行互动以“故意误导”该人员,将被认定为违法行为。
DeepFake换脸技术危害政治议程。众议院举行了第一次听证会,专门审查DeepFake换脸技术中人工智能生成的合成数据,委员会查问了以下内容:人工智能促成的虚假内容对国家安全构成的威胁;可采取哪些措施来发现和打击这些虚假内容;政府部门、私营部门和社会应采取何种措施来应对可能出现的、可怕的“后真相”未来。
中国人工智能发展情况及预测
中国人工智能发展
近一年来,中国人工智能发展迅猛,主要体现在几个方面。
一是用人脸识别提升用户体验、节省消费者时间。例如在商店刷脸支付和在机场检索航班信息。
二是中国互联网企业进军农业领域。阿里巴巴和京东都已涉足畜牧业。养鸡方面,2016年,京东推出了“跑步鸡”计划,将人工智能工具集成到整个饲养流程中,现已实现自动化喂食、饮水和清除废物。养猪方面,德康集团、特驱集团和阿里云相互合作,使用计算机视觉和语音识别系统通过胁腹上的数字来辨别每只猪。
三是中国企业研发支出快速增加,但市场份额明显较小。中国企业的研发支出同比增长34%,但北美企业在全球科技支出中仍占比61%。
四是中国的工业自动化水平越来越高,裁员量也越来越大。过去三年,中国某些工业企业利用自动化技术取代了40%的劳动力,因为自2012年以来,中国年度机器人安装量增加了5倍(相比之下,欧洲仅增加了1.12倍)。
五是机器人推动了中国自动化仓储业发展。京东的自动化仓库数量和面积同比增长45%。目前,京东上海运营中心每天使用自动化仓储机器人完成20万份订单的组织、拣选和运送,该仓库仅由4名人员照管。
六是中国企业继续在美国公开市场上市。2018年,33家中国企业在美国交易所上市,同比增加了两倍,几乎达到2010年最高水平。2018年,全球共有190家企業在美国上市。
七是中国拥有的专利数量最多,但只有23%属于“发明专利”。中国发明专利的审批程序较为严苛,但一旦被批准就会获得长达20年的保护。实用新型专利和设计专利的有效期为10年,审查流程不甚严格,且可在1年内获得批准。中国的这种双重专利制度有助于使其专利数量远远领先于其他国家。
中国发明专利的有效期大多为5年,95%的设计专利和61%的实用新型专利会在5年后失效。相比之下,美国85.6%的专利在5年后仍在支付维护费用。
八是中国发布了更多的高影响力机器学习学术研究。相比于美国,中国发布的机器学习研究数量更多。艾伦研究所最近的一项分析表明,中国也在迅速缩小质量差距。
对未来一年人工智能
发展的预测
预计从2019年6月起的未来12个月,将有一批新初创企业应用近期在自然语言处理领域实现的研究突破,上述企业将集体筹集1亿多美元。分领域看,自动驾驶技术仍主要处于研发阶段,未来1年所有自动驾驶汽车公司的行驶里程将均不超过1500万英里。在隐私保护方面,财富2000强企业中将有一家除谷歌、苹果、Facebook、亚马逊、微软之外的公司采用隐私保护机器学习技术,以增强其数据安全性和用户隐私政策。在高等教育方面,越来越多的机构将设立专门的人工智能本科学位,以填补人才空缺。在AI+量子计算方面,谷歌在量子计算硬件方面取得了重大突破,将催生至少5家尝试进行量子机器学习的初创公司。此外,随着人工智能系统的日益强大,人工智能治理将成为一个更大的争议话题。至少将有一家大型人工智能企业对其治理模式做出重大变革。