人工智能技术全球专利布局与竞争态势
2020-06-04傅俊英赵蕴华
高 楠,傅俊英,赵蕴华
(中国科学技术信息研究所,北京 100038)
人工智能(artificial intelligence, AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及其应用系统的一门新的技术科学,是一门涉及计算机科学、信息科学、系统科学、控制论、语言学、认知科学等多学科的综合性技术学科,最早于1956年召开的达特茅斯会议上提出[1]。作为21世纪的三大尖端技术之一,人工智能已被广泛地应用于教育、医疗、国防、金融、生产工业、生活娱乐等领域,在为学科、产业带来新变革的同时,也为人们的生活和工作带来新体验。根据国际数据公司(IDC)统计,人工智能的发展将推动全球的收入从2016年的约80亿美元增长到2020年的约470亿美元[2]。鉴于人工智能的重要意义,该领域的竞争愈加激烈,从国家到科技企业纷纷加紧对人工智能细分市场及其应用领域的布局,开展人工智能研究也已上升为各国的国家战略。而专利是世界上反映科学技术发展最迅速、最全面、最系统的信息资源,对人工智能领域进行全球专利布局和竞争态势的分析,有助于更好地把握人工智能技术的整体发展脉络与世界竞争格局。本文采用德温特创新索引数据库(Derwent Innovation Index,DII)对人工智能领域进行检索,检索日期为2019年4月13日,共得到128 714篇专利文献,对专利申请号进行去重合并后,共得到106 206件专利(以下简称“样本专利”),将分别从技术态势、研发地域和创新机构等方面深入探讨人工智能领域的全球专利布局状况和竞争态势。
1 全球AI技术整体态势
1.1 专利申请趋势
对样本专利做年度分布统计,得到1961—2017年全球人工智能领域专利申请趋势和授权趋势如图1所示。1961—1986年,人工智能领域的专利申请量每年均未超过100件,1987—1999年每年的专利申请量在100~1 000件,2000年以后专利申请量迎来一个快速增长的时期,到2017年达到峰值共19 646件;另外,由于专利从申请到公开有18个月的延迟, 2018—2019年的专利申请数据收录不全,因而专利申请量并非呈断崖式下降,故本文在图1中用虚线标注近两年的专利申请趋势线。人工智能领域的专利授权量逐年趋势与专利申请量类似,2008年以前每年的专利授权量不超过1 000件,2008年以后专利授权量迎来快速增长期,并于2018年达到峰值共8 546件。
图1 1961—2017年全球人工智能领域专利申请和授权趋势
1.2 技术生命周期
通过对某技术领域内参与研发的机构数量与专利产出情况关系的研究,可以初步判断某领域的技术成熟度。根据样本专利得到如图2所示全球人工智能领域的专利技术生命周期曲线,可见全球人工智能领域的发展大致分为3个阶段:
(1)萌芽阶段:1956—1996年,人工智能领域的专利申请人数和专利申请数量均增长缓慢,处于发展初期。由图灵测试拉开了人工智能研究的序幕,人工神经网络模型的提出推动人工智能研究迎来第一次发展浪潮,该阶段以知识表达和启发式搜索算法为代表;但之后由于计算能力的限制和智能化实现程度的不足,1960—1980年大部分人工智能项目停摆,或经费削减,人工智能研究进入衰退期[3]。
(2)成长阶段:1997—2010年,人工智能领域的专利申请人数和专利申请数量有了新的发展,形成了第二个点密集聚集的阶段。该阶段中专家系统及机器学习算法发展迅速,推动人工智能研究迎来第二次发展浪潮。
(3)快速成长阶段:2011年至今,人工智能领域的专利申请人数和专利申请数量均增长迅速,说明相关技术有了较大突破,隐含的经济价值开始显现,参与的研究机构不断增多,相应的专利产出数量也提高了。受益于移动互联网、大数据、云计算、深度学习等技术的繁荣,极大地提高了训练数据量和计算能力,推动人工智能研究迎来第三次发展浪潮。
图2 全球人工智能领域专利技术生命周期曲线
1.3 专利类型与有效性
统计样本专利类型与有效性分布后发现,人工智能领域内申请专利类型占比最高的是发明专利,高达93%;从专利有效性看,未授权(审中)、有效专利和已失效专利数量分布较均匀,约73%的专利处于未失效状态。受专利审查制度的影响,发明专利需经过实质审查才能授权,故而相较其他的专利类型,发明专利的技术含金量和专利质量往往更高,因此对于专利类型的分布研究能够从一个侧面反映出某领域专利的总体质量、技术含金量和技术先进性。由于专利在授权后要维持其有效性需每年缴纳一定数量的年费,故而处于有效状态的专利比处于失效状态的专利有价值。本文综合发明专利占比和未失效专利占比这两项指标,可以反映出人工智能领域专利的技术含金量普遍较高;再结合其近年来强劲的发展势头,可见其未来仍有广阔的技术创新空间。
2 全球AI技术竞争态势
2.1 技术研发地域竞争
2.1.1 技术市场与来源地对比
一个国家/组织拥有的专利申请量越多,说明有更多的技术选择在该国/组织进行专利布局,故可以反映出该国/组织在国际市场上的重要程度越高;优先权专利可以粗略地反映出技术源发地,故国家/组织拥有的优先权专利量可以反映其作为技术来源国/组织的世界排名。根据样本专利,得到人工智能领域的主要技术市场与来源地对比情况如图3所示,其中排名前5位的国际市场地分别是中国、美国、日本、世界知识产权组织(WO)、欧洲专利局(EPO);排名前5位的技术来源国分别是美国、中国、日本、韩国、德国。这与各国在政策上的鼓励和支持分不开,如美国在2016年陆续推出《为人工智能的未来做好准备》《国家人工智能研究与发展战略规划》《人工智能、自动化与经济》3份重量级报告[4],后又在2017年推出《人工智能与国家安全》;日本在2015—2017年先后发布了《机器人新战略》《日本机器人战略:愿景、战略、行动计划》和《人工智能产业化路线图》[5];德国的《信息和通讯技术2020——为创新而科研》和“工业4.0的自动化计划”中均有很大比重是关于人工智能相关技术的发展;中国也陆续推出《中国制造2025》《中国人工智能白皮书》《机器人产业发展规划(2016—2020年)》《新一代人工智能发展规划》和《“互联网+”人工智能三年行动实施方案》等一系列国家战略规划、科技政策[6]。可见各国对人工智能领域的高度重视。
图3 全球人工智能领域主要技术市场与来源地
2.1.2 研发活跃度对比
根据样本专利,得到人工智能领域内各国/组织的研发活跃度对比情况如表1所示。从近4年的研发活跃度看,中国在人工智能领域的活跃度最高,日本的活跃度最低,美国排名第3位。日本的人工智能专利申请量和优先权专利量均位列世界第3位,是很重要的国际市场和技术创新来源地,但近4年其研发活跃度不高,若要继续保持在人工智能领域的优势地位,日本未来还需加大政策性引导与支持。
表1 全球人工智能领域主要国家/组织的研发活跃度
2.1.3 优势技术对比
根据样本专利对排名前50的IPC大组按照其技术内容进行归纳,得到人工智能领域内排名前10位的技术主题,分别是图像识别(G06T5、G06K9、G06T7、G06T1)、语音识别(G10L13、G10L25、G10L17、G10L15、G10L21、G10L19)、智能搜索(G06F17)、神经网络模型(G06N3)、人机交互(H04N21、G05B19、G06F3)、智能金融(G06Q50、G06Q30)、车辆自动驾驶(G08G1、G01C21)、智能医疗(A61B5)、机械臂(B25J9)、专家系统(G06N5);将这些技术主题与排名前10位的专利公开国家/组织建立交叉矩阵,得到各国/组织的优势技术对情况如图4所示。从图4可见,图像识别、语音识别、智能搜索是各国/组织均着力发展的人工智能领域技术;除这3种技术外,中国对于神经网络模型的研究投入较多,美国的智能金融发展较好,日本在车辆自动驾驶技术方面较专长。
图4 全球人工智能领域主要国家/组织的优势技术
2.2 技术创新机构竞争
2.2.1 创新实力对比
根据样本专利,在对机构进行清洗后(包括子母公司合并、公司名称规范等),得到人工智能领域内15家全球顶级技术研发机构的研发实力对比情况,综合这些机构的专利数量、发明人数和人均专利申请量,可以反映其持续创新能力和研发实力(如图5)。其中,人均专利申请量大于1件的机构有8家,分别为美国4家、韩国2家、日本和中国各1家,包括英特尔、韩国电子通信研究院、三星电子、微软、谷歌、百度和IBM;专利数量和发明人数最高的3家机构分别是微软、IBM、三星电子,中国百度的专利数量全球排名第12位。
除研发实力外,各研发机构的优势技术领域也各不相同。其中,微软的优势技术领域集中在自然语言处理、计算机视觉、语音识别和机器学习;IBM在数据挖掘与统计分析、预测建模等领域处于领先地位;三星电子、谷歌通过并购与投资人工智能领域的公司,现于汽车无人驾驶、智能家居、语音识别等领域处于技术领先地位,还开发了两套人工智能系统,分别是主攻机器学习的TensorFlow系统和专注于棋类游戏的AlphaGo系统;松下电器在智能家居领域实力不俗,日本电气集中于机器学习的研究,佳能侧重智能工业机器人的开发;Nuance是全球最大的专门从事语音识别和图像处理研发的公司;百度先后建立了深度学习实验室和硅谷人工智能实验室,专注于机器学习、自然语言处理、语音识别、计算机视觉等技术领域的研发[7]。
图5 全球人工智能领域排名前15位机构的研发实力对比
2.2.2 研发活跃度对比
根据样本专利,从2016—2019年的研发活跃度看(见表2),全球人工智能领域研发活跃度排名前5位的技术研发机构分别是百度、英特尔、谷歌、三星电子、IBM,其中有3家属于美国的机构,中国和韩国各1家,来自日本的机构有5家。日本的5家机构从专利数量看,在排名前10位的有4家,但除索尼外,其余4家的研发活跃度排名均在前10位之外,可见这些老牌的日本企业的专利池中人工智能领域的新专利亟待补充,仅倚靠之前申请的“老专利”不利于在快速发展的人工智能技术领域里抢占技术蓝海区域,甚至在未来将很难维持其现有的国际战略地位。
表2 全球人工智能领域排名前15位机构的研发活跃度对比
2.2.3 专利质量对比
根据样本专利,从各机构的同族专利占比、有效专利占比、授权专利占比、分布最多的专利年龄4个维度对表2中15家机构的专利质量进行对比(见表3)。
(1)机构专利池中拥有的同族专利占比越高,说明该机构越注重国际市场的布局;此外,相比于仅在单一国家申请的专利,同族专利的申请无论是从申请时长还是申请费用,都要高于非同族专利,因而其技术含金量往往更高。15家机构同族专利占比最高的5家分别是飞利浦、西门子、谷歌、微软、英特尔,其中飞利浦的同族专利占比明显高于其他4家机构。
(2)专利处于效期内,该专利技术才能被所申请的国家/组织保护,若专利失效,则该技术将进入公有领域,可以被无偿使用,故机构专利池内的有效专利占比越高,专利技术为其在市场上赢得技术红利的概率越高。15家机构有效专利占比最高的5家分别是Nuance、谷歌、微软、IBM、飞利浦,其中Nuance的有效专利占比明显高于其他4家机构。
(3)并不是每件提交申请的专利均能授权,只有具备新颖性、创造性和实用性的专利才能得到授权,进而获得相应国家/组织的保护,故授权专利占比可以作为反映机构专利质量的一个方面。15家机构授权专利占比最高的5家机分别是Nuance、韩国电子通信研究院、IBM、谷歌、微软,其中Nuance的授权专利占比明显高于其他4家机构。
(4)专利年龄指在专利授权后,从专利申请日至今所经过的时长,分布最多的专利年龄可反映出一个机构进入某技术市场的时间。专利年龄很小,说明机构近年来在某领域积极地进行专利布局,但进入市场时间太短则未必能够抢占到该领域的核心技术;相反,专利年龄很大,甚至接近20年的话,则表明机构的专利将很快失效,未来不能提供长期的技术保护,那么机构在某技术领域的优势地位将很难保持,亟待进行专利布局的调整;而若专利年龄在3~6年,则说明机构进入某技术市场有一定时间,现有的专利正值发挥其技术红利的最佳时期,属于该技术领域的核心机构。15家机构中新兴研发机构包括西门子、三星电子、英特尔、百度;核心研发机构包括Nuance、微软、IBM、谷歌、韩国电子通信研究院。
表3 全球人工智能领域排名前15位机构的专利质量对比
表3 (续)
2.2.4 合作族群对比
为了能更全面地反映全球人工智能领域研发机构的合作族群,根据样本专利,对规范名称后的相关机构进行研发机构合作分析,如图6所示,图中点的大小代表机构拥有专利数量的多少,点之间连线的粗细代表机构间合作次数的多少。规模较大的企业通常下设专门负责知识产权业务的子公司,由其为总公司执行专利布局等相关事项,因而机构研发合作形式最常见的是总-分公司合作;近年来,随着汽车自动驾驶的不断发展,汽车行业间的企业合作愈见普遍,如现代汽车集团与东风悦达起亚的合作;产学研合作的典型代表由顶级高校与企业、科研院所与企业间的紧密合作来实现,包括从高校或科研院所到企业的专利权转移、质押保全、专利许可等专利运营活动,如清华大学与各企业间的合作;企业间跨行业交叉合作虽然数量占比较小,但鉴于人工智能是一门涉及计算机科学、信息科学、系统科学、控制论、语言学、认知科学等多学科的综合性技术学科,随着人工智能技术的不断发展与优化,企业间跨行业交叉合作必将越来越频繁。
图6 全球人工智能领域主要专利权人合作族群
3 全球AI重点技术
根据样本专利,去除技术性较弱的外观设计专利和失效专利,按照专利的简单专利家族数量降序排列,选取排名前1万篇专利,采用K均值聚类算法结合文本挖掘技术,对专利的标题、摘要和权利要求部分进行文本聚类,得到全球人工智能领域的重点研究技术专利地图,共得到10个聚类技术主题,每个技术主题采用1~3个核心词组表示。
(1)支持向量机|交互系统|卷积神经网络。支持向量机属于机器学习中常见的用于分类的算法,卷积神经网络(CNN)和递归神经网络(RNN)是近几年研究最热的深度学习算法。深度学习作为神经网络的延伸,二者都属于机器学习众多算法中的子集,而机器学习是实现人工智能的核心方法[8]。
(2)专家系统|知识库|过程控制。专家系统指具备某领域大量专家水平的知识和经验的程序系统,通过人工智能技术和计算机模型进行推理和判断,从而解决现实世界中需要专家解答的复杂问题;知识库和推理机是专家系统最基本的两大构成部分,常见功能包括解释、预测、诊断、故障排除、设计、规划、监督、除错、修理、行程安排、教学、控制、分析、维护、架构设计、校准等[9]。作为人工智能领域发展最活跃、应用最广泛的技术主题之一,专家系统在工程、科学、医药、军事、商业等领域成果丰硕,甚至在某些应用领域的应用还超过人类专家的智能与判断[10]。
(3)生物特征识别。生物特征识别是指通过对人体的生物标识进行比对来实现身份确认的一种技术方法,包括生理特征(如指纹、面像、虹膜、掌纹等)识别和行为特征(如步态、声音、笔迹等)识别[11]。生物特征识别由于其备具高辨识度、不易被复制伪造、使用方便快捷等特点,目前在智能安防领域被重点研究。
(4)智能医疗。人工智能技术在医疗领域有广阔的应用前景,包括辅助诊断、智能康复训练、病例和医学影像理解、辅助手术、语音录入病例、智能健康管理、智能药物开发等。据思科公司预计,智能医疗领域未来的年复合增长率将达到30%。
(5)智能家居|智能机器人。随着人们对于高质量生活关注度的不断提高,智能家居和智能机器人得到了空前的发展和大力研究。智能家居通过全面的信息交互技术来提供环境感知、远程可视对话、家电远程控制、室内安全警报等多种功能,全球智能家居市场在2014年价值为204亿美元,预计在2020年将达到587亿美元[12];全球智能机器人产业规模自2012年以来年均复合增速达17%,2017年市场规模达到232亿美元[13]。
(6)人脸识别|图像识别|图像处理。人脸识别指从给定的图像或视频中可以准确地找到相应人脸的位置并识别其身份的技术[14];图像识别指计算机通过分类并提取重要特征而排除多余的信息来识别图像,先后经历了文字识别、数字图像处理与识别、物体识别3个阶段。人脸识别主要应用于教育和安防领域,如预防替考、公共场所或居民小区的人脸识别监控等。
(7)虚拟现实|头盔显示器。虚拟现实(virtual reality,VR)是一种利用计算机模拟产生三维动态虚拟世界,为使用者带来包括视觉、嗅觉、听觉、触觉等多种感官体验的仿真系统,具备交互性、沉浸性和想象性[15]。头戴式显示设备等技术的发展,为VR的实现提供了基础。2014年,Facebook宣布以20亿美元收购Oculus,引发虚拟现实类技术的研发热潮,随着HTC、索尼、Oculus、阿里巴巴、百度等公司相继推出一系列VR产品和设备,VR在2016年迎来了产品成型爆发期[16]。目前,VR在游戏、视频、军事、航天领域的发展欣欣向荣,未来也将在社交、旅游、教育、医疗等领域加深应用程度,预计未来10年很可能孕育出一个万亿元级别的新市场。
(8)语音识别。语音识别的目的是将人类语音转换为计算机可以理解的编码语言。2014年,苹果公司发布集成了语音识别功能的Apple Watch,微软在Windows 10里推出语音助手“小娜”;2015年,IBM Watson获得了英语会话语音识别领域一个重大里程碑式的突破,其语音识别系统在产业标准Switchboard数据库中的词错率仅为8%;2016年,微软的语音识别系统在Switchboard中的词错率仅为5.9%,等同于人速记同样一段对话的水平,也是目前Switchboard语音识别任务中的最低记录;2017年,Google以机器学习为基础的语音识别系统已获得95%的英文字准确率,逼近人类语音识别的准确率[17]。从2014年语音识别仅作为一项功能推出,到后续语音识别准确率的不断提高,反映了语音识别技术蓬勃发展的趋势。
(9)计算机视觉|机器视觉测量|红外激光器。计算机视觉包括图像信息表达和物体识别,多应用于工厂自动化监测及机器人产业。该类技术的应用很广泛,如人脸识别、手势识别、视频检测、智能车辆安全保障、车牌识别、路径识别和障碍物检测、目标跟踪、智能安防、智能教学、电商搜图购物等,因而属于人工智能领域的重要技术主题[18-19]。红外激光器多用于计算机视觉的图像采集环节。
(10)智能安防。随着人们对生活质量要求的提高,对居住安全问题的重视,极大地促进了智能安防技术的发展。
4 结论
(1)从技术整体态势看,全球人工智能领域现在处于快速增长阶段,无论是专利的申请量还是进入领域的机构数量都在大幅增长,领域竞争激烈。人工智能领域的专利申请多为发明专利,大部分专利均处于未失效状态,说明该领域专利的技术含金量较高,未来仍有较高的技术创新空间。
(2)从技术研发地域看,美国、中国、日本既是重要的国际市场地,也是重要的技术创新和技术来源地,这与这些国家的政策大力扶持密切相关。从研发活跃度上看,美国、中国保持着较高的活跃度,正加紧对人工智能领域细分市场的布局,而日本的研发活跃度在世界前10位专利申请大国中排名最低。除图像识别、语音识别、智能搜索是各国均着力发展的人工智能领域技术外,中国对于神经网络模型的研究投入较多,美国在智能金融方面发展更好,日本在车辆自动驾驶技术方面较专长。
(3)从技术研发机构看,专利申请量排名前15位的机构中,美国、日本各5家,韩国2家,中国、德国、荷兰均1家;人均专利申请量排名前5位的机构分别是英特尔、韩国电子通信研究院、三星电子、微软、谷歌;研发活跃度排名前5位的机构分别是百度、英特尔、谷歌、三星电子、IBM,其中日本的5家机构普遍研发活跃度较低。各机构的专利质量从同族专利占比、有效专利占比、授权专利占比、分布最多的专利年龄进行对比,在前3个维度中排名均处于前5位的机构包括飞利浦、谷歌、微软;从分布最多的专利年龄看,人工智能领域的核心机构包括Nuance、微软、IBM、谷歌、韩国电子通信研究院。中国百度全球专利数量排名第12位,人均专利申请量排名第6位,研发活跃度排名第1位,可见百度属于积极进行人工智能专利布局的企业。通过合作族群对比发现,随着AI技术的不断发展与优化,未来企业间跨行业交叉合作将越来越频繁。
(4)从人工智能领域重点研究技术看,10组重要的技术主题分别是支持向量机/交互网络/卷积神经网络、专家系统/知识库/过程控制、生物特征识别、智能医疗、智能家居/智能机器人、人脸识别/图像识别/图像处理、虚拟现实/头盔显示器、语音识别、计算机视觉/机器视觉测量/红外激光器、智能安防。
作为新一轮科技革命的重要引领,人工智能将在推动经济繁荣、改善民生方面继续发挥重要的作用,中国应继续保持对人工智能领域的重视,虽然目前在专利申请量和研发活跃度上占据优势地位,但世界顶级的标杆企业数量还待增加。