全球人工智能科学领域专利信息计量分析及其启示
2020-12-22李玉华张福俊尹燕霞卢昱波
李玉华,张福俊,尹燕霞,卢昱波
(1.山东科技大学计算机科学与工程学院;2.山东科技大学图书馆;3.山东科技大学基建处,山东青岛 266590)
1 研究背景
人工智能作为第四次工业革命的核心,是实现从自动化到自主化,创造增长和竞争优势的关键推动因素。1956 年,在达特茅斯会议上,约翰·麦卡锡提出了“人工智能”一词,被看做是人工智能正式诞生的标志[1]。1980 年,卡内基梅隆大学设计的专家系统——XCON 问世,人工智能技术在经历低迷之后重新崛起。1997 年,IBM 公司的“DeepBlue”战胜国际象棋世界冠军象征着人工智能研究从理论科学走向实际应用。2016 年,AlphaGo 战胜世界围棋冠军,掀起了全球范围内研究人工智能的新热潮,2017 年,深度学习大热,各国政府相继出台政策,将人工智能上升为国家战略,力争在新一轮的科技竞争中取得主导权。
2016 年5 月,美国成立“人工智能和机器学习委员会”,随后连续发布《为人工智能的未来做好准备》和《国家人工智能研究和发展战略规划》两份报告[2];2018 年4 月,欧盟委员会提交了《欧洲人工智能》,同年12 月,发布主题为“人工智能欧洲造”的《人工智能协调计划》;2019 年3 月,法国发布《人工智能战略》,旨在把人工智能纳入原有创新战略与举措中,谋划未来发展。自2016 年以来,我国在人工智能领域持续发力,相继推出《“互联网+”人工智能三年行动实施方案》等扶持政策,明确指出要培育发展人工智能新兴产业,推进重点领域智能产品创新[3]。
目前国内外学者从学术论文、专利文献等视角对我国以及全球的人工智能技术领域进行多角度研究,探析当前AI 领域的研究热点、前沿趋势以及潜在的技术机会,如张振刚等[4]以德温特数据库收录的人工智能领域相关专利为数据源,利用Citespace软件绘制知识图谱。Alfonso 等[5]以人工智能领域学术论文为例,通过贝叶斯网络分析了文献计量指标间的关系。吕一博等[6]基于物联网和人工智能领域的专利数据,通过绘制共现矩阵和确定文献计量指标识别出语音分析等未来发展趋势。王友发等[7]基于德温特创新索引数据库,对人工智能专利全球地理分布、主要国家PCT 布局、技术热点、未来趋势等进行了分析。陈军等[8]以专利数据为依据,从专利申请总体情况、PCT 专利申请、IPC 重点技术领域、创新主体等方面对中美人工智能产业发展进行了比较研究。基于上述背景,研究全球人工智能领域专利技术的发展现状、技术热点和前沿趋势,有助于我国把握时代发展脉络,积极调整科技发展战略与政策,进行前瞻性、战略性技术研究布局。
2 关键技术分解
WBS(Work Breakdown Structure),即工作分解结构,是项目管理中常用的工具和方法,它将复杂的工作任务细化为易于操作的工作包或可交付成果,明确了项目的工作内容,是制定进度计划、资源需求、成本预算、风险管理计划和采购计划等的重要基础,同时也是控制项目变更的重要基础[9]。技术分解是专利分析的关键步骤,对确定技术边界、制定检索策略以及总结专利分析的结论和建议起决定性作用。当前对人工智能技术领域的划分没有一个明确的标准,为了获得准确全面的专利数据,本文结合WBS方法对人工智能技术领域做关键技术分解。
综合考虑专利检索的可操作性和行业内的认知广泛程度,将人工智能技术领域划分为机器思维、机器学习、机器感知和机器行为等四个技术分支。机器思维一般指计算机模拟思维,以与非判断为逻辑基础,主要包含搜索、规划以及推理等线性思维;机器学习是研究怎样使用计算机模拟或实现人类学习活动的科学,是人工智能的核心[10];机器感知是一连串复杂程序所组成的大规模信息处理系统,研究如何用机器或计算机模拟、延伸和扩展人的感知或认知能力;机器行为指具有人工智能行为的机器,这些智能机器或智能控制器,具有类似于人的智能行为的某些特性。在以上四个技术分支的基础上,还可以对各技术分支做进一步分解,最终形成一个完整的技术分解图,如图1 所示。
图1 人工智能关键技术分解图
3 数据来源与研究方法
3.1 数据来源
本次人工智能技术领域专利检索分析,数据来源选择智慧芽(PatSnap)全球专利检索数据库。智慧芽专利数据库是由智慧芽信息科技(苏州)有限公司推出的专利信息数据库,深度整合了从1790 年至今全球116 个国家(地区)的1.3 亿专利数据。在对人工智能技术领域进行技术分解的基础上,本研究最终以(TAC:(Artificial intelligence OR Knowledge discovery OR Data mining OR Deep learning OR Machine learning OR Machine vision OR Pattern recognition OR Natural language processing OR Smart robot OR Intelligent logistics OR Intelligent manufacturing OR Intelligent Terminal OR Smart home OR Smart transportation OR Smart medical OR Intelligent se curity OR Smart City OR Smart agriculture OR Smart finance OR Intelligent education))AND APD:[19990101 TO 20181231])为检索式,时间跨度为1999—2018年,专利类型选择发明申请及授权发明,分组去重规则设定为每组简单同族一个专利代表,机器翻译选择全选,截词功能设定为关闭,检索时间为2019年10 月15 日。
根据上述检索表达式及规则偏好进行该领域1999—2018 年的有效发明专利文献检索,在116 个国家(地区)中,共检索到296 672 件发明专利信息,其中有效授权发明专利信息76 898 件。
3.2 研究方法
专利是科研产出的重要表现形式之一,是科技研发活动中定义明确的发明成果的法定代表,普遍认为是表征科技创新的强有力的指标。对人工智能领域专利信息进行挖掘和研究,不仅能够准确揭示全球及各国家(地区)、组织机构、技术研发的侧重点,而且能为我国人工智能技术发展提供决策参考。
专利信息计量是将专利分析、文献计量和信息计量学的原理和方法用于专利文献和专利信息的定量分析,从而为从事专利活动、科技创新、市场竞争和管理决策等提供服务。本研究采用专利信息计量法,对专利数据进行采集、处理和统计分析,以报表、图表、矩阵和网络等方式提供可视化的分析结果,探析当前全球人工智能领域专利分布格局和前沿热点。
4 人工智能技术领域专利分析
4.1 专利年度申请及授权趋势分析
1999—2018 年全球范围内共授权人工智能有效发明专利76 898 件,以一个年份作为统计周期,以专利的申请日期和授权日期为统计依据,汇总近20年发明专利的年度申请量、授权量以及专利授权比例,形成1999—2018 年全球人工智能领域专利申请及授权量统计图,如图2 所示。
图2 1999—2018 年全球人工智能领域专利申请及授权量
由图2 可知,近20 年间,人工智能领域专利申请的趋势大致可以分为五个阶段。
(1)低速增长阶段。1997 年IBM 公司的国际象棋电脑深蓝Deep Blue 战胜国际象棋世界冠军卡斯帕罗夫引发了人工智能技术发展的小高峰,1999—2000 年人工智能领域的专利申请量从2 739 件增加到3 402 件,增幅为24.21%,与此同时,这一阶段申请专利的已授权占比从4.56%增长到18.37%,表明专利的数量和质量有了显著的提高,专利研发向着规范化和实用性发展。
(2)短暂下降阶段。受2002 年前后互联网经济泡沫的影响,2001—2003 年人工智能领域的专利申请量均维持在4 000 件左右,甚至出现小幅度的下降,已授权占比基本维持在19%左右。
(3)稳步增长阶段。2004—2011 年,专利申请量呈现稳步增长趋势,除受2008 年全球金融危机影响,2009 年专利申请数量与2008 年基本持平外,这一阶段专利申请量稳步提升,由4 000 件增至9 000余件;专利授权比同时呈现出增长趋势,到2011 年,专利已授权占比达到40%以上,说明人工智能领域技术发展逐步趋于成熟,相关专利呈现蓬勃发展前景。
(4)高速增长阶段。2012 年有效专利申请量首次突破1 万件,全球人工智能领域专利总申请量达到12 151 件,专利已授权占比为45.96%;到2014年专利申请总量突破2 万件。数据统计表明,这一阶段的专利研发质量有了显著提高,实现了数量和质量的双飞跃。
(5)蓬勃发展阶段。2016—2017 年,Google DeepMind 开发的AlphaGo 战胜了世界围棋冠军李世石,引发了人工智能领域新一轮的发展热潮,加之同年深度学习的大热,人工智能专利申请量在2016年突破4 万件,2017 年达到53 106 件。鉴于专利库整合数据的时间滞后性,近3 年专利授权数据存在缺失,因而不能完全反映专利授权情况,在此不做授权数据的探讨。
4.2 专利来源国家/地区分析
开展专利技术的地域分布研究有助于了解人工智能领域在不同国家或地区的发展情况,进一步了解该科技领域在全球研究的前沿地区,识别出技术优势较高的地域。根据专利申请的地区不同,统计分析全球范围内授权人工智能发明专利数量较多的前10 位国家/地区,具体数据如图3 所示。
图3 主要国家(地区)人工智能专利授权情况
对1999—2018 年有效授权发明专利进行区域分析可知,全球范围内,人工智能技术领域的专利集中分布在中国、美国、韩国、日本及欧洲这五大国家(地区)。其中,中国有效授权发明专利量达到32 978 项,占全球专利总量的48.31%,位居全球首位,美国有效授权发明专利达到14 718 项,位居第2 位。韩国以7 256 项有效发明专利排在第3 位,其次是日本4 822 项和德国1 297 项,分别排在第4 位和第5 位。对以上5 个国家(地区)绘制年度专利申请量变化趋势图,如图4 和图5 所示。
图4 1999—2018 年主要国家(地区)人工智能专利授权趋势
图5 1999—2008 年主要国家(地区)人工智能专利授权趋势
就总体情况而言,中国和美国以绝对的数量优势处于人工智能技术领域的第一梯队,代表着全球先进技术的发展方向。美国对人工智能技术的研究开始最早,较为深入,在2008 年之前,一直位列全球各国家(地区)首位,发明专利授权量连年快速提升,2008 年至今,随着联邦研究经费的投入、工业和学术研究热情高涨以及强大的人才吸引策略,美国始终处于人工智能领域研究的前沿。
日本在人工智能技术领域起步仅次于美国,1999 年专利申请且授权数量为20 件,2000 年授权专利数量突破100 件,其后呈现小幅度增长趋势,到2013 年达到顶峰488 件。然而,日本在继互联网时代“掉队”之后,在人工智能领域的发展近年来也稍显迟缓,其专利申请情况呈现出不升反降现象。与中美两国相比,日本在人工智能领域研究力量不足,在研发投资、人才培育和资源争夺等方面行动缓慢,但目前日本政府已经认识到人工智能对日本社会和企业竞争力的影响并积极采取措施。2016 年4 月,日本首相安倍晋三宣布成立“人工智能技术战略会议”,2018 年6 月,日本政府在人工智能技术战略会议上出台了推动人工智能普及的计划。
韩国在人工智能专利技术领域的发展起步较早,2008 年之前增幅较小,2009 年以后增长迅速,到2016 年专利授权量突破1 000 件,2017 年达到1 263件,同年美国专利授权量为1 396 项。除三星、LG等科技巨头公司外,现代汽车等传统制造企业也纷纷进行人工智能技术布局,成为韩国AI 行业创新的主力军,总统文在寅表示将在2019 年内推出首份国家级人工智能发展战略,积极开放政府数据,建立数据中心。
以德国为代表的欧洲各国在人工智能领域的发展较其他地区稍显落后,德国人工智能专利技术领域的发展起步较早,但发展较慢,近20 年的年均专利申请授权量仅为75.1 件。近年来,欧洲各国似乎没有受到世界范围内AI 热潮的影响,专利申请量并未有大的突破。聚焦欧洲人工智能领域处于领先地位的初创企业可以发现,不同于其他国家纷纷崛起的独角兽企业,欧洲并未出现通用的人工智能平台,数据分析公司成为欧洲AI 行业的主导者。如2016年成立于英国德国Autolabs 公司专注于语音助手开发;法国Qucit 公司通过量化城市活动,利用人工智能算法处理数据,从而实现减少污染,优化交通和资源管理功能;荷兰Braingineers 公司是一家使用深度学习算法来处理数据的情绪分析公司。
中国在人工智能专利技术领域起步晚,但发展迅猛,1999 年专利申请数量仅为1 件,此后十年,相继超越韩国、日本以及美国,在2009 年申请且得到授权的专利数量达到724 件,2010 年以后,中国人工智能专利技术的发展迅速提升,2015 年达到8 269件,占全球人工智能技术领域专利申请量的一半。
4.3 基于IPC 维度的专利计量分析
国际专利分类 (IPC) 是国际通用的、标准化的专利技术分类体系,蕴含着丰富的专利技术信息。通过对专利的IPC 进行统计分析,可以准确、及时地获取该领域涉及的主要技术主题和研发重点[18]。对人工智能领域的专利进行IPC 维度的计量分析有利于了解该技术领域内可应用的不同技术和潜在机会,并进一步识别人工智能领域内跨界应用的机会。对近20 年来人工智能领域的专利按照IPC 小类进行统计,得到专利数量位于前20 位的热点技术领域,如表1 所示。同时,对授权专利数量排在前五位的国家展开重点IPC 分类的研究,如图6 和表2 所示。
表1 人工智能技术领域排名前20 位热点技术
图6 全球排名前15 位热点技术在主要国家(地区)分布情况
表2 主要国家(地区)人工智能关键技术领域
从整体情况来看,全球关注的人工智能领域排名前10 位的技术依次是G06F(电数字数据处理)、H04L(数字信息的传输)、G06K(数据识别;数据表示)、G06Q(数据处理系统或方法)、G06N(基于特定计算模型的计算机系统)、H04N(图像通信)、G06T(图像数据处理或产生)、H04W(无线通信网络)、G05B(一般的控制或调节系统)以及A61B(诊断;外科;鉴定)。对排名前5 位的国家进行技术领域的分析可知,中国在人工智能技术领域的发展与全球整体发展步调基本一致,其最为关注的领域依次是:G06F、H04L、G06K、G05B、H04W,除以上技术之外,中国在其他专业领域均有所涉及;美国最为关注的领域依次是:G06F、H04L、G06Q、G06K、G06N,在电数字数据处理、数据处理系统或方法以及基于特定计算模型的计算机系统等三个领域专利数量远超其他国家,位居全球首位,其中,G06F17/30(信息检索/数据结构)达到1 947 件、G06F17/27(自动分析)为1 017 件。未涉及H02J(供电或配电的电路装置或系统)技术领域;韩国关注的领域依次是:G06F、G06Q、G06K、H04L、H04W,韩国在数据处理系统或方法领域专利授权量达到1 700 件,仅次于美国;日本关注的领域依次是:G06F、G06T、G06K、H04N、G06Q,日本在图像数据处理领域专利量为798 件,在H04W(无线通信网络)、H02J(供电或配电的电路装置或系统)及G01R(测量电变量)等技术领域无专利申请授权记录;德国关注的领域依次是:G06F、G06K、A61B、G06T、H04L。
对各国家(地区)主要技术领域进行IPC 小组分析,可以挖掘出当前区域的关键技术领域。中国在人工智能领域的发展表现为产品应用为主,理论基础较为薄弱。依托中国国家电网雄厚的科研实力,中国在AI 与电力行业的融合中成绩突出,无线电通信、智能调度以及传输控制等技术的广泛应用,大规模提升了电网在输、配电环节的作业效率;此外,中国在图像及语音识别领域也有所突破。
美国人工智能起步早,覆盖面广,理论基础与产品应用齐头并进,在图像识别、自然语言处理、机器学习、机器视觉等核心技术领域处于领先地位;高通、IBM、微软、谷歌、苹果、英特尔和Facebook等科技巨头极大的推动了美国人工智能的发展,在福布斯最新发布的美国最具前景的50 家人工智能公司报告中,美国企业人工智能技术研究的热点分布在企业服务、自动驾驶与机器人、健康医疗、网络安全等领域。
韩国侧重于在制造业部门推进基于人工智能的工业智能技术,加大对无人驾驶汽车和物联网技术的研发,与此同时,积极将自然语言处理、图像识别、机器视觉等技术应用于智能语音助手、医疗影像大数据等公共安全、金融、医疗以及商业领域。与韩国类似,日本依托在传统制造、工业领域雄厚的技术基础,积极推动AI 与制造业集合转换,将人工智能应用于无人驾驶和共享汽车领域等制造行业,其核心技术领域包括图像分析、防撞系统、语音识别技术,有望在机器人、智能制造等人工智能应用领域上有所突破。
4.4 全球专利权人分布分析
全球人工智能技术领域排名前10 位的专利权人参见图7,其中,属于美国的公司有4 家,中国公司5 家,韩国公司1 家。对排在前10 位的专利权人授权专利进行年度统计,可以详细展示各公司在人工智能领域技术的发展历程,各专利权人年度授权专利数量以及核心技术如表3 和图8 所示。
图7 人工智能领域全球前10 位专利权人分布图
表3 全球人工智能技术专利权人历年专利授权量
表3(续)
图8 人工智能领域全球前10 位专利权人核心技术分布(仅统计IPC 分类中数量前10)
美国的IBM 公司和微软公司以1 378 项和1 137项的有效授权专利量分别排名第1 和第2,两家公司在自然语言处理、机器学习、数据挖掘等技术领域均处于全球领先地位。IMB 公司早在1952 年开始着手对人工智能进行研究,2015 年确立以云计算为平台新的转型方向,其自主研发的Watson 多行业得到广泛应用。2019年8月15日,第七代微软小冰发布,其产品形态涵盖社交对话机器人、智能语音助理、人工智能内容创作和生产平台。除智能机器人小冰外,微软公司在云计算业务中也部署了机器学习工具——Azure 云服务。Azure 形成了一个从IaaS 到PaaS 再到SaaS 的一套完整的云生态体系,基于这些产品庞大的用户群体,几年来Azure 呈现出飞速增长的形势。
中国国家电网以1 145 项专利位居第3 位,从技术领域来看,电力工程是中国电网专利布局的重要支点,而在数据处理、图像识别等人工智能技术的核心领域专利量较少,力量相对薄弱。韩国三星电子公司以643 项专利量位居申请人第4 位,技术领域主要集中在机器学习、无线通信网络和自然语言处理,其研发的Bixby2.0 被视为“数字助理的根本性飞跃”,而三星电子趋向于设备联网技术研究,积极为即将到来的物联网时代做准备。Google 公司一直致力于分布式计算和分布式存储研究,基于上述技术基础,其在人工智能领域呈现出多处开花的局面,相继研发出语音助手Google Assitant、人工智能学习系统Tensor Flow 以及无人驾驶汽车Waymo。亚马逊早在2006 年3 月研发出了自己的云服务AWS,2014 年11 月推出Echo 智能音箱,并于2015年在AWS 推出机器学习服务,此外,亚马逊结合自身的电商业务涉足无人机送货领域,研发PrimeAir无人机。
华为、百度、小米以及OPPO 等企业作为中国科技公司的“先头部队”,所谓的“ABC”——人工智能、大数据和云计算,已经成为其技术发展的标配。华为在人工智能方面采用的“全栈全场景”策略,致力于芯片和平台研究,能够同时面对云端计算、本地服务和存储的边缘计算以及各种终端设备。百度目前拥有语音、图像、自然语言处理等多项技术,涵盖开放对话式人工智能系统以及智能驾驶系统两大行业生态。2019 年8 月,科技部授予小米“智能家居国家新一代人工智能开发创新平台”称号,目前小米正在持续发力AI 自主研发,围绕“手机+AIot”的双引擎战略,小米已经在声学、语音、视觉、自然语言处理、知识图谱、机器学习6 大方向取得一系列成果。AI 一直是OPPO 的重点发展方向,2019 年1 月,OPPO 正式成立了新型移动终端事业部,同时对外推出智能助理Breeno,其功能包括Breeno 识物、速览、识屏、建议、驾驶、空间等用户日常用机的各种情景。
5 结论研究与启示
5.1 人工智能领域专利分析结论
(1)从专利申请数量上看,中国在人工智能技术领域起步较晚,但增速较快,截至2018 年,中国的专利申请量占全球申请总量的一半。美国人工智能技术起步早,覆盖范围广,始终保持稳定的增长趋势,韩国、日本、德国等增速相对平稳。目前各国纷纷布局人工智能,相继推出政府扶持和人才吸引策略,在此背景下,中国应继续给予政策扶持,鼓励企业创新,吸引各国的优秀人才,及时进行前瞻性、战略性技术研究布局。
(2)从IPC 分类来看,全球人工智能专利技术主要集中在G(物理)、H(电学)两部,尤其是G06F、G06K、H04L、H06N、H04N 等方向。当前人工智能技术的热点领域有:无线通信网络、图像识别与分析、特定计算模型的计算机系统、语音识别、计算机视觉、自然语言处理等。尽管涉及分类号众多,但现有专利多集中在应用层面,基于硬件、算法以及芯片等方面的基础专利较少,其原因一方面是由于硬件层面的技术要求高,难度大,可完成的企业数量少,另一方面是一些企业采用商业秘密的保护方式对技术进行保护,因此没有申请专利。
(3)从专利权人分布情况来看,专利申请数量较多的企业集中在发达国家,如美国的IBM、微软、谷歌,韩国的三星、LG 等企业,中国的华为、百度、小米等企业近年来大力开展人工智能领域的相关研究,取得了一定突破,但由于起步晚、基础薄弱,研发重点位于产品应用层面,在人工智能核心技术掌握方面与国外巨头相比仍有较大差距。
5.2 中国人工智能未来发展启示
(1)立足基础研究,促进跨学科深度融合。加强人工智能理论研究,势必要促进AI 与数学、脑科学、人文科学等多学科的交叉融合,为产品研发提供强大的理论支持。硬件和算法水平关乎人工智能发展是否能突破技术壁垒,就目前国内现状来看,我国人工智能发展的基础不牢,硬件和算法力量薄弱,基于认知层面的算法水平亟待提高。因此,立足基础领域,致力于核心技术研发,将是未来我国科技企业需要关注的重点。
(2)加快专利布局,抢占未来市场。中国国家电网在国内的专利申请量远高于其他专利权人,其布局的专利技术多集中在数据处理系统和数字信息传输等领域,为我国电力行业转化升级做出了突出贡献,AI 技术在输配电领域的广泛应用反映出人工智能和能源系统的结合将会是未来一个重要领域,中国人工智能技术应用应开拓新的方向,加快促进能源低碳转型。就世界发展形势来看,中国应积极推进物联网技术研发,加快传统企业与人工智能融合转化,推动物联网产业落地,在即将到来的物联网时代抢占先机。
(3)增强企业培育,加快人才引进。以华为、百度为代表的科技巨头人工智能发展中展现出强大的生命力,政府应积极发挥龙头企业的带头和辐射作用,鼓励企业协同合作,完善产业生态体系,形成完整的生态系统,打造中国本土的高影响力、强竞争力的国际知名企业。人才的竞争已经形成全球新的竞争态势,以中美两国为代表的科技强国正在对人工智能人才展开激烈争夺,对此,推进产学研融合,鼓励企业走进高校、科研单位,探索人才培训新模式,为我国人工智能技术发展提供高端储备人才。