基于论文和专利分析的人工智能发展态势研究

2019-08-13周伯柱AditiGUPTA

世界科技研究与发展 2019年4期

周伯柱 Aditi GUPTA

（1.中国科学院武汉文献情报中心，武汉430071；2.维多利亚大学，维多利亚，加拿大V8W 3H5）

1950年，艾伦·图灵（Alan M.Turing）发文预言了创造具有真正智能机器的可能性［1］。1955年8月，美国著名计算机科学家约翰·麦卡锡（John McCarthy）等首次提出人工智能（Artificial Intelligence，AI）的概念［2］。此后，尽管经历了两次发展低潮，人工智能在90年代机器学习，特别是后来的深度学习兴起之后，迎来了快速发展时期。

当前，人工智能被普遍认为是新一轮产业变革的关键驱动力，随着云计算、大数据、物联网等领域的发展，已经在众多领域得到越来越广泛的应用［3］。其所涉及的智能语音、模式识别和自然语言理解等“感知智能”已经具备相对成熟的应用基础，在围棋赛事、大规模图像识别、人脸识别、皮肤癌诊断等领域的局部应用能力已经超越了人类，但对要求具备理解、分析、推理等能力的“认知智能”，目前还处于探索之中［4，5］。这些探索主要涉及的类脑智能研究近些年也取得了一定进展，如深度神经网络模型中的卷积神经网络模型以其端到端的建模和学习能力颠覆了传统的“特征＋分类器学习”固有模式，使得特征和分类器不再有明确的界限［6］；深度神经网络与强化学习的融合在一定程度上解决了深度学习的大数据依赖问题；思维自适应控制在行为层面模拟脑区功能，是认知体系机构研究的代表性成果之一；脉冲神经网络被认为是能接近仿生机制的神经网络模型，其与生物规则的结合，是提升类脑神经网络模型最有效的手段与研究方向之一。

为把脉领域技术发展态势，近些年相关机构加强了人工智能知识产权分析，如中国专利保护协会发布的《人工智能技术专利深度分析报告》、世界知识产权组织发布的《2019年产权组织技术趋势：人工智能》报告等。人工智能领域既涉及基础研究又注重技术应用，因此论文和专利成果的结合分析对全面把握该领域发展态势是必要的——而这正是本文的主要工作。同时，可追溯的可靠数据源、必要的数据清洗、多角度的可视化分析以及系统的政策归纳等为本文更好地揭示人工智能领域发展态势提供了前提。

1 相关政策规划

从2017年至今，中国、美国、欧盟等多个国家／地区都出台了人工智能顶层战略，俄罗斯也宣称将于2019年出台人工智能国家战略［7］。人工智能领域顶层战略在短时间内如此大范围密集出台，非常罕见，足见其对于未来经济社会发展的重要性。2017年3月加拿大政府发布的《泛加拿大人工智能战略》是全球首个人工智能国家战略。在这之前一些国家已有针对或涉及人工智能的政策计划：国内如2015年的《中国制造2025》，2016年的《机器人产业发展规划（2016—2020年）》、《中华人民共和国国民经济和社会发展第十三个五年规划纲要》等；国外如2013年法国的《法国机器人发展计划》、2014年欧盟的《2014—2020欧洲机器人技术战略》、2015年日本的《机器人新战略》，以及2016年美国的《为人工智能的未来做准备》、《国家人工智能研究与发展战略计划》、《人工智能、自动化与经济报告》等。

当前已有至少十个国家／地区明确了人工智能资金支持计划（表1）。欧盟计划将人工智能研究和创新投资由2017年的7500万欧元增加到2020年的15亿欧元，并争取公共和私营部门总投资在2020年至少达到200亿欧元［8］；美国计划从2018年开始的5年内，投入20亿美元研究新一代人工智能技术［9］；德国提出到2025年在人工智能领域投入30亿欧元［10］；法国提出自2018年开始的5年内在人工智能领域投入15亿欧元［11］；英国也提出了涵盖政府、学界和业界的9.5亿英镑投入计划［12］；加拿大、新加坡、丹麦、澳大利亚和韩国等均有政府资金支持的计划，金额在人民币数亿元至十几亿元不等［13］。

表1 政府人工智能资金支持计划Tab．1 Artificial intelligence fund support program by government

表2 人工智能指导性政策Tab．2 Artificial intelligence guiding polices

另外一些是未明确投入资金额度的指导性政策（表2）。2017年7月，中国发布《新一代人工智能发展规划》，提出人工智能发展三步走的战略目标［14］；2018年6月，印度发布《国家人工智能战略》，关注人工智能如何促进经济增长和社会包容性，并提出将印度人工智能解决方案推广到其它发展中国家［15］；2018年12月，为落实《欧盟人工智能战略》，欧盟发布《人工智能协调计划》，其主题为“人工智能欧洲造”，以促进欧洲人工智能的研发和应用；2019年2月，美国发布《美国人工智能倡议》［16］，提出调动更多联邦资金和资源用于人工智能研发，以应对来自“战略竞争者和外国对手”的挑战，确保美国在该领域的领先地位，并强调“美国价值和利益”。日本、阿联酋、芬兰、意大利、瑞典、德国、西班牙等也先后提出了相关人工智能战略规划，多数提出要争当人工智能领域的领导者。

这些政策规划各不相同，也有一些共性特征。从人工智能技术发展来看，这些政策规划的共性包括：注重研究经费支持，包括引导社会资金的介入；倡导成立专门研究机构，搭建人工智能创新平台；强调人才的培养，增设人工智能学科与课程；支持领域初创企业发展壮大，促进成果转化；明确重点方向，聚集力量攻坚克难。从人工智能与人的关系来看，共性包括：关注人工智能对就业的影响；关切潜在的安全、伦理、法律、社会公平等方面的影响；倡导“以人为本”的人工智能理念。

2 论文分析

本部分数据基于Web of Science的核心合集论文数据库（SCI），由系统中的“计算机科学，人工智能（Computer Science，Artificial Intelligence）”类别进行检索获得。检索截止时间2018年12月31日，检索日期2019年4月。

2.1 年度趋势

人工智能领域共产出SCI论文212000余篇。从年度趋势看（图1），1990年之前，年度论文产出不足1000篇；1990—1996年前后出现了快速增长；1997—2002年间，增长相对平缓；从2003年开始，论文数量又出现了快速增长，2010年后年度论文数量更是达到11000篇以上，人工智能发展方兴未艾。近些年大数据、云计算、物联网技术的不断发展为人工智能发展提供了基础。随着无人驾驶、机器人技术、人脸识别等技术的应用，加上人工智能程序战胜人类顶尖围棋手等热点事件的助推，人工智能已经成为科技领域的一个焦点。

图1 人工智能SCI发文年度趋势Fig．1 Annual trend of artificial intelligence SCI papers

2.2 国家／地区分布

由美国和中国引领的人工智能领域论文区域分布特征明显（图2）。美国历年共产出论文48000余篇，居首位；中国（港澳台另计，后同）以40400篇居其次；其后依次是英国、西班牙、法国等。发展中国家中，印度和伊朗的论文产出已出现在前列。日本论文产出不算突出，印证了其“应用强于研究”的现状［17］。近十年论文产出又有一些变化。中国以34600余篇大幅领先，并占其历年论文产出的85%以上，发展势头强劲；美国共计20500余篇居次位，但只占其历年论文的约43%；再后依次为英国和西班牙，分别占历年论文的56%和71%；印度和伊朗近十年论文表现突出，分别为6221篇和4995篇，占各自历年论文的79%和94%。中国、印度、伊朗近十年论文增长势头强劲，澳大利亚在发达国家中增速领先。

作为当今头号科技强国，美国目前在人工智能领域拥有全球53%的人工智能人才［18］，技术实力雄厚，论文成果众多，引领了领域的发展。中国积极践行科技强国战略，积极开展前瞻性科技布局，人工智能人才得到快速聚集和培育；国内高等学校纷纷设立人工智能专业和学院，人工智能获得高度重视，论文成果获得了快速增长。

近十年人工智能领域的被引数据显示（图3），中国论文被引次数超过65万余次，超过美国的44万余次，大幅领先其他国家／地区，反映出中国该领域论文总体影响的提升。从篇均被引次数来看，美国以22次领先其他国家／地区，彰显其突出的研究影响力。在庞大的论文总量情况下，中国该领域论文平均被引仍然达到了19次之多，显示出中国在人工智能领域是数量和质量的综合提升。

图2 人工智能SCI论文国家／地区分布Fig．2 Country／region distribution of artificial intelligence SCI papers

图3 主要国家／地区人工智能SCI论文（2009—2018）被引情况Fig．3 Citations of SCI papers（2009－2018）during the main countries／regions

分析近十年各国国际合作论文比例趋势发现（图4），澳大利亚、加拿大和英国国际合作论文比例较高，超过72%；美国、法国和德国较为接近，在60%左右。发达国家国际合作比例近十年普遍呈上升趋势。发展中国家国际合作论文比例相对较低，中国国际合作论文比例在30%左右；印度和伊朗的仅为20%左右，且近十年无明显提升，可见人工智能领域的技术合作主要发生在发达国家之间。发展中国家本身开放程度相对较低，并且受发达国家在技术领域限制甚至是封锁影响，迫使其技术发展更多依靠自身，国际参与度较低。人工智能涉及多个交叉技术领域，广泛的合作交流有利于技术的快速发展。未来即使面临阻力，中国也应该积极参与国际交流合作，携手推动人工智能服务人类社会。

图4 论文数量前十国家国际合作论文比例趋势Fig．4 Proportional trend of international cooperation papers in top ten countries

2.3 机构分布

人工智能领域历年论文总产出在1000篇以上的机构共24家（表3），其中，中国11家，美国6家，新加坡2家，韩国、加拿大、西班牙、伊朗和印度各1家。中国科学院为该领域历年和近十年论文产出最多机构；新加坡南洋理工大学仅次于中国科学院，表现突出。除这两家机构外，领域历年论文在1400篇以上的机构有卡耐基梅隆大学、新加坡国立大学、香港城市大学等9所高校；近十年论文产出上，伊斯兰阿扎德大学（系统）、西安电子科技大学、浙江大学和华中科技大学等表现突出。对比近十年与历年份额占比，中国有10家机构上升，美国6家机构均下降。近些年中国经济社会快速发展，科技强国战略稳步推进。在这一背景下，国内研究机构积极布局人工智能研究，科技成果产出富有成效，已具备了开展国际竞争的能力。

2.4 方向对比

人工智能涉及领域方向繁多，研究者往往根据具体需要来考察相应研究方向。人工智能研究目的是促使智能机器会听、会看、会说、会思考、会学习、会行动等［4］。总体而言，“机器学习与算法”、“计算机视觉”和“语音识别及自然语言处理”，大致对应了人类智能中的“会思考会学习”、“会看”和“会听、会说”等重要能力，覆盖了人工智能论文的73%以上，并具备较好的区分度。因而下面着重就这三个方向进行对比分析。

自1990年以来，三个方向均取得了长足发展（图5）。1990—2018年，“机器学习与算法”方向论文由220余篇增长到12000余篇，增长势头最强劲，表明目前对如何提升机器的“认知能力”的研究热度很高，这也是迈向未来“强人工智能”的关键所在；“计算机视觉”方向由200余篇增长到近5000篇，增长势头也较快，图像识别和人脸识别相关成果已得到了大量的应用；“语音识别和自然语言处理”方向由40余篇增长到2400余篇，呈平稳增长态势，但其研究范围更集中，论文数量相对较少。

表3 人工智能主要SCI发文机构及论文占比变化情况Tab．3 Main institutions of artificial intelligence SCI papers and the percentage change in recent ten years

图5 人工智能领域三个方向论文产出趋势Fig．5 Trends of artificial intelligence papers in three directions

由中美引领的区域分布特征同样突出（图6）。“机器学习与算法”方向中国占21%领先，美国占19%居其次；“计算机视觉”方向美国占22%领先，中国占19%居其次；“语音识别和自然语言处理”方向美国占20%领先，中国占14%居次位。中国、美国、英国、西班牙、法国、德国、加拿大和中国台湾地区在上述三个方向均居前十；论文数量排在十名之外的国家／地区论文平均占比仅约25%，说明人工智能领域论文成果高度集中在少数国家和地区。

图6 三个方向论文国家／地区分布Fig．6 Country／region distribution of papers for the three directions

3 专利分析

本部分数据基于德温特专利数据库，通过涉及机器计算与算法、神经网络、数据挖掘、计算机视觉、语音识别和自然语言处理、机器人等相关关键词检索获得，检索策略如下：TS＝（＂artificial intelligen*＂or＂expert system*＂or＂neural network*＂or robotics or＂machine learning＂or＂machine intelligen*＂or＂machine translat*＂or＂deep learning＂or＂natural language processing＂or＂NPL＂or＂speech processing＂or＂ontolog*engineering＂or＂computer intelligen*＂or＂face recognition＂or＂facial recognition＂or＂fuzzy logic＂or＂particle swarm optimization＂or＂support vector machin*＂or＂pattern recognition＂or＂genetic algorithm*＂or＂decision making＂or＂reinforcement learning＂or＂data mining＂or＂feature select*＂or＂feature extract*＂or＂speaker recognition＂or＂computer vision＂or＂object recognition＂or＂action recognition＂or＂visual tracking＂or＂evolutionary algorithm*＂or＂image segmentation＂），检索截止时间2018年12月31日，检索日期2019年4月。

3.1 专利数量

截止2018年，基于德温特专利数据库的人工智能专利申请量超过118000件（图7）。1990年之前，专利年申请量不到1000件；至2006年，年申请量稳步增长到近1000件；2006之后，年申请量快速增长，最高超过23000件。近些年人工智能应用领域不断延伸，人脸识别、图像识别、语音识别和机器人技术等已被商业化应用，无人驾驶、智慧医疗等概念成为热点，这些都带动了人工智能领域的技术布局；同时，各主要国家认识到人工智能对未来科技的重要性，纷纷出台激励政策措施，抢抓技术布局，力图占据技术制高点。

图7 人工智能专利年度申请趋势Fig．7 Tendency of annual application for artificial intelligence patents

3.2 国家与机构

“中美引领、中国后来居上”是人工智能领域专利的突出特点。至2018年，中国人工智能领域专利受理量超过43300件（图8），先后于2012年超过日本、2017年超过美国，目前居世界首位。中美专利受理量有拉开差距趋势，并大幅领先其他国家或组织。世界知识产权局专利受理量仅次于中国和美国，呈上升趋势，突显各方加紧在世界范围内进行技术布局的特征。美国凭借雄厚的技术基础，在2017年之前长期雄踞专利受理量首位，并在近些年呈加速增长趋势。2008年中国颁布《国家知识产权战略纲要》，知识产权工作上升为国家战略，为人工智能技术的布局创造了条件。在国家政策的推动下，利用互联网、大数据发展的契机，中国在人工智能领域的技术布局得到了长足的发展，并后来居上。

图8 主要国家或组织专利受理年度趋势Fig．8 Annual trends of patent acceptance in major countries or organizations

中国尽管在专利总量上已雄踞首位，但市场主体仍与美国、日本等有一定差距。从专利权人分布看（图9），美国IBM公司以2352件绝对领先；中国国家电网拥有1544件，居第二；其后依次为微软、谷歌和三星等大型企业。中国科学院拥有727件专利，在科研机构中最多。前二十机构中，企业有14家，其中美国6家，日本4家，中国2家，韩国和德国各1家；科研机构有6家，均来自中国。中国该领域专利成果主要来自少数科研机构，市场主体明显不足，说明在科技成果的转化上还急需加强。国际（PCT）专利数量均不多，相对突出的是NEC公司、英特尔和索尼等。中国机构国际专利数量更少，国际范围技术布局还有很大提升空间。

图9 主要专利权人专利数量分布Fig．9 Patent quantity distribution of major patentees

3.3 技术分布

以国际专利分类代码描述的技术分布如图10所示，主要涉及G06K-009／00（用于阅读或识别印刷或书写字符或者用于识别图形的方法或装置）、G06F-017／30（适用于特定功能的计算机信息检索及其数据库结构）、G06N-003／08（基于神经网络模型的学习方法）、G06N-003／04（基于神经网络模型的计算机系统体系结构）和G06F-017／27（自动分析的自然语言处理方法）等技术方向。总体而言，图形识别技术相关专利数量最多，增长较快；基于神经网络技术方向其次，但增速更快；再后为自然语言处理技术相关方向，呈稳步增长态势。

人工智能领域专利的技术主题分布如图11所示。专利地图中数个突出的“山峰”，即为当前集中的热点主题，包括“图像处理技术”“卷积神经网络”“机器人”“人脸识别”“检索与候选答案”以及“支持向量机”等方向。其他一些主题如“语音处理技术”“车辆信号检测”“遗传算法”等方向也有了一定聚集，预示了人工智能技术应用的动向。

图10 人工智能专利技术分布趋势Fig．10 Distribution trend of artificial intelligence patent technology

图11 人工智能专利热点技术主题分布Fig．11 Topic distribution of artificial intelligence patents

4 结论与启示

近些年人工智能国家层面政策密集出台。这些政策既注重凝聚力量进行科技攻关，也非常关注人工智能给人类社会带来的潜在影响，加强了在伦理、法律、教育、安全等多方面的研究，并倡导“以人为本”的人工智能理念。在政策的推动下，当前人工智能科研成果产出高速增长。中美两国引领了人工智能领域科研成果。中国近些年国内研究机构科技成果产出在数量和影响上均富有成效，已具备了开展国际竞争的能力。通过分析，还可获得以下结论：

1）如何提升机器的“认知能力”是当前人工智能研究的关注焦点。“卷积神经网络”和“图像处理技术”等主题是当前技术的热点，“语音识别和自然语言处理”、“机器人技术”等在技术应用领域的布局也较为突出；2）美国在“计算机视觉”、“语音识别和自然语言处理”等方向成果产出领先，中国在“机器学习与算法”方向已居领先。其后呈追赶状态的主要有英国、西班牙和法国等；3）以中国科学院为代表的国内研究机构在人工智能领域基础研究和应用研究上齐头并进，表现突出。国外在该领域的基础研究主要集中在高等院校，而技术应用则主要由科技企业承担。

对中国人工智能发展的启示包括：

1）中国在人工智能领域已具备参与国际竞争的条件，应充分利用科研平台聚集和培育人才，重点突出提升机器“认知能力”，力争在关键技术上形成突破；2）中国在坚持科技自立的基础上，还应积极与技术领先国家和追赶国家开展合作与交流，实时把握领域研究动向，客观认识自身的优势与不足，不留下技术短板；3）人工智能的最终目的在于应用，加大基础研究的同时，应加快促进科技成果转移转化，培育和壮大市场主体，推动中国人工智能良性发展。人工智能涉及面广泛，对经济社会影响广泛，中国应鼓励智库机构开展前瞻性规划研究，贯彻“以人为本”的理念，以利于人工智能更好地服务于人类社会。

致谢：感谢加拿大维多利亚大学图书馆研究馆员柳颖（Ying Liu）在论文撰写过程中提供的帮助！