APP下载

科学计量学视角下全球人工智能研究现状与趋势

2019-06-11周峻宇于磊李信姚强

电子技术与软件工程 2019年7期
关键词:神经网络领域人工智能

文/周峻宇 于磊 李信 姚强

1 引言

人工智能(Artif icial Intelligence)是由人类所研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,主要目的是理解自然智能奥秘,创制人工智能机器,增强人类智力能力。自1956年在达特茅斯人工智能夏季研究会正式提出以来,人工智能经历了上升、衰退、突破和重生等60多年的历史沉浮。2016年,人工智能领域在全世界掀起了第三次热潮。本轮人工智能发展将打破传统创新模式和学科的壁垒,实现理论创新与实践创新的最大化融合,带来颠覆性的创新并极大地促进创新成果的应用。目前,学界、产业界和政府层面纷纷将人工智能视为国际竞争的关键所在,并全力开展人工智能研究与产业创新布局。全面了解人工智能领域的科研态势和最新进展,对于科研人员、企业和管理人员把握人工智能的发展趋势具重要意义。因此,本研究主要目的是通过科学计量学的方法,全面揭示国际人工智能领域的科研进展情况,包括科研产出、影响及其合作情况,热点主题的演化进程,领域的最新研究前沿等,以期为我国人工智能领域相关科研人员、企业和管理人员了解自身状况,制定相关战略提供依据。

图1:1900-2019年人工智能领域研究年度分布情况

表1:1900-2019人工智能Top 10 国家/地区及影响力情况

表2:1900-2019人工智能Top 10 机构及影响力情况

图2:人工智能研究国家合作网络图谱(F≥60,N=55)

2 数据与方法

2.1 数据来源

选择Clarivate Analytics公司旗下的Web of Science核心数据库为数据源,其收录了科学、社会科学、艺术和人文科学领域的世界一流学术性期刊、书籍和会议录等文献,最早可以追溯到1900年,是世界范围内最具影响力的科学引文索引。同时,考虑到人工智能领域会议的重要性,本研究的文献类型确定为研究论文(Article)、综述(Review)以及会议论文(Proceedings Paper)。具体检索策略为:主题="*Artif icial intelligence*" AND文献类型= (Article OR Proceedings Paper OR Review) AND 年份=1900-2019. 数据库索引: SCI-EXPANDED, SSCI, A&HCI, CPCI-S, CPCISSH。检索时间2019年3月10日,共检索到31,218数据。然后,选择“全记录与引用的参考文献”下载为txt文本格式。

2.2 研究方法

本研究采用科学计量学研究方法和可视化技术,利用自编文献处理软件和VOSViewer软件,将下载的题录导入到相关软件程序,从时间序列、国家分布、机构分布、学科和主题分布等方面全面分析目前国际人工智能的科研产出、研究热点前沿及其发展趋势。国家和机构的产出数量通过发文数量测量,产出质量及影响通过引用和H-index测量,合作情况主要通过合作网络;人工智能主题分布、热点前沿主要通过学科分布和关键词的共词聚类分析以及同年度关联可视化进行研究。

3 结果

3.1 年度分布

国际人工智能研究的发文量时间分布如图1所示,1960年,Shubik在美国统计学会会刊(Journal of the American Statistical Association) 发表了“Bibliography on Simulation, Gaming, Artificial Intelligence and Allied Topics”一文,系统整理和推荐了人工智能领域的读物,1960年至1990年,人工智能领域研究进入缓慢发展阶段,文章数量缓慢增长,1990年仅达到246篇。1991年至2009年,人工智能领域进入了一个稳定发展的阶段,文章数量从1991年510篇增长到2009年的1271篇。2010年之后,人工智能研究迅速增长,2018年人工智能年度文章数量迅速增长到3296篇。因此,人工智能研究目前处于快速发展的新阶段,目前已经成为科学界的焦点领域之一。

3.2 国家分布

人工智能研究产出前十名的国家/地区情况如表1所示。157个国家和地区发表了31,218文献,其中前10名国家发表了21761篇次文章,占总发文量的69.71%。研究数量方面,美国作为人工智能研究历史最悠久的国家发文量最高,6376篇(占17.25%),中国大陆发文量紧随其后,4186篇(13.41%)。研究质量方面,美国篇均被引频次最高,17.25次/篇,英国和加拿大紧随其后,分别为15.17次/篇和12.29次/篇;中国和印度在相当对较低,分别为4.46次/篇和4.76次/篇。综合科研实力方面,H指数表明,美国远远高于其他国家(133),其次为英国(83),中国大陆排名第三(56)。

国家或地区之间的合作情况如图2所示,其中点的大小代表国家的合作总次数,国家之间的连线代表合作次数,合作次数越高,点和连线越大,不同颜色表示不同通过合作行程了不同的国家聚类,图中显示发文量大于等于60的55个高产国家之间的合作情况。通过国家之间的合作网络图谱,美国处于人工智能合作网络的中心,具有最广泛的合作伙伴,同英国、中国、加拿大、法国、德国、西班牙等过一同支撑起全世界人工智能合作的主干。形成了以德国为代表的欧洲、以中国为代表的亚洲、巴西为代表拉丁美洲美、阿尔及利亚和突尼斯为代表的北非等合作群体。同时,金砖国家(俄罗斯除外)以及澳大利亚同美国形成了紧密的合作群体,以色列形成了独立的研究网络,并且同时主要与主干国家合作。

3.3 机构分布

图3:人工智能研究机构合作网络图谱(F≥50, N=100)

人工智能研究产出前二十名的机构如表2所示。14319个机构中发文量前10名机构发表了1615篇次文章,占总发文量的5.17%。数量方面,中国科学院发表257篇排名第一,其次为伊朗伊斯兰阿扎德大学(190篇),麻省理工学院和斯坦福大学发文180篇并列第三。研究质量方面,美斯坦福大学、麻省理工学院、卡内基梅隆大学篇均被引次数均超过排名前三,平均被引次数均超过20;香港理工大学排名第四(19.97);中国科学院较低在10次以下。总体研究实力方面,麻省理工学院和斯坦福大学以H指数33并列第一,卡内基梅隆大学、香港理工大学、南洋理工大学位列2-5名,中国科学院排名第六,H指数为24。此外,我们发现发文量排名12位的加拿大多伦多大学篇均被引40.26次,在所有单位中排名最高。

机构之间的合作情况如图3所示,目前主要形成了以美国斯坦福和麻省理工学院等大学为中心和以中国科学院为中心的两大合作集团。其中斯坦福大学主要与美洲机构合作,同时包含了荷兰、日本、韩国和中国等国家的机构,是一个全球性的合作集团;而麻省理工学院主要与英国牛津大学和伦敦学院等高校合作并且形成了英国属性的合作集团;中国集团里包含了新加坡国立大学。此外,还形成了以伊朗伊斯兰阿扎德大学为核心的伊朗-马来西亚合作集团、以西班牙瓦伦西亚理工大学等为核心的西班牙合作集团、以澳大利亚悉尼科技大学等为核心的澳大利亚-希腊合作集团等。新加坡南洋理工大学、印度理工学院和波兰AGH科技大学主要同各大集团同时均匀的合作,但是没有与某些机构固定紧密的合作,因此形成了合作性的特点但是并没有形成各自为中心的研究集团。

3.4 主题演化

人工智能关键词主题聚类图谱如图4所示,其中点的大小代表关键词共现频次,线粗细代表两个词之间联系紧密程度,颜色反映关键词或主题的时间分布。通过人工智能主题图谱的时间变化可以发现,

(1)人工智能早期主要关注知识管理和智能决策系统等知识表达的研究(蓝紫色主题),如专家系统(Expert Systems)、多代理系统(Multi-Agent Systems)、决策支持系统(Decision Support Systems),分布式人工 智 能(Distributed Artif icial Intelligence)、基于案例推理(case-based reasoning)、基于知识的系统(Knowledge-Based Systems)以及本体论(ontology)、知识表示(Knowledge Representation)、知 识 管 理(Knowledge Management)、 知 识 工 程(Knowledge Engineering)、 智 能 代 理 商(Intelligent Agents)等数据管理技术和理论。

(2)随后,以机器学习为代表的研究成为人工智能重要方向(黄绿色),主要包括机器学习(Machine Learning)、强化学习(Ref inement Learning)、数据挖掘(Data Mining)、模式识别(Pattern Recognition),故障诊断(Fault Diagnosis),决策树(Decision Trees),分类(Classif ication),计算机视觉(Computer Vision),图 像 处 理(Image Processing)等。

(3)在此基础上,目前人工智能最前沿和热点的研究主要聚焦深度学习(Deep Learning)和大数据(Big Data)。主要包括特征提取(Feature extraction)、卷积神经网络(Convolutional Neural Networks)、支持向量机(Support Vector Machines)、自适应神经模糊推理系统(Adaptive Neuro Fuzzy Inference System)、物联网(Internet of Things)等。

(4)同时,以神经网络为代表的算法模型作为人工智能的核心一直伴随和推动着人工智能的发展(浅蓝色主题),主要包括人工神经网络(Artif icial Neural Network)、遗传算法(Genetic Algorithms)、模糊逻辑(Fuzzy Logic)、粒子群优化算法(Particle Swarm Optimization)、遗传编程(Genetic Programming)等一系列算法和预测模型的研究及优化。同时,自然语言处理(Natural Language Processing)也是近年来人工智能重要的研究方向,强化学习(Ref inement Learning)也成为推动人工智能领域发展的新动力。此外,机器人(Robots)作为人工智能的重要应用表现,一直伴随着人工智能的全过程,最新前沿技术和算法革新将进一步推动机器人的发展。

4 结论

通过研究发现人工智能研究目前处于爆发式发展阶段,美国和中国及其大学和科研院所是引工智能科研大国。美国作在人工智能研究方面具有悠久的历史,一直保持高度的活跃性,是全球人工智能研究的中心。同时,英国、加拿大、西班牙、法国和德国等国家也有不俗的表现。中国作为新兴国家的代表,尽管近年来科研产出已经比肩美国,但是在科研积淀和影响力方面仍然有较大差距,目前科研影响力方面仍然是地区性的中心,并且与美国合作紧密。科研机构方面,斯坦福大学、麻省理工学院和卡内基梅隆大学在人工智能方面具有深厚的积淀和超强的科研实力及全球性的影响力。加拿大多伦多大学因“深度学习之父”Hinton团队的贡献在论文篇均被引方面表现突出。同时,美国的伊利诺伊大学在影响力方面也而表现不俗。相比之下,中国科学院和伊斯兰阿扎德大学作为新兴国家的科研机构代表,科研产出近年来迅速提高,逐渐成为引领地区的核心机构,但是研究质量和影响力方面与欧美等发达国家科研机构相比仍然有很大的差距。因此,总体上,人工智能研究形成了“一超多强”的局面,美国作为人工智能研究的科研大国和超级强国在整个人工智能领域处于全面领跑地位,同时,英国、加拿大、西班牙、法国、德国等发达国家同样在人工智能领域具有较为深厚的积淀并且在某些领域处于世界领先。中国、印度、巴西等世界新兴经济体近年来在人工智能领域正在从追赶到部分超越的过程,中国作为人工智能的科研大国和应用强国在人工智能领域具有广阔的前景。

图4:人工智能关键词主题聚类与发展趋势图谱(F>=100, N=52)

人工智能的研究主题经历了知识表达、机器学习和深度学习的发展历程,以神经网络为代表的算法作为人工智能的核心要素是推动人工智能发展的核心因素,同时大数据时代、应用场景多元化和计算机算力的提高进一步加快了人工智能发展的步伐。通过对人工智能科研产出和研究内容的综合分析发现,1943年由McCulloch和Pitts提出的人工神经元模型开了启结构模拟方法,同1956年由McCarthy发起、Simon和Newell等功能模拟方法占成为人工智能20世纪50和60年代的主流。20世纪70至80年代,人工智能的发展主要聚焦在知识表达技术和系统的开发,以专家系统和知识系统等为代表的智能决策系统希望通过知识的积累和相关规则的制定,实现智能决策。然后,由于人类决策的规则复杂海量导致专家系统的决策成本急剧增加,人工智能的发展进入了瓶颈期。20世纪90年代开始,人工智能研究人员开始转向机器学习,希望通过机器自主学习解决一系列决策相关规则的制定问题。随后,贝叶斯网络、支持向量机、神经网络、进化算法、遗传算法等成为研究人员研究的焦点。最终,随着加拿大多伦多大学Hinton团队与于2006年提出的由一系列受限波尔兹曼机组成的深度置信网络以及非监督贪心逐层训练使得神经网络突破瓶颈,2012年提出通过阻止特征检测器的共同作用来改进神经网络,使得神经网络又向前推进了一步。神经网络算法方面获得的突破性进展突破了深度学习的瓶颈,再一次让人工神经网络重新走到了人工智能研究的中心,并且将人工智能发展从机器学习带进了深度学习的新时代,卷积神经网络等一系列围绕神经网络开展的算法和强化学习等研究和应用迎来了热潮。同时,随着大数据的产生、计算机算力的提高、应用场景的多元化进一步推动了人工智能在现实生活中的应用。

人工智能正逐步从弱人工智能时代步入强人工智能时代,人工智能在某些领域已经可以比肩甚至超越人类,并且广泛应用到显示生活中的各个方面。目前,人工智能语音处理、计算机视觉、自然语言处理等方面取得了重要进展,已经在图像识别、语音识别、文本处理、游戏博弈、软件设计等诸多方面全面赶超人类,并且开始广泛应用到安防、医疗、教育、金融、零售等数据集规范且密集的行业。未来,深度学习将成为人工智能研究的焦点和各国竞争的关键,大数据时代将进一步助力深度学习发展,同时也是从强智能时代到超智能时代的重要路径,即不仅在各方面都能和人类比肩,甚至可以在各个领域均可以超越人类,可解决任何人类无法解决的问题。

猜你喜欢

神经网络领域人工智能
神经网络抑制无线通信干扰探究
领域·对峙
人工智能与就业
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
新常态下推动多层次多领域依法治理初探
基于支持向量机回归和RBF神经网络的PID整定
肯定与质疑:“慕课”在基础教育领域的应用
3D 打印:先进制造领域的必争之地