APP下载

基于CiteSpace的国际人工智能研究热点与趋势分析

2022-11-04盛云梦

软件工程 2022年11期
关键词:高产领域人工智能

盛云梦,刘 倩

(上海工程技术大学管理学院,上海 201620)

shengym2562@163.com;lqsn1996@163.com

1 引言(Introduction)

人工智能作为信息和计算机技术领域的一个重要分支,从前期计算机模拟人的认知研究发展为人与计算机网络结合的混合群智能研究,其目标是以更快的速度和更高的准确性解决人类智能的问题。在国家战略层面,美国、英国和德国等主要发达国家都将人工智能视为国家竞争、信息安全的关键技术,纷纷加大研究与产业创新结构升级。我国人工智能相关研究发展迅速,已步入全球领先水平。目前与人工智能相关的研究成果相对普遍,但研究内容较分散,大多数聚焦于某一子领域,较少从全局视角对国际人工智能发展趋势进行系统深入的研究,且人工智能是目前发展最快、影响最广泛的学科之一,需结合多种科学计量方法对文献数据进行深入的挖掘和分析。因此,本文运用文献计量软件,从总体角度对国际人工智能的研究热点、演进过程、发展脉络进行了梳理和分析,希望为该领域的发展探索提供新的研究视角和思考。

2 研究设计(Research design)

2.1 研究目的

为探析近十年人工智能整体发展的动态与演进轨迹,本文对期刊文献进行研究,主要从科研合作网络和文献、突显词、关键词层面进行信息整合和数据挖掘,归纳国际人工智能研究的发展特征,深入了解领域内的动态和焦点问题,对科研人员进行相关理论研究具有重要的借鉴意义。

2.2 数据来源

本文研究的所有文献数据来源于全球学术信息重要数据库Web Of Science的核心数据库。设定期刊时间跨度为2011-2021 年,检索日期设置为2022年2月1日,检索条件为:标题=“ARTIFICIAL INTELLIGENCE”,文献类别=“ARTICLE”,利用Web of Science筛选剔除掉非期刊类别的文章,共计检索到6,007 条纪录。

2.3 研究方法与工具

首先以人工智能相关领域的期刊发文量和影响因子为标准筛选了1,886 篇期刊论文,然后借助“CiteSpace”软件对具有国际影响力的人工智能学术刊物进行可视化的分析,采用文本信息提取法、定性与定量结合法,挖掘出当前世界人工智能研究的热点,并揭示其演化轨迹和发展趋势。

3 研究结果与分析(Research results and analysis)

3.1 论文分布及载文期刊分析

对上述数据清洗后的6,007 篇国际人工智能研究期刊论文的年度产出情况进行描述性分析,详见图1。

图1 国际AI相关论文年产量分布图Fig.1 Annual output distribution map of international papers related to AI

从图1可以看出,2011—2016 年人工智能研究领域相关文献量总体呈现逐年增加趋势,2017—2021 年,相关领域文献呈两倍急速上升趋势。2011 年国际上关于人工智能的研究已经兴起,但研究成果较少,这主要受两方面的影响,一方面是全球人工智能理论的基础研究、认知理论模型尚待完善,另一方面是硬件、软件、数据等技术工具的限制。2016 年谷歌旗下的AlphaGo以4:1打败了世界围棋高手,迎来了“人工智能60 周年”的发展拐点,使人工智能论文数目猛增。自此以后,人工智能的研究成果在数量和影响力上都有了明显的提升,其关注度也在不断飙升,到2020 年发文增长率为89.07%,上升到了一个新的高度。国际上关于人工智能研究且具有影响力的期刊有:、、等。结合Web of Science的期刊影响力因子,以及人工智能领域期刊的论文发文量,对6,007 条搜索结果进行了提炼和整理,最后得出1,886 条。

3.2 国际人工智能研究高产国家分布统计

设置面板中的“Country”选项,其余为系统默认值,可获得世界上高产人工智能研究国家的知识图谱,详见图2。图中每个节点表示国家,两个节点的连线代表了两国间的联系,节点的大小则是发文的数目。为了更好地理解该领域的节点层次,进行深一步的数据挖掘,详见表1。

图2 人工智能研究高产国家可视化知识图谱Fig.2 Visual knowledge map of high-yield countries for AI research

表1 按照文章数量和中心度分别排序的前10 位高产国家Tab.1 Top 10 high-yield countries ranked by the number and centrality of the paper

从论文产出的角度看,中、美、韩在人工智能领域发表的文章最多,其后的7 个国家论文产量差别较小。由图2可知中国人工智能研究起步较晚,与英国、美国、澳大利亚、越南、西班牙相比在基础研究、技术方面存在一定的差距,但已经有了较大的发展,研究也较深入。其中英国和美国在人工智能方面的研究起步较早,且部分文献是人工智能方向研究的关键转折点,这或许是其人工智能行业发展较快的一个重要原因。另一方面,从中心度观察,中心度值大于等于0.1的节点被视为关键性的节点,这些节点通常被视为导致研究领域发生变化的重要因素。从表1可以看出,英国、美国、澳大利亚、越南、西班牙、伊朗这六个国家的文献中心度大于等于0.1,这六个国家具有很高的创新能力,在人工智能领域中发挥着巨大的作用。

3.3 国际人工智能研究高产机构分布统计

运行该软件选取“Institution”选项,可得高产机构的分布图(图3)。图谱中较大的圆对应的连线未必多,表明有较多研究结果的组织和其他组织的关系也不是很密切。

图3 高产机构合作图谱Fig.3 Cooperation map of high-yield institutions

高产机构合作图谱共有615 个节点、1,743 条连线,每个节点代表了该机构的论文数量,连线表示组织间的相互协作,协作越多说明这个组织与其他组织的合作程度就越高。从图3可观察到各机构间的合作较为紧密,能够充分利用各高校、科研单位的文献,从而激发出新的研究视野,更深入、迅速地做出有意义的研究。发文单位基本上为高等院校或者研究机构,高产研究机构主要为Duy Tan Univ、Harvard Med Sch、Univ Tabriz等,其中美国机构发文频次前十名中占比40%,但美国高等院校及研究机构与其他机构合作不是特别密切,可见其主要利用内部资源进行独立的研究。

3.4 国际人工智能高产作者分布统计

为了更好地反映人工智能领域的核心作者和关联度,对1,886 篇论文进行了作者合作图谱可视化分析(图4)。

图4 高产作者合作图Fig.4 Cooperation map of high-yield authors

图4中的节点尺寸代表作者所发表的论文数目,连线则代表相互的协作关系。根据普赖斯定律,假设某一领域中最有生产力的作者论文数量为,那么=0.749。在这一领域中,发表超过篇文章的作者被定义为本研究的主要作者。可知=13,≈3,即发表3 篇文章以上的为核心作者,统计得样本文献中核心作者共29 名,其排名靠前的作者为Salaheldin Elkatatny、Abdulazeez Abdulraheem、Md Mohaimenul Islam、Kang Ryoung Park。总体而言,国际人工智能领域合作关系较为紧密,该领域的研究力量处于比较集中的状态,各个学者之间联系密切,对该领域的深度探究具有重要意义。

3.5 基于突显词可视化分析的人工智能热点及趋势研究

运用软件的“Detect Bursts”功能,在特定的年份里可以发现在短期内急剧增加的专业词汇,从而观测更深层次的发展变化,图5为样本文献生成的突显词图谱。从突显词看出其热点持续时间表现出从长到短的趋势。

图5 前22 个最强突显词Fig.5 Top 22 keywords with the strongest citation bursts

2011—2012 年突显词包括时间序列(time series)、人工神经网络(ann)、智能仿真(simulation)、机器学习模型中的定义参数(parameter)、行为(behavior),这些突显词持续时间长达7至9 年;2014—2017 年突显词包括遗传算法(genetic algorithm)、增长智能(growth)等,这些关键词平均持续时间长达4 年;2018 年至今突显出支持向量机(support vector machine)、人工智能未来法案(future)、智能医疗(care)、特征学习(feature)等突显词。以上突显词体现了人工智能的发展脉络和趋势,其中,支持向量机、人工智能未来法案、智能医疗、特征学习等关键词一直持续至今,反映出在未来一段时间相关研究仍是人工智能领域的关键趋势。

3.6 基于关键词共现的研究热点分析

关键词反映了文献所要表现的各个主题之间的相互关系,是文章中心的核心概括,分析关键词有利于研究本领域的热点。运行软件得到图6所示的人工智能关键词共现图谱。该图谱每一个节点的尺寸代表了该词出现的次数,随着出现次数的增加,这个圆圈也会越来越大。在出现频率超过20的关键词中,神经网络、系统、模型出现的次数最多,分别出现次数为187、141、141。总结国际人工智能领域学者们关注的热点主体主要有10 个方向:诊断(diagnosis)、神经网络(neural network)、深度学习(deep learning)、风险管理(risk management)、优化(optimization)、预测(prediction)、分类(classification)、算法(algorithm)、智能仿真(simulation)、管理(management)等关键词,高频关键词与中心排名靠前的关键词基本保持一致,即频次越高,中心越明显,中心性一定程度上可以涵盖热点和关键转折点。

图6 关键词聚类图Fig.6 Keywords cluster map

结合文献分析将关键词结果归纳为两大类。一是针对深度学习的相关算法研究,深度学习是研究计算机获取新的知识技能,一方面在信息感知、数据预测和估计模型上直接使用,另一方面试图模仿人脑在数据中寻找模式的方法,这种模式又被称为“神经网络”,神经网络代表了人工智能在人类思维模仿技术方面的前沿。二是算法优化和特征学习,通过训练数据集进行预测以采取行动优化某些系统,当前有多种算法可用于此优化,包括基于模型的强化学习、基于遗传算法的多目标寻优策略、基于数据挖掘的数据算法、支持向量机的特征分析等。三是人工智能与跨门类的尖端学科,它的研究领域十分广阔,“人工智能+X”的创新模式将会在技术与工业发展中逐渐走向成熟,研发聚集多方向结合的混合智能,在智能城市、智能农业、智能制造等需求的牵引下需要更多交叉融合的新发展,从而改变生产力、产业结构,促进人类迈向“普惠型”的智能社会。

4 讨论(Discussion)

随着信息环境、数据挖掘、跨媒体计算等方面表现出来的巨大变化,VR、AR、移动终端等穿戴设备的涌现及元宇宙概念的提出为新一代人工智能的突破提供了技术环境和概念延伸。人工智能技术实现了新的技术突破,使其跨越了科学与应用之间的“技术鸿沟”,在理论与应用之间,平台支撑系统和平台服务驱动人工智能也走向了新的发展阶段。环境的日益复杂需要越来越多的基于人工智能的支持系统来制定解决方案,使各个方向的研究能够以更快、更准确的方式进行调整。

就目前发展来看,人工智能的发展从信息感知、机器学习等“浅层智能”过渡到模仿自然大脑如何处理信息的“深层智能”。出现频次高的关键词包括神经网络、深度学习、优化模型、预测、风险管理等,对其余方向的关注度相对平稳,且根据节点中心性,时间序列、人工神经网络、群智能仿真对人工智能领域具有重要的影响力,支持向量机、人工智能未来法案、智能医疗、特征学习等相关研究仍是未来一段时间内人工智能领域的热点。

5 结论(Conclusion)

本文以CiteSpace软件为基础,通过定性和定量分析研究领域内的国际期刊,得出如下结论。

从高产国家、机构、作者分布统计可视化结果来看,国际人工智能高产国家集中在中国、英国、越南、西班牙、伊朗、美国;发文量排名前三的高产研究机构为Duy Tan Univ、Harvard Med Sch、Univ Tabriz,产量排名靠前的作者为Salaheldin Elkatatny、Abdulazeez Abdulraheem、Md Mohaimenul Islam,且各机构间、学者间的合作较为紧密。在高产国家、高产机构、高产作者三方面的结果中,美国综合排名靠前,可见其在人工智能领域学术研究上较为领先。

从研究热点来看,目前国际人工智能领域重点关注的是深度学习、神经网络理论和技术领域的应用。国际人工智能领域的关键词之间强度较大,与其他多门商业、生物、医疗等传统领域渗透和融合,关注面愈加广泛。围绕人工智能技术的深入应用还有待挖掘,在深层智能的研究如思维、策略等方面仍有不足。鉴于对社会经济和发展的重要影响,这仍然是进一步研究的主要领域。

从研究的演进特点和发展历程来看,2011 年至今国际人工智能经历了蓬勃发展期、稳定期、新一轮爆发期三个时期。从早期理论向实际的转化,到中期基于大数据、图形处理等计算平台的快速发展,再到后期结合金融、医疗机构、教育、数据安全、管理等领域进行深度应用,在社会和经济领域都引起了广泛的关注。

猜你喜欢

高产领域人工智能
小麦高产栽培技术探讨
领域·对峙
秋茬蔬菜高产有妙招
2019:人工智能
人工智能与就业
数读人工智能
下一幕,人工智能!
新常态下推动多层次多领域依法治理初探
超级杂交稻广两优1128高产栽培技术
无公害大葱高产栽培技术