基于CiteSpace的人工智能研究可视化分析
2014-07-27陈文娟
陈文娟
(河南财经政法大学图书馆,河南 郑州 450002)
基于CiteSpace的人工智能研究可视化分析
陈文娟
(河南财经政法大学图书馆,河南 郑州 450002)
本报告借助于CiteSpace引文分析软件对“人工智能”这一主题的相关文章从共引文献、共引著者、共引期刊等多个角度进行可视化分析,根据图谱分析人工智能相关的研究现状及前沿。
人工智能;CiteSpace;引文分析;可视化
人工智能也称机器智能,它是计算机科学、控制论、信息论、神经生理学、心理学、语言学等多种学科互相渗透而发展起来的一门综合性学科。从计算机应用系统角度来看,人工智能是研究如何制造出智能机器或智能系统,实现模拟人类智能活动的能力,以延伸人们智能的科学[1]。
近年来,随着互联网和通讯技术的迅猛发展,人工智能逐渐渗透到了社会生活的各个方面,极大地改变这社会面貌,也给人们的思想和行为带来了深刻的变革[2]。本文对近十年来有关人工智能的文献进行可视化分析,清晰地揭示人工智能研究的发展演变态势。
1 分析方法及数据来源
相比传统的统计分析方法,引文分析法对于揭示某一学科研究领域的动态结构和发展规律,衡量著者、成果的影响力具有更大的价值。本文以Web of Knowledge为来源数据库,借助于CiteSpace专业引文分析软件,截取2003-2013年10年内有关人工智能的文献进行计量分析。具体检索策略是在Web of Knowledge中输入检索式“Artificial Intelligence”,时间限度限定在2000-2013,并选择文献类型“ARTICLE”,得到的检索结果为3 144条。
2 共引文献(DCA)可视化分析
在CiteSpace中导入数据,限定时间为2003至2013,时间跨度为1,选取节点类型为共引文献(Cited Reference),运行后进行可视化,得到共引文献聚类的混合网络,如图1所示。图示中的网络共有170个节点,836条链接。
从图1可以看出,此聚类图的发展途径呈现出从左上角到右下角的演化,出现三个明显的聚类:最先出现了左上角的蓝色聚类,主要聚焦于蛋白质组学(proteomy);随后出现了以湖蓝色聚类,在这之后分为了两个不同的研究领域,研究内容分别为大神经网络(large neural network)与特殊谓语(special predicate);最后出现的是以橙色和黄色的聚类,内容涵盖遗传算法(genetic al⁃gorithms)、机器学习(machine learning)、基础神经网络(funda⁃mentals neural)、遗传编程(genetic programming)、计算机智能(IEEE Cevol computer)等新领域。黄色和橙色部分聚类连线较多,联系紧密,是目前人工智能领域研究的核心区域。
图 1 基于DCA的人工智能引文聚类图谱
中间中心性和被引次数均排在前列的文章是Goldberg DE于1989发表的有关遗传算法的文章,共被引32次,中心度为0.18,是该群体最具影响力的作者。这一文章可以说是人工智能领域的奠基之作,且仍处于目前研究的核心领域。从绿色到黄色、橙色的过渡并没有明显的节点。蓝色和湖蓝色的部分都相对孤立的,但左下方的湖蓝色部分文章节点都是红色,这表明这一领域的文章还是处于研究前沿。绿色节点较为分散,表明这一领域的研究出现时间较短或者研究尚浅,或是研究中遇到了难题,因此分布比较分散。自2008年之后的黄色与橙色的聚类网络相对紧密,这说明这些领域是目前研究的热点,且取得了较多的创新和成果,相互间联系比较紧密,分布比较集中。
3 共引著者(ACA)可视化分析
在CiteSpace中,选取节点类型为共引著者(Cited Author)进行分析,进入可视化界面,得到文章共引著者的聚类混合网络,如图2所示。
图 2 基于ACA的人工智能引文聚类图谱
由图可知,共引作者与共引文献的走向大致相同,蓝色与湖蓝色(2004至2005年)与其他文献之间联系不紧密,共引现象不多。在2005年之后共引开始增多,多个研究领域相互交叉,共引率较高。但同时也可以看出,2005年之后出现的研究相对比较分散,形成了多个分叉研究领域,且每个领域尚没有形成一个系统,虽然彼此间联系紧密,但从人工智能整个研究领域来说,目前所做的研究尚浅,研究的整体性不强,还有许多内容需要探索。
CiteSpace也给出了基于ACA人工智能的共引记录,其中共引率最高的是Haykin S,被引次数为64次。被引次数排名第二的为前面提到的Goldberg DE,中心度为0.18,可以说是人工智能研究领域内最具有影响力的权威专家。其他具有影响力的专家还有Zadeh LA,Newell A、Holland JH、Rumelhart DE、Kennnedy J、Mccarthy J等。
4 共引期刊(JCA)可视化分析
根据统计得知,人工智能研究领域共有126种共引期刊。在CiteSpace中,选取节点类型为共引期刊Cited Journal进行可视化,可以直观地看出该领域最重要的期刊有ARTIF INTELL、SCIENCE,以及LNCS、LECT NOTESARTIF INT等。同时视图也展示出了人工智能随着时间共引情况的发展变化情况:人工智能的研究起始于五六十年代,事实上,“人工智能”一词最初是在1956年Dartmouth学会上提出的[3]。从那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。自80年代以来,人工智能取得了较大的进展,人工智能的研究不断向多个方向和领域延伸,并取得了很大的成就,许多文献见诸一些世界级权威期刊。
通过人工智能共引记录的共引次数与中心度的排序可以更明确地看出人工智能的共引期刊分布情况,继而定义该领域的十大核心期刊。排名第一的期刊是ARTIF INTELL,被引次数(183次)最高,中心度(0.63)最大,是该领域最具有影响力的核心期刊。紧随其后的是SCIENCE,也是很有该领域内最有影响力的核心期刊之一;NATURE、LNCS、LECTNOTESARTIF INT、LECTNOTESCOMPUT SC这四种期刊次于前两种期刊,影响力处于第二核心等级;COMPUT IND、IEEE TNEURAL NETWOR、EUR JOPER RES、DATA KNOWL ENG这四种期刊影响力弱于其前的四种期刊。
5 结论
本文利用web of science数据库的检索数据对人工智能(2004-2010年)进行基于CiteSpace的科学知识图谱分析,根据图谱我们分析得知,人工智能的研究已经持续多年,在近些年来更是取得了非凡的进展,研究热点主要集中在遗传算法、机器学习、神经网络等方面。但总体来看,人工智能领域的研究尚不成熟,研究主题分布较为分散,主题之间联系不紧密。此外,本文通过定量分析,得出这一研究领域内具有较大影响力的核心文献、著者和期刊,有助于从宏观上把握人工智能的发展过程和现状,指导人工智能领域研究的进一步发展。
[1]胡国华,袁树杰.人工智能研究现状与展望[J].淮南师范学院学报,2006,8(37):22-24.
[2]刘树安.人工智能研究领域及其社会影响[J].合作经济与科技,2012(19):126-128.
[3]丁世飞.人工智能[M].北京:清华大学出版社,2011.
TP18
A
1671-0037(2014)06-88-1.5
2014年度河南省社科联、河南省经团联调研课题《基于关联数据的网络信息资源融和利用机制研究》,项目编号为:SKL-2014-765。
陈文娟(1988.3-),女,硕士,助理馆员,研究方向:信息资源管理与服务。