APP下载

国际数据挖掘研究热点与前沿可视化分析

2018-08-11赵蓉英余波

现代情报 2018年6期
关键词:可视化分析知识图谱热点

赵蓉英 余波

〔摘 要〕为全面了解国际图书情报学数据挖掘领域的研究热点和前沿趋势,以Web of Science数据库收录的2007-2016年数据领域的文献数据为研究对象,通过CiteSpace软件,结合文献计量学和可视化方法,从年度分布、期刊分布、研究力量分布、重要文献、研究热点以及前沿等方面进行分析。研究发现,国际数据挖掘研究出现了网络与计算机技术、数据挖掘方法、数据挖掘与管理、数据挖掘与应用四大聚类。研究前沿探测出3个发展时期,每个时期的热点都有特色。根据上述研究绘制该领域知识图谱,对国际数据挖掘的研究现状和发展趋势进行分析和总结,为我国数据挖掘研究提供参考。

〔关键词〕数据挖掘;热点;前沿;可视化分析;知识图谱

DOI:10.3969/j.issn.1008-0821.2018.06.020

〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2018)06-0128-10

〔Abstract〕In order to understand the progress of Date Mining research,published articles on Date Mining during 2007-2016,which were recorded in the database of WOS,were chosen to be analyzed in this paper.By applying the method of bibliometric and Visualization,the paper analyzed the research status in this area according to the time,journals,disciplines,the research power,important literatures,research focus and frontiers through Cite Space.The study found that there are four clusters of international data mining research:network and computer technology,data mining method,data mining and management,data mining and application.Research front detected three development periods,each period had its own hot spots.Based on the knowledge map,the research status and development of international Date Mining were analyzed and summarized,which in order to provide reference for the researching about the Date Mining in our country.

〔Key words〕data mining;hotspot;frontier;visualization analysis;knowledge mapping

随着计算机软件、硬件技术、数据搜集以及数据存储技术的高速发展,数据库应用的规模不断增加,大量的数据和信息给人们带来了数据过剩、信息爆炸、信息安全、信息不对称等现象。目前人们如何从海量的信息中获取有价值的知识和信息成了一种挑战。数据挖掘正是在这种挑战中应运而生的,并在不同领域得到了广泛的应用。人们对数据挖掘的开发、应用和研究兴趣主要源于超大规模数据库的出现、先进的计算机技术、对海量数据库的快速反应和统计方法在数据处理中的应用[1]。

国内外学者对数据挖掘研究开展了较广泛的研究,这些研究主要集中在某一主题或一些应用领域。如Guizani S利用移动数据挖掘的K-Means集群安全框架,提出了一种能够收集信息并实时生成警报的系统框架,以确定该方案的有效性和准确性[2];Sumba X使用语义和数据挖掘技术检测类似的知识领域,提出了一种新的架构,通过本体、词汇表和关联数据技术的结合,确定共同的研究领域和潜在的协作网络,从而丰富一个基础数据模型[3];Keramati A利用数据挖掘技术,从组织数据库中收集数据,认为数据挖掘为从海量数据中提取知识提供了强大的工具,最后通过应用决策树技术构建了预测模型[4];Khalkhali HR通过分类和回归树(CART)应用于乳腺癌数据库,通过十倍交叉验证实验,测量了回归树的大小的分类误差,建立模型准确性、敏感性和特异性的性能评价标准[5]。宋韬等分析了基于数据仓库的数据挖掘技术,对数据挖掘在税务稽查中的应用进行了探讨,认为在税务稽查选案中应用人工神经网络来实现稽查选案[6]。石冰等介绍了信息检索中的数据挖掘技术,结合挖掘过程重点讨论了基于知识规则挖掘的分类方法,并以关联规则发现算法为例探讨了数据挖掘在数据库系统中的使用[7]。朱丽萍等汇总了网嵊泗县供电公司各生产专业数据,形成“生产经营统计一套表”,运用数据挖掘进行全面分析,探讨了数据挖掘对生产经营管理和综合计划统筹及电网科学发展[8]。目前,国内对数据挖掘领域的计量文献研究较少,鉴于此,本文基于采用文献计量学和可视化分析方法,对国际数据挖掘研究领域的现状和趋势进行了多角度计量和可视化展示,以期为相关领域的研究人员提供参考。

1 数据来源与研究方法

1.1 数据来源

本研究选择Web of Science数据库为数据来源,检索策略为主题=“Data Mining”进行檢索(检索时间:2017年12月2日),学科限定在图书情报学。检索年限为2007-2016年。共获取535篇有效论文作为本文的数据样本。

1.2 研究方法

本文主要采用最新的CiteSpace 5.1可视化软件,利用文献计量分析方法,从文献的年代分布、期刊、研究力量分布、重要文献、研究热点及前沿等方面进行多角度计量与可视化展示,从而全面地展现国际数据挖掘领域的研究热点方向以及发展现状。

2 研究结果分析

2.1 年度分布

文献的年度变化趋势与文献知识量的增长有着较为密切的关系,能揭示该领域研究发展趋势。因此,文献的数量是衡量文献研究热点的重要指标之一[9]。通过分析国外近10年数据挖掘研究领域的文献数量,可大致分析出该领域文献的应用程度,进一步较全面地掌握国外数据挖掘研究领域的发展速度和理论水平。如图1所示,从图中可看出,2007-2016年间,国外有关数据挖掘的研究文献增长趋势大致可分为3个阶段:第一阶段为2007-2010年,该阶段是数据挖掘研究正由高峰时期开始转向下降趋势,2007年发文量高达71篇,占总发文量的13.2%,到2010年下降至42篇,表明该阶段数据挖掘研究的热度开始减弱;第二阶段2011-2013年为缓慢发展时期,2011年发现发文量降到了最低,仅为32篇,占发文总量的5.98%,从2012年开始,该领域发文量再次开始增长,在一定的范围波动,总体发文量较稳定;第三阶段2014-2016年为持续发展时期,发文量从46篇增至67篇,2016年总发文量占比12.52%和2007年占比13.2%比较接近,这充分表明了近年对数据挖掘的研究热度再次升温,发文量上升趋势显著。文献量变化的趋势可能与数据开发和利用的政策有关,也可能与信息、网络和计算机技术的发展有关。

2.2 期刊分布

大部分文献期刊在刊载文献时,都有各自期刊载文的侧重点,即不同的期刊有不同的刊载领域。考察某一学科领域研究文献的来源期刊,有利于进一步了解该领域文献的空间分布现状,对开展该领域文献调研也具有重要意义。为此,在软件中选取Cited Journal为分析对象,在Cite Space中设置一定的阈值,运行Citespace软件得到数据挖掘领域共现图谱,如图2所示。表1中展示的是数据挖掘研究领域的高被引期刊。从频次上看,该领域高被引期刊最高的是LECT NOTES COMPUT SC,高达91次,其次是COMMUN ACM(76次)、EXPERT SYST APPL(74次)、DECIS SUPPORT SYST(65次)和INFORM PROCESS MANAG(63次)等。

通过节点的中心性可以衡量网络中不同位置的节点的重要性[10]。基于此,对该领域的高被引频次频次>20期刊和中心性较高的期刊进行了统计,表1所示。上述高被引期刊中有6个期刊的中心性大于0.1,分别是“DATA MIN KNOWL DISC”、“INFORM PROCESS MANAG”、“ACM COMPUT SURV”、“COMMUN ACM”、“MACH LEARN”、“IEEE T KNOWL DATA EN”,其中心性依次是0.2、0.18、0.18、0.16、0.14、0.11,这表明了这些期刊在数据挖掘领域是比较重要期刊,是该领域学术交流的重要载体,其载文质量较高,是该领域学者关注的焦点。同时,结合表和图谱还发现信息科学领域的期刊对该领域的研究关注度最高。

2.3 研究力量分布

2.3.1 国家和地区分布

研究国家分布,我们可以快速地掌握不同国家和地区在该领域的研究实力情况。在软件中选取Country为分析对象,在软件中绘制数据挖掘研究领域的国家和地区分布图谱,如图3所示。

图中的节点代表国家和地区,节点大小表示发文量的多少。从发文量来看,数据挖掘领域发文最多的国家是美国,发文高达201篇。其次是中国大陆发文106篇,位居第二。另外,数据挖掘领域高产的国家和地区还包括中国台湾地区(37篇)、英格兰(26篇)、西班牙(20篇)、德国(17篇)、加拿大(15篇)、韩国(14篇)、意大利(13篇)、法国(11篇),说明这些国家和地区对数据挖掘领域研究的关注度较高,并在该领域取得一定的研究成果。从中心度来看,数据挖掘领域中心度较高的国家有英国(0.41)、美国(0.24)、中国大陆(0.21)、中国台湾地区(0.09)、意大利(0.09)等,这表明这些国家和地区在数据挖掘研究领域处于领先和主导地位。

节点之间的连线代表了国家和地区之间的合作情况,连线的粗细则说明了国家和地区之间的合作紧密情况。由图3可知,在数据挖掘领域,合作较为密切的国家和地区主要是美国和英国等为主的欧洲国家和地区。同时,也说明了该领域之间国际之间的合作和交流较少,需要进一步加强以促进该领域研究的发展。

2.3.2 机构分布

通过研究机构分布情况,有利于掌握不同机构的研究重点和合作状况。在软件中选取Institution为分析对象,设置合适的阈值,运行软件得到数据挖掘研究领域的机构分布图谱(见图4)。节点大小与该机构的发文量成正正比,节点之间的连线代表了机构之间的合作关系。

由图4可知,数据挖掘领域研究机构数量众多,但机构之间的合作较为稀疏,只有较少的机构之间存在合作关系。从中心性来看,图中机构在网络图谱中的中心性均趋近0,表明机构间合作文献较少,在整个网络中的连接作用很小。从发文量来看,排名靠前的机构分别是Beijing Normal Univ、East China Jiaotong Univ、Gachon Univ、Bucharest Univ Econ Studies、Old Dominion Univ、Stanford Univ、Acad Econ Studies、Natl Univ Ireland Univ Coll Dublin、New Jersey Inst Technol、Virginia Tech。从机构类型来看,高校及科研院所是数据挖掘研究的主要力量,高校所占比重最大。其中在我國科研机构中,中国科学院及北京师范大学的发文量位居前列,表明这两所院校在数据挖掘领域具有较强的科研实力。

2.4 作者分布

科学研究成果通常以科学论文等重要形式表现出来,在软件中选取作者(Author)为分析对象,设置合适的阈值,运行软件得到数据挖掘领域研究的作者分布图谱,如图5所示。图中节点代表发文作者,节点大小代表作者的发文量,节点越大,表明该作者发文量越多。节点之间的连线代表作者之间存在合作关系。

由图5可知,数据挖掘研究领域发文量位居前10的作者分别是Chen Y(4篇)、Li N(4篇)、Kim C(3篇)、Dan Z(2篇)、Zhang D(2篇)、Li XM(2篇)、Ji ZH(2篇)、Holzinger A(2篇)、Chalaris M(2篇)、Tzima FA(2篇)。从合作角度看,该领域作者之间的合作相对比较分散,2~4人的小团体较多。在这些作者中形成的最大的合作网络是由Li N、Ji ZH等组成的4人网络,这些学者主要涉及数据挖掘技术方面的研究。从中心性来看,图中作者的中心性趋近为0,仅有Li N的中心性为0.01,这表明网络中该作者处于核心地位。

2.5 引文分析

引文分析是文献计量学的重要组成部分之一,高被引论文对该领域的研究具有重要的价值和意义,也是该领域研究的基础。通过Citespace软件可分析文献被引频次的高低及其中心性,被引频次的大小和中性度的高低能反映其文献的影响力和价值。通常情况下,单篇文献的被引频次越高,说明该文献在研究领域中的学术价值和影响力越大。节点文献的中心性也体现文献在学科领域的重要程度。在软件中选取Cited Reference为分析对象,并选择图谱类型为聚类视图,运用可视化软件可得到数据挖掘研究文献的共被引图谱,共获得有效期刊114种,如图6所示。

选取被引频次位居前列,且中心性均不低于1.0的文献作为数据挖掘领域的重要文献,共有3篇重要文献,分别为DATA MINING PRACTICA、DATA MINING CONCEPTS和J COMPUT SCI-NETH。可见,这3种期刊在数据挖掘领域占有重要的地位。

通过对高被引期刊和文献的研究,我们发现这些高被引文献主要體现在数据挖掘的技术应用领域,如在数字图书馆领域,数据挖掘技术应用在数字图书馆推荐服务中,有效地利用有意义的信息来提高数字图书馆的服务质量是图书馆服务的重要目标,使用的数据挖掘过程关联规则和聚类方法生成一个推荐系统促进数字图书馆服务;人工神经网络(ANN)和数据挖掘(DM)技术是一个很好的方法来满足图书馆用户的需求[11]。在商业应用领域,商业智能(BI)是一个过程,对企业的业务操作、战术和战略有积极影响。BI在企业计算环节中,智能系统的部署使商业智能更有效[12]。在基于互联网的电子商务环境中,大多数业务数据分布呈现异构和私有的特征,为了实现真正的商业智能,挖掘大量的分布式数据是必要的,通过分布式数据挖掘(DDM)电子商务系统,将现代DDM系统分为3类具有代表性的样本解决这些识别问题[13]。基于此,可以体现出国外数据挖掘技术在各个领域的应用较为广泛。

2.6 研究热点探测

关键词是对文章主题的高度概括和提炼,也是文章的核心和精髓。因此,高频关键词通常被用来确定某一个研究领域的热点问题。运用可视化软件Cite Space绘制数据挖掘领域的关键词聚类知识图谱,对热点关键词进行聚类分析来探测学科领域的研究热点。在软件中设定相应的参数,选择探索关键词的路径算法(Pathfinder),Pathfinder是一种较小的生成树算法,通过算法经过模型运算来剪切网络中大部分不重要的关联节点,只保留重要的关联节点,保留所有原节点不动,从最大程度上将原网络简化为一个最小值网络[14-15]。国际数据挖掘研究领域热点聚类图,如图7所示。图谱中每个节点代表对应的关键词,节点越大说明关键词频次越大。表2是由Citespace统计得出的部分高频关键词和中心性较高的关键词。

在图7和表2,可以看出该领域出现频次最高的关键词是Data Mining(数据挖掘),频次高达215次。高频关键词反映出的数据挖掘领域的研究热点还包括System(系统)、Model(模型)、Classification(分类)、Big Data(大数据)、Algorithm(算法)、Text Mining(文本挖掘)、Information(信息)、Web(网络)、Information Retrieval(信息检索)、Clustering(聚类)、Neural Network(神经网络)、Knowledge(知识)和Association Rule(关联规则)等同时,从中心性角度来看,中心性大于0.06的关键词包括Data Mining(数据挖掘)、System(系统)、Information(信息)、Model(模型)、Behavior(行为)、Text Mining(文本挖掘)、Algorithm(算法)、Classification(分类)和Network(网络)等。将高频关键词与高中心性关键词进行比较可知,两者大体上保持一致,因此,可以确定这些关键词在一定程度上能够表示数据挖掘研究的热点。

为了进一步更深层次地了解该领域的热点研究,利用软件绘制了该领域的聚类知识图谱。通过数据挖掘领域聚类图谱分析发现,国际数据挖掘研究主要有4大聚类:网络与计算机技术、数据挖掘方法、数据挖掘与管理、数据挖掘与应用,对应图中的A、B、C、D 4个聚类。可以看出国外数据挖掘对计算机技术及在不同领域的广泛应用普及度较高。

2.6.1 网络与计算机技术

A聚类是反映了网络与计算机技术的热点词汇,包括Model(模型)、Network(网络)、Database(数据库)、Data Stream(数据流)、Web(网络)、Twitter(推特)、Visualization(可视化)、Cluster Analysis(聚类分析)、Citation Analysis(引用分析)、Science(科学)、Machine Learning(机器学习)、Information(信息)等,这些热点词汇分别涵盖了数据挖掘的基础理论,互联网和计算机技术是数据挖掘领域中必要的组成部分。随着互联网和计算机技术的普及,数据挖掘领域的可视化数据挖掘技术、数据库和网站数据挖掘技术的发展越来越快。在大数据背景下,国外数据挖掘研究正在不断的发展中。随着互联网技术的发展,业务数据的数量增加很快。知识提取与数据挖掘需使用分布式云计算之类的环境进行多个节点之间共享存储和处理[16]。

2.6.2 数据挖掘方法

B聚类反映了不同的数据挖掘方法,包括Information Retrieval(信息检索)、Text Mining(文本挖掘)、Knowledge Discovery(知识发现)、Spatial Data Mining(空间数据挖掘)、Social Network(社会网络)等,这些关键词表明了数据挖掘方法从不同的层面深入,挖掘更深层次的信息和知识。数据挖掘的目的与决策和用户息息相关,在这个聚类中,我们还发现与之相关的关键词,如Decision Tree(决策树)、Strategy(决策)、User(用户)、Behavior(行为)等关键词。通过对以上聚类关键词可以发现,国外数据挖掘方法在不断地发展和创新,综合考虑数据挖掘方法与模型和应用的关联[17]。

2.6.3 数据挖掘与管理

C聚类反映了数据挖掘与管理相关的关键词,包括Management(管理)、Knowledge(知识)、Digital Divide (数据分类)、Expert System(专家系统)、Information System(信息系统)、E-learning(学习管理)、Performance(绩效)、Motivation(动力)、Knowledge Management(知识管理)、Neural Network(神经网络)、Prediction(预测)、Impact(影响)、Framework(框架)等,这些热点关键词体现了与管理相关的各个方面,涵盖了与管理相关的主要因素。国外数据挖掘与管理应用在体育知识管理中,在体育知识管理中发挥着重要的作用[18]。

2.6.4 数据挖掘与应用

D聚类反映了数据挖掘技术的应用层面,主要是大数据和云计算环境下与数据玩家相关的实践应用层。包括Business Intelligence(商务智能)、Electronic Health Record(电子健康记录、Digital Library (數字图书馆)、Big Data(大数据)、System(系统)、Classification(分类)、Cloud Computing(云计算)、Design(设计)、Feature Selection(特征选择)、Association Rule(关联规则)等,从这些热点关键词中能体现出国外数据挖掘在商业、医疗和数据图书馆领域应用较突出。在国外医疗应用领域,人们认为挖掘电子健康记录数据就像发现金块一样,可见数据挖掘在医学领域应用的重要性[19]。在图书馆应用领域,国外学者认为文本和数据挖掘是寻找埋藏知识的宝库[20]。

2.7 研究前沿分析

研究某学科的前沿可及时掌握学科最新研究动态,且能预测学科的发展方向和未来研究的热点问题。探测研究前沿可利用Cite Space软件的膨胀词探测算法,通过词频的时间分布,将词频的热点从主题中探测出来,根据词频的变化趋势,来探测该领域的研究前沿及其演化趋势[21]。在参数设置选择Keyword(关键词)作为节点,通过调整相关参数,结果以Time Zone(时间区域)方式显示,运行软件绘制出国际数据挖掘研究领域的前沿与知识图谱,如图8所示。图中的每一个结点代表一个热点关键词,结点大小表示关键词出现频次的高低。

表3列出了2007-2016年国际数据挖掘研究前沿术语及其频次,结合图8可知,该领域研究大致经历了3个时期:即2007-2010年的繁荣期,2011-2013年的稳定探索期,2014-2016年的新一轮繁荣期。

2.7.1 数据挖掘的繁荣期(2007-2010年)

从表3和图8中可以发现,大量的高频关键词集中于这个时期,如2007年,System(系统)、Classification(分类)、Algorithm(算法)、Text Mining(文本挖掘)等,到 2008年,Model(模式)、Information Retrieval(信息检索)、Management(管理)、Knowledge(知识),2009年的热点前沿词为Information(信息)、Internet(因特网)、Ontology(本体)等;2010年Web(网络)、Behavior(行为)、Prediction(预测)、Feature Selection(特性选择)、User(用户);这一时期体现了国际挖掘领域技术与管理的完美结合。

2.7.2 数据挖掘的稳定探索期(2011-2013年)

这一时期热点关键词开始下降,说明该时期正在进行探索和创新阶段。2011年为Network(网络)、Framework(框架)、Impact(影响)、Data Analysis(数据分析);2012年为Business Intelligence(商务智能)、Cluster Analysis(聚类分析)、Pattern(模型),2013年为Electronic Health Record(电子健康记录)、Science(科学)、Twitter(推特)。这时期可以看出数据挖掘研究正在不同的领域探索其应用范围。如商业领域和医疗领域。Patterncluster Analysis(聚类分析)、Expert System(专家系统)。

2.7.3 新一轮繁荣期(2014-2016年)

2014年为Big Data(大数据)、Retrieval(检索)、Data Mining(大数据挖掘),2015年为Cloud Computing(云计算)、Discovery(发现)、Support(支持)、Technology(技术);2016年为Time(时间)。这一时期受大数据、云计算的影响,数据挖掘的空间和广度更大,导致再次繁荣和发展。

由以上热点关键词我们预测,该领域研究学者们在不断探索新的技术与方法,将系统、算法、文本挖掘、商务智能、本体、云计算、可视化分析、空间计量等相关理论、技术和方法综合应用到数据挖掘的开发和实践中,以促进数据挖掘在不同领域的应用和发展。

3 结 语

本文选取了Web of Science数据库中图书情报学科收录的数据挖掘研究领域相关文献为数据来源,国际采用文献计量学理论和可视化方法,利用可视化软件Cite Space,以对2007-2016年国际数据挖掘领域研究现状、热点和前沿进行可视化分析,通过相关统计数据和知识图谱得出以下结论:

1)通过文献发文了解该领域发文趋势和变化情况,得知国际数据挖掘领域的研究处于稳定和不断的深入研究阶段,在这些时期数据挖掘的发展也面临着新的发展机遇和挑战;通过期刊分布发现该领域的高被引期刊和高中心性期刊为《COMMUN ACM》;通过对研究力量分布可以发现该领域发文最多的国家是美国、中国大陆等国家;发文机构较多,但机构间的合作较少;另外,高校及科研院所是数据挖掘研究的主要力量,高校所占比重最大;通过对作者分析发现该领域作者合作度不高,作者分布较稀疏,表明作者之间的合作度有待进一步加强;通过引文分析可以发现,该领域高被引文獻的研究价值和意义及对该领域的贡献。

2)在数据挖掘研究热点探测中,国际数据挖掘热点研究主要有:网络与计算机技术、数据挖掘方法、数据挖掘与管理、数据挖掘与应用4大聚类。主要体现在理论、技术、方法和应用层面。数据挖掘技术、方法和应用都在不断多深入和拓展,特别是在大数据环境下,数据挖掘技术正在不断地发展和创新,其研究重点不局限于某个技术方法层面,而是与数据挖掘的管理和应用层完美结合。

3)通过对研究前沿分析,笔者发现国际图书情报学科对数据挖掘研究在不断地深入和加强。在时期研究前沿时区视图上呈现3个阶段,并且每个阶段都体现出新的研究方向。

第一个时期是该领域的繁荣期,大量的热点前沿都集中在这一时区,其中技术、管理是这一时期的热点。第二个时期是稳定探索期,表明国外数据挖掘领域在不断地探索该领域新的发展空间。第三个时期是新一轮的繁荣期,在大数据、互联网和云计算等背景下,该领域研究正在酝酿一种新的研究浪潮。

以上的研究表明,国际数据挖掘热点研究和研究前沿可视化分析对于我国的相关领域问题的研究具有重要的参考价值。从研究热点趋势而言,在大数据和互联网技术背景下,数据挖掘涉及的领域在不断地深入。同时,通过该领域的热点研究前沿探测分析可以预测数据安全将成为未来数据挖掘领域人们越来越关注的焦点。此外,值得关注的是,我国数据挖掘领域的研究成果有待提升国际知名度和竞争力,加强国际科学技术交流与合作,从而提高我国数据挖掘研究领域的国际竞争力。

参考文献

[1]蒋胜益.数据挖掘原理与实践[M],北京:电子工业出版社,2011:4-5.

[2]Guizani S.A K-Means Clustering-Based Security Framework for Mobile Data Mining[J].Wireless Communications & Mobile Computing,2016,16(18):3449-3454.

[3]Sumba X.Detecting Similar Areas of Knowledge Using Semantic and Data Mining Technologies[J].Electronic Notes in Theoretical Computer Science,2016,329:149-167.

[4]Keramati A.Developing a Prediction Model for Customer Churn from Electronic Banking Services Using Data Mining[J].Efinancial Innovation,2016,2(1):14-16.

[5]Khalkhali HR.Applying Data Mining Techniques to Extract Hidden Patterns about Breast Cancer Survival in an Iranian Cohort Study[J].Journal of Research in Health Sciences,2016,16(1):31-35.

[6]宋韬,张琦,陈丽秋.数据挖掘及其在税务系统中的应用[J].计算机工程,1997,(S1):92-94.

[7]石冰,郑燕峰.信息检索中的数据挖掘技术[J].情报学报,1999,(S1):108-111.

[8]朱丽萍,林淑英.数据挖掘在生产经营中的应用与实践[J].企业管理,2016,(12):288-289.

[9]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:44-45.

[10]Chen Chaomei.CiteSpaceⅡ:Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature[J].Journal of the American Society for Information Science and Technology,2006,57(3):359-377.

[11]Chen CC.Using Data Mining Technology to Provide a Recommendation Service in the Digital Library[J].Electronic Library,2007,25(6):711-724.

[12]Zeng L.Business Intelligence in Enterprise Computing Environment[J].Information Technology & Management,2012,13(4):297-310.

[13]Liu B.Distributed Data Mining for E-Business[J].Information Technology & Management,2011,12(2):67-79.

[14]Borner K,Chen C,Boyack K.Visualizing Knowledge Domains[J].Annual Review of Information Science and Technology,2003,37:179-255.

[15]Chen C.Visualizing Scientific Paradigms:An Introduction[J].Journal of the American Society for Information Science and Technology,2003,54(5):392-399.

[16]Dahmani D.Improving the Performance of Data Mining by Using Big Data in Cloud Environment[J].Journal of Information & Knowledge Management,2016,15(4):12-19.

[17]Gilbert C.XML Data Mining:Models,Methods,and Applications[J].Australian Library Journal,2013,62(3):252-253.

[18]Schumaker RP.Sports Knowledge Management and Data Mining[J].Annual Review of Information Science and Technology,2010,44(3):115-157.

[19]Ohno-Machado L.Mining Electronic Health Record Data:Finding the Gold Nuggets[J].Journal of the American Medical Informatics Association,2015,22(5):937-937.

[20]Dyas-Correia.Text and Data Mining:Searching for Buried Treasures[J].Serials Review,2014,40(3):210-216.

[21]欒春娟,侯海燕,王贤文.国际科技政策研究热点与前沿的可视化分析[J].科学学研究,2009,27(2):240-243.

(责任编辑:孙国雷)

猜你喜欢

可视化分析知识图谱热点
热点
热点
结合热点做演讲
我国职业教育师资研究热点可视化分析
声波吹灰技术在SCR中的应用研究
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展