基于CiteSpace的IPv6地址应用研究的可视分析
2018-10-24赵玉婷努尔布力吾守尔·斯拉木
赵玉婷 努尔布力 吾守尔·斯拉木
摘 要: 为了分析近些年来IPv6地址的使用情况,以CiteSpace软件为研究工具,以WOS数据库中的2000—2017年出现的核心期刊数据为研究对象,以频数(Freq)、激增(Burst)指数作为分析指标。该文揭示了IPv6地址研究的演进路径,分析并统计目前IPv6地址的研究成果,预测IPv6发展的新动向,总结IPv6地址的分析结果。
关键词: 数据可视化; IPv6地址; WOS数据库; CiteSpace; 激增指数; 知识图谱
中图分类号: TN919?34 文献标识码: A 文章编号: 1004?373X(2018)20?0001?05
Abstract: Taking the CiteSpace software as the research tool, the core journal data from 2000 to 2017 in the WOS database as the research object, and the frequency and burst index as analysis indicators, the evolution path of the IPv6 address research is revealed, so as to analyze the research on the use of IPv6 addresses in recent years. The current research achievements on IPv6 addresses are analyzed and summed up to predict the new tendency of IPv6 development and summarize the analysis results of IPv6 addresses.
Keywords: data visualization; IPv6 address; WOS database; CiteSpace; burst index; knowledge image spectrum
0 引 言
隨着Internet技术的广泛应用,作为Internet基础的IPv4地址已日渐匮乏。虽然业界出台了多种地址转换技术弥补了IPv4地址的不足,但都没有从根本上改变地址短缺的状况。IPv6技术也就是在这种情况下产生的。传统的IPv4只有32位,而新一代IPv6具有128位,地址空间巨大,完全可以满足未来发展的需要。其中美国、日本及一些欧洲发达国家为应用IPv6地址及研究IPv6地址比较领先的地区。美国占有全球74%的IPv4地址[1],所以之前美国对IPv6地址的研究一直都不够重视。不过近几年,美国也加大了对IPv6地址的研究力度,拥有的IPv6地址数量为全球第一。我国也积极研究IPv6地址,因为我国是需求大国。CERNET2是目前世界规模最大的IPv6主干网,我国的大型科研机构和200所高校都与此相连接。
面对IPv6地址的快速发展及研究,世界上每天都在发生着变化。清楚地了解国内外对此研究的关注度及研究趋势,能对IPv6地址的研究起到一定的指导作用。所以本文使用科学计量的方法,统计分析过去17年间的IPv6地址研究情况,并结合CiteSpace工具,对关键词共现分析,并对地区、机构和研究热点进行分析。
1 数据来源和研究方法
1.1 数据来源
本文选取国外数据库WOS作为文献数据来源,以TS=("IPv6 address*")为检索式进行检索,得到Web of science核心数据库中的1 515篇文献。为了计量的准确性,因会议论文等文献往往没有提及具体研究方法或者确实关键词部分等问题,本文只收集了article和reviews,下载日期[2]为2017年3月16日。
文献计量发展至今,国内外出现了很多文献计量分析的可视化软件,如SPSS,HistCite,CiteSpace等。本文选用美国德雷塞尔大学的陈超美博士研发的CiteSpace文献计量可视化软件,版本号为最新更新的4.0.R5.SE.64?bit。该软件可以用来分析作者、机构或国家的合作网络,主题、关键词的共现,以及共被引,文献耦合等。由于WOS的文献下载数据格式为全数据格式,而且还包含了共被引分析及文献耦合分析,所以能很好地分析其结果。
1.2 研究方法说明
通过大量文献计量相关文献的调研发现,目前为止许多文献计量方面的研究都仅仅使用的是一种计量指标,比如频次、中介中心性等[3]。这势必会存在一定的弊端,导致计量结果不准确。在本文的研究工作中,通过单一计量指标的结合,达到更好的文献计量分析效果。在做文献内容分析时,最常用的是频数统计,其也是计量指标之一。而通过对文献计量指标的调研可以明确某个研究领域的发展趋势,通过论文主要关键词及频次、学科共有关键词的分析,可以得到该学科的活跃研究领域及预测该学科与其他学科交叉发展方向。针对本文选用的工具CiteSpace ,通过对NodeTypes不同组合的选取来分析不同的问题。而且把CiteSpace具有的频数(Freq)、激增(Burst)指数的分析功能相结合可以得到更好的计量结果[4]。
本文为了研究的准确性,确定每一年作为一个时间切片,并在图谱分析过程中,使用了最小生成树(Minimum Spanning Tree)算法简化网络[5]。简化网络的作用在于控制网络中出现的连线密度,减少连线交叉,以提高图谱的清晰度[6]。研究方法流程如图1所示。
2 IPv6地址的研究进展分析
2.1 时间分布统计
分析1 515篇WOS文献,根据图2可知, IPv6地址研究的相关文献在2000年以后开始漫长的缓慢增长。一直到2006年才开始有大的起色,2015年出现峰值,将近140篇。随后IPv6地址的研究出现下滑的趋势,截止数据下载时,2017年的发文量也仍在降低,预计发文量会持续降低。
2.2 作者网络分析
两名作者一起出现在同一篇论文中,说明这两位作者之间存在合作关系,且共同出现的频次越高,他们的关联程度就越大。在分析的过程中将Node Type选择为Author。首先对这些学者在该段时间内发文的突发性进行检测如图3所示。有突发性变化的作者有Hwang CS,Azcorra A(2007年以后论文量逐渐减少);Bi J等人的研究持续性不强;Wang XN,Cheng HB,Li FL,Le DG等人虽是近几年才开始研究,但是研究一直持续到现在。
2.3 关键词共现网络分析及聚类分析
1) 频数(Freq)。频数指当前分析的某个节点出现的次数,通过分析可以得到某个领域的研究现状。共现分析是将这些文献中的共现信息定量化的分析方法,以揭示信息的内容关联和特征项所隐含的寓意。文献计量研究中,共同出现的特征项之间肯定会存在关联性,关联的程度可以用共现频数来决定[7]。
对WOS核心数据库的数据进行分析时,在对关键词的分析过程中,得到IPv6地址关键词共现网络聚类分析的结果如图4所示。由图4可知,国际研究频数较高的关键词有“IPv6”“security”“mobile IPv6”“ad hoc network”“network”“6 lowpan”等。图中显示的多层彩色同心圆(黑白图中表现出深浅差异)表示的是关键词的出现早晚,大小表示的是该关键词的出现频数。同心圆中心出现暖色的圆环,即引用年代较近,冷色的圆环代表该关键词引用年代较远,如将“security”“6 lowpan”做对比,可发现,“security”的暖色部分大于可视化,说明“security”在早些年就被引用来作关键词,而“6 lowpan”则在近几年被引用的多些。
2) 激增(Burst)指数。由于上文提到的频数描绘的是主题词的增长势头,而激增指数的关注点是单个主题的自身发展变化过程,可以很容易地展示热点主题的凸显性和关键技术的识别[8]。因而,对中外关键词网络进行突发性检测,将突发性检测的参数值统一设置为2.0,minimum duration取2,运算得18个突发词如图5所示。
从图5中可以看出,“mobile IP”是最早出现突发性并且延续时间很长的关键技术。2000年以后IPv6地址的突发性渐渐出现在“mobile computing”“address lookup”“mobile IPv6”“mobility”等。2010年以后,“dual stack”“6 lowpan”“wireless sensor network”“IPv6 address”“openflow”等逐渐突发。在IPv6发展过程中,目前的IPv6地址分为mobile IPv6和6 lowpan,这一点从图5所示的节点频次就可以发现。随着互联网的发展,IPv4已经完全满足不了需求,因此包含128位的IPv6地址应运而生,来解决此需要。
2.4 期刊共引分析
設置合适的节点类型,选择cited journal(即期刊共被引)来分析2000—2017年间所有的论文都主要属于哪些核心期刊,这样能很快地定位想找的论文,具有一定的现实意义。分析的结果如图6所示。
从图6可以看出,IEEE J SEL AREA COMM的节点最大,它的被引频次也是最高的,达到了194频次,中心性为0.16。其次是IEEE COMMUN MAG和IEEE ACM T NETWORK节点,但有所不同的是期刊IEEE COMMUN MAG相比于IEEE J SEL AREA COMM期刊,它的中心性更大,所以它的重要性更大。通过简单分析频次排名最大的两个期刊,可以发现频次高的中心性并不是相应的高,所以判断期刊的重要性时,不能仅仅只看引用频次的高低,还需要更多地关注别的参数,比如中介中心性。
3 IPv6地址研究的演进分析
3.1 前沿演进分析
时区视图是从时间的角度来展示前沿知识演进的视图。本文将Node Types选择为keywords,将Term Type 选择为Burst Terms,然后选择Detect Bursts,对文章的关键词进行突发性检测,从而能够清晰地展示目前学科的发展脉络和趋势[9]。
关键词的时区分析如图7所示,每个圆代表了不同的节点。由于关键词首次被引用的时间不同,所在的位置沿着时间坐标轴相应地被展示在不同的时区中。节点的大小代表被引用的次数。节点越大,相应地引用的频率越高,关键词的重要性也越大。而且各个节点之间连线的数量也不同。连线的数量越多,代表此节点和别的节点的联系也越紧密,两者之间的传承关系较强[10]。
由图7可以看出:
1) 从future Internet,bluetooth,IPv6 transition,cloud computing等节点的颜色可以看出这些词是近两年新出现的词,是新的研究热点,是IPv6地址研究的重要前沿领域。
2) 还有一些突变频率偏高的词,如IPv6,mobile IPv6,ad hoc network,mobility management,这些也说明了此研究领域的研究重点。
3) 由wireless sensor network,auto?configuration,wireless network,cloud computing 这些词可以看出,目前关于IPv6地址的研究与目前的云计算,无线传感网络,IPv6的自动配置联系紧密。由于现在物联网发展良好,所以预测未来几年的方向将对物联网方面有所帮助。
3.2 演进路径分析
演进路径分析主要侧重于关于IPv6地址研究的文献聚类之间的关系和聚类中文献的历史跨度。通过演进路径分析,可以很直白地看出关于IPv6地址研究进化史。将Node Types选择为Cited Reference,Purning选择为Pathfinder和Puring sliced networks,Visualization选择Cluster view和Show Merged Network,其他参数选择默认参数不变,以不同聚类节点作为纵坐标,以不同的时间范围作为横坐标,运行结果如图8所示。
同一聚类的节点被排放在同一水平线上,所以每个节点就像是用一个时间串串在一起,来展现聚类的历史成果。通过视图分析,可以得到:
1) 在2000年就出现了聚类,属于#5 enhanced handover scheme,相应地也有了第一篇参考文献:NORDMARK E,1998,2461 RFC,V,P。
2) 通过视图可以很明显地看到在2004年,#1 vehicular wireless network和#5 enhanced handover scheme聚类的文献明显增多,成果也增多。
3) 在2015年度和2016年度所有的聚类都在减少,关注度降低。
4) 在整个聚类的发展过程中,在2004年出现了一篇被引用次数超高的文章,文章名为RFC 3775。其无论是在第1聚类和第5聚类中都有很大的影响,由此可见,此文献有很大的研究价值。
引用频率高的文献都有一定的研究的价值。引用频率最高的RFC 3775主要介绍了在IPv6互联网上移动,节点仍为其保留的一种协议。每个移动节点总是通过其家庭地址来识别。在远离家的位置中,移动节点与提供有关移动节点当前位置的转交地址相关联。IPv6地址寻址到移动节点的家庭地址是通过透明的路由到其转交地址,然后发送去移动节点的任何数据包都直接在这个转交地址。
为了支持这个操作,移动IPv6定义了新的IPv6协议和新的目的地选项,无论节点是移动还是固定,所有IPv6节点都可以与移动节点进行通信。
1998年E. Nordmark发表的Neighbor Discovery for IP Version 6 (IPv6)论文规定了IPv6的邻居发现协议。同一链路上的IPv6节点使用邻居发现彼此的存在,确定彼此的链接层地址,来查找关于到达活跃邻居的路由器和维护可达性信息。
2008年 Gundavelli, Ed.的Proxy Mobile IPv6论文主要讲述了基于网络的移动管理机制能够实现主机IP的移动性而不需要其参与任何与移动相关的信令。网络代替主句负责管理IP的移动性。网络中的移动实体会跟踪主机的移动并且启动必需的移动信令。此规范描述了基于网络的移动管理协议,被称之为代理移动IPv6协议。
关于IPv6地址的生成,在RFC 7707 Network Reconnaissance in IPv6 Networks中,提出了人工配置地址的方法,有三种模式分别是低字节模式,IPv4嵌入的IPv6地址,嵌入服务接口的模式。对于本文还提出了适用IPv6地址的扫描方法。因为IPv6提供比IPv4更大的地址空间,IPv6地址前缀能容纳大约1.844×1019个主机,从而造就更低的数量主机密度。人们普遍认为对IPv6网络执行地址扫描攻击需要付出巨大的努力,所以这篇文章给了很好的解释,提供了更好的工具和方法。
4 结 语
本文通过CiteSpace软件分析Web of science数据库中2000—2017年的核心期刊数据,分析结果为:
1) IPv6地址研究领域中的主要期刊时间分布及研究机构合作关系,有利于为研究IPv6的初学者,以及IPv6地址研究领域合作发展提供参考。
2) 關键词共现网络分析可以了解目前IPv6地址的发展现状,尤其激增指数,更是突出了目前最火热的研究热点,这对现阶段关于IPv6地址的研究都有一定的重要意义。
3) IPv6地址的研究,目前在向物联网等方面深入,使这一技术能被人们生活所利用。
4) 通过频次分析,在IPv6地址研究方面的热点有IPv6,Mobile IPv6,6 lowpan,network,security,ad hoc network,protocol等。
5) 通过爆发词的排名可以得到研究前沿,具体的是Mobile IPv6,Mobile computing,lookup,anycast,wireless sensor network,ad hoc network。
虽然本文基本上对截止目前的所有关于IPv6地址的论文进行分析和可视化展示,但是还是有些地方做得不够完善,而且在此只是对国际上的核心期刊做了分析,下一步的研究将进一步分析国内IPv6的发展进程,并与国外的做一个全面的分析和对比。
参考文献
[1] 李卫娜.IPv6节点地址的分配模式研究与管理实现[D].北京:北京交通大学,2011.
LI Weina. Research and management implementation of IPv6 node address assignment mode [D]. Beijing: Beijing Jiaotong University, 2011.
[2] 黄研.基于CiteSpace的陕南移民研究数据可视化计算分析与应用[J].现代电子技术,2016,39(18):123?126.
HUANG Yan. CiteSpace?based visualization analysis of Southern Shaanxi immigration date and its application [J]. Modern electronics technique, 2016, 39(18): 123?126.
[3] 傅柱,王曰芬,陳必坤.国内外知识流研究热点:基于词频的统计分析[J].图书馆学研究,2016(14):2?12.
FU Zhu, WANG Yuefen, CHEN Bikun. Research hotspot of knowledge flow at home and abroad: statistical analysis based on word frequency [J]. Researches on library science, 2016(14): 2?12.
[4] 储节旺,钱倩.基于词频分析的近10年知识管理的研究热点及研究方法[J].情报科学,2014,32(10):156?160.
CHU Jiewang, QIAN Qian. Analysis of research focus and research methods in the field of knowledge management during the past decade [J]. Information Science, 2014, 32(10): 156?160.
[5] CHEN C. CiteSpace II: detecting and visualizing emerging trends and transient patterns in scientific literature [J]. Journal of the American Society for Information Science & Technology, 2014, 57(3): 359?377.
[6] 赵建保.CiteSpace可视化流程与分析范式研究[J].知识经济,2014(16):105?107.
ZHAO Jianbao. Research on CiteSpace visualization flow and analysis paradigm [J]. Knowledge economy, 2014(16): 105?107.
[7] 王颖纯,岳磊,康在龙,等.基于词频统计分析方法的SaaS国内研究热点分析[J].情报杂志,2012,31(7):44?48.
WANG Yingchun, YUE Lei, KANG Zailong, et al. Research of hotspot of SaaS theory based on word frequency statistics analysis [J]. Journal of intelligence, 2012, 31(7): 44?48.
[8] 曹洁.基于CiteSpace的计算机网络领域可视化分析[J].电脑知识与技术,2015,11(32):156?158.
CAO Jie. Analysis of computer network based on CiteSpace [J]. Computer knowledge and technology, 2015, 11(32): 156?158.
[9] 吴彬彬,王京,宋海涛.基于CiteSpace的复杂网络可视化研究图谱[J].计算机系统应用,2014,23(2):7?16.
WU Binbin, WANG Jing, SONG Haitao. Knowledge maps of complex network visualization based on CiteSpace [J]. Computer systems & applications, 2014, 23(2): 7?16.
[10] 许鑫,冯诗惠.互联网金融领域研究热点与前沿探讨:基于CiteSpace的分析[J].华东师范大学学报(哲学社会科学版),2015,47(2):133?139.
XU Xin, FENG Shihui. Research hotspot and frontier research in Internet finance field: analysis based on CiteSpace [J]. Journal of East China Normal University (Humanities and Social Sciences), 2015, 47(2): 133?139.