基于科学知识图谱的应急救援研究可视化分析
2020-08-03夏正洪
邓 伟, 夏正洪
(1.中国民用航空飞行学院发展规划处, 广汉 618307;2.中国民用航空飞行学院空中交通管理学院,广汉 618307)
应急救援是指针对突发事件采取预防、响应和恢复的活动和计划,根据事件类型可分为卫生应急、交通应急、消防应急、地震应急、厂矿应急等。目前,中国应急救援研究成果多集中在应急救援体系[1]、应急救援预案[2]、应急救援虚拟演练[3]、救援物资转运和路径优化[4]等。但是,这些研究在一定程度上为应急救援提供了思路和方法,但是面对越来越难以预测与控制的应急救援安全形势,单一知识点的微观聚焦研究方法显得太过单薄,亟需对该领域研究现状整体格局的宏观可视化分析。
科学知识图谱是用于显示科学知识发展进程和结构关系的图形,既是具有时间序列化的知识谱系,又是可视化的知识图形;可对知识或研究群体所构成的复杂网络进行聚类分析,将海量数据以图形、图像等可视化集中表现形式,挖掘数据之间的潜在关联,实现数据可视化信息处理,以协助人们做出科学合理的决策[5]。科学知识图谱分析技术在大数据时代背景下发展迅速[6],目前被广泛应用于管理科学[7]、安全科学[8]、科技管理[9]等领域。
基于科学知识图谱可视化软件CiteSpace V[10],以中国知网CNKI上的核心期刊为数据源,检索应急救援领域近20年(2000—2019年)所载论文,分析研究成果产出时序、研究力量分布、关键词及文献共引、突变词分析;通过科学知识图谱的可视化分析呈现应急救援研究领域的知识结构、规律和分布情况,实现对应急救援领域研究动态的总体把握。
1 应急救援研究成果可视化分析
1.1 数据来源及方法
2020年1月10日,以“主题=应急救援”在CNKI上检索最近20年(2000—2019年)的文献,共得到12 826条数据;根据布拉德福定律可知,少数核心期刊集中了该研究领域的大量重要文献,于是在高级检索中将期刊来源类别同时勾选“EI源期刊、核心期刊、CSSCI、CSCD”,检索条件:精确,得到文献1 715篇,再经过筛选去除不相关的声明、通知公告等,可得该领域的有效文献1 693篇。
将检索结果导出为Refworks文本文件,导入CiteSpace V中进行格式转换,“Time Slicing”选择2000—2019,“Years Per Slice”设置1年为一个时间分区,“TOP N Per Slice”选择阈值50,即每个时区选择高频出现的前50个节点,采用网络裁剪运算策略,绘制作者、机构合作网络知识图谱,有效地完成应急救援领域科学研究进行可视化分析。
1.2 论文产出时间图谱
论文产出是衡量研究领域已有知识的累积量以及成熟程度的重要指标,将应急救援研究近20年(2000—2019年)的核心期刊论文进行时间图谱分析如图1所示:应急救援领域研究论文产出曲线基本符合科学文献的指数增长规律——普赖斯逻辑增长曲线。2000—2003年,中国应急救援研究还处于初级阶段,论文年平均不超过10篇,是普赖斯曲线缓慢增长的初级阶段;2004—2007年,中国应急救援研究论文呈现线性增长趋势;2008—2011年,该领域研究论文呈指数型增长趋势,并于2011年达到了峰值153篇,该年研究成果占比总研究成果的9.05%;2012—2019年,该领域论文年均发文量基本稳定在133篇左右,标志着中国应急救援研究已经成熟。
图1 2000—2019年应急救援研究论文产出时间图谱Fig.1 Sequential maps of research papers of emergency rescue during 2000—2019
将刊载应急救援领域研究论文的北大核心期刊按其刊载量进行降序排列,前十位分别是《中国安全生产科学技术》(223篇)、《中国安全科学学报》(137篇)、《消防科学与技术》(134篇)、《煤矿安全》(58篇)、《灾害学》(42篇)、《工业安全与环保》(37篇)、《中国煤炭》(33篇)、《矿业安全与环保》(30篇)、《工矿自动化》(29篇)、《煤炭技术》(28篇)。由此可见,该领域最核心区期刊所刊载的文献数量约为总数的1/2,即中国应急救援领域已形成集中稳定的核心发文期刊群:《中国安全生产科学技术》《中国安全科学学报》和《消防科学与技术》。其中,《消防科学与技术》为北大核心,《中国安全生产科学技术》《中国安全科学学报》为北大核心和CSCD核心检索;可见核心期刊群所发表的文章能代表该领域的热点,是该领域后续学者的重要参考期刊源。进一步地对核心期刊群进行时序统计分析如图2所示。
图2 应急救援领域核心期刊群时序分析图Fig.2 Sequential maps of core periodicals in the emergency rescue
可见,中国应急救援研究成果最高产和次高产年度2011年、2016年,分别产出51篇和45篇论文。《中国安全生产科学与技术》年均发文量约为12篇,且在2011年论文产出高达28篇,是该领域发文量最多的刊物。根据2019年CNKI统计的数据显示:《中国安全生产科学与技术》的复合影响因子和综合影响因子分别为1.407和0.962,《中国安全科学学报》的复合影响因子和综合影响因子分别为1.770和1.294,《消防科学与技术》的复合影响因子和综合影响因子分别为0.744和0.504。因此,综合发文量和影响因子可知,《中国安全生产科学与技术》是中国应急救援领域最权威的核心期刊。
1.3 学科分布
通过对应急救援领域近20年的研究论文分析,提取研究成果的学科分类如表1所示。其中,安全科学与灾害防治方向应急救援研究成果最突出(717篇),占总研究成果的42.53%;其次是矿业工程方向(369篇),占总研究成果的21.79%;行政学及国家行政管理方向发文207篇(占比12.22%);地质学方向发文量为157篇(9.27%);公路与水路运输方向发文量126篇(占比7.44%)。进一步分析研究论文的基金来源:约有18.91%的论文受国家自然科学基金资助,8.18%的论文受国家支撑计划支持,4.43%的论文受国家社会科学基金的资助;应急救援研究领域所涉工程技术、基础与应用基础研究以及政策和行业规范等层次。
表1 应急救援研究成果学科分布
2 应急救援研究合作图谱分析
2.1 作者合作图谱
图3 应急救援研究论文作者合作网络Fig.3 Author cooperation network of emergency rescue research papers
作者合作网络节点间的连线越粗表示作者间的合作次数越多,网络密度为0.007 6,说明作者之间的合作关系网络整体较为松散,即应急救援领域没有形成联系紧密的合作网络。但是,以来自同一院校师生之间的局部合作网络较多,如北京科技大学的蒋仲安、邓云峰、盖文妹、李竞、杜焱等组成的最大子网络如图4所示。该网络中的学者在应急救援领域的平均发文量约4篇,合作网络连接多达28条,连接线越粗则表示学者间合作次数越多;节点间的连线也呈现不同的颜色,分别对应作者合作的时间分区,其中冷色调和暖色调表示时间由远到近。通过发挥团队集体优势,承载应急救援知识的延续性,提高在该领域的科研产出效率。
图4 应急救援研究论文作者合作最大子网络Fig.4 The largest author cooperation sub-network of emergency rescue research papers
2.2 机构合作图谱
机构合作图谱分析可以揭示某研究领域的主要科研力量分布及其之间的合作关系,挖掘出该领域具有较大影响力的科研机构,为学术交流提供参考。笔者通过分析应急救援研究论文的机构合作网络如图5所示,近20年机构合作网络节点数162,合作关系数69,网络密度为0.005 3。网络节点的大小反映其发文量的多少,节点由不同颜色的年轮构成,每个年轮对应不同的时间分区,该时区内产出越多则其年轮越厚。该领域论文发表量排名前五的机构包括中国安全生产科学学研究院(35篇)、中国人民武警部队学院(34篇)、中国矿业大学(26篇)、中国煤炭科工集团(21篇)、北京科技大学(18篇),以上及机构在应急救援领域的研究比较活跃。网络中节点与节点之间的连线表示机构之间合作关系,连接线越粗表示机构之间的合作产出越高,连线颜色越鲜艳表明机构合作时间越近。
图5 应急救援研究论文机构合作网络Fig.5 Institution cooperation network of emergency rescue research papers
2.3 关键词共现图谱
关键词是对所述文章思想和观点的高度概括,通过对关键词的共现分析可挖掘该领域研究内容的内在联系和微观结构。近20年应急救援领域1 693篇核心期刊论文的关键词共有3 873个,通过统计分析得到该领域前10个高频关键词及其频次分别为:应急救援(522次),应急管理(129次)、突发事件(63次)、应急预案(58次)、煤矿(47次)、消防(39次)、GIS(35次)、安全生产(32次)、地震(27次)、重大危险源(25次)、应急能力(23次)。将该数据导入CiteSpace V 中进行关键词共现知识图谱如图6所示,threshold=10。其中,图谱共生产节点343个,982条连线,网络密度为0.016 7。知识图谱中节点字体及其黄色方框区域的大小代表该节点的重要程度,字体越大、黄色区域面积越大则表示该关键词出现的次数越多,重要性等级越高,越有可能成为网络的核心节点;连接线上的数字表示共现次数,表示关键词之间的关联程度大小。CiteSpace软件中提供了一个可量化某一节点在连接其他节点中的重要程度的指标——中心度,若某节点的中心度大于等于0.1,说明该节点处于核心位置或对信息的流动起到控制作用。从图谱中可知,关键词中应急救援(0.95)、应急管理(0.33)、突发事件(0.11)等节点在图谱中发挥了重要的枢纽媒介作用。综合关键词频次及其中心度,以上节点可视为共现网络的关键节点,反映了应急救援领域的核心研究主题。
图6 应急救援研究关键词共现分析Fig.6 Keyword co-citation of emergency rescue research key words
2.4 应急救援文献共引分析
通过对应急救援领域文献共引分析可知,表2中的成果是排名前5位的高被引文献,其被引次数平均约为178次,平均下载次数3 364次,说明其学术水平较高,有较高的参考价值。高被引文献研究内容涉及应急救援物资转运、救援手段、救援技术和救援管理
表2 应急救援文献共引分析
平台等,期刊来源均为公认度较高的核心期刊。其中,陈志宗在2006年发表于《管理科学》上题名为《重大突发事件应急救援设施选址的多目标决策模型》的研究成果,其被引次数高达231次,在高被引文献TOP5中占比25.94%,且下载次数高达3 744次,所构建的应急救援设施选址是现代应急救援研究的基础,是后续学者的重要参考来源。
2.5 关键词突变分析
科学知识图谱能够显示知识的演化和衍生关系,可通过关键词频增长率显著变化和突变词检测来明确新研究主题或研究热点;而CiteSpace V 不仅能够实现对高频节点和聚类的解读,也能通过“突变词语”的突变检测来实现对学科研究前沿的探测。通过对应急救援研究领域近20年的1 693篇文献进行突变词提取分析,其结果如表3所示。突变词“重大危险源”的突变强度最大,达到5.161 1,其突变时间段为2006—2009年,说明该时间段学者们集中关注“突发危险事件”和“重大危险源”[11]影响下的应急救援;之后逐渐开始开发基于地理信息系统(geographic information system,GIS)的应急救援平台和管理系统[12];2010—2014年期间,研究方向逐渐转换为应急救援路线[13]、物资分配模型[14]的优化问题上,因此“优化模型”[15]和“矿山事故”[16]突变和使用频次显著增加;2013—2017年,“地震应急”[17]相关的应急救援成为研究者们青睐的新主题和热点,“地震应急救援”突变强度达到3.305 9;2017—2019年,研究热点又演变为应急救援相关的“多目标优化”[15]和 “应急救援物资”[18]方向。
表3 应急救援研究关键词突变分析Table 3 Keywords burst analysis of emergency rescue research
3 结论
以CNKI近20年收录的主题为“应急救援”的核心期刊论文为数据源,借助CiteSpace V 对其研究成果、学者、机构、关键词共引、文献共引、突变词等进行可视化分析。
(1)中国应急救援研究论文产出符合普赖斯逻辑增长曲线,且安全科学与灾害防治学科方向论文产出最高,研究成果主要刊载在《中国安全生产科学技术》《中国安全科学学报》和《消防科学与技术》上;综合发文量和期刊的影响因子可知,《中国安全生产科学技术》是中国应急救援领域最权威的核心期刊。
(2)作者以郭其云、夏一雪、郭德勇等为核心,机构集中于中国安全生产科学学研究院、中国人民武警部队学院和中国矿业大学,且作者合作和机构合作关系网络均较为松散。
(3)应急救援、应急管理和突发事件等是该领域的核心关键词,突变词“多目标优化”和“应急物资”代表当前应急救援研究的热点和前沿。