基于CiteSpace的集对分析理论研究进展的可视化分析
2021-04-01张佳李茹张梦鑫姜璐瑶黄辉
张佳,李茹,张梦鑫,姜璐瑶,黄辉
(宁波工程学院 材料与化学工程学院/安全工程学院,浙江 宁波315211)
0 引言
集对分析是赵克勤在1989年提出的一种处理系统确定性与不确定性相互作用的数学理论,因其具有全面性、分析方法的综合集成、应用广泛等特点,在学术领域有特殊的应用价值[1]。如今,集对分析作为一种系统数学方法,所涉及的应用范围广泛,主要集中在工程技术(自科)、基础与应用基础研究(自科)、基础研究(社科)等领域。CiteSpace是陈美超在2015年开发的一款引文可视化图谱分析软件,旨在探测学科知识领域的发展及其研究热点、前沿和趋势[2]。
本文利用CiteSpace软件对2015年1月至2020年10月期间涉及集对分析的相关研究文献进行了关键词、作者、机构等方面的可视化分析,绘制了相应的知识图谱,以此分析近年来集对分析的研究热点及其发展状况,以期为该理论方法的后续研究应用提供指导。
1 数据来源
本次研究基于中国知网(CNKI)数据库,在高级检索界面输入主题“集对分析”,文献的资源类型选定为期刊、硕士论文、博士论文、国内会议论文;为保证研究结果的前沿性,将时间节点设定为2015年1月至2020年10月并进行检索;为保证文章的可靠性和严谨性,剔除与主题不相关文献及重复文献,最后得到879篇相关文献。
2 方法
本次研究采用CiteSpace 5.6.R4版本。分别创建input、output、project、data四个文件夹。进入数据库的高级检索界面,将筛选出的879篇文献转化为Refworks格式并导出至input文件夹中。在软件中点击data选项,选择import/export,在input directory一栏中将input文件夹里的数据存入,通过output directory将数据转化为软件自身可识别的数据且保存至output文件夹中并复制其中数据,继而粘贴到data文件夹中。回到软件界面点击new选项,将标题改为文件名,在框中选择相对应的input、project文件夹并保存。最终设置时间范围为2015年1月至2020年10月,在node types中分别选择Keyword,Institution,Author并绘制出相应的可视化知识图谱。
3 结果
3.1 发文量分析
文献刊载量是衡量某一领域研究发展的重要指标之一,其增减变化在一定程度上反映了科学知识量的变化情况以及学者对该研究领域的研究热度[3]。在数据库中对近年来关于集对分析的文献量进行分析,结果如图1所示。从图1可以看出,从2015年至2020年,集对分析每年的文献刊载量在170篇左右,发文量总体上较为平稳。而CiteSpace相关文献近年来已呈高速发展趋势,从2015年的163篇增长到了2019年的1 450篇,截止到2020年的10月就已发表了1 200篇相关文献。
图1 2015-2020年相关文献的刊载量图
3.2 关键词分析
对论文关键词的研究可以总结和评价发表论文的水平和层次、发表的文章是否紧跟学科发展的趋势及是否反映学术界的热点问题[4]。图2为通过CiteSpace软件分析得到的关键词共现网络图谱,图中共有239个节点,723条连线,网络密度为0.025 4。节点大的集对分析法、联系度、联系数、层次分析法等为出现频次高的关键词,表明这些是近年来的研究热点。中介中心性(Betweenness Centrality,缩写为BC)可以发掘和量度文献的重要性,由中心性计算公式计算得到大于0.1的点被称为重要节点,节点越重要代表中介中心性越高[5]。高频关键词及其中心性的分析结果如表1,从中可以看出集对分析法、联系度、联系数等关键词中心性较高,说明上述关键词在文献中占据了重要位置。
这些关键词成为研究热点的原因在于,集对分析的重要研究思路就是建立两个集合在指定背景下同异反联的联系度(表达式为:μ=a+bi+cj,其中i为不确定系数),而联系度是集对分析中的重要概念,它表示集对之间的关联程度,用联系度所刻划的数就称为联系数[6]。综合评价法作为一类评价方法,包括了层次分析法、模糊数学法、人工神经网络法等[7]。单独采用集对分析法无法准确分析出复杂问题的结果,确定不了各权重的指标,且带有一定的主观因素,因此上述方法常用来确定各指标的权重与集对分析法配合使用来分析问题。比如采用熵权法去确定指标权值,可以降低权重计算的主观因素影响,使评价更加客观[8]。
图2 集对分析相关文献的关键词分析图
表1 前10高频关键词
3.3 关键词时区图谱分析
时区图谱可以从时间维度上清楚地展现出文献的更新情况及研究热点随时间的演变关系。关键词随时间的变化情况如图3所示,其中节点在某一时区表示关键词最开始出现的文章所发表的年份,节点之间的连线表示关键词出现在同一文章中。由图3可知,集对分析法、联系度、风险评价等关键节点都在2015年开始出现,且在2015年这一时区中节点数较多,说明此时对集对分析的研究正处于繁荣状态,且以集对分析、集对分析法、风险评价等关键节点为基础的集对分析应用领域也较多。
随着时间的变化,2018年到2020年的时区逐渐演变出了水资源承载力评价、环境影响、医药、安全等新关键词,这表明集对分析逐渐应用发展到了上述领域。
图3 关键词的时区图谱
3.4 突现词分析
突现词是关键词随着时间的变化而变化所产生的,其可以反映出相关研究的变化及其发展趋势[9]。集对分析的突现词图谱(8个突现词)如图4所示,其中“Year”代表数据开始搜集的年份,“Begin”和“End”分别表示开始突现的时间和突现结束时间。由“Strength”突现率可以看出熵值法、评估等关键词在2016年的突现率最高。权重、综合评价、熵值法、评估在2016年或2017年结束突现,转而变成评估方法、不确定性在2017年开始突现,这说明随着时间的变化对集对分析的研究主题也发生了变化。
从图4中还可以看出,云模型、银屑病是其中突现持续时间最长且持续突现至今的关键词(2018至2020年),是集对分析应用研究中持续突现的研究热点。云模型相较于其他指标体系评价方法兼具模糊性和随机性,且比较客观精确,能够较好实现定性与定量之间的转化[10],因此也是集对分析未来发展的重要方向。银屑病的突现是因其治疗为一个动态系统,被治疗的患者处在系统的不同层次上[11],可利用集对分析中联系数的重要概念计算并分析其结果。
图4 突现词图
3.5 作者分析
优质的作者是学术领域高水平文献的供给主体,能提升相关领域的学术影响力,保障相关领域发表文章的质量[12]。图5为通过软件分析得到的作者合作共现图谱,其中节点的大小、连线分别代表了作者的发文量及其之间的合作关系,图中节点数为163个,连线数为262,网络密度为0.015 7。从图5可以看出,发文量较多的作者有赵克勤、金菊良、李欣、李斌等。由普赖斯定律(计算公式:Nmin=0.749其中Nmin为核心作者最低发文量,Nmax为作者最高发文数量)[13]计算可知,发文量大于等于4篇的都属于核心作者,均是推动集对分析相关研究发展的重要力量。表2给出了发文量在8篇以上的作者名单,这与作者合作共现图给出的信息一致。
由图5和表2可以看出,以赵克勤为核心的合作规模最大,这是因为其作为集对分析法的创造者,发表的文献最多,且主要集中在联系数、银屑病、模糊数、人工智能、疗效曲线、同异反网络计划等领域,具有很高的影响力。其余作者间则相对较为零散,少有核心聚集团体,说明缺乏足够的相互交流和沟通。
图5 作者合作共现图
表2 位于前10发文作者与其发文量
3.6 机构分析
机构合作共现图谱如图6所示,其中节点的连线和大小的涵义与作者情况分析中的相同,节点数为211,连线只有111,网络密度为0.005。表3给出了高频发文机构及其发文量。从图6和表3可以看出,发文较多的机构有合肥工业大学土木与水利工程学院、河海大学水文水资源学院、诸暨市联系数学研究所等。集对分析相关文献机构主要集中在高校,医院及研究所等相关机构也有一定的发文量,但机构之间相对缺乏相互合作,不利于整体协同发展。集对分析在环境、水资源、医疗、数学等方面的研究应用相对较多,这与上述领域较为庞大、系统复杂、相关评价指标多有很大的关系,同时集对分析本身作为系统数学方法在数学领域的研究应用较多。
图6 机构合作共现图
表3 前10发文机构与发文量
4 结论
以集对分析为主题,将中国知网数据库中2015年1月至2020年10月的相关文献作为研究对象,利用CiteSpace可视化分析软件绘制了科学知识谱图并进行了分析,得出以下结论:
(1)集对分析的文献刊载量较为平稳,年均发文量在170篇左右。可通过加强与发文作者间的联系,深化不同研究机构间的沟通,促进产学研合作。高校与企业合作,将理论与实践相结合,更易扩大集对分析研究的影响力,使之应用于新的领域。
(2)集对分析的研究热点主要集中在联系度、安全评价、风险评价等方面。采用层次分析法、风险评价及云模型等评价方法作为确定各指标与集对分析结合的权重,做出的结果相对于一般评价方法更为客观精确,将是集对分析后续研究关注的热点评价方法。
(3)集对分析因在庞大的领域系统内能发挥自身特点优势,并能较好地解决复杂问题,在水资源、环境、医药、安全等研究领域都将是相关学者及研究机构关注的重点。