Bibexcel在关键词共词矩阵构建中的应用
2019-11-12胡雅张露
胡雅 张露
摘要:Bibexcel软件是重要的文献计量分析工具,本文从Bibexcel软件在关键词共词矩阵构建中产生的文件类型及操作步骤两个方面介绍了如何分析某一领域中关键词及关键词共词矩阵构建的方法,以期指导科研工作者了解某一领域的学科主题。
关键词:Bibexcel;关键词;共词矩阵
中图分类号:TP393 文献标识码:A
文章编号:1009-3044(2019)25-0257-01
共词分析法主要用来统计一对词同时出现在同一篇文献中的次数,用于反映词组之间的关联程度。利用共词分析法分析某一关键词在某一领域中出现的频次高低,经聚类分析后揭示该领域主题结构[1,2]。BibExcel文献分析软件能够处理集成在ISI Web of Knowledge数据库上的数据[3],对数据库中的作者、关键词、引文做频次分析和频次排序,产生的作者、关键词、引文的共现矩阵,具有强大的知识单元共现分析能力[4]。本文简单介绍了Bibexcel软件在关键词共词矩阵构建中产生的文件类型及操作步骤,以期为科研工作者提供主题结构分析的方法。
1 Bibexcel在关键词共词矩阵构建中产生的文件类型
利用Bibexcel文献信息统计分析软件进行关键词的抽取、共词矩阵构建以及相异矩阵的转换过程中文件类型如表1所示。
2 Bibexcel在关键词共词矩阵构建中需要的分析步骤
2.1 题录导出
通过Web of Science数据库的题录信息导出功能,对所有文献信息进行标记,将所有文献记录以Txt格式导出包括标题、作者、摘要、关键词的文献题录信息,每500条记录分成一批进行下载,保留首批数据开头符“FN Clarivate Analytics Web of ScienceVR 1.0”和结束符“EF”,删除其余批次开头符合结束符,将所有批次的txt整合至同一纯文本中。
2.2关键词显示
选中Keywords.doc文件,点击View file按钮,The list窗口就会显示这个文件的内容。在Old Tag中填写关键词对应的标签代号DE,在Select field to beanalysed下拉列表框中选择“Any; Separated field”,然后点击Prep按钮,在弹出的对话框中点击“确定”,生成后缀名为Keywords.out文件。在The List窗口显示每一个关键词出现的频次以及关键词名称。
2.3关键词频次降序排列
选中Keywords.out,在Frequency distribution下拉列表框中选择Whole string,在下面的复选框中选择“Sorted descending”,点击Start按钮,在弹出的窗口中,点击“确定”,生成后缀名为 Keywords.cit文件。The List窗口显示按照出现频次由高到低依次排列的关键词。
2.4产生关键词共词次数
选中Keywords.out文件,在Frequency distribution下面的复选框中选择“Remove dup licate”和“make new out-file”,点击Start按钮,在弹出的窗口中,点击“确定”,生成后缀名为Keywords.oux文件。然后选中Keywords.cit文件,点击“view file”,在The List显示窗口中选择频次大于等于2的前50个关键词作为分析对象,然后点击“Analyze→Co-occurrence→Select unitsvialistbox”,选中Keywords.oux文件,点击“Analyze→Co-occurrence→Make pairs via listbox”,在弹出的窗口中点击“否”,再弹出的窗口选择确定,此时生成Keywords.coc文件。
2.5产生关键词共词矩阵
选中Keywords.Coc文件,在Analyze下面选择“List Units in pairs”,点击确定,产生Keywords.ccc文件。选中Keywords.ccc文件,在Analyze下面选择“Make a matrix for MDS etc”,点击“确定”,若仅需要产生下三角矩阵,则在“Do you wish to make a lower left matrix”对话框中选擇“是”,若需要产生全矩阵,则选择“否”。点击“确定”,产生表示关键词共现的下三角矩阵或者全矩阵Keywords.ma2。
2.6可视化分析
将Keywords.ma2文件中的矩阵复制粘贴至excel文件中,把excel文件导入Ucinet软件,利用Ucinet做可视化知识图谱分析。
参考文献:
[1] 赵丽梅, 张花. 我国大数据时代数字图书馆研究前沿分析——基于共词分析的视角[J]. 情报科学, 2019, 37(03):99-106.
[2] 傅柱, 王曰芬, 陈必坤. 国内外知识流研究热点:基于词频的统计分析[J]. 图书馆学研究, 2016(14):2-12.
[3] 刘齐平. Bibexcel在文献计量分析中的应用例说[J]. 湖北第二师范学院学报, 2011(8):83-84.
[4] 姜春林, 陈玉光. CSSCI数据导入Bibexcel实现共现矩阵的方法及实证研究[J]. 图书馆杂志, 2010(4):58-63.
【通联编辑:光文玲】