APP下载

基于共词分析的知识域可视化研究

2015-07-13刘妮萍宋艳辉

电脑知识与技术 2015年13期
关键词:共词分析

刘妮萍 宋艳辉

摘要:共词分析方法是文献计量学的研究方法,而知识域可视化的一种交叉学科研究。本文尝试将共词分析应用于知识域可视化的研究。该文对知识域以及知识域可视化进行定义,并详细分析了如何以共词分析进行知识域可视化的研究。

关键词:共词分析;知识域可视化;知识域

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)13-0238-02

Abstract: The Co-words Analysis method is the research method of literature metrology, and domain knowledge visualization of a cross-disciplinary study. This article attempts to apply Co-words Analysis to the domain knowledge visualization research. In this paper, the knowledge domain and the domain of knowledge visualization are defined. We analyze in detail how to apply Co-words Analysis to domain knowledge visualization research.

Key words: Co-words Analysis; Domain Knowledge Visualization; Domain Knowledge

随着知识经济在全球范围内的广泛兴起,知识这种可以产生巨大经济效益的无形资产受到前所未有的重视,知识也因此被提升到与物质、能量同等重要的位置。在学术界,与知识密切相关的一系列研究也在悄然兴起,如知识管理、知识经济等。如何从可视化的角度显示知识就是众多研究中的一支重要的研究力量,这是计算机技术与知识表示相结合的一个研究领域,即知识域可视化。我们认为,共词分析方法能够较好的进行知识域可视化。本文尝试以共词分析与知识域可视化结合起来进行研究。

1 知识域可视化概念

知识域通常被理解为知识领域,知识领域可以是一个一级学科、二级学科、三级学科,甚至可以仅仅是一个技术领域。但是,其它学科的学者对知识域有不同的理解。艺术学有人将知识域理解为“教学中传授的全部知识内容,包含两个部分:教学的常设知识部分、信息部分[1]”。经济学领域有人认为知识域是在知识的经济价值转化过程中,不同形态的同质知识与异质知识,由于表现出的不同的价值差异性而重新整合从而形成的一种知识的群聚[2]。我们认为,与可视化结合在一起的所谓的知识域是一般意义上的知识域,即学科知识领域。The International Symposium on Knowledge Domain Visualization(知识域可视化国际学术研讨会)对知识域可视化做出的定义是:使用可视化技术用直觉的方式表示领域知识结构关系及其发展进程的方法;其目的是通过多种可视化思维、可视化发现、可视化探索和可视化分析技术来揭示一个知识域的动态发展,并从中发现模式。

2 基于共词分析的知识域可视化

“共词分析”被认为是由20世纪70年代末法国计量学家Callon提出的[3]。其原理是,统计文献中共同出现的主题词,计算这些主题词在同一篇文献中出现的次数,从而建立主题词之间的共词网络,通过主题词的聚类以及关联效应研究文献之间的依存关系。这实际上已经是从内容层面探析文献之间的内容关系,因此,共词分析被认为是内容分析法的一种。共词分析中的主题词一般都是叙词表中的叙词,但最具有分析意义的应该是论文的关键词,它是论文作者对论文内容进行高度的概括与精确的凝练而形成的。共词分析是发现科学研究各领域之间关系的有效方法,也是追踪人类社会认知网络的结构和变化的一种有力工具。共词分析方法在知识域可视化中的基本步骤可以表述如下:

1)从数据库中提取可以代表该学科研究主题或研究方向叙词(高频关键词或主题词);

2)计算这些叙词在文献中共同出现的次数,即它们的共现次数,形成共词矩阵;

3)矩阵的处理,如对角线值,标准化等问题;

4)选取多元统计、词频法、突变词检测、关联法等方法分析对共词矩阵中叙词关系(如果是知识域的分析,使用较多的可能是聚类方法),揭示叙词所代表的学科的知识结构与发展状况。

5)对研究结果进行可视化展示,并进行详细阐述。

周宁等认为,共词分析分析法有两个主要的应用:①探索知识领域之间的互相关系;②探测次要的但是存在着潜在增长性的知识域[4]。我们认为,战略坐标图就是共词分析方法在知识域可视化上对这2个应用方面的很好体现。战略坐标图是由Law等人提出的[5]。战略坐标图以向心度和密度为参数绘制成的二维坐标图,一般情况下,X轴为向心度(Centrality),Y轴为密度(Density),原点为二者的均值。

向心度(Centrality):测度类团之间的相互作用力。对于某一类团,其对其它类团的联系越紧密,联系越多,该类团在结构图中就会越处于中心位置,其重要性也就不言而喻[6]。我们可以计算各个类团之间的主题词或者关键词的相互链接强度来推算向心度。具体的计算公式是外部链接的总和、平方和的开平方。

密度(Density):不同于向心度计算类团之间的相互作用力,它是计算类团内部的相互作用,即类团内部链接的紧密型。它可以通过计算类团内部主题词或者关键词对在同一篇文献中出现的的次数的定量化数值(如平均值、平方和或者中位数)来获取。

如图1所示的分为四个象限的战略坐标图就是一种较好的表达研究领域的研究发展状况的。

Ⅰ象限:它们的密度高,向心度也较高。密度高说明研究主题内部联系紧密,研究趋向成熟;向心度高,说明这个象限中的研究主题又与其余各研究主题有广泛的联系,即处于研究网络的中心。

Ⅱ象限:此象限的研究主题内部联系紧密,说明结构已相对固定,但与其他研究主题联系不密切,在整个研究网络中处于边缘位置。

Ⅲ象限:此象限的研究主题密度较低、向心度也较低。较低的密度和较低的向心度都说明其研究主题处在整个研究网络的边缘位置,需要向中心区域推进。

Ⅳ象限:此象限的研究主题向心度较高,密度较低。向心度高说明,它跟别的主题还是有一定联系的,研究者们对其有兴趣。但较低的密度又说明该主题内部松散、呈涣散状,尚处于发展初、中期,还需要有进一步提升的空间。

图2为2000-2010年间我国图书馆学知识域的战略坐标图(SPSS绘制)[7]。

3 结语

本文认为共词分析方法是一种比较有效的知识域可视化的表示方法,实际上,知识域可视化还有很多研究方法,如共被引方法、耦合方法、合作方法、共词方法。在今后的研究中,我们会系统地进行这些方法的研究。

参考文献:

[1]焦应奇. 知识域概念和专业知识板块的划分与设计[J]. 美术观察,2001(9):16-20.

[2]高政利, 梁工谦. 价值性差异、知识域结构与知识计量研究[J]. 科学学研究,2009,27(6):881-890.

[3]Callon, M., Courtial, J.P.,Turner W.A.. From translations to problematic networks: An introduction to co-word analysis [J]. Social Science Information Surles Les Sciences Sociales, 1983, 22(2):191-235.

[4]周宁,张李义,等. 信息资源可视化模型与方法[M]. 北京:科学出版社,2008.

[5]Law J., Bauin S., Courtial J.P., etal. Policy and the Mapping of Scientific Changer: A co-word analysis of Research into Environmental Acidification[J]. Scientometrics,1988,14(3-4):251-264.

[6]Callon M.,Laville F.Co-word Analysis as a tool for Describing the Netword for Interactions Between Basic and Technological Research:The Case of Polymer Chemistry[J].Scientometrics,1991,22(1):155-205.

[7]丁敬达. 学术社区知识交流模式研究[D]. 武汉:武汉大学博士学位论文,2011.

猜你喜欢

共词分析
基于德温特数据库的关键共性技术分析
国内图书馆嵌入式服务研究主题分析
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
基于知识图谱的智慧教育研究热点与趋势分析
基于关键词共现聚类的电子商务信用研究热点分析
基于共词分析的近年国内O2O研究主题分析
国内移动用户行为研究热点与前沿
国内MOOC学术研究热点领域构成的共词可视化分析
关键词共词分析法:高等教育研究的新方法
十五年来我国社区教育研究规律和研究热点