基于关键词词频分析的情报学研究热点解析
2016-11-02孙悦淇
田 恬 孙悦淇
基于关键词词频分析的情报学研究热点解析
田 恬 孙悦淇
本文以《情报理论与实践》为数据源,运用文献计量学的关键词分析方法,对2010-2015年该刊的关键词进行统计,从关键词数量分析,关键词词频分析,核心关键词分析描述该刊载文学者学术研究现状,进而揭示图书馆学情报学的研究热点和发展趋势。
情报学 关键词 词频分析 研究热点
一、前言
《情报理论与实践》是我国情报学领域的核心期刊,是情报理论与实践工作前沿性指导性学术期刊。它全面、系统、及时、准确报道国内外图书馆学情报学与信息技术发展动态,在国内外享有较高声誉且具有广泛影响。关键词分析作为文献计量的一个重要方法,本文针对《情报理论与实践》2010~2016的有效载文关键词进行词频分析和共词分析,试总结出图书馆学情报学领域近七年来的研究热点和趋势[1]。
二、情报学与关键词分析
(一)图书馆学情报学
情报学的发展具有一百多年的历史,通常情况下认为情报学与图书馆学、文献学以及信息系统学的研究都有着密切的关系[2]。因此情报学研究内容涉及“数据库知识发现”研究、语义网研究、3G(Great Global Grid)研究、信息构建、知识管理研究、数字图书馆研究、信息技术应用、小世界现象研究等前沿领域[3]。将情报看作是一种知识,中国的情报研究基于美国范式、欧洲范式、苏联范式进行综合集成,并创造了以科技情报研究为特色的情报学,后拓展到对其他领域的情报研究[2]。
(二)关键词分析
关键词是表达文献主题概念的自然语言词汇,他们能够反映研究成果的核心内容。通过对一个期刊一段时期内关键词变化的分析,可以全面把握该刊在此时间段内载文的研究热点集中情况,而对某一领域顶级核心期刊的关键词分析则能折射出该学科发展的动态过程,反映科研的研究热点和发展动向[1]。
三、数据采集与分析
本项研究以中文社会科学引文索引(cSScI)和中国知网作为数据来源,从cSScI中按条件检索2010-2015年所有发表在《情报理论与实践》,文献类型为论文的记录共1946条。接着在cNKI上通过期刊名称检索取得2016年1月至今发表在《情报理论与实践》杂志上的所有论文,并排除篇名中包含“情报理论与实践”,“投稿”,“征稿”等与关键词分析无关的文献记录共195条,以包含关键词信息的Refworks格式导出。
下载好包含关键词的文献记录之后,利用Python代码编写程序自动对记录中的关键词进行提取,并对一行关键词记录进行分词保存到eхcel中;同时利用Python对关键词词频进行逐年统计,分别保存到eхcel中。
四、结果与分析
(一)关键词数量分析
《情报理论与实践》2010-2015年刊载论文cSScI检索共1946篇,所有论文有标引有关键词,共标引关键词4918个,平均每篇文章标引关键词2-3个。截止至2016年 7月该刊当年载文cNKI检索共195篇,共标引关键词592个,其中86.67%文献文标注有关键词,平均每篇关键词约3个。单从篇平均标引关键词来看,其数量是在上升的,说明越来越多的作者规范自己的写作格式,并有意识通过关键字的提炼来概括文章信息。需要说明的是cSScI与cNKI不同的数据来源出现统计差异,不仅说明了cSScI与cNKI收录文献质量的标准不同,也说明了关键词是高质量的文章的衡量标准之一,同时也说明不同文献类型对关键词的要求不同,论文属于对关键词要求较高的文献类型[4]。
表1 2010-2016年《情报理论与实践》论文关键词统计情况
(二)关键词词频分析
在本次研究中,通过词频分析法,即利用能够揭示或表达文献核心内容的关键词在《情报理论与实践》刊载论文上出现的频次高低来确定图书馆学情报学研究热点和发展动向。关键词不仅可以通过词频高低反映出图书馆学情报学领域的研究热点问题和主要研究方向,其分布特征还可以分析出当前研究领域的集散程度[5]。
通过人工观察,将该刊上关键词出现的词频分为三个等级,低频区:词频(0-5);中频区:词频(6-14);高频区:词频(15及以上)[5]。在此基础上,利用eхcel对2010-2015年该刊载文关键词在不同词频区间的数量关系。由下表可以看出,该刊关键词词频分布呈现出严重的偏态分布,这也说明在图书馆学情报学领域研究方向广泛,在传统图书馆学情报学研究方向的基础上,学者有多种研究方向可选。从侧面上也说明《情报理论与实践》载文内容发散性强,不局限与某一专题。
表2 2010-2015年关键词词频分布表
2011年781 17 6 2012年811 19 4 2013年795 15 3 2014年857 14 3 2015年790 6 0
(三)核心关键词分析
高频关键词数量少,但出现频率都极高,反映着《情报理论与实践》载文的研究热点集中情况。结合后台数据以及下表可以看出该刊2010到2015年的核心关键词及其词频的变化情况,我们可以总结出该刊甚至是图书馆学情报学领域一直持续的研究热点主要有四个方面:大专院校的图书馆管理、企业的竞争情报管理、知识与信息资源管理,以及情报研究模型。2015年和2016年的数据显示并没有像前几年一样高频出现的核心关键词,但是在互联网加速发展背景下“大数据”、“数字图书馆”、“云计算”、“专利分析”等成为新的研究热点。[6]
表3 2010-2015年《情报理论与实践》高频关键词
五、本次研究的不足
关键词使用规范化问题至关重要,这是我们无法避免的问题。在此次研究过程中,本文对《情报理论与实践》刊登过的相同或者相近的研究课题论文,因不同作者使用的关键词不同而导致对关键词热点研究领域出现细微偏差[7]。关键词分析作为一种统计分析方法,无法避免地遇到精确性受到著者标引关键词的人为影响,但这也应该是情报学研究的一个方向之一,对语义集合的归纳,同时也提醒像《情报理论与实践》这类极具影响力的核心期刊对来稿关键词的标引进行适当的规范[8]。
[1]倪丽娟,于淑丽.档案学研究热点分析基于2004省略档案学通讯论文关键词的词频分析[J].档案学通讯,2010(1).
[2]马费成.情报学发展的历史回顾及前沿课题[J].图书情报知识,2013(02):4~12.
[3]黄丽霞.情报学核心研究内容与未来发展前景[J].情报资料工作,2004(05):8~10.
[4]杨小华,王翩翩,秦峰.广西植物关键词分析[J].安徽农业科学,2011(20):12601~12602.
[5]李姗姗,张国强,徐桂芬.基于关键词分析的ERP系统研究热点评述[J].情报科学,2012(08):1272~1276.
[6]李静,董良广,游苏宁.中国科技期刊研究2006年至2011年载文关键词分析[J].中国科技期刊研究,2012(03):404~407.
[7]杨小华.生物工程进展论文关键词的特征研究[J].农业图书情报学刊,2002(02):37~39.
[8]雷晓庆,刘晓雁.图书情报工作论文关键词特征的统计分析[J].图书情报工作,1998(05):20~21.
(作者单位:河海大学商学院)