情报学领域研究热点及演进趋势分析
2015-06-16张曼曼张丹朱光亚何雨
张曼曼 张丹 朱光亚 何雨
[摘 要] 情报学是一门新兴的综合性学科,在信息化发展的社会中其发挥的作用日益突出。以CNKI为数据源,以2010-2014年发表的情报学领域的文献为研究对象,以共词分析法为理论依据,以SPSS19.0为分析工具,研究了近5年来情报学领域的研究热点及演进趋势。经研究分析归纳出情报学领域的四大研究热点:基础理论研究、社会网络分析法研究、共词分析法研究、文献计量学研究。并预测情报学未来的研究方向是以理论研究为主、图书馆学研究和定量的分析法。
[关键词] 情报学;研究热点;演进趋势;分析
[中图分类号] F79 [文献标识码] B
一、引言
随着信息化社会的到来,情报学已经渗透到我们的生活中,其社会重要性日益增强。情报学的研究热点随社会的不断发展而变化,因此对其研究热点及演进趋势的分析,有利于我们了解情报学领域的关注重点及其未来的发展方向。词频分析法能够利用文献关键词或者主题词在某一研究领域文献中出现的频次高低来确定该领域的研究热点及发展方向。本论文即采用共词分析法来探析近五年来情报学领域的研究热点及其演进趋势,为科研人员选择研究课题提供借鉴方向。
二、数据收集和整理
(一)原始文献的选定
本研究的文献源于CNKI数据库,检索主题为“情报学”,年限为“2010.1-2014.12”,期刊为“《情报学报》、《情报科学》、《情报杂志》、《情报理论与实践》、《情报资料工作》”。结果得到397篇文献,去除如无著者的,主要包括征稿启事﹑来稿须知等,经整理之后共得到文献数321篇。将其按作者、题名、文献来源、年份、关键词顺序导出到excle表格中。
(二)高频关键词的选定
一篇论文的关键词能够大致反映出该论文的研究内容及其研究方法,是整篇文章的缩影。同样一个研究领域文献的高频关键词在一定程度上能够折射出本领域的研究热点及发展趋势。基于此本研究将原始文献表中的关键词列复制到一张新表中,对其进行处理:一是对其进行分列处理,将所有列的关键词合并为一列,即A列,共得到有效关键词1406个,删除一些与本研究无关的非实质性的关键词,如创新﹑分析﹑内涵等。处理后共得到关键词1329个;二是将A列复制到B列,并对B列的关键词删除重复项,共得到612个单一关键词。用COUNTIF函数计算B列关键词在A列中出现的次数,即C列。将C列的词频按照降序排列,选取频次大于10的关键词,一共是14个,绘制高频关键词表。
三、情报学领域研究热点分析
(一)构造高频关键词矩阵
高频关键词表中“情报学”出现的频次最高,但是其与本研究的内容完全重合,故舍弃;图书情报学与图书馆学情报学的意义相同,故将它们合并为图书情报学。在此基础上共计得到12个高频词作为共词分析的原始数据。
将这12个高频关键词进行两两组合,统计出它们同时出现在一篇文献中的次数,形成共词矩阵。该矩阵为对角矩阵,对角线上的数字代表任一关键词自身出现的频次,非对角线上的数字代表两个关键词同时出现的次数。为了更清晰地表示关键词之间的关系,我们将用Ochiia系数计算关键词相似矩阵,“Ochiia系数等于AB两词共同出现的频次除以AB各频次乘积的开方[1]。”“此相关矩阵中0值太多,以后做统计分析时容易造成较大误差,因此为了方便统计,将相似矩阵转化为相异矩阵,即用1与相似矩阵中所有值相减[1]。”
(二)因子分析
因子分析简单地说就是用少数几个因子来描述原始多个变量因子之间的联系,能反映原始资料的大部分信息。“因子分析有以下5个特点:提取的因子个数小于原有变量数;因子可代替原有变量参与数据建模,减少了计算量;因子能够反映原有变量的大部分信息;因子之间的线性关系不显著;因子具有命名解释性[2]。”
本研究用SPSS19.0对共词矩阵进行因子分析,具体操作步骤为:将高频关键词的相异矩阵导入到SPSS19.0中,选择分析——降维——因子分析,在出现的对话框中把左边的所有要分析的变量选入右边变量处,依次按照提示设置分析内容及方法,即描述统计﹑抽取(本次采用主成分抽取法并且特征值大于1)、旋转(最大方差法)、得分、选项。最后点击确定即可生成因子分析的各类图表。
相关系数矩阵图中多数高频关键词的相关系数较高,并且每个变量都具有较强的线性关系,因此我们能够从中提取公共因子,进行因子分析。
1.提取公因子
本研究采用的是主成分分析法提取公因子,并要求选取的因子特征根大于1。
公因子方差表中多数因子的方差都比较高,说明这些因子能够反映原始变量的大部分信息,如引文分析的因子方差为86.9%,说明提取的公因子对关键词引文分析的方差作出了86.9%的贡献,表明原有矩阵转化为公因子矩阵后保留了原始数据的大部分信息,因此因子分析的效果整体比较好。因子变量的总方差图中旋转后的公因子累计方差贡献率为63.078%,表明公因子能够涵盖原有变量63.078%的信息,信息丢失较少。碎石图清晰地描述了因子特征值的变化情况,图中前四个因子特征值的变化较为明显并且都大于1,之后因子特征值的变化趋于平缓。根据以上分析,我们将提取的公因子数定为四个。
2.因子的命名解释
因子载荷矩阵表示的是提取的公因子对原有变量的解释比例,该矩阵中公因子变量在多数变量上都有较高的载荷值,所以公因子代表的含义就比较模糊,故我们按照方差极大法对因子载荷矩阵进行旋转,旋转后的每个公因子的含义大致清晰,因子1基本反映了研究热点、知识图谱、共词分析;因子2基本反映了图书馆学、文献计量学、核心期刊;因子3基本反映了社会网络分析、合著研究;因子4基本反映了被引分析、图书情报学、引文分析。这些因子的关键词代表了他们的研究内容概况,可以用来总结出情报学研究领域的几个主要部分及其相互关系。endprint
(三)聚类分析
聚类分析是研究“物以类聚”这类问题的一种有效方法,“它的实质是建立一种分类方法,将一批样本数据按照它们在性质上的亲密程度在没有先验知识的情况下自动进行分类,同类间较为相似,不同类之间区别较大[3]。”具体操作步骤为:一是将相异矩阵导入SPSS19.0中,选择分析——分类——系统聚类(即是层次聚类);二是将所有变量选择到右边的变量列表中,依次设置聚类分析的选项,包括统计量﹑绘制﹑方法,输出内容为统计量和图。
生成的聚类表中第一列表示聚类分析的第几步;第二、三列表示本步聚类中哪两个变量或者小类聚为一类;第四列表示变量距离或者小类距离;第五﹑六列表示本步聚类中参与的是变量还是小类,0表示变量,非0表示由第几步聚类生成的小类参与本步聚类;第七列表示本步聚类结果将在以下第几步中用到。如:首先进行合并的是第九和第十二个变量,他们之间的相关系数为0.886,此聚类结果将在以下第四步聚类中用到。
树状图更加客观清晰地展现了聚类分析中每一次类合并的情况,首先合并为一类的是研究热点和知识图谱,依次按照距离大小合并为一类的是图书馆学和文献计量学,图书情报学和被引分析,合著网络和社会网络分析,各变量合并之后,就是变量与小类及小类与小类之间的合并,最终所有小类合并为一类,此时类间的距离已经非常大了。
(四)多维尺度分析
“多维尺度分析和因子分析一样都是
降维分析,在多维尺度分析中,各数据点在空间中的位置是分析解释的重要内容,聚类分析可以确定组别,但是无法在空间中标出观测值,因此可以用多维尺度分析对聚类分析进行补充说明[4]。”具体操作步骤为:将相异矩阵导入SPSS19.0中,选择分析——度量——多维尺度;将所有变量选择到右边的变量列表中,对模型,选项依次进行设置。
二维图中这12个变量分布于四个象限,大致分为四类:研究热点﹑知识图谱﹑共词分析;图书馆学﹑文献计量学﹑核心期刊;社会网络分析﹑合著研究;被引分析﹑图书情报学﹑引文分析。需要指出的是理论研究这个因子,其与其他因子间几乎没有任何关系,自行一类,结合原始的数据表可以发现基础理论研究与情报学联系最为紧密,共现的频次也较高,由于数据处理时将情报学舍弃,故而导致理论研究成为孤立的一个关键词。为整体研究的合理性,将在下文研究热点及趋势的分析中添加上情报学理论研究。
经以上研究本文将情报学领域的研究热点分为以下四类,一是基础理论研究。理论研究是其学科确立的根本,5年来,情报学基础理论研究成果不断丰富。二是社会网络分析法研究。社会网络分析法通过定量分析方法,扩散到社会的各个领域中,目前合著网络的研究是情报学领域的研究热点。三是共词分析法研究。共词分析法属于内容分析法的一种,其原理为统计一组词两两出现在一篇文献中的次数,对其进行聚类等分析,得到研究领域的主题。四是文献计量学研究。引文分析及被引分析都属于文献计量分析法,引文分析一直以来都是文献计量学方法的一个重要研究方向,随着计算机网络的快速发展,为其提供了可视化支持,使研究结果更加科学直观。
四、情报学领域演进趋势探析
结合以上研究热点的分析及计算机网络的发展,本文预测情报学未来的研究方向。一是以理论研究为主。理论是实践的基础,对理论的深入研究能够促进该学科的长久发展。因此广大情报学工作者重视对情报学理论的研究,并且有的学者将其他领域的理论知识与情报学相结合,使得情报学的内容更加丰富。二是图书馆学研究。图书馆学一直以来都是情报学研究的重点内容之一,从高频关键词表可以看出,其居于第三位。基于此可以预测图书情报研究依然是未来情报学研究的热点。三是定量的分析法。无论是文献计量法还是社会网络分析法都是定量研究法,当前随着计算机网络的发展,越来越多的分析软件被广泛应用于情报学的研究之中,鉴于此定量的研究方法与计算机技术的结合必将成为日后研究人员的主要科研领域。
[参 考 文 献]
[1]刘涛.关于我国图书馆学研究热点分析[D].东北师范大学,2012
[2]余建英,何旭红.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2003
[3]邱均平,吕红.近五年国际图书情报学研究热点、前沿及其知识基础——基于17种外文期刊知识图谱的可视化分析[J].图书情报知识,2013(3):4-15+58
[4]储节旺,郭春侠.共词分析法的基本原理及EXCEL实现[J].情报科学,2011(6):931-934
[责任编辑:王凤娟]endprint