基于引文分析的我国情报学学科交叉性实证研究
2018-01-02开滨
开滨
〔摘 要〕本文采用学科交叉指数及科学叠加图可视化技术对我国CSSCI数据库中4种情报学的核心期刊2006-2015年刊载的13 098篇文献进行分析,用以揭示我国情报学学科交叉性的特征及变化。结果表明,被引学科的频率分布符合幂律分布,10年间我国情报学与国内外人文社会科学领域及自然科学领域的关系非常密切;其中国内外人文社会科学领域的被引学科的数量变化不大,而国内外自然科学领域的被引学科数量增长较为明显;国内外被引学科主要集中在与图情学相邻近的几个核心学科中,且国内外学科交叉性呈现出了相反的变化趋势,但总体变化并不明显;具体来看,国内的图情学、新闻与传播学等学科以及国外的图情学、计算机科学—交叉应用、跨学科等学科等具有学科交叉性背景的学科的比例在不断增加。
〔关键词〕情报学;学科交叉;Rao-Stirling指数;科学叠加图
DOI:10.3969/j.issn.1008-0821.2017.12.025
〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2017)12-0144-10
〔Abstract〕This paper analyzed 13098 articles from 4 core journals of the information science in China from 2006 to 2015 in the CSSCI database in order to reveal the characteristics of the discipline using interdisciplinary index and science overlay map visualization technology.The results showed that the frequency of discipline sources was in accordance with the power-law distribution,the relationship between information science and humanities and social science field and natural science field was very close in domestic and international in the past 10 years;The number of cited subjects in humanities and social science had not changed greatly,but the number of cited subjects in natural science had increased markedly;The cited disciplines domestic and international focused on several core disciplines which close to the information science and library science,and the interdisciplinary domestic and international showed the opposite trend,but the change was not obvious;Specifically,the proportion of domestic subjects such as information science and library science,news and communication science and international subjects such as information science & library science,computer science,interdisciplinary applications,multidisciplinary sciences had been increasing.
〔Key words〕information science;interdisciplinary;Rao-Stirling index;science overlay maps
情報学是一门交叉性非常强的学科,国内外众多学者从不同角度出发进行了深入研究。早在1968年,Brok就通过研究指出情报科学是一门交叉性的学科,其知识来源非常广泛且与众多学科如数学、逻辑学、语言学、心理学、计算机技术、运筹学、平面艺术学、通信学、图书馆学、管理学等有关[1],Al-Sabbagh在其1987年的博士学位论文中分析了JASIS期刊1975-1985年文章中的参考文献,发现被引用的出版物来源于各种学科,其中计算机科学、图情学被引用的最为频繁,特别是计算机科学的引文被引用频次有上升趋势,而图情学的频次则产生了下降[2],Mu-Hsuan Huang通过直接引用分析和作者合著两种方式对情报学的交叉性进行了研究,结果表明情报学的学科交叉程度呈现出增长趋势,作者合作方面的学科交叉性的增长更为明显[3]。更多的学者是将图书馆学和情报学结合起来进行分析的,如Buttlar的引文分析研究针对的是61种图情学期刊的论文,结果揭示了图情学的研究者经常引用来自于图情学、教育学、计算机科学、医疗、医药学、社会学、通信学以及商务学等学科[4],Yu-Wei Chang等使用3种计量学方法对图情学的交叉性进行了研究,结果表明图情学的研究者最长引用本领域内的文献,且直接引用得到的学科交叉程度最高,而作者合作得到的学科交叉程度最低[5]。国内方面,孙海生等基于引文分析、共词分析和社会网络分析方法,选择计算机科学、科学学两个学科,对情报学学科交叉知识引用情况进行实证研究,结果中给出了情报学与计算机科学、科学学之间的关联及共同领域[6]。崔斌等基于文献分类号对情报学的学科交叉特征进行了分析,给出了我国情报学在期刊、作者、关键词方面的学科交叉属性[7]。马费城等对我国人文社科领域的23个学科的多样性进行了研究,并对我国图情学的跨学科性进行了分析,将我国23个人文社会科学领域学科划分为6个多样性水平,其中图情学处于较低的水平[8]。迄今为止还未有学科从引文分析角度对我国情报学的学科交叉性进行研究,本文拟通过引文分析对我国情报学的学科交叉性进行研究,通过研究本文试图解决下列问题:endprint
①10年间我国情报学的学科交叉性具有怎样的总体特征?
②10年间我国情报学的学科交叉性变化情况如何?
③10年间我国情报学的学科交叉性过程中具体有哪些学科产生了怎样的变化?
1 研究说明
1.1 数据来源
本文數据来源于中国社会科学引文索引数据库(CSSCI)中的4种情报类核心期刊中包含的论文,这4种期刊包括情报学报、情报杂志、情报理论与实践、情报科学,发文时间从2006-2015年,文献类型为论文,检索时间截止到2016年6月30日,共计检索得到13 098篇文献。
1.2 学科范围的选择
本文对我国情报学与国内外其他学科的学科交叉性进行研究,因此首先需要界定本文中的学科范围,通过比对国内外权威数据库,最终将学科范围设定如下:国内方面,人文社会科学领域以CSSCI包含的学科为准,自然科学领域以CSCD包含的学科为准,CSSCI和CSCD构成了国内的全领域学科;国外方面,人文社会科学领域以SSCI包含的学科为准,自然科学领域以SCI包含的学科为准,SSCI和SCI构成了国外的全领域学科,下文中所指的国内外全领域学科即为上述所指。
1.3 学科交叉性指数的选择
研究事物的多样性有很多指标,较为常见的有COC指数、布里渊指数、Shannon指数、Rao-Stirling指数等,由于Rao-Stirling指数能够通过多样性对论文的知识来源多样性进行更加综合全面的分析,因此本文采用Rao-Stirling指数作为学科交叉性的指标,该指数公式如下:
1.4 研究思路
本文通过引文分析对我国情报学的学科交叉性进行研究,其中涉及到学科交叉性指数的计算及学科交叉性可视化的展示,其中学科交叉性指数的计算具体指Rao-Stirling指数的计算,学科交叉性可视化的展示具体指科学叠加图的制作,为了实现这两个目的,采用如下思路:
①全领域学科范围内相似性矩阵的构造;
②根据学科相似性矩阵,对学科进行因子分组;
③根据学科相似性矩阵及因子分组,对科学叠加图的基础图进行构造;
④选择情报学4种期刊为研究样本,对情报学的学科交叉性进行探究。
1.4.1 全领域学科范围内学科相似性矩阵的构造
为了计算Rao-Stirling指数,我们需要得到学科i和学科j的相似性程度,由于国外学者Leydesdorff已经对国外的全领域学科(SSCI和SCI)范围内的科学叠加图的制作过程进行了研究,其中就包括224个SSCI和SCI学科之间的相似性矩阵,因此我们可以直接进行使用[10]。下面我们对国内的全领域学科(CSSCI和CSCD)范围内的学科相似性矩阵进行构造,方法如下:首先构造80个学科之间的引文矩阵,接下来将引文矩阵导入SPSS中进行余弦相似性分析即可得到相似性矩阵,该相似性矩阵为对称矩阵,对角线上的数值均为1,代表学科与自身相似性完全一致,学科i和学科j的相似性数值介于0和1之间,表示两个学科之间的相似性程度,数值越大说明两学科之间的相似性程度越高。
1.4.2 根据学科相似性矩阵,对学科进行因子分组
为了可视化显示学科交叉性,我们需要对各全领域学科进行分组,这样有助于将小的单一学科整合为大的聚类学科群,便于图像的解读。由于国外学者Leydesdorff已经对国外的全领域学科(SSCI和SCI)范围内的制作过程进行了研究,其中就包括224个SSCI和SCI学科的因子分组,因此我们可以直接进行使用[10]。下面我们对国内的全领域学科(CSSCI和CSCD)范围内的80个学科进行因子分组,方法为将1.4.1中得到的国内的全领域学科(CSSCI和CSCD)范围内的学科相似性矩阵导入SPSS中进行因子分析,由于实际不同的分组方案会产生不同的分组结果,我们通过对不同分组方案进行综合调整分析,最终采用了8个因子分组的方案。
1.4.3 根据学科相似性矩阵及因子分组,对科学叠加图的基础图进行构造
在将全领域学科进行分组后,即可构造科学叠加图。科学叠加图作为一种全新的可视化手段,可以从宏观上直观地显示出各个学科之间的关系及其变化过程[11]。要制作科学叠加图,首先要进行全领域科学基础图的构造,基础图即为全领域所有学科之间引用关系的宏观图,国外学科的基础图为224个SSCI和SCI学科之间的关系图,国内学科的基础图为80个CSSCI和CSCD学科之间的关系图。在得到基础图的基础上,可以将具体的研究案例投射到基础图上,最终得到具体某一研究案例的科学叠加图,在基础图和科学叠加图的可视化过程中,我们采用Pajek软件进行显示。
由于国外学者Leydesdorff已经对国外的全领域学科(SSCI和SCI)范围内的科学叠加图的制作过程进行了研究,其中就包括224个SSCI和SCI学科的基础图,因此我们可以直接进行使用[10]。下面我们对国内的全领域学科(CSSCI和CSCD)范围内的基础图进行构造,方法为根据1.4.1中得到的国内的全领域学科(CSSCI和CSCD)范围内的学科相似性矩阵得到80个学科之间的net引用关系文件,根据1.4.2中得到的学科的分组得到80个学科之间的clu分组关系文件。需要说明的是,在反复权衡准确性和可读性后,net引用关系文件中相似性阈值的最小值设置为0.1,这样做既能够保留绝大多数重要的引用关系,同时对于图像具有较好的可视性,最后将net文件和clu文件导入pajek中即得到国内的全领域学科(CSSCI和CSCD)范围内的基础图。
1.4.4 选择情报学4种期刊为研究样本,对情报学的学科交叉性进行探究
在前面3步的基础上,选择情报学的4种期刊作为具体案例进行探究,包括被引学科分布分析、学科交叉性指标分析、科学叠加图分析以及核心学科变化趋势分析。其中被引学科分布分析用来解决 “10年间我国情报学的学科交叉性具有怎样的总体特征?”这一问题;学科交叉性指标分析用来解决“10年间我国情报学的学科交叉性变化情况如何?”这一问题;科学叠加图分析及核心学科变化趋势分析用于解决“10年间我国情报学的学科交叉性过程中具体有哪些学科产生了怎样的变化?”这一问题。endprint
2 结果及分析
2.1 被引学科分布分析
2.1.1 被引学科频率分布
为了探究我国情报学学科来源分布的特征,我们在SPSS中对所有被引学科的频次进行拟合,图1、图2分别显示了国内被引学科和国外被引学科的曲线拟合,兩幅图中左图为普通坐标下的频率曲线拟合,右图为双对数坐标下的频率曲线拟合,可以看出两种频率的曲线拟合均符合幂函数分布,拟合曲线的相关系数分别为:0.969和0.935,说明拟合效果非常好。证明了我国情报学的学科来源在频率上符合幂律分布,也就是说我国情报学的众多被引学科中,存在比例很少但频次巨大的核心学科,这部分核心学科与我国情报学的关系非常密切,而大部分学科的频次都非常低,属于被引学科中的边缘学科。
2.1.2 被引学科总体分布
学科总体分布包括10年间我国情报学的学科来源总体数量分布和前20位主要学科列表,分别见表1、表2所示。从表1可以看出,CSSCI学科和SSCI学科的学科覆盖率较为接近,分别为86.96%和85.96%,而CSCD学科和SCI学科的学科覆盖率较为接近,分别为78.95%和79.10%。4种学科覆盖率数值均较大,说明我国情报学与国内外人文社会科学领域及自然科学领域的关系均非常密切,非常广泛地从各类学科中吸收知识。同时4种学科的覆盖率差别并不是特别明显,说明了我国情报学具有十分强的人文社会科学和自然科学的交叉属性。
表2列出了10年间我国情报学学科来源中排名前20位的学科,从国内学科来看,图书馆、情报与文献学(以下简称为图情学)排名第一,且比率达到了62.39%,远远高于其他学科,这是由于情报学本身属于图情学的缘故,说明我国情报学主要从我国图情学中吸收知识。接下来的两大学科分别为管理学(16.49%)和自动化技术、计算机技术(10.26%),说明我国情报学与这两个学科具有非常近的学缘关系。同时经济学(2.16%)、新闻学与传播学(1.85%)、教育学(1.01%)等也占有一定的比率。从国外学科来看,比率最大的前3位学科分别为管理学、图情学、商务学,让我们颇感意外的是,排名首位的不是图情学,而是管理学,说明了10年间我国情报学对于国外管理学的知识吸收超过了图情学。之后的计算机学科的几个子学科如计算机科学—信息系统、计算机科学—跨学科应用、计算机科学—人工智能也占有较大的比率。综合比较来看国内外学科前20位中,国内的8个学科与国外的16个学科具有相同或相似的学科背景,说明了我国情报学国内外主要学科来源具有一定的重合性。
2.2 学科交叉性指标分析
2.2.1 被引学科数量
10年间我国情报学国内外被引学科数量变化趋势见图3、图4所示。图3可以看出,CSSCI中学科数量介于17~20个之间,总体变化不大,CSCD中学科数量介于16~32个之间,前期和后期出现了较为明显的变化,中期则变化不大,说明我国情报学对于国内人文社会科学学科的覆盖面总体变化不大,对于国内自然科学学科的覆盖面则出现了阶段性的变化。图4可以看出,SSCI中学科数量介于28~44个之间,总体上变化也不太大,SCI中学科数量介于46~108个之间,变化较为显著,说明我国情报学对于国外人文社会科学学科的覆盖面总体变化不大,对于国外自然科学学科的覆盖面则产生了较大的变化。总体来看,10年间我国情报学的国内外人文社会科学领域中学科丰富程度变化不大,而对于国内外自然科学领域中学科丰富程度总体处于增长状态,特别是2008-2009年阶段、2013-2014年阶段对国内CSCD学科库中学科的知识吸收以及2007-2009年阶段、2011-2014年阶段对国外SCI学科库中学科的知识吸收均出现了明显的增长趋势。
2.2.2 Rao-Stirling指数
10年间我国情报学的Rao-Stirling指数变化见图5所示。从数值来看,国外被引学科的Rao-Stirling指数明显高于国内被引学科的Rao-Stirling指数,说明我国情报学的国外学科知识来源比国内学科知识来源分布上更为均衡和广泛。是什么导致了外国学科的学科交叉性大于国内学科的学科交叉性呢?根据表2可以看到,国内来源学科中排名第一的图情学的比率高达62.39%,远远高于国外学科中排名第一的管理学的17.87%。因此国内被引学科的频次分布上具有非常明显的不均衡性,同时由于国外被引学科的数量(189个)远远高于国内学科的被引数量(65)个,因此国内外被引学科的丰富程度上也差异巨大。以上两方面原因使得我国情报学的国内学科交叉性要明显低于国外的学科交叉性。
从变化趋势来看,国内外被引学科的变化呈现出了截然相反的过程。2006-2010年国外被引学科的Rao-Stirling指数处于降低趋势,2010-2015年国外被引学科的Rao-Stirling指数处于增加趋势。2006-2010年国内被引学科的Rao-Stirling指数处于增加趋势,2010-2015年国内被引学科的Rao-Stirling指数处于降低趋势。但总体来看,国内外两种被引学科的学科交叉性变化并不明显。
2.3 科学叠加图分析
10年间我国情报学国内外被引学科的科学叠加图分别见图6、图7所示。图6可以看出我国情报学国内被引学科主要集中在与图情学相邻近的范围内,比如管理学、新闻与传播学、自动化技术、计算机技术、经济学、教育学等学科中,这一结果也与之前的分析相吻合。图7可以看出我国情报学国外学科来源同样集中在管理学、经济学、计算机系列学科、商务学等学科中。10年间我国情报学国内外被引学科的科学叠加图变化过程见图8、图9所示,图8可以看出我国情报学国内被引学科频次的变化很小,仅有少量的学科被引频次变化较为明显,如新闻与传播学等学科,说明10年间情报学与国内其他学科之间的关系较为稳定,对于国内核心来源学科知识的吸收程度趋于稳定。图9可以看出2006-2009年及2009-2012年时间段内,情报学国外被引学科频次的增长非常迅速,2012年之后国外被引学科的频次已趋于稳定。endprint
2.4 核心学科变化趋势分析
为了进一步更加细化地探究我国情报学核心被引学科的变化趋势,我们分别取国内和国外被引学科的前10位,对其频次变化趋势进行详细分析,得到图10和图12。图10中排名前3位的学科显示相对清晰,而后面的学科由于度量的原因无法辨识,因此将4~10位的学科单独显示在图11中,同理可以从图12中得到图13。从图10可以看出国内被引核心学科中,图情学频次要远远高于其他学科,且该学科频次自2010年之后变化幅度较大,总体上处于增长趋势。之后的管理学和自动化技术、计算机技术两门学科,在2008年之前,自动化技术、计算机技术频次高于管理学的频次,2008年之后管理学频次开始超过自动化技术、计算机技术的频次,并在此之后一直处于第2位。图11中需要注意的是新闻学与传播学,该学科从2011年起频次迅速增长,并最终超过了经济学。从图12可以看出国外学科来源中,管理学、图情学、商务学、计算机科学—信息系统这4门学科的频次变化趋势非常类似,2012年之前,管理学一直处于领先位置,2012年之后图情学的频次超过了管理学的频次跃居首位。图13中需要注意的是计算机科学—跨学科应用、跨学科学这两门学科分别从2011年
起和2013年起频次迅速增长,而这两门学科均属于交叉性的研究学科,说明近年来我国情报学对于国外具有学科交叉背景的学科知识的需求开始不断增长。总体来看,近年来我国情报学对于国内的图情学、新闻与传播学等学科以及国外的图情学、计算机科学—交叉应用、跨学科学等具有学科交叉性背景的学科的知识需求不断增强。
3 结论及思考
3.1 结 论
1)学科交叉性的总体特征:我国情报学学科来源的频率分布符合幂律分布,说明我国情报学的众多被引学科中,存在比例很少但频次巨大的核心学科,这部分学科与我国情报学的关系非常密切,属于情报学学科来源中的核心学科。而大部分被引学科的频次都非常低,属于学科来
源中的边缘学科。我国情报学与国内外人文社会科学领域及自然科学领域的关系非常密切,广泛地从这两个领域的众多学科中吸收知识,说明我国情报学具有十分强的学科交叉性。
2)学科交叉性变化情况:从学科丰富程度变化来看,10年间我国情报学的国内外人文社会科学领域中学科丰富程度变化不大,而国内外自然科学领域中学科丰富程度增长较为明显。从学科交叉性来看,10年间情报学国内外学科范围内的学科交叉性呈现出了相反的态势,国外学科范围内的学科交叉性先降低后增加,而国内学科范围内的学科交叉性则先增加后降低,但总体来说国内外范围内的两种学科交叉性的变化并不明显。
3)具体哪些学科产生了怎样的变化:10年间我国情报学国内外学科来源主要集中在与图情学相邻近的几个核心学科中。从国内学科变化来看,我国情报学与国内其他学科之间的关系较为稳定,说明国内学科的知识来源已趋于稳定,而国外学科的知识来源在前期发展非常迅速,在2012年之后也逐渐趋于稳定。具体来说,10年间我国情报学对于国内的图情学、新闻与传播学等学科以及国外的图情学、计算机科学—交叉应用、跨学科学等学科的知识来源不断增长,同时对于国外有学科交叉背景的学科的知识需求也开始不断增长。
3.2 一点思考
关于本文开头提出的第2个学科交叉性变化的问题,国外也有类似的研究,如Porter等在对国外6个学科的学科交叉性研究的基础上,得出了国外学科在其他单个指标(如单一作者论文百分比、篇均作者数量等)增长趋势非常明显而学科交叉性(Rao-Stirling指数)增长相对较为缓慢的结论,关于两者发展趋势为何不一致作者也进行了研究探讨[12]。通过本文的研究我们也发现了类似的事实,从图3和图4中可以看出,10年间我国情报学国内被引学科的数量从33个增加到了52个,增长率为57.58%,国外被引学科的数量从74个增加到了152个,增长率为105.41%,说明10年间我国情报学的国内外被引学科(主要指国内外自然科学领域)的丰富程度增长较为明显,但从图5来看,我国情报学的学科交叉性增长并不显著,两者之间变化趋势不一致的原因何在?通过综合考察,我们认为原因主要如下:
1)尽管10年间国内外被引学科的数量(主要指国内外自然科学领域)增长非常明显,但进一步考察我們发现10年间国内新增的19个学科和国外新增的78个学科均属于距离情报学较远的边缘学科,这些被引学科的出现虽然使得学科的丰富程度提高了,但由于其被引频次非常低,因此对于实际的学科交叉性的影响非常有限。
2)从图6、图7、图8、图9来看,我国情报学对于国内外学科的引用主要集中在与情报学有着密切关系的核心学科中,这些核心学科控制着我国情报学知识的重要来源,由于从学科相似性角度来说,这些核心学科与我国情报学之间的差异性校对较小,属于情报学中的“近亲学科”或“近邻学科”,因此使得我国情报学的学科来源的多样性并不高,这就使得我国情报学的学科交叉性整体上变化不大。
参考文献
[1]H Borko.Information science: What is it?[J].Journal of the Association for Information Science and Technology,1968,19(1):3-5.
[2]Al-Sabbagh IA.The evolution of the interdisciplinarity of information science: a bibliometric study[D].Unpublished manuscript,Florida State University,Tallahassee,FL,1987.
[3]MH Huang,YW Chang.A study of interdisciplinarity in information science: using direct citation and co-authorship analysis[J].Journal of Information Science,2011,37(4):369-378.endprint
[4]L Buttlar.Information sources in library and information science doctoral research[J].Learning & Individual Differences,1999,191(14):227-245.
[5]YW Yu-Wei Chang,MH Huang.A study of the evolution of interdisciplinarity in library and information science: using three bibliometric methods[J].Journal of the Association for Information Science and Technology,2012,63(1):22-33.
[6]孙海生.情报学跨学科知识引用实证研究[J].情报杂志,2013,(7):113-118,100.
[7]崔斌,李長玲,冯志刚.基于文献分类号的情报学跨学科属性分析[J].情报资料工作,2015,(6):28-34.
[8]马费成,陈柏彤.我国人文社会科学学科多样性研究[J].情报科学,2015,(1):3-8.
[9]Carley,S.,& Porter,A.L.A forward diversity index[J].Scientometrics,2012,90(2):407–427.
[10]L Leydesdorff,I Rafols.Interactive overlays: A new method for generating global journal maps from Web-of-Science data[J].Journal of Informetrics,2011,6(2):318-332.
[11]Rafols,Ismael,Porter,Alan L.,Leydesdorff,Loet.Science.overlay maps: A new tool for research policy and library management[J].Journal of the American Society for Information Science and Technology,2010,61(9) :1871-1887.
[12]Alan L.Porter,I Smael Rafols.Is science becoming more interdisciplinary?Measuring and mapping six research fields over time[J].Scientometrics,2009,81(3):719-745.
(本文责任编辑:孙国雷)endprint