基于Citespace的国内学科馆员研究文献量化分析
2014-08-08王慧
王慧
[摘要]以CSSCI 数据库收录的学科馆员领域350篇文献为数据源,运用信息可视化技术和工具(Citespace II),首先对发文机构、关键词、引文进行分析,揭示研究热点;其次对相应的研究主题进行聚类分析,进而对国内学科馆员的研究进行维度划分;最后通过时间区间分析,展现该领域的知识结构关系和演进规律。以期通过知识图谱的方式全面掌握近年来我国学科馆员领域的研究状况。
[关键词]学科馆员;Citespace;科学知识图谱;文献计量学;信息可视化
1引言
从1998年清华大学率先在国内实行学科馆员制度以来,一方面,北京大学、武汉大学、西安交通大学、南开大学等高校也相继开展了学科馆员工作,相应的研究文献大量涌现,形成一定的规模,以CNKI数据库为统计来源,以“学科馆员”为检索词进行检索,共计包含1660条记录,开创了图书情报界新的研究领域和研究热点[1]。另一方面,对于学科馆员文献计量的研究却很少,CNKI数据库仅检索出5条记录,这5篇文献多是针对发文量、期刊分布、机构分布、时间分布的一些统计,对于关键词、研究主题等分析也仅仅是对其频次进行统计分析[2—6]。然而,学科馆员研究在不同时期研究热点、热度都会有所不同,仅仅通过简单的数理统计分析很难揭示其演进规律、预测发展趋势。因此,本文采用信息可视化技术和工具(Citespace II)对CSSCI数据库中收录的有关学科馆员的文献进行论文关键词、文献共引、机构以及时间区间分析,以期发现国内学科馆员领域存在的问题并揭示其知识结构关系和演进规律。
2数据来源及研究工具
2.1 数据来源
本文以CSSCI数据库为数据来源。由于国内对于学科馆员有很多种称谓,如学科馆员、学科联络员、联络馆员、咨询馆员、采访馆员、学科联系人,等等,为了提高文献的查全率,以关键词为检索字段,检索式为“学科馆员+学科联络员+联络馆员+咨询馆员+采访馆员+学科联系人”。检索年限为1998—2012年,共计检索出350条文献记录。
2.2 研究工具
知识图谱构建软件有多种,如:Ucinet、Pajek、Citespace等。本文选择的是Citespace II软件,是由美国德雷塞尔大学信息科学与技术学院陈超美博士与大连理工大学WISE实验室联合开发的科学文献分析工具。Citespace II是用来分析和可视共被引网络的Java程序、通用方法[7]。
2.3 数据清洗及格式转换
本文在进行数据清洗时,主要做了以下两方面处理:一方面对一些同义词进行合并,如“学科化服务”“学科馆员服务”统一合并为“学科服务”,“参考咨询员”“参考咨询馆员”统一合并为“参考馆员”等;另一方面对一些专指度不高的限制性关键词如“学科馆员”“图书馆”“图书馆员”等无法反应学科馆员研究的具体主题的词进行删除[8]。
3分析与结果
3.1 研究机构分析
Citespace II可视化软件可以通过对学科馆员领域贡献数据的分析,以大小“年轮”与不同颜色的形式来直观地展现出该研究领域的主要机构,并通过机构之间的连线及其粗细程度表达它们之间有无联系和联系的强度[9]。将检索到的350篇学科馆员领域相关记录输入到Citespace II中,节点类型选择Institution,主题词来源选择题目、摘要、描述符、标识符,时区分割选择1,数据抽取选择前50位,阀值选择为(2,2,10)、(2,2,10)、(2,2,10)。运行软件后,得到有关“学科馆员”研究机构的频次排名表(前5位)和综合分析图谱分别见表1和图1。
表1机构分布结果(前5位)
排名机构频次 1清华大学图书馆122南开大学图书馆103中科院国家科学图书馆84上海交通大学图书馆75中科院文献情报中心7图1机构分布可视化图谱
由表1和图1,我们可以看出:1)从频次分析,清华大学图书馆、南开大学图书馆、中国科学院国家科学图书馆、上海交通大学图书馆、中国科学院文献情报中心发表论文数位于前五名。2)从中心度分析,所有机构的中心度均为0,中心度是用该点的“度数”衡量与该节点直接联系的个体数目[10],因此在机构研究力图谱中,中心度越大则表示它与其他机构建立的学科馆员研究合作越多,对其他机构的影响力也就越大。此研究结果表明各高校图书馆之间的合作关系不强。
3.2 “学科馆员”研究前沿的知识基础分析
研究前沿代表了一个研究领域的思想现状,而知识基础则是它在科学文献中(即由引用研究前沿术语的科学文献所形成的演化网络)的引文和共引轨迹[11]。“学科馆员”研究前沿的知识基础由两方面构成:一方面是文献共被引图谱中的高频次与高中心性的关键文献;另一方面是由文献共被引时区视图中早期奠基性文献构成。
本文以2年为一个时间区间。对数值进行如下设置:C,CC,CCV的阀值分别设置为(2,2,20)、(4,3,20)、(5,4,20),网络节点设置为参考文献(cited reference),主题词设定为题目、摘要、描述符、标识符,主题词类型暂不设定,共计生成节点数40个,连线143条。依据文献被引频次和文献中心性绘制被引文献的时区视图和中心度聚类视图。
3.2.1 “学科馆员”领域的奠基性节点分析。图2是被引文献的时区视图,从中可以看出,国内学科馆员领域的第一篇奠基性文献是姜爱蓉于1999年在《图书馆杂志》上发表的题名为《清华大学图书馆“学科馆员”制度的建立》的论文。清华大学图书馆是国内最早开展学科馆员制度的图书馆,姜爱蓉介绍了清华图书馆建立学科馆员制度的主要动因、具体措施以及在建立该制度过程中的经验与体会。该论文无疑为后续开展学科馆员制度的图书馆提供了借鉴与参考,提供了思想基础和研究基础。图2“学科馆员”研究前沿知识基础分析时区视图
另外一篇奠基性文献是胡继东于2002年在《图书情报知识》杂志上发表的题名为《关于学科馆员制度的建立与完善问题》的论文。该论文描述了学科馆员制度的产生背景及发展、实施与完善等问题,同时分析了学科馆员的素质与职责。
这两篇奠基性文献都是关于制度建立与完善、管理措施方面的研究,表明开展学科馆员工作,首先必须建立合理的制度,这样才能保证学科馆员工作的顺利开展。国内在2005年之前的研究重点是学科馆员制度,2005年之后着重服务与合作化的研究。
3.2.2 “学科馆员”领域的关键节点分析。一个研究领域的知识基础与其研究前沿将随着时间的变迁而不断延伸和拓展,最终形成该学科的核心文献集,并进而表现为该领域的高被引文献簇[12]。图3中每个圆形节点代表一篇文献,节点的大小代表该文献的中心性高低,节点越大,这篇文献的中心度越高,节点的厚度与相应年份的引文数成正比,色调由冷色向暖色转变代表时间由远到近的过度。从表2可知,按照节点在共引网络中的中心度大小,排在首位的是胡继东于2002年在《图书馆情报知识》杂志上发表的《关于学科馆员制度的建立与完善问题》。该文的被引频次为30,中心度为0.29,是网络中最大的关键节点。排在第二位的是姜爱蓉于1999年在《图书馆杂志》上发表的《清华大学图书馆“学科馆员”制度的建立》,该文的被引频次为24,中心度为0.23,这两篇文献同时也是学科馆员领域的奠基性文献。排在第三位的是韩广峰于2005年在《图书馆工作与研究》上发表的《关于学科馆员的角色定位及其绩效考核的思考》,该文的被引频次为6,中心度为0.23。该文是在国内高校纷纷开展学科馆员工作的基础上,提出了因馆制宜、循序渐进的定位学科馆员的职责,同时建议要做好学科馆员的绩效考核工作。这篇文章即为我国学科馆员研究从制度到管理的一个过渡。图3“学科馆员”研究前沿知识基础关键节点分析视图
表2学科馆员领域的关键节点信息
序号频次中心性文献信息1300.29胡继东, 2002, 图书情报知识,关于学科馆员制度的建立与完善问题2240.23姜爱蓉, 1999, 图书馆杂志,清华大学图书馆“学科馆员”制度的建立360.23韩广峰, 2005, 图书馆工作与研究,关于学科馆员的角色定位及其绩效考核的思考4110.18刘波涛, 2004, 图书馆论坛,建立和完善高校图书馆“学科馆员”制度的几项措施5310.1杜也力, 2002, 大学图书馆学报,谈大学图书馆“学科馆员”制度3.3 “学科馆员”研究热点分析
关键词是作者对文章主要研究内容与方法的概括和精炼,高频关键词通常用于揭示一个研究领域的热点问题。本文将350篇相关文献数据输入至Citespace II软件,网络节点确定为关键词,适当调整阀值,同时将专指度不高的词如“学科馆员”“图书馆”“图书馆员”等无法反映学科馆员研究的具体主题的关键词进行删除,运行得到“学科馆员”研究热点时区分布图谱(图4)和基于研究热点频次的信息表(表3)。图4中每个圆形的节点代表关键词,节点的大小代表该关键词出现的频次,节点越大,表示该关键词出现的频次越多,表明其为学科馆员领域的研究热点。图4“学科馆员”研究热点时区分布图谱
表3“学科馆员”研究热点频次信息表(前10位)
序号频次关键词1122高校图书馆254学科服务335信息服务432学科馆员制度517服务模式序号频次关键词617参考咨询715参考馆员89知识服务97网络环境107数字图书馆从图4和表3可以看出,出现频次最高的词是高校图书馆,出现频次是122次。该词表明高校图书馆是目前进行学科馆员研究最多的单位。高频关键词反映出学科馆员领域的主要热点包括学科服务、信息服务、学科馆员制度、服务模式、参考咨询、参考馆员、知识服务等。这些关键词揭示了国内学科馆员研究重点分别是制度、管理、资源建设、素质要求、服务、合作化。
图5是基于学科馆员研究热点的聚类视图,共生成13个聚类,计算得出聚类内部相似程度的指标Silhouette的均值为0.831,该指标值的范围为0到1,数值越大,相似程度越高。一方面从聚类大小分析:图中最大的聚类是资源建设,其次学科馆员制度、服务质量位列第二和第三位;另一方面从聚类形成时间分析:学科馆员的研究最早从网络环境开始,随后开始进行制度研究,逐步过渡到资源建设及服务模式、服务质量的探讨,随着时间的变迁,到2008年出现“第二代学科馆员”、虚拟研究环境、机构库等新的研究热点。图5学科馆员研究热点聚类视图
3.4 “学科馆员”研究前沿分析
研究前沿是指一组突现的动态概念和潜在的研究问题[13]。Citespace II软件自带的膨胀词探测(burst detection)技术和算法,通过考察词频的时间分布将突现词从大量的主题词中探测出来,并计算出突现率,凭借词频的变动趋势来确定学科馆员研究领域的前沿和趋势。图6即通过运行Citespace II软件得出的学科馆员研究前沿与发展趋势图[14]。图6学科馆员研究前沿与发展趋势图由图6可以看出,主题词变化率较高的词有学科服务、信息服务,这两个突现词的突现率分别为8.93和3.82。说明学科服务和信息服务是近年来学科馆员研究的重要前沿领域。图7和图8分别列出了学科服务和信息服务历年来频次变化情况,从中发现2006年开始对于学科服务的研究逐渐趋热,到2010年达到顶峰,随后逐渐下降;而信息服务属于趋弱型研究前沿,2004年开始信息服务的突现率一直呈下降趋势直至2012年降为0,表明在2002年左右对于学科馆员的工作职责主要以信息服务为主,而随着时代的发展,服务的类型、工作的职责逐渐明晰,而服务也不仅限于信息服务这一个种类。从发展趋势看:1998—2004年国内学科馆员的研究以学科馆员的工作职责、素质要求、信息服务为主;2004—2010年以学科服务、知识服务、学科馆员制度为研究重点;2010—2012年研究前沿则转化为服务模式、资源建设、服务创新。
图7“学科服务”突现词频次曲线
图8“信息服务”突现词频次曲线
4结论
本文通过Citespace II软件对学科馆员领域的机构分布、知识基础、研究热点、研究前沿做了分析与探讨,得到以下结论:
(1)通过对学科馆员研究机构的考察,可知目前在这一领域研究较多的单位主要是图书馆,而且大多为高校图书馆。而其他类型的图书馆如公共图书馆、职业院校图书馆对学科馆员的研究较少。其中贡献力最大、最具影响力的机构是清华大学图书馆,位居第二和第三的分别是南开大学图书馆和中国科学院国家科学图书馆。另外中国科学院文献情报中心也十分重视对学科馆员的研究,位居第四位。
(2)通过对学科馆员知识基础和研究热点聚类分析,当前我国学科馆员的研究主要可以归为8类,分别是合作化、学科资源建设、管理措施、学科馆员制度、馆员素质、服务、分配制度、读者服务。
(3)通过对学科馆员研究前沿和发展趋势分析,我国学科馆员的发展可以归为三个阶段,第一阶段(1998—2004年):研究主要以学科馆员的工作职责、素质要求、信息服务为主;第二阶段(2004—2010年):以学科服务、知识服务、学科馆员制度为研究重点;第三阶段(2010年至今):随着时代与环境的不断变化,在出现了第二代学科馆员、虚拟研究环境、机构库的基础上,学科馆员开始了服务模式、服务创新的研究,同时也注重资源建设和馆际合作化的新趋势。服务既是我国学科馆员的研究前沿也是研究重点,一直贯穿研究始终。
(4)笔者前期做过国外学科馆员的科学计量研究,国外讨论最多的是特殊馆藏,其次侧重于对联系、联络的具体案例研究。国内由于开展学科馆员工作较晚,前期主要是对工作职责、素质要求、管理制度的探讨,目前也开始加强了对于资源建设的研究,因为资源是开展学科馆员工作必不可少的条件,并且各研究机构唯有做到自身资源建设的特色才不会被替代,但是国内对于学科馆员的工作职责之一“联络”的研究较少,对于“联络”的实效也缺乏考评,因此国内在进行一段时间的理论研究基础之上,研究重点应该逐渐向实践研究转变。
[参考文献]
[1] 高雅佳. 关于我国高校图书馆学科馆员服务的研究[D]. 保定:河北大学图书馆学专业,2009.
[2] 李伟基. 2000—2011 年我国图书馆学科馆员研究论文的文献计量统计分析[J]. 图书情报工作,2012(S1):244—246.
[3] 王平南, 杨建, 肖卫雯. 国内学科馆员研究文献的计量分析[J]. 科技情报开发与经济,2007,17(1):34—36.
[4] 王芳. 国内学科馆员研究文献计量分析[J].情报科学,2011,29(2):271—273.