基于SPSS知识地图的国内高校图书馆学科信息服务研究热点探析
2014-01-13李杏丽
●李杏丽
(河北联合大学图书馆,河北唐山063009)
基于SPSS知识地图的国内高校图书馆学科信息服务研究热点探析
●李杏丽
(河北联合大学图书馆,河北唐山063009)
学科信息服务;知识地图法;可视化;高校图书馆
以CNKⅠ数据库收录的国内高校图书馆学科信息服务研究论文为基础,采用知识地图法绘制国内高校图书馆学科信息服务研究的知识地图,据此对国内高校图书馆学科信息服务研究热点进行可视化分析,以期为国内高校图书馆学科信息服务研究与实践提供有价值的参考信息。
1 引言
所谓学科信息服务,就是指信息服务机构针对学科用户需求,按照科学研究(例如学科、专业、项目等)而不再是按照文献工作流程来组织信息服务工作,它主要是通过学科馆员来进行的、系统的、面向用户的信息服务。[1]
多年来,国内高校图书馆学科信息服务研究取得了丰硕成果。笔者尝试以CNKⅠ数据库中相关期刊论文为基础,采用知识地图法绘制1983~2012年30年间图书馆学科信息服务研究的知识图谱,据此对国内高校图书馆学科信息服务研究进行可视化分析,以揭示该领域的发展现状与研究热点,这对于促进我国高校图书馆学科信息服务研究与实践均具有重要意义。
2 方法与材料
2.1 知识地图法
知识地图起源于地理领域的地图,最早由英国情报学家布鲁克斯(B C Brookes)提出,是一种新兴的信息可视化研究方法。通过分析文献的逻辑内容,找到相互关联、相互影响、能够引起人们创造和思考的知识点并将其联系在一起,构成知识地图,进而通过知识地图揭示知识的有机结构。本文所指的SPSS(Statistical Package for the Social Sciences)知识地图,是指以学科信息服务研究论文为研究对象,以SPSS为工具绘制的以论文高频关键词为结点的可视化多维尺度分析图,[2]该知识地图可以清晰地描绘学科信息服务研究的主题结构,揭示国内高校图书馆学科信息服务的研究热点。
2.2 数据获取
以CNKⅠ数据库为数据源,以“学科信息服务”、“学科化信息服务”、“学科化服务”、“学科服务”、“学科馆员”、“定题服务”和“高校图书馆”为关键词,检索国内高校图书馆学科信息服务研究论文。时间范围:对论文的起始年代不作限定,截至时间为2012年,共获得相关论文2082篇。
提取上述2082篇论文的关键词,利用Excel表进行词频统计,得到不同关键词数为1975个,其累计频次为7712次。由于关键词标注的不规范性,在统计时对关键词作如下处理:(1)合并同义不同名的关键词,如“图书馆员”、“图书馆工作人员”、“馆员”等;(2)去除一些无益于主题研究的关键词,如“发展”、“对策”、“进展”等。将所有关键词按照出现频次的高低排序,并截取阈值≥20的24个关键词作为高频词(见表1)。这些高频词累计频次为3351次,占所有关键词累计频次的43.45%。一般而言,累计频次大于40%以上就能代表本学科研究的热点。因此,对这24个关键词进行分析能揭示国内高校图书馆学科信息服务的研究热点。
表1 Top24高频关键词类目频次表
2.3 数据预处理
适应多元统计分析对数据的要求,在绘制SPSS知识地图前,需要对数据进行预处理。(1)建立共词矩阵。将上述24个关键词两两配对,统计它们在论文中共现的频次,形成24·24的共词矩阵(见表2)。矩阵中各行与列交叉处的数值为关键词的共词强度。(2)构造相似矩阵。知识地图中显示的不是共词次数,而是通过点与点之间距离的远近显示各关键词之间的关联程度。因此,利用Ochiia系数,将上述共词矩阵转化为相似矩阵,其方法是将共词矩阵中的每个数据值都除以与之相关的两个词总频次开方的乘积(矩阵图略)。(3)构造相异矩阵。从技术层面而言,进行多维尺度分析的模型一般采用是差异性数据。为此,用1与全部相似矩阵上的数据相减,得到表示两词间相异程度的相异矩阵(矩阵图略)。
表2 高频关键词共词矩阵(局部)
2.4 数据统计处理
分别将相似矩阵导入SPSS作聚类分析与因子分析,初步判断各主题词之间的联系强度及其所应提取的公因子个数。图l显示,聚类分析将24个关键词之间的实际距离按比例调整到0~25的范围内,用逐级连线的方式连接性质相近的样本或新类,直至所有关键词并为一类,越早被聚为一类的关键词之间的关联越紧密,而类的大小直接反映这个主题的集中程度和学者对它们的关注程度。一般来说,理论性强、研究方向指导性强以及较受重视的研究领域会形成较大的类。聚类龙骨图以类团的形式,清晰地揭示了学科信息服务研究的知识结构。但是,聚类成团的关键词是由相互间的密切程度而聚集在一起的,所应划分的类团数目仍无法明确判断,为此,需结合因子分析的结论。
图1 聚类分析结果——龙骨图
在因子分析中,“特征值大于1的因子应被保留,特征值小于1的因子应被舍弃”[3]。因子分析结果显示,前8个因子的特征值λ>1,其累计方差贡献率为70.079%。一般而言,累计方差贡献率达到60%以上就能满足分析的需要。前7个因子累计方差贡献率为63.369%,也就是说将24个关键词分为7类,就解释了总体信息的60%以上。为此,提取7个因子,即将图l中的24个关键词聚类数确定为7类比较适宜。
3 SPSS知识地图绘制与解读
在确定了聚类的个数和基本范围后,接下来通过SPSS中的多维尺度分析(Analyze Scale Multimensional Scaling),绘制出国内高校图书馆学科信息服务的多维尺度分析图;然后根据聚类分析和因子分析得出的结果,按照7因子要素,将24个关键词按照图1的聚类,绘制出国内高校图书馆学科信息服务的知识地图(见图2)。具体而言,该图的绘制分两步进行:第一步,利用SPSS绘制多维尺度分析图;第二步,根据关键词聚类过程、聚类分析与因子分析的结论划分结点区域。
图2学科信息服务研究知识地图
图2 所示的封闭曲线将24个高频关键词结点划分为A-G七大区域。与聚类树状图相比,SPSS知识地图利用平面距离展示出关键词之间的亲疏关系,词的位置显示了词的相似性,高度相似的词聚集在一起,形成一个类团,越在中间的词,表示越核心。下面结合图3,对我国高校图书馆学科信息服务研究热点进行解读。
(1)类团A:基于学科用户需求的学科馆员服务研究。包括k1、k3、k4、k7等关键词。学科馆员服务是学科信息服务发展的最初形态。1998年清华大学图书馆学科馆员制度的建立,引发了业界广泛的响应和实践热潮。截至目前,学科馆员服务已成为高校图书馆开展的一种比较普遍的服务模式。伴随着这一过程,关于学科馆员的学术研究也获得了迅速发展。表现在一是论文数量多,在学科信息服务论文中占半数以上;二是研究内容丰富,既包括理论研究,又包括实践探讨。诸如对学科馆员概念涵义、发展沿革、工作内容、管理制度、实施途径、服务模式、质量评价、工作考核及队伍建设等都进行了系统、深入的研究。[4,5]
(2)类团B:学科信息服务主要内容研究。包括k5、k8-k10、k12-k14等关键词。学科信息服务内容丰富,既包括学科馆员与用户之间的沟通联络、学科信息资源的宣传推介、信息资源检索与传递、用户教育与培训、参考咨询服务、定题服务、检索查新服务、信息服务等基础服务;又包括基于用户信息需求的个性化信息服务,为重点建设学科、重点科研项目提供的嵌入式服务、知识服务以及学科进展评价、学科情报研究等深层次服务。[6]学科信息服务的主要内容是我国高校图书馆学科信息服务研究与实践的核心。
(3)类团C:学科信息资源建设研究。包括k22、k23等关键词。学科信息用户需要的信息资源是与自身学科研究领域密切相关,具有一定深度的、前沿的、高学术价值的信息资源,即面窄但纵深度较高的相对集中的学科信息资源。丰富的、专业化的学科信息资源是学科信息服务实施的基础与保障,然而目前我国大多数高校图书馆的学科信息资源保障能力较为薄弱,学科信息资源的专业化程度低,缺乏特色,对电子资源和馆藏资源的整合不够,这都严重影响了学科信息服务的开展。基于此,很多研究者都敏锐地把握了学科信息资源保障能力不足这一学科信息服务的“短板”,不仅从理论上论述了学科信息资源建设的概念含义、重要性、建设理念、宗旨与原则等,而且结合实际,从文献采访、特色馆藏建设、学科资源配置与整合、数字图书馆建设等方面提出了操作性强的学科信息资源建设措施与基本模式。[1,7]
(4)类团D:学科信息共享空间服务研究。包括k11、k16、k24等关键词。学科信息共享空间是一种融合了信息共享空间与学科化服务的双重优势,以解决用户实际问题为最终目标而建立的专业化、个性化的增值服务模式。由于该服务模式具有适应现代科研人员学习和研究的特点,因此日益呈现出迅速发展的势头。在该领域,目前的研究主要包括两大方面:一是理论探讨,主要包括概念、构建模型以及评价等方面;另一方面是应用研究,着眼点集中于学科信息共享空间的构建过程、构建模式、服务与组织管理模式等。此外,随着学科信息共享空间的发展,相关的案例分析研究也日益增多。
(5)类团E:网络环境下学科用户教育与培训研究,学科信息门户研究。包括k6、k15、k18-k19、k21等关键词。在用户教育与培训方面,目前研究的着眼点主要集中在用户需求调研,用户教育与培训的原则、目标、内容、方法与技巧,信息素质教育课程及其平台建设、用户教育与培训的质量与效果评价等方面。
学科信息门户最早是由英国的电子图书馆计划提出的。我国对学科信息门户研究可以归纳为两个方面:一方面是学科信息门户的泛论性研究,包括学科信息门户的概念、特点、历史发展,国外发展情况介绍等;另一方面是学科信息门户的建设研究。这是研讨的重点,主要包括标准规范与体系建设、合作问题、整合与互操作、构建模式、技术问题、资源建设、服务评价研究等。可以预见,作为一种新的网络信息资源组织和服务模式,学科信息门户仍将是今后相当长时期内高校图书馆研究与实践的重点。
(6)类团F:学科博客研究。学科博客是图书馆学科服务与博客平台技术相结合的产物。清华大学图书馆于2007年10月建立了国内最早的新闻传播学科博客。其后,上海交通大学图书馆、上海师范大学教育学院、北京大学学科服务博客群也纷纷建立。学科博客为图书馆学科馆员的深层次服务和科研实践提供了一个崭新的、具有生命力的学科服务新模式。然而,由于学科博客建立的时间尚短,因此,无论在学科博客服务实践,还是在学术研究方面都处于初步探索阶段。目前的研究主要集中在学科博客概念、类型与特点,发展现状、问题与对策及建设技术等方面。
(7)类团G:数字图书馆型学科信息服务模式研究。随着信息技术和网络技术的发展,学科信息服务形成了许多网络化、数字化服务模式,如学科仓储、网络资源导航、虚拟参考咨询、虚拟学术社区等。这种网络服务平台进一步与数字图书馆等系统相整合,逐渐形成了数字图书馆型学科信息服务模式。目前该领域的研究主要集中于国内外服务模式的比较研究、数字图书馆个性化信息服务研究等方面。
[1]张召琪.高校学科化信息服务创新机制研究[J].图书馆理论与实践,2010(8):69-72.
[2]陈立娜.知识管理中企业知识地图的绘制[J].图书情报工作,2003(8):58-60,78.
[3]张文彤.SPSSⅡ统计分析教程[M].北京:北京希望电子出版社,2002:123.
[4]谭浩娟.“学科馆员”概念解析及其角色定位[J].湖北教育学院学报,2006(6):134-135.
[5]张怀绥.“学科馆员”制度研究[J].西华师范大学学报(哲学社会科学版),2005(6):158-161.
[6]叶丹.高校图书馆学科化服务研究——以合肥市高校图书馆学科化服务为例[D].安徽:安徽大学,2010.
[7]施必青,等.网络环境下高校学科文献资源保障体系建设思考——以浙江林学院图书馆的实践为例[J].情报探索,2010(3):63-65.
G252.8
A
1005-8214(2014)01-0038-03
李杏丽(1979-),女,硕士,河北联合大学图书馆馆员,研究方向:信息资源管理。
2013-03-06[责任编辑]徐娜
本文系2012年河北联合大学科研基金项目“基于科研创新需求的高校图书馆学科信息服务策略研究”(项目编号:S201210)中期成果之一。