基于文献计量学的大连图书馆历年科研活动多元统计分析
2020-08-12刘彧菲
刘彧菲
(大连图书馆,辽宁 大连116012)
1 引言
随着图书馆事业的蓬勃发展以及社会生活的变化,如今图书馆已经从简单的借阅服务走向智慧化、数据化的智能服务,全国图书馆界都在致力于加强培养科研队伍,使图书馆尽快转型为集服务、科研于一体的现代图书馆。因此,运用科学的分析方法,审视图书馆的历来科研发展历程,有助于总结图书馆科研道路的过去、预测未来的发展趋势。
笔者基于大连图书馆自1984 年以来发表于CNKI 的论文,采用文献计量学的方法对文献增长的规律、期刊、作者的分布情况,以及研究热点的变化进行深入分析,以此来判断大连图书馆的科研情况,为其未来的发展提供理论依据。
2 数据获取与研究方法
2.1 数据获取
笔者以中国知网“中国学术期刊(网络版)”为数据来源,基于对科研活动能力水平的考虑,将文献搜索策略规定为:只以期刊发表文献为搜索和研究对象。考虑实际发表过程中单位名称的使用情况,分别以“大连图书馆”和“大连市图书馆”两组检索词在专业检索功能中进行检索,共检索获得323 篇文献记录,经过文献除重后,获得317 篇文献作为本研究的数据集[1]。(检索日期为2018 年12月31日,选取范围为1984年至搜索日期的所有文献)
2.2 研究方法
文献计量法是以定量分析为出发点,以信息的外部特征为研究对象,形成了包括文献增长与文献老化规律、三大定律及引文分析3部分内容的体系,在多学科领域有着广泛的应用[2]。笔者运用文献计量分析工具Bibexcel、Citespace 对研究文献进行文本挖掘,再采用SPSS22.0及Excel 等相关软件对挖掘文本进行统计学分析,融合知识图谱、文本挖掘与计量分析的知识理论,运用可视化的表现方式来揭示大连图书馆学科研究的进展情况[3]。
3 文献计量分析
3.1 文献增长规律及分布情况分析
科学文献是反映客观主体在某学科领域中科研成果和知识体量的重要依据,通过对机构各年代所发表论文的数据挖掘进行统计分析,可以获取其随时间发生变化的规律,并可根据拟合曲线预判未来科研文献的增长趋势[2]。笔者分析了大连图书馆1984—2018年共32年间所发表的317篇文献的增长变化规律,平均每年发文量为9.90篇。对时间分布情况进一步分析,可以得出:
(1)大连图书馆的学术科研活动始于1984年,从整体来看1984年后的文献发表数量呈阶段性波动并整体上升趋势。从图1可以看出,其变化阶段基本可以分为4 个阶段:第一阶段为1984—1993年,文献发表数量先增长后下降,10年间共发表47篇文献,年均发表4.7篇,占总发表文献的14.83%,其中1985 年为0 篇,1984 和1993 年各为1 篇。第二阶段为1994—2001 年,文献发表数量同样为先增长后下降,8 年间共计发表57 篇,年均发表7.25篇,占总发表文献的17.98%,实际每年发表文献均在5 篇以上。第三阶段为2002—2010 年,整体进入文献数量高发时期,9年间共计发表文献106篇,年均发表11.77 篇,占总发表文献的33.44%,从实际发表情况来看,这一阶段每年的文献发表数量都在5 篇以上,其中2002 和2007 年文献发表量最高,分别是20篇和18篇。第四阶段为2011—2018年,仍然是呈先上升后下降的趋势,8 年间共计发表文献106 篇,年均发表13 篇,占总发表文献的33.44%,从实际发表情况来看,除2017 年为5 篇外,其余年份都在7篇以上,且2013和2014年达到历史年发表最高峰,分别是25篇和20篇。
从以上分析可以看出,大连图书馆的学术科研活动在32 年间呈现出了阶段性波动、整体大幅上涨的趋势,近8年(2011—2018)的年均文献发表数量是最初10年(1984—1993)的2.26倍。这种增长态势与进入21世纪后图书馆大力引进高学历人才、制度激励科研、增强科研能力队伍建设密不可分。由此可以判断,在未来相当长的时期内仍然可能持续这种“阶段波动,总体上升”的科研发展趋势。
图1 1984—2018年大连图书馆发文数量变化
(2)大连图书馆在1984—2018 年期间的文献累积量可通过曲线(图2 和表1)Y=0.1717x2-677.42x+668330 进行拟合,其R2值为0.9972,说明实际文献累积量变化曲线与拟合曲线吻合度极高。这有助于我们预测图书馆科研总量的发展趋势,表明未来图书馆的科研活动文献发表数量的累积将按照曲线预测趋势发展,保持长期稳定的增长。
图2 1984—2018年期间文献累积量变化及拟合曲线
(3)从图3的文献增长率变化情况同样可以看出,大连图书馆的科研活动并非一直保持稳定的增长速率,而是阶段性的加速增长,基本以10年为一个周期变化。如从1984年开始只有1篇发表文献到1994年实现了第一次加速增长,从1995年到2002年实现了第二次加速增长,从2003年到2013年实现了第三次加速增长,在每个周期的中间年份均出现多次负增长,从2014年至2018年仍然在经历着阶段性的增长率波动。据此可推测出2019年图书馆的文献数量将仍会持续上升,但上升幅度不大。
表1 1984—2018年大连图书馆年发文量统计
续表1
图3 1984—2018年文献增长率变化
3.2 载文期刊分布情况分析
分析机构科研工作者文献发布的期刊分布情况,可以在一定程度上了解科研人员学术研究的水平,学术偏好及领域研究深度等信息。通常所发布期刊的优先等级也代表着论文质量的等级,是衡量学术水平非常有用的标准[4]。笔者所统计的大连图书馆32年间发表的317篇论文总计发布在94种期刊中,刊均载文量为3.37篇,单刊载文量超过3 篇的共18 种。表2 罗列了单刊载文超过3篇的期刊名录,其中核心期刊包括5 种,刊载文献23 篇,占全部期刊载文量的7.3%。317 篇文献中核心期刊载文量为33 篇,发表在13 种核心期刊上,占全部期刊载文量的10.41%。在所有期刊中《图书馆学刊》载文量最高,共刊载110 篇文献,占全部期刊载文量的34.7%。
从数据来看,大连图书馆科研人员文献发布更倾向于省内省级刊物《图书馆学刊》,占据了全部发表文献总量的1/3,这与大连图书馆所处的地缘性质有关,并且与东北、辽宁地区图书馆学术进展程度、关注领域具有相似性有关。此外,在前10位高载文量的期刊中只有两种是核心期刊,分别是《图书馆学研究》和《图书馆杂志》,各刊载了7篇文献,其余期刊均为省级刊物。由此看来,大连图书馆的学术研究水平与质量有待于进一步提高,这要求图书馆从科研团队、科研管理制度、激励机制等多个方面加强业务能力建设,为科研人员创造良好的研究氛围,快速提升研究水平与研究能力。
表2 1984—2018年载文超过3篇的期刊载文量统计(由高到低)
表3 1984—2018年核心期刊载文量统计(由高到低)
3.3 文献作者分布情况分析
对大连图书馆历年发表文献的作者进行统计分析,了解作者的分布情况,有助于掌握图书馆的科研现状、研究人才队伍及学科领头人。通过调研数据得出,大连图书馆1984—2018 年期间共有113 位研究人员发表了学术文献,表4 列举了文献发表5篇以上作者的统计数据,作者姓名用编号代替。这部分作者称之为相对高产作者,共有17位,占全部作者总人数的15.04%,发表文献总量为147篇,占全部发表文献的46.37%。从职称分布来看,这17位高产作者中副高以上职称占比88.24%,其中正高职称9 人、副高职称6 人。从年龄分布来看,17 位作者中有4 人已退休,50 岁以上9 人,40-50 岁的有3 人。从学历分布来看,17 位作者中有研究生学历6 人、本科学历11 人。从职务分布来看,曾担任或仍担任相应领导职务的作者分别有副馆长(副处级)3 人、主任(正科级)5 人、副主任(副科级)4人,占全部高产作者的70.59%。
以上数据说明,大连图书馆的学术高产作者相对于所有发表文献作者总数而言占比不高,在这一方面反映了图书馆的整体学术氛围还不够浓厚,另一方面反映了具有高水平学术研究能力的馆员还是相对少数。对高产作者所作的人群分布画像可看出,高产作者的学历水平都较高,在业务工作中多数担任管理岗位重要职责,并且年龄层偏高,基本上都是具有20 年以上工作经验的老馆员。这种情况的发生与我国事业单位管理体制及职称制度有着重要的联系,工作年限的增加及职称评审制度的需要,能够合理有效地解释年长老馆员在文献发表总量上占优的现象。但是也要清楚地看到,未来图书馆的学术科研更要围绕国家、城市发展的核心热点,学术研究将成为图书馆提升自身价值的一个必然路径。历来图书馆给人的印象只是提供以借阅为主的基础服务,要从深层次改变这种图书馆不擅研究的印象,还应充分调动起馆员的研究热情和营造学术氛围,使馆员能够基于业务需要开展各项研究,通过有效的激励机制和管理手段,调动起年轻馆员的研究热情,才能快速地提升图书馆的整体科研能力,以便能够为读者、为政府、为企业以及更复杂的读者需求提供深层次的服务。
表4 文献发表5篇以上作者统计
3.4 高频关键词统计分析
关键词是作者从文献中摘录整理的最能表达文章核心内容的词汇。对所有发表文献的关键词进行提取,并通过多元统计分析,能够揭示出在一定时期内图书馆研究热点、研究领域的变化情况,并为未来的学术研究提供研究方向指引[5]。由于文献发表作者对关键词的界定标准不完全一致,在进行高频关键词统计前要对关键词进行预处理,主要处理以下几方面:①将表述不同但实际为同一涵义的词汇进行合并。前文涉及的部分需要调整合并的词汇有“市图书馆与大连市图书馆”“图书馆员、图书馆工作者与图书馆工作人员”“信息服务与参考咨询”“图书馆事业与图书馆事业发展”“数字图书馆与数字化图书馆”“服务创新与创新服务”“电子资源与数据库资源”等;②去除与研究主题相关性极低的词汇,如“启示”“途径”“分析”等;③由于笔者主要针对大连图书馆的发表文献进行研究,本机构中所有发表文献内容均与图书馆有关,因此去掉“图书馆”这一高频关键词,对研究结果将没有太大影响;④对文献关键词进行系统梳理,由于早期发表文献在关键词的使用上不甚规范,导致某些文献关键词过于繁锁且不能清晰反映文献核心内容,需要对具体文献研究后进行调整。
通过对数据集文献关键词提取后,共得到1008 条关键词条目,共计频次为1493 次。调整后选取频次大于等于5 的关键词作为高频词汇研究对象,得到如表5所示,共计39条高频关键词。在后续分析中,采用了层次聚类和多维尺度分析对高频关键词进行多元统计分析,以从多角度来对大连图书馆的研究领域和研究热点进行深度分析。
根据周秋菊[6]在2015 年专门对常见矩阵处理方法进行的讨论,比较了SPSS 中使用3 种方法对矩阵进行聚类和多维尺度分析的思路,得出了正确的通过SPSS 分析矩阵的方法,即先对原始出现矩阵聚类再进行多维尺度分析[7]。如此便避免了错误地使用标准化后的共现矩阵进行分析,可以得出较为真实的计算结果。笔者采用了这一分析思路对高频关键词进行了聚类分析和多维尺度分析。
表5 频次大于5的高频关键词
续表5
3.4.1 层次聚类分析
聚类分析是在分类的过程中从样本数据出发,自动进行分类的一种探索性分析,使用不同的方法会得到不同的结论。而不同的研究者对同一组数据进行聚类分析,所得到的结果也未必一致[8]。
在层次聚类分析的聚类方法和度量标准的选择上,经过比较分析,选择了“Between groups link⁃age”配合“Squared Euclidean distance”的方法对高频关键词的出现矩阵进行聚类,得到树形图4。根据层次聚类树状图,大连图书馆历年来的学术研究可分为6 个大类。第一类研究主题关键词有7个,出现频次总计为86次,占所有关键词总频次的6.88%,主要关键词有互联网网络环境、竞争情况与科技情报、满铁大连图书馆、图书馆馆员、计算机编目与著录、藏书建设、古籍修复和保护。第二类研究主题关键词有4个,出现频次总计为26次,占所有关键词总频次的2.08%,主要关键词有档案、数字化建设、情报信息服务、编目工作。第三类研究主题关键词有9个,出现频次总计为61次,占所有关键词总频次的4.88%,主要关键词有大谷文库、传统文化、购书经费、电子借阅、日本殖民统治、古籍、满洲、明清小说研究、创新服务。第四类研究主题关键词有5个,出现频次总计为43次,占所有关键词总频次的3.44%,主要关键词有书目数据、图书馆事业、数字图书馆、参考咨询、读者服务。第五类研究主题关键词有3个,出现频次总计为15 次,占所有关键词总频次的1.2%,主要关键词有资源共享、图书馆学、经济。第六类研究主题关键词有4个,出现频次总计为32次,占所有关键词总频次的2.56%,主要关键词有阅读推广馆员、日本、信息服务。
图4 高频关键词聚类分析树状图
3.4.2 相似度结构分析
相似度结构分析,即通常所说的“多维尺度法”,是将多维空间的研究对象简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据,并以空间图的方式用最少的维数最佳拟合输出数据的一种分析方法[9]。不同关键词在空间中的距离远近显示了其相似性的高低,通常关键词之间的距离越近则表明两者关联性越强,高度相似的关键词聚集在一起,形成学科研究的热点[10]。
在相似度结构分析过程中,笔者选择了MDS的PROXSCAL 模块进行多维尺度分析,结合聚类分析的结果,绘制得到了大连图书馆科研重点研究领域的知识图谱(图5)。
图5 高频关键词多维尺度分析
4 研究热点分析
对1984年以来大连图书馆发表的科研论文所进行的聚类分析和相似度结构分析得出的分析图,揭示了大连图书馆历年来的研究热点变化与发展历程,在以下几个领域中有着较为持续且稳定的研究,并反映出随着时代进步研究领域的更新变化。
(1)情报信息服务研究,关键词主要集中在第一象限。该领域的研究主题反映出了图书馆信息服务的服务手段从简到繁、服务内容从浅到深的变化历程。从过去到现在,图书馆的信息服务经历了剪报、印刷信息、电子化信息、互联网信息的演进过程。从最初的收集、整理信息,到利用现代科技手段(如电子邮件、官方网站、公众号等渠道)进行主动推送信息,进而演变为对广泛信息的提纯、去粗取精并深入分析。大连图书馆信息服务工作在几十年中顺应时代变革,不断的改变研究方向,深化业务、提升服务层次,通过论文发表的内容变化体现了出来,例如对竞争情报、科技情报的研究命题就是对参考咨询与信息服务的不断延伸。
(2)馆藏建设研究,关键词主要集中在第二、三象限。该领域的研究主题反映出图书馆馆藏建设由基础文献建设走向互联网产生后的数字化建设。最初的馆藏建设研究只围绕文献编目、馆藏管理等基础领域展开,随着互联网的发展,大连图书馆的服务与研究领域不仅仅局限于纸质馆藏文献的管理与研究,而更加重视与互联网结合的数字化馆藏建设,以及基于互联网的创新读者服务。
(3)特殊馆藏研究,主要围绕满铁资料和明清小说,关键词主要集中在第一、三象限。基于大连图书馆拥有全国75%藏量的满铁资料馆藏,对于这部分资料的研究由来已久,并取得了不错的研究成果。在不断持续深入进行满铁资料研究的同时,更加注重古籍的修复和保存工作。
(4)围绕读者服务工作、馆藏书目、传统文化创新服务的研究,关键词主要集中在第三象限。随着国家现代化建设进程的不断提速,图书馆的各项工作都在寻求不断的突破与发展,大连图书馆在读者服务、馆藏书目方面都做出了积极的创新,开拓图书馆事业,积极创新阅读推广工作,并在传统文化的创新服务研究中有了较为突出的表现,积累出经验,开展相关研究。
(5)基于传统的参考咨询业务研究,研究内容向深层次智库型研究转变,关键词主要集中在第四象限。从最初的简单业务咨询不断发展,结合高学历人才的培养和丰富的业务实践,带动科研能力的提升,逐步形成具有一定研究能力的信息咨询馆员队伍,并通过研究能力的提升进一步扩展图书馆的研究型服务领域,逐步向研究型图书馆转变。
5 结语
笔者采集了1984 年至2018 年期间大连图书馆发表文献的数据,利用文献计量学的多元分析方法,总结出大连图书馆研究热点的变化和发展过程。总体来看,研究水平与发刊水平正随着时间的推移不断得到提升,研究领域也越来越广泛,这与图书馆业务的精细化要求和不断改进息息相关。从科研产出角度看,总的论文产出量和质量均不高,说明图书馆在注重业务建设的同时,并未着重于馆员科研能力的开发,这将是未来图书馆建设中需要着重加强的领域,尤其应加强在核心期刊的论文发表能力。笔者仅进行了单一图书馆科研产出的纵向研究,未能将大连图书馆与业内同级别其他图书馆在同时期的科研产出进行横向比较研究,留待日后进一步深入探讨,以便更好地反映出在同等时期内大连图书馆与其他图书馆科研能力相比的强弱情况。