APP下载

我国智慧图书馆研究热点分析与趋势预测*

2020-06-10盛东方

图书馆论坛 2020年6期
关键词:词频智慧图书馆

王 雨, 盛东方, 王 铮

0 引言

大数据、物联网、云计算、人工智能、虚拟现实等信息技术蓬勃发展,为智慧图书馆构建注入了动力。智慧图书馆是数字图书馆和复合图书馆发展理念与实践的延续、整合与升华,是图书馆创新发展的新模式[1]。“智慧图书馆”这一新理念首先在欧美付诸实践,2001年前后加拿大渥太华率先建立名为“Smart Library”的图书馆联盟,这是国外关于智慧图书馆的最早实践[2]。2003年AITTOLA等发表《智慧图书馆:基于位置感知的移动图书馆服务》,拉开了西方研究智慧图书馆的序幕[3]。我国首次对智慧图书馆进行论述的学者是严栋,论述内容为物联网技术对智慧图书馆构建的深远影响[4]。之后智慧图书馆研究逐渐成为国内图书馆界关注的热点。为精准把握国内智慧图书馆建设的研究热点及前沿趋势,本文通过共词分析、战略坐标图、灰色预测等方法对2001-2018年我国智慧图书馆领域的理论研究文献进行全面梳理,总结已取得的学术成果,跟踪发展动向,挖掘生长点,为该领域发展提供借鉴。

1 研究方法

1.1 数据获取与预处理

以中国知网学术文献总库为数据源,为保证数据量的完整型,采用多个不同的检索策略进行文献题录的获取。策略为:“主题=图书馆AND全文=智慧服务”OR“主题=智慧服务AND 关键词=图书馆”OR“主题=图书馆AND关键词=智慧化”OR“主题=智慧图书馆AND 全文=智慧服务”OR“主题=图书馆服务AND 关键词=智慧”OR“主题=智慧图书馆AND 关键词=服务”;所有检索式中的发表时间均为“2010.01.01-2018.12.31”。

首先,利用NoteExpress软件对检索得到的文献题录进行预处理,包括去除重复题录,删除会议、学位论文、报纸等类型文献,得到1,603篇文献。其次,统计1,603条题录信息中关键词的词频量,合并意思相同的关键词,筛选出词频量前25 的关键词,将其作为高频关键词。然后,使用BibExcel软件对高频关键词进行共现分析,得到共现相似矩阵。为减少0值个数对聚类结果造成的影响,将相似矩阵转换为相异矩阵。

1.2 分析框架

为全面展现我国智慧图书馆研究主题的热点及趋势,本文利用图1所示的体系框架对预处理之后的题录数据进行分析与预测。首先,利用SPSS绘制关键词共现聚类谱系图,通过聚类分析发现关键词之间的亲疏关系,挖掘潜在的有用知识。利用可视化工具VOSviewer绘制关键词共现网络图谱,以图谱方式直观呈现热点关键词,反映近年来该领域的前沿研究。然后,结合参考文献对聚类结果所代表的研究主题进行详细分析。其次,对得到的主题类团采用GM(1,1)模型进行词频量、向心度、密度三指标的定量预测,基于2010-2020年的指标值绘制战略坐标图,从时间维度展现智慧图书馆领域研究热点主题的演变以及未来两年的发展走势[5]。

图1 主题领域分析体系框架

图2 高频关键词聚类谱系图

2 主题领域研究热点分布

2.1 关键词聚类分析

运用SPSS对相异矩阵采用系统聚类、沃德连接、平方Eucilidean距离、Z-score标准化等方法进行聚类分析,根据聚类结果,可将高频关键词划分为4类,见图2。

经聚类得到谱系图后,对各主题类团进行命名。为保证命名的客观性,引入“粘合力”指标来衡量关键词对类团的贡献程度,贡献度的大小决定着关键词是否居于类团的核心地位。粘合力是用该词与该类团下的其他主题(关键)词在同篇文献中的共现频率的平均值计算而得[6],其符号定义如下:对于包含n个主题词的类团,其中主题词Ai(i≤n)对于Bj来说Ai的粘合力N(Ai)为:

通过计算可得到:物联网、大数据、智慧图书馆、读者服务与信息服务分别居于核心地位,对聚类成团的贡献程度最大。因此,分别将四大类团命名为“智慧信息技术类”“大数据与智慧服务类”“图书馆类”“读者信息服务类”,见表1。

2.2 关键词共现知识图谱

基于可视化软件VOSviewer构建关键词共现网络及密度图(见图3),相同颜色的标签归为一类,标签大小表示词频量大小。聚类结果与SPSS得到的结果略有差异,但关键词“智慧图书馆”“图书馆”“智慧服务”依然是研究热点。图3中,颜色越“暖”意味着关键词受关注度越高,从图中明显看出“智慧图书馆”“智慧服务”“图书馆”“大数据”等词是近9 年的研究热点。

2.3 研究热点主题内容分析

(1)智慧信息技术类将物联网、RFID、云计算等当下主流信息技术融入智慧图书馆,使图书馆更具智慧化。近年将信息技术与智慧图书馆构建相融合的研究引起学者的关注。蒋玲探讨RFID技术在图书馆书刊流通、图书定位、图书盘点、智能防盗、存储信息等方面的应用, 肯定RFID技术对提高图书馆服务水平的意义[7]。沈奎林等设计超高频RFID智慧图书馆管理平台系统架构,实现图书自助借还、定位、盘点,读者自助查询以及感知走廊、智能书架、安全门禁等应用[8]。王茜等将大数据、云计算、可视化等技术与智慧图书馆相结合,提出智慧图书馆系统平台建设及应用的方案[9]。董同强等从空间功能和结构设计入手,以大数据、云计算、人工智能等新技术作为支撑,提出智慧型学科服务空间的功能框架体系[10]。

表1 高频关键词粘合力统计表

图3 关键词共现网络及密度图

(2)大数据与智慧服务类是基于用户的大数据来分析用户的信息行为,从而为用户提供精细化、个性化的智慧服务,因此,大数据分析技术在图书馆服务中的应用(即提供智慧服务)逐渐成为学者关注的热点。高颖指出大数据背景下高校馆智慧服务建设面临的主要是平台技术、数字信息资源等问题,建议建设大数据服务平台,推进大数据应用,优化智能系统管理[11]。徐潇洁等搭建基于数据管理的智慧服务框架,指出智慧图书馆应在数据管理基础上挖掘需求并提供决策支撑,主动提供创新服务[12]。陈臣构建基于大数据挖掘与知识发现的图书馆智慧服务体系,为读者提供个性化智慧阅读服务[13]。

(3)图书馆类的核心关键词是智慧图书馆,它是大数据和数字图书馆相融合的必然产物,是图书馆发展的新方向[14]。近年来智慧图书馆研究一直是热点,“智慧服务”在图书馆建设中的应用越来越多。郑怿昕等综述国内外智慧图书馆研究现状,认为全球范围内关于智慧图书馆的认识日益清晰、实践逐步深入,但国内的应用与推广较为缓慢[15]。潘雪等构建基于泛在网络环境的公共图书馆智慧服务模式,指出图书馆在提供智慧服务时应该智慧化感知用户信息需求、智慧化提供特色信息服务、智慧化存贮整合信息资源[16]。

(4)读者信息服务类凸显读者服务中的信息及知识服务。根据用户特定需求,以知识和信息开发为手段,为用户提供增值信息、特定信息成为图书情报机构信息服务的主要内容。这一领域国内已有大量研究。赵蓉英等提出大数据环境下的知识管理框架模型——聚识成智,实现数据-知识-智慧的转变,有利于知识服务、智慧服务的开展[17]。陈臣等从读者个性化阅读角度,提出图书馆可以从读者相关大数据中精准感知用户的阅读需求与行为,实现图书馆个性化服务内容的精准推送与资源均等化分配,同时保护智慧阅读中读者的隐私[18]。洪亮等构建了大数据驱动的图书馆智慧信息服务体系,将图书馆的设备、资源、服务和用户融合,通过数据挖掘技术,向用户提供高效智能化、精准个性化的智慧信息服务[19]。曾子明等构建了智慧图书馆个性化知识推荐服务体系,探讨智慧推荐服务的保障模式[20]。钱蔚蔚等对图书馆信息服务的用户体验进行实证研究,提出图书馆网站应该加强传统信息服务、优化服务流程、强化有效沟通、挖掘个性特征、提供更高级的知识服务[21-22]。

3 主题领域研究趋势预测分析

3.1 基于GM(1,1)的类团定量预测

灰色模型可以解决“小样本、贫信息”问题[23]。在使用模型之前需要通过计算数列“级比”的方法(公式2)检测模型的稳健性及准确性是否达到标准。如果λ(k)能够落入到(间,则可以使用GM(1,1)进行预测。

利用Matlab软件对数据进行检验,发现后5年数据的级比能落入灰色模型的范围内。因此,可以使用GM(1,1)模型进行未来两年词频量的预测。据图4可知,未来两年四大类团词频量都会有不同程度的增长,智慧信息技术类、大数据与智慧服务类、读者信息服务类涨幅明显,预示着智慧图书馆的发展将更加依赖信息技术的发展,智慧图书馆所提供的服务将会更加智慧化、创新化。

3.2 基于战略坐标图的类团定性预测

图4 GM(1,1)预测词频量的导出图

上一部分针对高频关键词进行聚类分析,通过计算词与词之间的距离划分出四大类团。这些类团只显示关键词之间的相似程度,却无法揭示其内部的核心概念以及彼此间的关系。所以,仅仅统计类团词频量并不能很好地预测智慧图书馆这一研究主题未来的变化情况。笔者通过分析类团内外部的研究情况对研究主题做出相应解释。衡量类团内部关键词联系强度的一个重要指标是密度指标,它与粘合力指标有着密切的联系。本文采用赵蓉英等给出的公式进行密度指标D的计算[24],公式如下:

与密度指标相似,衡量类团间联系程度的指标是向心度。向心度越大表征该类团在该领域越趋于中心化。本文采用邵作运等给出的公式来计算四大类团的向心度[25],公式如下:

其中,Eij为关键词间的共现次数,n为这一类团中包含的关键词个数,N为所有高频关键词的数目,φs指一个类团,φ指研究领域的整体。

根据上述公式,分别计算各类团2010-2018 年的向心度及密度。同样,利用GM(1,1)模型对这两个指标数据进行检验与预测,得到2019年和2020 年的预测数据。取所有年份的向心度、密度的均值作为坐标原点,以词频量来衡量类团的 规模, 构建2010-2020 年四大类团的战略坐标 图( 见 图5,P44)。

从总体角度分析,每一类团的词频量都呈现逐年增加的趋势,表明智慧图书馆研究逐渐引起国内学者的广泛关注,未来这一主题仍将是研究热点。从具体角度分析,得到如下结论:

(1)智慧信息技术类在2010-2018年间经历了由第三象限过渡到第二象限最终到达第四象限的演变过程(即由第一阶段依次向第三阶段过渡,图中圆点的颜色由浅及深表征着年份由小到大,下同)。这表明在起步阶段时,类团处于研究的边缘,并未引起足够重视,但有很大的发展空间;由第一阶段过渡至第二阶段过程中,密度陡增,表明该类团内部关键词之间联系紧密。顾名思义,RFID 技术是物联网技术的核心感知应用,将云计算超强的“大存储”“快计算”功能与物联网特有的“与网互联”技术相结合,逐渐引起越来越多国内学者的关注。由第二阶段过渡至第三阶段时,向心度值逐渐增大,说明该类团与其他类团之间的联系开始密切。比如,云计算、物联网、RFID技术开始逐渐被应用到智慧图书馆的构建中,增强了智慧信息技术类与图书馆类的联系。根据预测结果可知,未来两年,该主题的词频量会继续增加,标志着这一主题仍是研究的热点;而且该类团主要位于第四象限,具有较低的密度值,但拥有较高的向心度值,表明信息技术在智慧图书馆的构建、智慧服务的供给等方面仍具有巨大潜力。所以,信息技术在智慧图书馆构建中的应用仍是未来学者们关注的重点。笔者认为,未来智慧图书馆除广泛应用RFID技术外,还可以将新兴的Beacon、NFC等技术应用在书籍定位等方面,节省用户查找书刊的时间。另外,尝试将数字人文引入图书馆构建中,利用OCR、VR/AR、可视化技术、机器学习等信息技术对人文社科领域的信息资源进行加工整合,以便更好地开展学科服务,提高用户满意度。

图5 2010-2020年四大类团战略坐标图

(2)大数据与智慧服务类在2010-2018年间大致经历了由第三象限过渡到第一象限最终到达第四象限的演变过程。第一阶段为起步阶段,内部结构松散,与其他类团的联系也不紧密。这一阶段类团的演变与“大数据”概念的提出、发展有着密切的联系。2011 年麦肯锡首次提出“大数据”概念,但只限于概念层面对海量数据的描述,并未应用于实践中,所以该类团发展并不成熟。第二阶段向心度、密度的值都较高,这说明类团内部之间以及与其他类团之间的联系都很紧密,是该时期比较活跃的主题[26]。这可能一是由于2014 年大数据首次出现在政府工作报告中,对大数据的关注已上升至国家战略层面,国内学者开始不断尝试大数据的应用实践,所以此阶段该类团逐渐趋于核心位置;二是2015 年是用户画像研究开始快速发展的时期,大数据是用户画像的数据基础,数字图书馆是用户画像的主要应用领域[26],数字图书馆借助用户画像这一桥梁,充分开发大数据,以提供更加精准、智慧的服务,由此带动该类团的发展。第三阶段密度值降低,向心度值增大,表明该主题与其他主题的联系日益密切,如“大数据”时代下的“智慧图书馆”构建得到迅猛发展。在智慧图书馆中,感知信息、用户信息、图书信息的存储与处理等都是基于大数据的,由此体现出“大数据与智慧服务类”与“图书馆类”联系密切。根据预测结果,未来两年,该类团的向心度、密度都有所下降,说明其内部以及外部的联系均趋于松散。但是,笔者认为“大数据”“数字图书馆”“智慧服务”仍然是未来图书馆建设的重点问题,随着数据挖掘技术的日趋成熟,基于用户行为数据的分析将会带动图书馆服务模式的创新。比如,在智慧图书馆的构建过程中,基于读者基本信息、借阅记录、跨平台的日志记录构建用户画像,了解用户偏好,从而进行阅读推广。此外,高校图书馆可以借助大数据分析技术、可视化技术等开展学科服务,以用户需求为导向,对海量资源进行数据挖掘、整合、分析及可视化呈现。同时,可运用大数据技术将各个高校图书馆的文献资源以联盟形式进行数字化开发与长期保存,鼓励跨学科合作,促进知识的开放获取。

(3)图书馆类在2010-2018年间大致经历了由第三象限过渡到第一象限的演变过程,即类团的结构由松散渐趋于成熟。顾名思义,对图书馆的研究一直以来是图书情报领域的热点研究内容。从2010年国内首次提出“智慧图书馆”的概念以来,新兴信息技术逐渐被应用于图书馆的建设中,这为智慧图书馆提供了新的契机,促进了智慧图书馆的发展,所以图书馆类与智慧信息技术类间的联系密切。此外,智慧图书馆的构建也是传统图书馆及公共图书馆朝“智慧”方向转型的产物,三者是密不可分的。根据预测结果,未来两年该类团的词频量、向心度、密度都在逐年增长,表明图书馆类具有良好的发展势头,对图书馆的研究依旧是学者们关注的焦点。其中,社区图书馆将是未来智慧图书馆的重要生长点,因为社区图书馆是公共图书馆服务的延伸,更贴近用户生活。社区图书馆的服务不再局限于文献资源的借阅,而是提供能集文化、知识、人文、娱乐于一体的、促进人际互动的物理场所[27]。

(4)读者信息服务类在2010-2018年间的密度、向心度、词频量大致呈现上升趋势,表明类团内部及其与其他类团间的联系都趋于密切。笔者认为,这源于图书馆“读者第一,服务至上”的服务宗旨。该类团中包含的“读者服务”“信息服务”“个性化服务”“知识服务”存在交叉关系,当中,知识服务是信息服务的深化,是在充分挖掘用户需求的基础上,从显、隐性资源中提炼用户所需的相关知识,提供知识服务。所以,知识服务的提供需要数据挖掘技术的支持,使得读者信息服务类与智慧信息技术类之间的联系紧密。根据预测结果,未来两年这一主题的发展会更趋于成熟。笔者认为,图书馆服务始终是智慧图书馆构建的核心问题,通过技术手段勾勒用户画像为用户提供个性化服务,以及基于用户的科研需求提供精准学科服务都将是未来智慧图书馆建设的重点内容。此外,提供知识服务的途径也要有所扩大,如采用针对数字人文项目的“3D虚拟展示”、利用新媒体进行知识推广,以及图书馆与书店、出版社、数据库商等展开跨界融合,促进知识的传播[28]。

4 结语

本研究基于文献计量方法,从主题领域对关键词进行聚类及可视化分析,突出现阶段智慧图书馆领域的研究热点;利用灰色模型特有的对小样本进行预测的优势,对未来两年4个类团的词频量、向心度、密度等指标进行定量预测;通过绘制战略坐标图,直观呈现各类团发展趋势。本文得到以下结论:(1)这一主题领域的研究热点主要集中在技术层面与服务层面,诸如RFID、物联网、云计算、大数据等新一代信息技术的飞速发展带动智慧图书馆的建设向更加智能的方向发展,而为读者提供个性化服务、信息服务、知识服务等是智慧图书馆建设的目标;(2)“图书馆类”及“读者信息服务类”的研究会走向成熟,表明未来图书馆的转型、智慧图书馆的建设与服务等将是国内学者关注的重点,而为读者提供更加人性化、智能化、信息化的服务仍是该领域研究的活跃主题。但是,本研究仅选取了中文数据库,对外文文献并未涉及,无法对比国内外在这一领域的差距。另外,CNKI数据库导出的文献题录无法对文献共被引、作者共被引等进行探讨,因此对这一主题领域的分析还有所欠缺。

猜你喜欢

词频智慧图书馆
基于词频比的改进Jaccard系数文本相似度计算
词汇习得中的词频效应研究
图书馆
词频,一部隐秘的历史
有智慧的羊
去图书馆
汉语音节累积词频对同音字听觉词汇表征的激活作用*
智慧派
智慧决定成败
智慧往前冲,统计百分百(1)