我国云计算在图书馆领域应用研究成果综述∗
——基于CNKI的计量分析
2021-04-09柏艺莹
柏艺莹
(天津社会科学院图书馆,天津300191)
大型计算机于20 世纪80 年代一次巨大变革后,客户端-服务器服务形式也同时出现,云计算技术产生是对于信息技术软件领域又一次重大的创新。大数据时代,云计算的应用激发出信息技术的创新与革命,并对计算机、传媒、通信等现有网络格局产生深刻影响。图书馆作为满足公众知识信息资源获取的重要平台,实现图书馆数字化信息管理以及完善图书馆服务功能,是云计算进入图书馆领域的价值体现。目前,学术界对云计算并没有确切而完整的定义,结合云计算的功能特征,笔者在此处借鉴美国国家标准与技术研究院(NIST)定义:云计算是一种按使用量付费的模式,这种模式提供可用、便捷、按需的网络访问资源,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件及服务),这些资源能够被快速提供,只需投入很少的管理工作或与服务供应商进行很少的交互[1]。云计算应用于图书馆服务过程中,对图书馆服务模式产生较大影响[2],相关主题领域研究成果较为丰富,并且有学者开展持续性研究,而大数据环境驱动下,云计算在图书馆领域的应用研究成为了学术界关注的焦点之一。因此,借助文献计量学分析方法对其研究现状进行探究,具有重要的理论意义和实际价值。笔者以近10年该主题相关的文献资源为对象进行分析与梳理,明晰该主题领域的研究现状,总结归纳研究热点,探究主题领域发展趋势,以期对我国有关云计算在图书馆领域实际应用提供理论指导。
1 数据收集与分析方法
笔者以《中国学术期刊全文数据库》(CNKI)收录的云计算技术在图书馆应用的相关研究成果为研究对象,借助Excel、UCINET、SATI 及可视化分析软件Net draw,遵循科学严谨的研究思路,进行定性与定量融合的研究,从而对近11 年我国有关云计算在图书馆领域的应用研究进行计量分析。首先对该领域总体分布特征即论文分布时间、学科、高产机构和基金资助等4个方面进行阐述[3];其次是从论文高频作者的合著现象即核心作者群分布、核心作者合著现象、整体网络密度3 方面进行分析;接着对高频关键词的耦合关系即高频关键词群分布、耦合现象、中心性分析、小团体性分析4个角度进行述评;最后结合数据分析提出建议。
文献样本是通过对CNKI 文献数据库进行高级检索,选择了文献目录中“信息科技”范围内的“图书情报与数字图书馆”,并以“云计算”AND“图书馆”为检索式,进行关键词检索,数据检索时间段为2009(2009 年是关注该领域最早文献刊发时间)至2020 年,检索具体时间是2020 年6 月15日。按照以上条件进行检索共获得相关文献594篇,为了进一步提升检索效度,结合人工筛选,去除会议通知、战略协议、资料不完整等文献以及去重筛选后,总共获得有效数据文献548篇。
2 文献总体分布分析
2.1 文献年代分布
某一领域特定时间内,文献发表数量以及变化情况反映出该领域研究规模、发展速度、受关注程度以及预测未来的发展趋势[4]。笔者根据548篇文献的发表时间进行统计分析,制出文献年度分布情况表(表1)和折线统计图(图1)。经过数据分析可以看出,该领域研究的总体发文量呈现增长的趋势,于2012年达到关注的最高峰,单年发文量达到近九年的16.91%。同时,2012 年也是该领域关注的分割点,2009年到2012年是成长期,每年都会有相对于前年更大的增长,从而也反映出该领域受关注度的范围的扩大;2012 年至2017 年进入了稳定期。在云计算发展的大事记中2008年1月出现了世界上的第一个服务应用、IBM成立大华区云计算中心、Google公司推出彻底融入云计算时代的Google Chrome 浏览器以及亚马逊、微软陆续开展的云计算服务,增强了各界学者对于云计算的关注;2009年以后云计算服务平台、操作系统的陆续问世,进一步推动了云计算在各领域的应用以及创新,也引起了学者对此研究的关注,研究成果达到相对较高的年增长量[5]。其中,2020年虽然只有上半年的数据,但是以说明学界对该选题研究的持续关注。
表1 文献发表年度分布情况
图1 文献发表年度分布情况
表2 文献发表关联学科分布
2.2 文献学科领域分布
同一主题文献研究在不同学科领域会有不同的研究倾向以及研究深度,对于文献学科领域归属研究,可以分析出主题研究主要应用的领域,即该主题应用的广泛性,同时也可以分析出该主题研究应用影响最大的学科领域,可以为未来各界研究机构的研究方向提供一定的引导。
数据统计分析主要是按照统计数据由大到小的顺序进行数据排列,如表2所示。在前期进行检索时,是对文献分类里面的图书情报与数字图书馆进行检索,所有筛选的文章都涉及图书情报与数字图书馆学科。而计算机软件与计算机应用、法学、政治、信息通信、科学学与科技管理等学科分别占88.50%、2.37%、0.36%、0.36%和0.18%,由此说明云计算在图书情报与数字图书馆的应用研究,更多融合计算机软件与计算机应用学科领域的知识,同时尝试从法学、政治、信息通信及科学学与科技管理等学科视角切入,开展云计算在图书馆的应用研究,一定程度上也反映了有关云计算研究涉及学科分布的广泛性,同时揭示了云计算研究过程中的学科交叉性。
2.3 高产期刊分布
某一主题领域论文期刊结构分布的情况,可以分析出该主题领域的核心期刊,为后期深入研究提供参考依据[4]。
表3 高产期刊分布表
表4 我国主要基金资助分布
根据有关云计算在图书馆领域应用研究发表的期刊以及期刊本身属性,可以分析出文献研究侧重点以及反映出该领域研究热点所在学科领域。笔者将文献数量在9 篇以上的期刊进行汇总并制成表3,依据期刊内容不同将期刊进行分类。由此可知,有关该主题研究的期刊涉及到的学科主要包括:科技信息、图书馆学、情报学、档案学、电子科技、科技与经济等。云计算在图书馆领域的应用研究,不仅关系云计算与图书馆两个主题领域,还涉及信息技术以及与图书馆相关学科的研究,即云计算在图书馆领域应用研究是借助多学科知识开展的,同时借助多学科期刊进行传播交流。信息技术与电子科技方面的研究更多是从技术层面上研究如何进一步提供升提供理论研究支撑,而图书馆相关学科领域的研究则是为云计算在图书馆领域更好地应用提供各种可能性研究。同时,结合高产期刊分布表可以看出,对于某一特定主题研究,并不能仅仅局限于该领域的期刊,还要注意关联学科期刊的研究成果发布,从而能够更加全面地把握有关该主题的研究现状以及进展。
2.4 基金资助分布
科研基金资助分布情况反映出该领域研究的质量与层次,同时也反映出该领域研究受重视程度。采用EXCEL对548篇文献资源的基金资助情况进行统计,共计42 篇文献受到基金资助,约占7.66%,国家级基金约占5.29%,地方省级基金资助约占2.37%。
结合以上数据分析,可以看出来对于该主题的研究整体需要进一步关注和支持。现有的支持是以国家级基金为主,地方级科学基金支持为辅。在宏观的引导下,各省市级有关机构的支持力度将成为推动该主题领域长期可持续发展的重要外在驱动力,也是更好发挥云计算技术在大数据时代作用,更好地促进云计算在图书馆领域应用的关键。
3 高产作者合著现象分析
3.1 核心作者群分布
核心作者群的分布情况可以看出研究该主题学者的心态倾向分布,在对该主题进行研究时,是倾向于热点追捧,还是长期的学术研究。
表5 作者发文情况统计
表6 核心作者发文情况分布
根据表5数据统计,548篇有效文献中,文献作者共501人,其中467人发表1篇,占所有作者总数的93.21%。根据洛特卡定律,1篇论文作者比重应在60.79%进行浮动,该领域内计量得出数据与经典学科参考值相距甚大[6],表明近11年间我国云计算在图书馆领域应用研究存在某一时段研究过热的现象。此外,文献发表1 至两篇的作者达到494人,占有效文献作者总数的98.60%,反映出云计算在图书馆领域应用研究的核心作者较为集中,大部分学者对于该领域研究很大程度上是出于对学术热点的追捧,不能进行深入长期的研究分析。与此同时,从表6 核心作者分布情况,可以看出该领域研究的学科的代表人物,如:李卉、黎春兰、王红、秦珂等。
根据普赖斯定律M≈0.749· N max ,其中M是核心作者的最低发文值,Nmax 是最高产的作者发文量,本研究中Nmax 为4 篇,计算得出M(M 约为1.498)取临近最大整数值两篇,因此发文量大于等于两篇的作者可初步列入核心作者候选群(见表6)。在我国云计算在图书馆领域的应用研究领域中,核心作者有37 位,占所有作者总数的7.39%,核心作者的发文总数共计86 篇,占有效文献的15.69%,并未占到全部发文量的半数。
3.2 核心作者合著现象分析
在特定领域内核心作者合著现象,不仅可以直接反映出该领域内作者之间相互合作的关系,还能反映出与核心作者持有相同或相近观点的作者分布情况。
笔者借助Ucinet 软件生成合著者关系网络图(见图2)。每一个小方块都代表着一位作者。作者发文的数量可以借助方块的大小进行表示,方块之间连线的粗细程度反映出关联作者之间的合作次数,合著频率越高,合著作者之间的连线会越粗。从图2 可以出来,保留了合著作者,同时里面包含核心作者,连线权重相对大的,是节点作者发表期刊较少或合著较少。
从图2整体上看,作者合著网络呈现局部联通特征,较多的文献作者处于游离状态。构成交流圈的文献作者通常是长期关注该主题领域发展的小群体,游离状态的文献作者呈现两种情况,一种是初次关注该主题领域,一种是多次发文,但是相互间沟通较少。以上现象在一定程度上反映了两个方面的问题:第一,该主题领域的学术知识交流范围相对较小,宏观整体交流不够活跃。第二,大部分学者处于对于该主题领域的热点关注状态,不利于该主题领域的快速发展。
图2 作者合著关系网络
3.3 整体网络密度分析
整体网络密度的数值越大,对行动者影响越大,不仅为个体提供社会资源也成为限制个体发展的重要力量。利用Ucinet 社会网络分析软件进行network——cohesion 内聚——density 流程操作[8],获得整体网络密度分析结果见表7。
表7 作者合作网络密度
表8 部分高频关键词统计表
根据图2 分析结果可知,在2009 年至2020 年之间,关于云计算在图书馆应用研究领域的作者合著整体网络密度为0.0017,网络中关系的标准差为0.0354,由此可知整体网络结构较为疏松,即学者行为产生影响较小,相互间交流较少,网络关系本身对于该领域学者之间的影响也不显著。以上现象表明在未来一段时间内,云计算在图书馆领域的研究与应用存在较大的发展空间以及需要学者持续关注、沟通交流与合作。
4 高频关键词耦合现象分析
4.1 高频关键词群分布
关键词主要是反映文献的核心内容、主要服务、基本特色等特征,笔者通过对高频关键词进行统计分析,进而对一定时期内该领域的研究重点进行明确以及识别该领域研究热点[9]。
根据数据统计结果分析,在548 篇有效文献中,关键词按照频次出现的高低顺序进行排序,最后选定出现频次不小于7 次的关键词作为分析对象,截取部分分布情况表见表8。
从表8可以看出,“云计算”出现517次。大数据时代背景下,云计算技术在图书馆不同的领域均可嵌入应用。根据高频关键词统计可以将关键词分为:第一类,反映该领域发展背景的关键词,例如“大数据”“物联网”“虚拟化”等;第二类,反映云计算作用图书馆类型,比如“数字图书馆”“移动图书馆”(频次为1)、“图书馆联盟”(频次为3)等;第三类,反映在该领域的实际运用,比如“云服务”“云存储”“信息安全”等;第四类,反映出云计算作用下图书馆长期的发展方向,比如“服务模式”“服务创新”“信息资源建设”等。这些关键词反映出云计算在图书馆领域应用的空间以及方式,即云计算与图书馆的契合点,在一定程度上也反映了该领域未来发展方向以及值得关注的焦点。
4.2 高频关键词耦合现象分析
关键词耦合现象,是对一定范围内高频关键词的聚类关系的描述,在学术界可以运用该关系推断对应范围内研究主题的热点与前沿[10]。笔者利用SATI 对有效文献的关键词进行提取,并生成关键词矩阵,将矩阵数据导入Ucinet 软件,利用NetDraw 绘制关键词耦合关系网络图(见图3),在网络图中关键词的节点用方形表示,形状的大小代表在网络中的作用大小。节点之间用实线进行连接,实线越粗细表示关系的紧与密。笔者将从中心性和小团体两个角度对云计算在图书馆应用研究领域的高频关键词耦合关系进行分析。
图3 关键词共现知识图谱
从图3 中,可以看出“云计算”“图书馆”“大数据”“云计算技术”“信息技术”“虚拟化”“互联网”“服务”“发展模式”等分词之间的连线较粗,其中“云计算”与“图书馆”之间距离最近,而云计算相关的技术和功能,在图书馆服务中逐步融合应用,由此说明云计算在图书馆领域应用的可行性、多样性,很好地促进计算机应用与图书馆信息资源的连接[7]。大数据、数字化背景下,已有的文献研究成果更多地关注数字图书馆建设与开发以及数据安全等方面。
4.3 中心性分析
4.3.1 点的度数中心度
点的度数中心度指的是在一个社会网络中,与某成员直接发生联系的其他成员的点数,又分绝对中心度(Degree)和相对中心度(NrmDegree),后者是前者的标准形式[8]。对此网络进行点的度数中心度分析,结果见表9。Out Degree 指关键词发出关系的点数,即主体关键词主动联系的关键词数量,InDegree 指关键词接受关系的点数,即主体关键词被联系的数量。NrmOutDeg、NrmInDeg分别是这两者的标准值。由于数据量较大,表9以InDegree 列为关键值降序排列,省略了部分数据。由表9 可知,关键词之间的联系是相互对称的,是同步的相互引用。
4.3.2 点的中间中心度
点的中间中心度衡量的是某关键词控制网络中其他关键词之间联系的能力,它既依靠关键词与邻接关键词之间的直接关系,还取决于关键词与网络中所有其他关键词之间的关系[8]。前者关注关键词的活动,后者关注对关键词的控制。也就是说在其他成员之间是否发挥“桥梁”作用以及作用的程度。表10中Betweenness指中间中心度。
从分析结果可以看出,中间中心度最高的是“云计算”“图书馆”“大数据”“信息服务”等关键词,说明这些关键词处于控制交往关系的权力地位,也就是说在该领域发挥着重要作用以及该领域的研究热点主要是集中在这几个方面。
点的度数中心度与点的中间中心度分析结果表明,有关云计算主题的研究关注点相对集中,一方面集中性研究有助于关注点的深入研究,另一方面也表明在未来的研究中可以进行拓展性研究,增加研究的关注点,完善并拓展云计算的研究领域。
4.3.3 小团体分析
社会结构是在社会行动者之间实存或潜在的关系模式,凝聚子群是一个行动者集合,在此集合中,“行动者之间具有相对较强、直接、紧密、经常的或者积极的关系”[8]。凝聚子群研究则是从某种社会结构中找出凝聚子群。笔者从小团体节度分析,即K-丛分析和节点距离分析进行计量。
表9 关键词网络:点的度数中心度
表10 关键词网络:点的中间中心度
图4 关键词聚类分析结果(部分)
K-丛分析是一种凝聚子群分析,首先将子群从整体网络中分离出来,通过了解子群对集群的影响来分析节点之间的紧密程度[8]。笔者令K 值取2,构建2-丛分析,共找到3824 个2-丛(详见图5)。结合K-丛的概念,2-丛的规模为n 时,则每个因子就至少与n-2 个其他因子有直接的联系。所有的2-丛中,规模最大的是7,也就是至少与5个关键词曾有共现关系。但从整体来看,大部分2-丛规模是4,即大部分关键词产生共现的现象,只是和两个关键词有关,说明网络共现关系的范围一般。
5 促进我国云计算研究繁荣的措施
基于上述研究,笔者得出以下结论:2009 至2020 年间,我国有关该主题领域的学术研究快速形成规模,但需要持续关注与深度研究;在大数据背景下研究的热点突出,符合时下信息技术发展的趋势以及图书馆数字化建设过程中未来的发展走向,期待有更多不同领域的学者持续关注该主题领域的发展,进行创新研究以及合作交流。为促进我国云计算研究繁荣笔者建议采取以下措施:
5.1 形成研究小团体,保持研究热度
研究小团体的形成,是研究主题走向成熟的一种外在特征。同时,研究主题的深入也需要借助稳定的小团体,开展持续性、延伸性的研究。我国云计算在图书馆领域的应用研究,对图书馆建设实践产生了深刻的影响,但是伴随背景环境的弱化或者新形势背景的产生,对于其在特定领域的研究就会很大程度上被削弱。如何弱化外在客观条件的影响作用,是保持云计算在图书馆领域研究占据较为稳固地位的核心问题。而小团体的形成,一方面表示有部分研究者对于特定主题的相关研究形成了较为一致的研究观点或者看法;另一方面小团体会有更高的概率,保持对该领域研究的持续性和系统性,有利于该主题领域研究能够得到深化,并始终维持一定的研究热度,以此促进该领域研究的成熟与发展。
5.2 拓展经费来源,提升研究力度
云计算在图书馆领域的应用研究,虽然较多成果倾向于理论研究,但是伴随研究的深入,对于具体的实操性研究的需求会逐渐增加,由此需要较大的经费支撑。“巧妇难为无米之炊。”理论研究尚且可以借助已有的文献典籍,所需的经费资源相比较工科实验类学科较少,但是云计算在图书馆领域的研究应用,伴随研究的深入,一些相关的基础设备的应用具有必然性。根据“资金资助分布”情况分析,现有经费来源是以国家级基金为主、地方级科学基金支持为辅,各省市地方或者院校机构单位,在一定程度给予经费方面的支持是保障该领域研究持续深入的重要支撑。根据“高频关键词耦合现象分析”分析结果可知,云计算在图书馆领域的应用研究,主要与“信息服务”“大数据”“云服务”“大数据”“物联网”“虚拟化”相关,并推动着“数字图书馆”“移动图书馆”“图书馆联盟”等新形态的成长与发展,与此同时催生了图书馆领域的“云服务”“云存储”“信息安全”等方面的问题,研究领域及视角的拓展,丰富着该领域的研究内容,同时也表达了该领域对于相关经费支持的较大的研究需求。
5.3 多学科融合借鉴,丰富研究内容
正如社会的发展需要综合型人才,云计算在图书馆领域的应用研究,同时并非是单一的应用操作,而是需要借鉴融合多个学科领域的知识,开展跨学科的研究,以丰富该领域的研究内容,沉淀该主题的研究思想。在以上研究中发现该主题研究涉及到的学科主要包括:科技信息、图书馆学、情报学、档案学、电子科技、科技与经济等。由此可知,对于云计算在图书馆领域的应用研究,不同领域的研究学者,借助自身不同的专业背景,结合自身的专业素养,利用专业知识,开展丰富理论的研究,并拓展技术层面研究工作。比如,云计算在图书馆领域的应用研究,有关服务、信息存储、信息安全等的研究,是云计算作用下图书馆长期的发展方向及拓展深化的方向,云计算在图书馆领域的应用研究必将大大丰富图书馆学研究的内容和视野。
5.4 紧跟时代发展,延伸研究主题
不管是“云计算”“云计算技术”“信息技术”“虚拟化”,还是“互联网”“大数据”,在图书馆服务深化创新的过程中,需要紧跟时代需求,并以读者需求为导向,进行云计算在图书馆领域应用的创新性、可行性、多样性的研究和升级。由此,在大数据、数字化背景下,需要在已有文献研究的基础上,融合时代特征,关注云计算应用背景下图书馆数字化建设与开发以及数据安全等方面的研究。同时关注新的时代环境及新的服务形式下,相配套的图书馆治理模式和治理体系研究与构建。对于云计算在图书馆领域的研究形成全面配套的研究框架及体系,同时注重该领域的理论研究与实证研究的相结合,以此丰富云计算在图书馆领域研究的内容,促进云计算在图书馆领域研究的繁荣,在保证与时俱进的同时,延伸该主题领域研究的深度,并拓展其广度。