大数据环境下国内图书馆服务研究热点及发展趋势
2019-03-18贾玉文黄小淋王康
贾玉文 黄小淋 王康
摘 要大数据已经驱动图书馆服务在各方面创新,利用Bicomb、SPSS、Ucinet软件对大数据环境下图书馆服务相关研究成果进行可视化分析并予以解读。研究发现大数据环境下国内图书馆服务研究关注于信息服务、知识服务、个性化服务、学科服务、智慧服务五大方面。同时,高校学科移动服务整合微服务、数字图书馆数据服务与人文服务、机器学习式智慧图书馆服务、图书馆服务中隐私保护的研究有望成为后续研究重点。
关键词大数据 图书馆服务 知识图谱 可视化分析
分类号G250.7
大数据的兴起与发展,使得许多学科的研究都建立在其背景下或是与其融合,例如:教育 、管理、经济、图书馆等领域[1]。其中,图书馆与大数据融合的研究与实践正进行的如火如荼,在大数据环境下,图书馆服务也面临新的机遇和挑战。以数据为基础的个性化服务,能够有效的促进知识的融合及发现,为用户带来更为周到、创新的体验,但同时,由于海量、异构的多元数据,也使得图书馆陷入冗余的非结构化数据中,对数据分析、挖掘的深度也提出了更高的要求。在此环境下,如何将大数据思维有效的运用到图书馆服务新的发展方向中,成为图书馆专业亟待解决的任务。基于这一背景,国内学者对大数据环境下的图书馆服务已做了大量的研究,因此,本文拟借助共词分析法、层次聚类法、多维尺度分析法和社会网络分析法对近年来的研究成果进行梳理,探究大数据背景下,图书馆服务的研究趋向,以期为后续研究提供参考。
- 数据收集与研究
- 数据来源
研究选用中国知网(CNKI)为基础数据来源,以“大数据”并含“图书馆”并含“服务”为主题词进行检索,时间跨度选择为不限,共得到1648篇文献,数据下载日期为12月21日。为保证主题信度,剔除通知、新闻报道等非研究型文献后,获得1556条记录。 1.2 研究工具与方法
(1)Bicomb2.0:Bicomb是一种书目共现分析分析系统,本文利用Bicomb2.0进行关键词词频的统计,及词篇矩阵的生成,为后续利用SPSS进行聚类分析作数据来源。
(2)SPSS20.0:SPSS即社会科学统计软件包,是应用最广泛的专业数据分析软件之一。利用SPSS20.0进行关键词的层次聚类分析,并生成可视化树图;导入相异矩阵,进行多维尺度分析,以期借助可视化的方式更清楚地展现各关键词间的关系。
(3)Ucinet6.0:Ucinet是一種社会化网络分析方法的应用软件,利用Ucinet及可视化绘图软件Netdraw,生成社会关系可视化知识图谱,以求直观的显示社会网络中各节点之间的复杂强度关系。
研究的主要过程与结果分析
2.1 样本的文献计量情况
通过对1556篇文献进行统计,显示2006-2011年该领域发文量只有3篇(见图1),而2012年后文献数量开始逐渐增多,这是由于2012年,奥巴马政府公布的“大数据研发计划” [2],使得国外大数据的研究正式步入轨道,国内也相应开展起大数据方面的探究。由图1可见从2013年起文献开始大量增长,尤其2016年,发文量达到最高点,但2017年有所下降,比2016年减少125篇,一方面,由于检索时还并未到2017年底,因此文献数量并不是2017年全部文献;另一方面,由图1可以看出,该研究领域的发文量已经经过了缓慢增长的初始阶段、指数增长阶段、线性增长阶段,由此,我们推测2017年开始,该研究领域文献数量进入缓慢增长阶段。
利用BICOMB2抽取作者及作者单位字段,显示发文作者共有2145人,涉及单位1321个。出于严谨性考虑,将作者字段的抽取仅考虑为“第一作者”,并设定15为频次阈值,显示高频发文作者2人,分别为马晓亭、陈臣,发文量都为19篇,其中马晓亭在所发的相关文献在CSSCI期刊中有9篇,陈臣为10篇(见表1),两人均来自兰州商学院。由此可见,该单位对于大数据环境下图书馆服务的研究关注度较高。
2.2 关键词抽取与共现矩阵生成
关键词是能代表文章主题思想的词,并且是检索文章的重要依据之一[3],可以客观的反映某一学科的发展情况。借助BICOMB2抽取获得关键词1939个,累计出现频次6130次。为了结果的精确性,将频次阈值设定为12,并且合并相似关键词,例如:高校图书馆与高校,合并为高校图书馆,这是由于原检索词已包含图书馆,因此可认为“高校”即代表高校图书馆;大数据与大数据时代、大数据环境合并为大数据;并去除对策、挑战、展望等概括性,对研究无显著作用的词汇;不合并“服务创新”与“创新服务”,这是由于“创新服务”与“策略”、“平台”等词进行连接,组成例如“创新服务策略研究”的主题,这是“服务创新”所不能完全涵盖的。
从表2可以看出,除研究主题本身所带的大数据、图书馆关键词以外,研究主要集中在高校图书馆、信息服务、数字图书馆、知识服务、数据挖掘以及个性化服务等方面。其次,微服务、数据服务也是主要的研究对象。这些数据初步表明,大数据环境下图书馆在服务上更加重视信息、知识、数据服务,并且追求服务方式的创新,将个性化服务作为重点研究方向。
为进一步研究关键词之间的关系,本文还借助BICOMB2矩阵生成功能,生成关键词词篇矩阵并导出矩阵至TXT,然后利用SPSS20.0中的Ochiai系数方法,将矩阵转换成“37*37”的近似性矩阵。为真正揭示关键词的内在联系,将近似性矩阵转换为相异矩阵(即用1减去近似矩阵系数),矩阵中的数值越接近于0,表明关键词间距离越近,相异度越低,反之表明相异度越高(见表3)。
2.3 关键词聚类分析
为确定当前已有文献的研究热点,利用SPSS将关键词词篇矩阵进行聚类,选用组间链接聚类方法,基于Euclideam距离判断关键词的亲疏关系, 由此生成关键词聚类树图,如图2所示,分为A-J共10类,具体分布情况如表4所示。
通过聚类分析,并结合相关专业知识,对比分析后认为大数据环境下图书馆服务集中在:A:知识服务与个性化服务;B:数字图书馆创新服务;C:数据挖掘与服务;D:智慧图书馆智慧服务研究;E:嵌入式服务;F:微服务;G:用户服务质量;H:公共图书馆的读者服务;I:阅读推广服务;J:移动图书馆的建设及服务。
2.4 多维尺度分析
多维尺度分析法是一种将原始样本简化到低维度空间进行分析、重新归类,但仍保持对象间原始关系的数据分析方法。该图谱能够直观的以平面距离的形式展示关键词之间的亲疏关系,利于判断某研究主题在学科中的位置。将相异矩阵导入SPSS22.0,利用度量中的多维尺度分析(ALSCAL),以序数值作为测度指标,生成如图3所示的知识图谱。结果显示RSQ=0.73>0.6,因此该拟合度能够可靠的反映关键词的关联状态。
根据可视化图谱,将其分为4个较为紧凑的类团。在战略坐标中,其横轴表示向心度,代表领域间的影响强度;纵轴表示密度,代表某一领域内部的联系强度。依照战略坐标的解读规则[4],领域1数据服务、个性化服务及服务创新位于第一象限,其主题关联度最高,处于研究的中心地位,并且与其他领域的研究也有较为密切的联系;领域2的智慧服务处于第二象限,其主题结构比较松散,研究尚不成熟,有待进一步发展,具有潜在的发展趋势;领域3的嵌入式服务及阅读推广服务位于第三象限,其内部链接紧密,且已形成了一定的研究规模;领域4、领域5的学科服务与服务模式横跨第三、第四象限,研究尚不成熟,是整个领域的边缘主题,有待于进一步发展,或与其他领域融合。
2.5 社会网络分析
聚类分析与多维尺度分析都未能很好的展现关键词间联系的强度,因此,利用Ucinet分析由Bicomb生成的关键词共现矩阵,并通过可视化分析软件Netdraw绘制社会网络分析知识图谱(见图4)。社会网络中节点大小表示其中心度的大小,与其在网络中的地位成正比;连线代表社会网络行动者(本文为关键词)间的联系,连线的粗细,表示两对关键词出现频次的高低。可以看出处于网络中心地位的是:高校图书馆、信息服务、知识服务、数字图书馆。
社会网络分析法借助中心性测定社会网络中拥有较大“权力”的行动者,判定一个行动者是否与多个行动者有直接的联系,如果存在则认为该者处于网络的中心地位。中心性分为:点度中心性、接近中心性、中间中心性三种形式。点度中心性用社会网络中与其他成员有直接联系的点数来衡量,点的数目越多,则越处于网络的核心地位,但它只考虑到行动者的自身交易能力,没有考虑到能否控制他者;接近中心性是对某点在多大程度上不受他人控制的测度,借助一点与其它所有节点的距离之和进行测量,距离越小,则越是网络的核心;中间中心性研究一个行动者多大程度上居于其他两个行动者之间,其程度作为测量其是否处于网络核心的指标,属于一种“控制能力”指数。利用Ucinet 进行三种中心性分析(结果详见表5),结果基本一致,即大数据环境下图书馆服务侧重于高校图书馆服务、信息服务、知识服务、数字图书馆服务、服务创新、个性化服务的研究。
3 研究热点分析
依据文献计量、聚类分析、多维尺度分析以及社会网络分析提取的结果来看,大数据环境下图书馆服务的研究主要集中在:信息服务、知识服务、个性化服务、学科服务、智慧服务五个方面。
3.1 信息服務
大数据环境下图书馆的信息服务研究包括基础理论研究与技术理论探讨两个方面。
信息服务是图书馆早期的热门关注点之一,因此在基础理论研究方面,大数据环境下的信息服务研究主要在于创新与发展转型,并以2014-2016年的研究成果为显著代表。例如:通过利用大数据思维评估图书馆经济价值,注重用户信息行为数据的利用,以指导信息服务的整合[5];从基于科学研究数据集的高校图书馆嵌入创客群体服务中,来提供精准化信息服务[6];提升数字图书馆在大数据下信息服务的移动化与可视化水平[7],从而优化信息服务;通过提高馆员素质、加强信息导航、建立多媒体平台来进行科研图书馆信息服务的创新[8]。
在技术理论层面,在为师生主动推送信息资源的角度下,来构建高校图书馆个性化信息服务的系统模型[9],并将大数据过滤和整合技术应用于信息服务资源整合系统中[10],从资源层、数据处理层、应用层、用户交互层四个层次来构建图书馆开放数据信息服务系统[11]。
大数据给图书馆的信息服务带来了创新发展的机遇,但大数据环境下用户信息行为被实时的监控,隐私性得不到安全的保障。因此在开展信息服务过程中,要注意用户隐私数据的清洗,并允许用户获取与其隐私相关的重要信息,努力降低个人信息的泄露风险[12]。
3.2 知识服务
大数据环境下图书馆的知识服务侧重于知识咨询服务、知识服务模式及体系的研究,并多与“嵌入式服务”融合。
在知识咨询服务中,大数据时代知识咨询服务有赖于数据资源与人才建设的驱动[13],因此可以通过嵌入知识服务运行机理来构建数字图书馆知识咨询能力研究框架[14],并利用Wiki构建重点学科导航库,开展定题知识咨询服务[15]。
在知识服务模式及体系研究上,由于人文关怀以及智慧图书馆员的培养在知识服务中可以起到模式创新的作用,因此可以搭建一个基于 SOA 架构、开放式的知识服务协同体系,从数据资源、知识发现处理、界面展示三个层面设计高校图书馆嵌入式知识发现服务模型[16-18]。
大数据虽使知识服务模式得到了前所未有的创新,但过程中的数据版权归属等信息伦理问题也必须重点把握[19]。
3.3 个性化服务
大数据环境中的个性化服务研究重点关注于策略、用户行为特征及用户隐私保护的研究。
在策略研究方面, “大数据+微服务”体系能够为图书馆的个性化服务提供强有力的支撑[20],因此可利用情境大数据以及数据生命周期提高个性化服务精准性[21],并通过可视化分析系统对用户数据进行即时分析和可视化展示 [22]。
在用户行为研究中,通过用户行为本体数据库、用户需求本体挖掘、基于本体的个性化服务来构建个性化服务方案[23],并以知识关联分析为核心构建基于个性化服务的用户行为分析体系 [24]。
在用户隐私保护的研究中,若用户数据若遭到泄漏,将极大导致用户对图书馆信用度的降低[25],因此可以通过有限制的使用用户信息以及利用云计算平台来降低个性化服务中用户隐私泄漏的风险 [26],并构建基于安全云的个性化服务保障体系,制定风险防控策略[27]。
3.4 学科服务
大数据环境中的学科服务研究与高校图书馆、服务平台两方面联系紧密。
在大数据环境下快速获取学术前沿热点、探求创新成为高校师生新的追求点之一,因此,有的放矢的满足专业人士的服务要求成为高校图书馆学科服务的重要内容之一。由于高校图书馆学科服务过程中的数据库、数据分析工具的选择以及学科馆员素质起着至关重要的作用[28],因此对学科馆员的素质教育和继续教育是强化高校图书馆学科服务质量的重要手段[29],并且应利用数字动态组合将用户空间、服务嵌入高校学科服务新框架中[30],以满足用户不同层面的需求。
大数据环境下的服务平台研究多建立在Hadoop的基础上,并侧重云平台的建设。例如:基于Hadoop构建SMMU学科服务平台,以支持动态数据存储与并行处理[31],或是在Hadoop技术架构的基础上,将云计算、云存储设施融合到学科服务云平台架构中[32]。
面对精确、及时的服务需求,大数据背景下一站式学科服务及协同服务也应进一步加强,重塑图书馆在新环境下不可替代的形象[33]。
3.5 智慧服务
基于读者需求驱动的智慧服务是大数据环境下图书馆服务新的创新点,也是必经之路。智慧图书馆作为第三代新兴的图书馆形式,与智慧服务有着不可分割的联系,并依托云计算技术的驱动,三者紧密结合。
在智慧图书馆研究中,面对有“资源无数据”的困境,可以采用 “以数据提供商为主+图书馆自提为辅”的元数据收集形式[34],并将开展公共智慧服务、提升人文关怀作为智慧图书馆的创新方向[35],从而提高智慧图书馆的智慧决策、感知、服务[36]。
基于云计算、物联网技术,可以从数据、平台、服务三个层面构建智慧服务体系[37],并借助大数据分析技术将用户行为、业务及科研三种数据用于智慧分析中[38],来提高由智能型服務、知识服务、人性化服务组成智慧服务模式[39]
智慧服务的开展离不开智能化的技术手段, AR等可视化技术有助于提高智慧服务的时效性及感知体验性,因此,及时将新型信息技术运用到智慧图书馆建设中是驱动图书馆转型的重要途径。
4 结语与展望
从传统图书馆到数字图书馆再到如今热点探究的智慧图书馆,图书馆服务从始至终都是图书馆界的核心要素之一,也是各学者、研究人员不断探究的主题,在大数据环境下,图书馆服务如何抓住机遇,利用好大数据实现图书馆的第三代转型,也成为当下图书馆学关注的焦点之一。经过可视化的分析,可以看出国内大数据背景下的图书馆服务研究主要集中在信息服务、知识服务、个性化服务、学科服务、智慧服务五个方向。此外,移动技术的发展将促进图书馆服务方式的创新,因此,本文作者对此后的研究作如下展望:
大数据环境下图书馆学科移动服务、微服务的研究。目前,移动服务多为移动图书馆在移动终端的延伸式服务,较少提供专业化的学科知识咨询服务。大数据环境下学科服务可进行借助移动终端嵌入学者间及学科馆员实时互动服务平台建设的研究中,并与微推送等服务进行整合研究,以及重视技术支撑、个体系统开发的研究。大数据环境下数字图书馆数据服务与人文服务的研究。第十三届数字图书馆前言问题研讨班上传递出了数据驱动的讯息[40],国外许多研究机构都对数据管理有迫切的需求,并且美国许多高校都成立了专门的数字人文研究中心,而数字人文项目的建设又离不开大量的数据。因此,大数据环境下的数据服务将侧重科学数据管理服务的提供及数据支撑下的数字人文服务研究。基于国外开展的公众参与式数字人文项目已取得不错的成果,例如Evolution Megalab项目,国内在大数据环境下的数字图书馆人文服务将结合众包科学及公共智慧来开展。大数据环境下机器学习式智慧图书馆服务的研究。AlphaGo的深度学习与强化学习给机器智能带来了新发展,在大数据环境下,智慧图书馆依靠大量数据的分析,感知实现智慧服务的无人化是指日可待的,但这有赖于语义技术的发展,因此新型智慧服务下机器学习技术的研究开发将成为重要关注点。
d.大数据环境下图书馆服务中隐私保护的研究。大数据虽给图书馆服务的形式带来极大的创新,但无论是知识服务、个性化服务、学科服务或是智慧服务、微服务等都依赖于用户行为数据的收集,这在一定程度上也加大了用户隐私的泄漏风险,虽然已有个别文献对此进行了探讨,但大多停留在理论层面,因此,在探索服务模式创新的的同时,对用户隐私数据的保护也应不断探求技术上的解决方案,以求在智慧服务的同时保证用户的隐私权利。
参考文献:
[1] AHMED W. Defining big data and measuring its associated trends in the field of information
and library management[J].Library Hi Tech News, 2017,34(9):21-24.
[2] KALIL T. Big data is a big deal[EB/OL].(2012-03-29)[2017-11-05].https://obamawhitehouse.archives.gov/blog/2012/03/29/big-data-big-deal.
[3] 张敏,吴郁松,霍朝光. 我国电子政务的研究热点与研究趋势分析[J]. 情报杂志, 2015(2):
137-141.
[4] 冯璐,冷伏海. 共词分析方法理论进展[J].中国图书馆学报, 2006(2):88-92.
[5] 和婷. 大数据思维对图书馆信息服务工作的启示[J].图书馆建设, 2014(1): 64-68.
[6] 刁羽.大数据环境下高校图书馆嵌入创客群体信息服务的策略探索[J].图书馆学研究, 2016(16): 70-75.
[7] 徐升华, 王琪. 大数据时代数字图书馆信息服务研究与发展[J].图书馆学刊, 2016, 38(4):59-62.
[8] 郭登浩. 大数据背景下科研图书馆信息服务的创新与发展[J] 兰台世界, 2016(18): 84-86.
[9] 胡伶霞. 基于大数据的高校图书馆个性化信息服务系统模型构建研究[J].图书馆理论与实践, 2016, no.205(11): 80-82.
[10] 叶翔. 基于大數据的数字图书馆信息服务资源整合系统研究[J].河南图书馆学刊, 2017(1): 123-125.
[11] 钟萍. 基于大数据的图书馆开放数据信息服务系统研究:以安徽大学图书馆为例[J].大学图书情报学刊, 2016(6): 70-73.
[12] 朱丽萍. 大数据时代数字图书馆信息服务中个人隐私保护研究[J].图书馆学刊, 2017(2):
128-131.
[13] 王天泥. 知识咨询:大数据时代图书馆的知识服务增长点[J]. 图书与情报, 2013(2): 74-77.
[14] 袁红军,宁光芳. 大数据时代数字图书馆知识咨询能力研究框架构[J].现代情报, 2013(11): 25-28.
[15] 陈研.大数据背景下高校图书馆的知识咨询服务[J]. 鞍山师范学院学报, 2014(6):108-110.
[16] 胡莲香. 走向大数据知识服务:大数据时代图书馆服务模式创新[J].农业图书情报学刊,
2014(2): 173-177.
[17] 张兴旺,李晨晖. 数字图书馆大数据知识服务体系协同设计研究[J].图书与情报, 2015(3): 61-70.
[18] 郝建军.大数据时代高校图书馆嵌入式知识发现情报分析服务模式研究[J].河南图书馆学刊, 2017(2): 49-51.
[19] 曹霞.国内大数据知识服务研究热点与进展[J]. 西南民族大学学报(人文社科版), 2017,
38(9):235-240.
[20] 李艷, 吕鹏, 李珑. 基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J].图书情报知识, 2016(2):60-68.
[21] 马晓亭. 基于情景大数据的图书馆个性化服务推荐系统研究 [J].现代情报, 2016(4):
90-94.
[22] 杨利军,高军. 图书馆个性化服务中的大数据可视化分析与应用研究 [J]. 现代情报, 2015(7): 68-72.
[23] 何胜,冯新翎,武群辉,等. 基于用户行为建模和大数据挖掘的图书馆个性化服务研究[J]. 图书情报工作, 2017(1): 40-46.
[24] 陈臣.基于大数据的图书馆个性化服务用户行为分析研究[J].图书馆理论与实践, 2015(2): 96-99.
[25] 杨亮,雷智雁.大数据环境下图书馆个性化服务研究[J].现代情报, 2014(4): 74-77.
[26] 马晓亭. 大数据时代图书馆个性化服务读者隐私保护研究[J].图书馆论坛, 2014, 34(2):84-89.
[27] 陈臣. 基于大数据的图书馆个性化服务安全体系构建研究[J]. 新世纪图书馆, 2014(11):
47-51.
[28] 董颖, 张艳蕾, 任晓辉,等.大数据环境下高校图书馆嵌入式学科服务模式研究[J].大学图书馆学报, 2017(3):25-28.
[29] 沈洋,李小平. 大数据背景下高校图书馆学科服务的创新发展研究[J].新世纪图书馆,
2017(1): 46-49, 55.
[30] 林静,伊雷,陈珊珊,等.大数据时代高校图书馆开展学科服务研究:学科馆员工作案例解析[J].现代情报, 2015(12): 65-69.
[31] 李情,汤文亮,项峻求,等. 基于Hadoop的个性化学科服务平台研究[J].图书情报论坛,
2016(2): 9-13.
[32] 刘禄峰.大数据环境下高校图书馆学科服务云平台构建研究 [J].图书馆学刊, 2016(3): 99-101, 108.
[33] 王红芳,姜功恒,张凯兵.大数据环境下图书馆学科服务的SWOT分析与服务策略[J].农业图书情报学刊,2015(10):180-183.
[34] 罗丽,杨新涯,周剑.智慧图书馆的发展现状与趋势:“智慧图书馆从理论到实践”学术研讨会会议综述[J].图书情报工作,2017(13):140-144.
[35] 杨海亚.提供公共智慧服务:大数据时代图书馆服务模式创新[J].新世纪图书馆, 2014(3):
10-14.
[36] 陈臣.基于大数据挖掘与知识发现的智慧图书馆构建[J].现代情报, 2017(8): 85-91, 97.
[37] 田梅.基于信息融合的图书馆智慧服务体系构建[J].兰台世界, 2016(5): 62-64.
[38] 陈卫静.智慧图书馆在大数据环境下的智慧分析[J].图书情报工作, 2015(s2): 49-52.
[39] 袁红军.图书馆智慧服务模式探析[J].新世纪图书馆, 2017(3): 22-25.
[40] 谢蓉,刘炜.数字学术与公众科学:数字图书馆新生态[J].大学图书馆学报, 2017(1): 6-10.
贾玉文 辽宁师范大学管理学院研究生导师、副教授。 辽宁大连,116029。
黄小淋 辽宁师范大学管理学院硕士研究生。 辽宁大连,116029。
王 康 辽宁师范大学管理学院硕士研究生。 辽宁大连,116029。
(收稿日期:2018-03-30 编校:刘忠斌)