大数据环境下图书馆服务变革探讨*
2016-02-12杨方铭
杨方铭,章 华
(淮安信息职业技术学院图书馆,江苏 淮安 223003)
大数据环境下图书馆服务变革探讨*
杨方铭,章华
(淮安信息职业技术学院图书馆,江苏淮安223003)
论述大数据的特征,阐述大数据对图书馆服务、馆藏的影响和作用,提出需要在分析和挖掘图书馆相关大数据的基础上创新图书馆服务,图书馆应朝着一体化的个性化服务、面向创新的知识服务和智慧化服务的方向发展。
大数据;图书馆服务;数据挖掘;数据分析
1 大数据概述
从字面上看,大数据是一个表示庞大规模数据的抽象概念。如果仅在数量上,大数据和以前的“海量数据”“超大规模数据”等概念之间并无太大区别。目前,关于大数据,学界尚未形成统一的定义,但是存在一些共识,大数据是一个用来描述海量的结构化、半结构化和非结构化数据的动态概念,这些数据的容量非常巨大以至于很难用传统的数据库和软件技术进行存储、管理和处理。其中,数据量并不是必须达到TB级或PB级才算是大数据,它的数量是随着技术的进步而改变,过去或目前的大数据,在未来可能不再是大数据。它的理念是通过包括互联网在内的多种渠道收集研究对象的多维度数据,再对海量数据进行关联分析和数据挖掘,发现被研究对象的潜在行为模式或规律[1]。
图书馆大数据环境具有 “4V+1C”特征:(1)Variety。数据种类多,包括结构、半结构和非结构等数据类型,具有较强的异构性。(2)Volume。图书馆利用监控、服务终端采集读者行为数据和系统运营数据,使其图书馆数据日益庞大。(3)Velocity。图书馆采集到的大部分数据均为用户行为和应用服务等方面的数据,它的分析处理时效性很强。(4)Vitality。图书馆依据用户需求和服务实际情况对大数据进行处理和分析,其需要很强的时间和空间适用性。(5)Complexity。图书馆需要采用高效算法对异构数据进行处理分析,其难度很大[2]。
2 大数据对图书馆的影响
2.1馆藏收集范围扩大与知识挖掘
随着移动服务的普及和社交媒体的流行,图书馆收藏的数据源开始扩展到视频、音频、数据流等非结构化数据。针对如此复杂的数据,图书馆需要利用大数据技术和理念处理好以下几个问题:(1)大数据的收集。图书馆需要收集的大数据主要包含自身网络应用子系统产生的数据和外部Internet产生的数据,收集范围是图书馆需要采集有价值的数据与可以采集到数据的相互交融的数据。(2)大数据由大变小,即如何处理和清洗大数据。图书馆要想利用大数据,就必须掌握大数据处理流程和方法,对大数据进行抽样、筛选、压缩、索引、提取元数据等操作,把海量数据变小。然后,采用主题分析,核心概念提取,选用上位词、普选利用下位词、缩小数据范围等方法对大数据进行分析和挖掘。(3)怎么对大数据进行价值提炼。随着图书馆越来越重视个性化服务,图书馆系统与网络日志、监控与服务视频、音频、图片、网络行为及增值服务等非结构化数据量将超结构化数据量。因此,图书馆需要对非结构化数据进行结构化解读和梳理,利用群体智慧提炼和发酵数据的价值。
2.2以用户为中心的服务创新
在大数据环境下,图书馆馆藏数量的激增、非机构数据占主体、数据种类繁多等特征,使图书馆不能再利用传统的信息搜集、组织、分析、传递与提供利用的服务模式以满足用户的信息需求,而是要在搜集、组织、分析、挖掘数据的基础上,提炼知识,关注知识服务的全过程,利用数据了解服务中发生了什么,分析和预测科研创新合作过程中、解决用户问题过程中发生了什么,以便在关注用户的结构化信息需求时,创新服务模式,通过对非结构化、半结构化、结构化数据的分析来满足用户急剧扩张的知识需求。
其具体措施是:(1)加强用户研究与交换数据的利用,对用户数据进行深度分析并建立用户模型,开展精准服务、知识关联服务,提供预测性信息服务产品;(2)将现有成熟的信息采集工作模式与先进的数学模型结合,实现工作效率的提升;(3)关注和融入社交网站,扩大图书馆的受众面,实时了解读者的需求,提升图书馆在读者个人文化生活中的作用和影响[3];(4)围绕用户的问题、科研创新提供服务。
3 大数据推动图书馆服务的发展
3.1图书馆服务走近用户
大数据对图书馆工作的冲击及其理念对图书馆服务的影响,迫使图书馆不能只重视馆藏数字化及其数据存储量,而是要强化图书馆对大数据的分析和挖掘的能力。让馆藏建设走向知识组织,把无序的网络空间变成有序的数字知识服务系统,保证用户高效、系统、可靠地获取所需要的信息[4]。图书馆还要加强随时随地为用户提供服务的能力,满足他们对知识服务的需求,为用户科学创造提供必需的情报服务,让用户在科研过程中体验到图书馆细致入微的科研服务,真正体现以用户为主的服务思想。在服务方式上,图书馆要改变过去只注重吸引大量用户到图书馆而不注重服务效果的服务方式,切实做到把图书馆服务延伸到用户的第一线,用大数据理念预测用户需求,提供精确服务,真正让图书馆服务走近用户。
3.2一体化的个性化服务体系
随着大数据技术与理念应用到各行各业,图书馆也要转变信息资源建设观念与信息服务理念,改变信息资源的选择、组织与存储方式,从海量数据中窥探用户行为,并与已有业务流程、服务模式融合,创造新的方法让图书馆服务更具价值。图书馆长期为用户提供信息服务,积累了大量用户资料,在此基础再研究用户的网络行为、学习行为、个人背景等数据资料,利用Hadoop、NoSQL等大数据处理技术,挖掘用户的知识背景、兴趣、学习风格、情感、社会关系等信息,利用语义网、信息检索、个性化推荐等技术,与用户行为模式相似的其他用户历史数据进行对照,并深层次分析、组织数字资源,让图书馆系统能够针对用户的搜索信息行为,提供个性化语义搜索服务;针对用户的浏览行为,提供个性化语义导航服务;针对用户的提问行为,提供个性化的问答服务;针对用户的自主学习行为,提供个性化定制服务;针对用户需求,进行语义分析、语义扩展等步骤来明确用户真实意图,根据用户本体,利用个性化推荐引擎为用户推荐符合需求的知识内容。这样,最终建立以数据为中心,以用户、服务、信息、技术和应用为一体化的个性化服务体系。
3.3面向创新的知识服务
在大数据环境下,图书馆的服务策略建立在对大规模复杂数据搜集、组织、整理、分析和挖掘的基础之上,因而图书馆服务项目更具有针对性和操作性[5]。图书馆经过对海量数据的统计性搜索、比较、聚类、分类等分析归纳,能够完成数据价值的挖掘和读者需求的预测,再利用大数据技术对多个信息平台的数据进行过滤整合,实现依据读者需求的变化而提供差别化的知识服务,满足用户智慧集群和群体创造的需要,满足多用户合作学习、合作科研、多元知识交互分析、利用与交流的需要,进而把知识服务嵌入到用户学习、科技创新的过程中,形成面向用户科研创新的知识服务模式。
其模式以解决用户问题为核心,深入解决问题的各个环节,拥有解决问题的探索、构建和测试等服务机制。此服务建立用户数据库,跟踪和整理大量文献(馆内外信息资源),对比、筛选与组织相关内容,鉴别、分析可能的结构和趋势来构建宏知识,利用大数据技术进一步挖掘知识结构中的冲突、变异和可能性,分析知识内容的发展趋势与路径,支持对科技创新、未来演变方向与可能性的挖掘与预警,从而开拓和激发创新思路与路径。通过对多样化数据和信息的关联与分析,来支持具体领域的具体问题及其解决方法的分析,再根据需求的动态变化不断调适,与用户共同探索问题的解决方案[6]。
3.4智慧化服务
大数据是数据世界的智慧基因,分析和应用大数据是获得智慧的关键[7]。传统分析数据基本上都是抽取样本,事先确定收集什么样的数据,然后寻找“已知的未知(Known unknows)”,也就是证实某一结论正确。而大数据分析则是以全部数据为对象,发现未知的未知,也就是找到一些未曾想到的结果。大数据这种发现未知的未知功能为实现图书馆服务智慧化开辟了途径。利用大数据技术能够了解用户信息行为、意愿、信息需求、知识应用能力及服务需求等,还能够预测用户科研创新将要发生什么,从而提供智慧服务。
3.5数据分析与数据挖掘是图书馆提供服务的基础
在大数据时代,大数据资源已成为关系图书馆服务质量和馆藏资源结构科学性的关键因素。人们将抛弃随机采样的调查方式,转向分析大量数据;人们不再疯狂追求分析数据的精确度,转向注重对事物发展趋势的预测;人们不再重视事情的前因后果,转向关注挖掘事物之间的关联性。因此,图书馆数据资源的质量、管理和分析,将成为图书馆服务质量提升的基础,成为准确分析用户需求、制定科学的管理与服务策略、服务质量提升的关键。
图书馆通过对互联网上的知识点 (词汇或专有名词)进行搜索,并对知识点进行关联、描述,建立知识点的知识数据库,再利用一定算法、链接技术和匹配技术,能够实现基于知识的知识推送服务,即网络在线阅读中提供动态的专有名词解释或提示服务;通过分析图书馆与用户之间、不同服务数据之间、用户与服务数据之间的关系数据,能预测用户需求,提供针对性服务和个性化定制服务,还能合理调配馆员,充分调动他们的工作积极性;通过对用户借阅信息、下载使用数字资源行为、浏览网站行为、检索信息行为等记录信息进行分析,并与用户行为模式相似的其他用户历史数据进行对照,能提供基于用户隐性知识的推送服务;通过对图书借阅率、流通量、访问数字资源类型及时间、学习行为、利用资源模式等记录进行分析,能针对性地采购用户需要的信息资源;通过对读者阅读习惯、学习方式、获取资源方式等数据进行分析,能科学合理地完善图书馆工作流程与服务模式。因此,大数据时代,图书馆需要对用户数据进行分析、处理和预测,以便提供更好的服务。
4 结语
在大数据时代,图书馆要真正将服务嵌入用户的学习、科研、教学、科技创新、管理决策等活动过程中,提供以知识、信息、智力、工具的应用为特征的知识服务,则需要搜集、分析、挖掘各种类型、各种结构的数据资源和用户的行为数据资源。只有这样,图书馆的服务范围和领域才会得到更大的扩展和延伸,并且数据分析服务、数据挖掘服务会成为图书馆服务体系创新的制高点[8]。
[1]李善青,赵辉,宋立荣.基于大数据挖掘的科技项目查重模型研究[J].图书馆论坛,2014(2):78-83.
[2]陈臣.大数据时代一种基于用户行为分析的图书馆个性化智慧服务模式[J].图书馆理论与实践,2015(2):96-99.
[3]吴敏慧.大数据与图书馆信息服务新构想[J].图书馆理论与实践,2015(2):14-16.
[4]冯国权.互联网思维下图书馆服务变革[J].图书情报工作, 2015(2):25-30.
[5]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报, 2012(4):120-122.
[6]张晓林.研究图书馆2020:嵌入式协作化知识实验室?[J].中国图书馆学报,2012(1):11-20.
[7]韩炜.大数据时代公共图书馆消除数据不平等的路径选择[J].图书馆论坛,2014(3):14-21.
[8]程莲娟.美国推进大数据的应用实践及其有益借鉴[J].情报资料工作,2013(5):110-112.
(编发:章忠平)
A Study of the Reform of Library Service Based on Big Data
YANG Fang-ming,ZHANG Hua
(Library of Huai’an College of Information Technology,Huai’an 223003,China)
This paper discusses the characteristic of big data,elaborates the influence and function of big data on library services and collections,points out innovations of library service which is based on the analysis and mining of big data related to the library.The integration of personalized service,the innovation of knowledge service and the intelligent service are the direction of library development.
big data;library service;data mining;data analysis
G250.73
G250.73
A
2095-5197(2016)01-0048-03
* 本文系2014 年中国职业技术教育学会科研规划项目:“高职院校互动学习平台的构建与实践研究”(编号:201410Y02)的研究成果之一。
杨方铭(1981-),男,馆员,硕士,研究方向:信息服务与信息咨询;章华(1963-),女,馆员,大专,研究方向:图书馆服务。
2015-11-10