基于大数据的图书馆信息模式与个性化服务研究
2017-03-15冯颖
冯颖
摘 要:文章阐述了大数据给图书馆信息服务带来的转变,提出了大数据图书馆服务的发展方向,分析了基于大数据的图书馆信息服务模式和资源流程,并研究了大数据模式下的图书馆信息模式与个性化服务方式。
关键词:大数据;主动服务;信息可视化;智能用户分析
中图分类号:G250 文献标识码:A 文章编号:1003-1588(2017)02-0093-03
近年来,随着移动信息技术、大数據技术、数据处理技术的发展,图书馆的信息模式也在不断地革新和优化。在图书馆信息服务中,各类跨行业、定制化、个性化的业务需求不断增多,对图书信息数据的抽取、挖掘和分析成为推动图书馆信息服务水平提升的关键。大数据技术的发展为图书馆信息模式的创新提供了良好契机,构建基于大数据的图书馆“数据—信息—知识—智慧”信息服务模式,能更好地推动图书信息数据转化为潜在知识服务,进而创新信息服务模式,提升数字化、智能化、个性化服务水平。
1 大数据带动图书馆信息模式的转变
根据维基百科的定义,大数据是一种数据集,能够通过常用的软件工具来获取、存储和管理,具有种类多、流量大、体量大、价值高的特点。此外,大数据的处理时间超过常规数据处理的可容忍时间,不仅数据量巨大,而且增长迅速。大数据是一种宝贵的信息资产,数据中蕴藏着丰富的信息内容,图书馆用户在图书信息网站、购物平台、社交网络等信息平台,都会产生并留下大量的数据,这类大数据信息包含图片、声音、视频等多媒体信息,最终形成海量的图书馆用户大数据。大数据对图书馆信息模式的转变有巨大的推动作用,具体如下。
1.1 从被动服务向主动服务转变
传统的图书馆服务以被动服务为主,管理员对图书资源进行信息加工,经过信息资源的采集、存储、集成、分享,形成信息产品推送给用户。这个信息流是以管理员为中心的单向流动的过程,用户处于一种被动接受的状态,很难将自身需求传递回图书馆[1]。
大数据的出现有助于图书馆向主动式服务转变,建立以用户需求为中心的信息服务模式,为用户提供个性化信息服务。如:图书馆根据对用户评论、满意度反馈调查等大数据的分析结果,提取出用户的实际需求、阅读习惯、阅读频次,并将之反馈给管理员,再由管理员进行信息资源的采集、存储、集成和分享,形成符合用户个性化需求的信息产品。
1.2 从内向型服务向外向型服务转变
传统的图书馆服务属于内向型服务,服务载体以纸质书籍、报刊、档案为主,知识传播途径较为单一。移动信息时代,图书馆的服务载体日益多元化,通过智能手机、电脑、电视等都可以进行图书信息传播,信息资源获取途径也不断拓展,打破了传统图书服务模式的时空限制。
大数据模式下,图书馆信息途径更加外向,信息受众也更加宽泛,目前包括首都图书馆、广州图书馆、上海图书馆等在内的图书馆都允许社会人员入馆,开放式的大数据图书馆成为发展趋势,传统“读万卷书、行万里路”的信息获取方式已经过时,“秀才不出门,便知天下事”的大数据阅读已成为现实。
2 基于大数据的图书馆信息服务模式研究
大数据是数字世界的智慧基因,来自图书馆用户的使用数据、动态数据、关联数据和社会网络数据都能够汇聚为大数据,图书馆自身即可被视为一个大的数据集,不同地区的图书馆可以联合构建大数据图书馆,不同地区的图书馆数据之间存在数据交换和资源共享。图书馆通过对大数据的整合与分析,洞悉用户的真实需求。图1为图书馆大数据应用的支撑技术与实现方法。
图1显示,图书馆大数据应用主要基于分布式数据存储、网络分析挖掘、图计算技术、可视化技术等,对各类源数据进行收集、整合、存储和处理、分析,最终转换为个性化服务。图书馆大数据结构复杂、种类众多、容量巨大,对数据的处理过程是信息工作人员对信息的再次加工与分析的过程。
国外对移动图书馆和大数据应用的研究起步较早,由此衍生出的个性化服务也较多。目前,美国高校可以提供基于Windows Phone、Kindle、Blackberry等多个系统的图书数据服务,很多高校都实现了数字图书馆服务。如:耶鲁大学所有纸质图书均印有二维码,用户可以通过扫码直接链接图书资源,还可以通过大数据收集提供多媒体资源的移动信息检索;斯坦福大学图书馆用户可以通过智能手机终端获取各类移动信息,包括视频、音频、乐谱等。
在国内,清华大学、中国人民大学等高校的图书馆,以及国家图书馆、首都图书馆等技术先进的图书馆也在大数据应用方面展开了一系列探索,国内很多图书馆已经基本实现馆藏数字化,并借助大数据提供了一系列特色服务[2]。如:国家图书馆的“掌上国图”、杭州数字图书馆的“文澜在线”等。大数据信息模式通过数据挖掘和分析最终得出用户行为分析结果,从而为图书馆个性化服务提供支撑。
如图2所示,图书馆大数据的信息架构可以分为四层,分别为大数据的采集、存储、处理和应用。其中,图书馆大数据主要采集来自国内外数据库的论文、著作以及社交网络数据等,包括文字、图片、影像、视频等多种表现形式。图书馆数据浩如烟海,要想从数据中成功提取所需要的信息,需要借助Hadoop技术、Map Reduce技术、SQL(Structured Query Language,结构化查询语言)技术等,将大数据存储到云服务器,通过云计算技术对大量的图书文件系统和元数据库进行整合,实现多渠道、多类型、大异构的信息存储服务[3]。
3 基于大数据的图书馆个性化服务研究
基于大数据的图书馆个性化服务能够帮助用户融入其中,构建充分适用于互联网、移动终端、智能手机、本地用户等多种接入方式的大数据知识共享平台。大数据技术强大的数据处理和分析能力,不仅能够帮助用户克服时空局限,与信息管理员进行实时反馈与交流,还能够帮助用户借助大数据个性化服务方式,通过新媒体传播、互动百科、学术论坛等方式来发布信息,实现图书信息的闭环传递和反馈。
3.1 信息可视化服务
移动信息时代图书信息资源日益多样化,用户对信息提供方式的要求日益提升,希望能够实现反馈信息可视化。大数据信息量大、价值密度低、数据层次多,因此通过大数据挖掘提取出有用信息,并以可视化形式呈现,能够大大提高图书馆用户对图书信息检索的评价。常见的圖书可视化技术包括标签云、历史流、空间信息技术等,通过大数据的可视化输出,能够提高用户的查准率。
清华大学图书馆将图书馆服务嵌入搜索引擎中,将购买的66,000多种电子期刊资源与Google Scholar等平台进行关联,并嵌入大数据的图书可视化技术,将电子馆藏大数据信息整合为XML文件并存储在特定服务器,从而使Google Scholar等平台能够定期抓取。当用户在相关搜索引擎进行搜索时,可以根据用户的检索自动连接到清华大学的馆藏资源,并能够可视化呈现,用户通过标识性的文字就能够获取阅读权限,从而极大地提升了资源的查准率和资源共享率[4]。
3.2 个性化图书信息服务
要做好图书馆信息服务,应该充分利用大数据技术的优势,并与云计算技术、无线通信技术、传感和网络技术相结合,实现图书馆数据从基础设施架构到用户服务模式的变革,进而帮助用户克服阅读时间、地点、内容、终端类型等条件的限制,结合移动图书馆、手机图书馆、云计算图书馆、泛在图书馆等新的服务形式,真正实现以用户需求为中心的信息模式与个性化服务。
如表1所示,以国家图书馆的“掌上国图”和杭州数字图书馆的“文澜在线”为代表,国内一些技术先进的图书馆已经逐步对馆藏进行数字化,并基于大数据技术对数字资源进行分析、存储和整合,提供参考咨询、图书馆微博、读者荐购等服务。图书馆将海量的无序数据进行整合,通过开放链接和数据混搭的方式对其进行推送,对于来自互联网、移动终端、本地等不同路径的图书馆用户,图书馆能够基于大数据提供的海量资源,提供具备个性化参考咨询的一站式检索服务。在个性化知识发布方面,图书馆能够通过学术博客、图书馆网站等来发布图书信息;在个性化知识交流方面,读者既能够在知网空间发表心得,也能够通过互动百科、学术论坛等方式参与知识交流。此外,互联网用户还能够借助泛在网络和虚拟社区来参与图书信息交流,大数据的可视化技术也极大地提升了图书馆个性化服务的效率。
3.3 用户智能化分析服务
数据挖掘即从大数据中提取出各类有价值信息,并将之应用于对图书信息用户阅读习惯、信息行为、信息轨迹的分析上,同时借助这些分析来预测用户需求,从而提供智能化推送服务[5]。此外,图书馆还能够借助智能化分析服务,对现有资源进行综合分析,预测未来有可能存在的系统故障、用户需求响应障碍、信息安全等方面的问题。
图3是大数据图书馆读者阅读行为分析判定流程图。如图3所示,大数据图书馆会全面而规范地搜集用户行为数据,基于大量的存储数据对用户行为事件进行初步过滤,通过科学分类、智能分析、人工匹配等环节,结合信息管理人员的经验,经过价值过滤和人工筛选后得出用户行为定义,从而进行用户行为判定,完成价值过滤和信息筛选过程。与此同时,图书馆还采集用户行为事件并将之存入大数据库,将用户行为分析的结果与数据库对比,进行用户行为匹配,最终得出用户的阅读行为和兴趣点,并据此进行个性化推送服务。
清华大学图书馆在新浪微博注册了名为“清华乐推”的微博,并使用了大数据的用户智能分析技术,通过对清华大学官方微博上的读者咨询、建议、投诉和表扬等方面数据的分析,筛选出重要的价值信息[6],并依据这些信息来提供相应的定制服务、培训信息、图书推送信息等。
4 结语
大数据是移动信息时代用户阅读需求快速变化的产物,也是信息技术发展的必然趋势,大数据在图书馆的应用有利于打破传统图书馆在时间和地点方面的限制。大数据已经成为保障图书馆信息系统和服务能力的重要因素,现代图书馆应该充分利用大数据资源,准确识别图书馆用户的服务需求、阅读行为、个性化特征,创新信息模式与个性化服务方法,不断改善用户的阅读体验,改善用户关系,从而实现精准化、个性化、智能化的图书信息服务。
参考文献:
[1]胡越.图书馆服务的学科化与个性化[M].北京:首都师范大学出版社,2008:21.
[2]周虹,张蓓,窦天芳,等.清华大学图书馆OPAC书封服务的设计与实现[J].现代图书情报技术,2008(8):84-87.
[3]施慧娟.可视化数据挖掘技术的研究与实现[D].上海:华东师范大学信息学院,2010.
[4]刘淑玲.网络环境下高校图书馆的知识管理与知识服务[J].情报科学,2010(4):523-526.
[5]韩晶星.面向知识社区的数字参考咨询服务平台构建[J].情报杂志,2010(2):123-126.
[6]李靖.图书馆自助式服务的现状与未来[J].上海高校图书情报工作研究,2011(2): 6-8.
(编校:周雪芹)