APP下载

大数据时代图书馆信息服务的创新

2014-04-01郭育艳

郑州航空工业管理学院学报 2014年1期
关键词:结构化图书馆时代

郭育艳

(河南财经政法大学,河南 郑州 450046)

大数据时代,尤其是电子商务、移动通信与社交网络把人类社会带入了一个以“PB”(1024TB)为单位的结构与非结构数据信息的新时代。在这一时代,以信息保存、开发、利用为己任的图书馆信息服务受到前所未有的挑战。如何保存与分析大量的复杂数据,利用大数据技术对隐含在用户行为中的结构化、半结构化数据信息进行挖掘、识别、组织与分析,以寻找其潜在的信息需求以及如何把握时代特征,掌握图书馆未来的服务趋势,改进服务水平,拓宽服务领域,达到图书馆资源服务与用户需求的双向理想控制意义重大。本文在分析大数据带给图书馆信息服务的影响与挑战基础上,重点探讨大数据时代下图书馆信息服务的创新。

一、大数据的内涵

从硅谷到北京,大数据的话题正被广泛传播。半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且信息增长速度也在不断加快。量变引发质变,最先经历信息爆炸的学科——天文学和基因学,率先提出“大数据”的概念[1]。

众所周知,生物体的大小影响着万有引力所产生约束力的大小。同理,数据及信息的规模也对自身价值的发挥产生影响。谷歌之所以能超前世界疾控中心,实时地给出和基于大量真实病例信息所得到的流感情况一致的结果,Farecast之所以可以预测机票价格的波动,让消费者真正获利,他们成功的秘诀都在于能够搜集由人们日常行为产生的数千亿计数据项,并对这些非结构化数据进行分析、挖掘,预测未来趋势。大数据的科学价值和社会价值正体现在这里。一方面,大数据可以转化为经济价值来源,另一方面,大数据已经撼动了如商业、科技、医疗、政府、教育、经济、人文等各个领域。就像显微镜让人类能够观测微生物,望远镜让人类能够感受宇宙一样,大数据开启了一次重大的时代转型,它正在改变着人们的生活以及思维方式,成为新发明和新服务的源泉。

大数据,并非一个确切的概念,它最初诞生于技术领域。当信息量过大,已经超过了一般电脑在处理数据时所能承载的内存量时,新的处理数据技术应运而生,例如谷歌的MapReduce和Hadoop平台(最初源于雅虎)。这些技术可以消除僵化的层次结构和一致性,令数据不需要借助传统的数据库表格来整齐地排列,大大增加了人们可以处理的数据量。

截至目前,学术界虽然并未对大数据形成一个统一的定义,但存在着这样一个共识:大数据作为结构化数据、半结构化数据与非结构化数据的总和(由邮件、视频、微博、帖子、页面点击等产生的),不是对数据量大小的定量描述,而是一种在种类繁多、数量庞大的多样数据中进行的快速信息获取[2]。大数据具有4V特点,即种类 (Variety) 多 、速度 (Velocity)快、容量(Volume)大、价值(value)大。这些内涵和特点预示着大数据将改变目前“IT”架构,将信息界变革的重点由“T”(技术)转向“I”(信息),以形态多样且富有价值的数据为主体,借助一定的技术,来发展数据处理、深层次分析与价值挖掘等信息业务。

二、大数据时代图书馆信息服务面临的挑战

如今,一个大规模生产、分享和应用数据的时代正在开启。大数据使信息与社会发展结合的深度、广度与力度都超过以往任何时代,信息成为比原材料、资本、劳动力和汇率更重要的因素。作为储存信息知识、提供信息服务的信息中心——图书馆,势必在大数据的浪潮下被赋予新的历史使命,从社会的边缘走向社会的前沿,从科技发展的“后勤保障部队”变成“前沿战斗部队”,从“学术性的服务机构”变成“学术、服务、产业为一体的综合性机构”。

信息服务是一个涉及众多要素、诸多环节的复杂的心智活动和过程。通过对图书馆信息服务内涵与特征的分析,根据蕴含其中的信息序化程度、知识整理水平、信息挖掘程度、创新知识含量的不同,可将图书馆信息服务划分为包括基础层、过渡层和创新层的由低到高的三层金字塔式结构[3],见图1。

图1 信息服务的三层金字塔式结构

预测,是大数据的核心。图书馆信息服务方向和策略的制定依赖于对大数据的分析与预测。数据的拥有量以及对各类海量数据的挖掘与分析是大数据时代下图书馆提高服务水平,由基础层转向创新层的关键。大数据时代下,图书馆信息服务所面临的机遇与挑战共存。

1.图书馆将面对增长迅猛的海量复杂数据处理

大数据时代下数据的组成结构、类型格式、存在形态等都愈加复杂化,不仅包括数据库、XML、门户网站等同类型的结构化数据,而且包括大量的非结构化、半结构化数据,如读者的借阅习惯、存储信息行为、搜索方式、消费痕迹等,所有能为图书馆改进服务模式,提高服务水平提供支撑的大数据,都将成为图书馆的核心资产。如何解决图书馆自身海量数据的存储及运算能力与大数据对存储能力的高要求之间的矛盾,直接决定着图书馆在大数据时代能拥有多少数量、什么质量的数据。

2.信息服务将面临以复杂数据为对象、以深度挖掘为要求的高标准挑战

随着大数据时代的到来,信息社会将逐步向知识社会转变,虚拟、泛在图书馆将成为未来图书馆主要形态之一,其信息服务更加突出“无处不在、无时不在、无所不在”的特点,服务的核心在于解决用户获取信息服务的三大问题:一是提供高质量的数据资源,二是在海量数据中迅速找到有价值的信息,提供个性化服务,三是利用大量结构化、非结构化及半结构化的数据,分析挖掘图书馆—用户的服务关系,预测用户的信息需求[4]。

3.大数据为图书馆信息服务提供专业的数据技术支持

大数据所涵盖领域主要有可视化分析、大规模并行处理数据库、数据挖掘算法、分布式数据库、云计算平台、互联网和可扩展的存储系统[5]等,为海量的各种类型数据的捕获、组织、分析及决策提供应用支撑。譬如云计算,在它产生之前对于如此庞大且不规则的“非结构数据”,传统的计算机束手无策。基于云计算方法的数据存放、共享和发掘手段,能快速有效地将数量庞大、形式多变的终端数据存储下来,并能随时进行剖析与运算。因此大数据与云计算之间是问题与方法的关系。利用云计算对大数据进行预测分析,能够提供更为精确的信息,并释放出更多的数据隐藏价值[6]。

三、大数据时代图书馆信息服务创新与发展方向

1.以用户为中心,提高信息服务的智能化程度

用户是图书馆信息服务工作的轴心,要利用大数据相关技术,进行高级的、自动的复杂数据的收集与处理,如自动抽取关键词、智能抓取数据等,分析并预测出用户的需求趋向,了解其需求动态,研究其需求规律,并结合其实际所需选择搜集有效的信息,主动提供索引指南帮助用户克服因信息分散而造成的检索困难,提高服务的实效性和针对性。

智能化的信息服务可以促使用户的潜在信息需求向现实信息需求的转化,同时有助于隐性知识向显性知识的转化,促进知识的发现、挖掘与组织,便于用户理解和吸收。这一方面使信息的价值得以实现,同时也使服务成为有价值的服务。

2.查找和形成解决方案,并贯穿用户信息活动的始终

全媒体环境下基本消除了因信息资源地域分布不均衡而导致的信息获取困难,传统单一的检索与传递等服务方式在用户中的影响逐渐弱化,更受关注的是在海量的信息中如何查询和捕获所面临问题的信息,并将这些信息整理形成相应的解决方案。

大数据时代的着力点恰恰是探究“是什么”,而不是“为什么”,大数据能够利用新的分析工具和思路提供出新的视野和有效预测,寻找事物之间的相关关系。这与当下信息服务的目标——为用户查找或形成解决方案相符合,而解决方案的形成又是一个对信息反复搜索、分析、整合的过程。用户利用信息来解决问题的欲望需求受多重因素的影响。因此,信息服务要对用户的不同信息需求加以分析研究,明确用户信息目标。同时,信息服务要根据用户信息需求目标的变化进行技术调整和重组信息,始终保证满足用户解决问题的信息需求。

3.根据用户所求,向其进行服务内容的个性化推荐

人们在上网时经常会遇到这样的提示语“猜您还喜欢”、“浏览了该商品的人还浏览了如下商品”,这就是各个网站分析了不同用户的“行为轨迹”,即非结构化数据,总结其共性习惯而有针对性地提供推荐策略[7]。这就带给图书馆信息服务新的思路,可以根据用户长期的借阅记录、检索日志等事务型数据,分析挖掘其数据模式及特征,进而发掘某群体的兴趣和行为规律,利用以用户需求为中心的Web服务,进行动态页面推荐和提供定制化的信息,如根据用户的兴趣度,向其推荐相关专题信息,以此有针对性地服务用户,拓展图书馆的资源利用率。

这种个性化服务富有更大的创新空间,根据每一次信息服务的具体内容,做有针对性的筛选、分析相关信息,为用户创设新的知识产品、服务方式,提供创新服务,因而具有更大的服务空间。个性化服务的宗旨不仅是向读者用户提供个性化信息,而且要通过服务帮助用户利用信息来解决实际问题,以满足不同用户信息需求为要义。

4.面向知识内容,以增值和创新为目标,实现知识价值

大数据下的信息服务是面向知识内容的服务。这个时代下,大量显性的、无序的数据信息对用户深层次需求(如教科研)的作用并不大。因此,图书馆信息服务工作一方面需要深入到文献知识的单元,对其进行有序整理、浓缩提取,开展深层次的信息加工,形成各种决策性的规范报告,满足用户需要;另一方面,图书馆应高度重视用户所需信息中隐含的知识内容,根据其提出的问题和问题环境进行需求分析,从海量的数据中集中动态地筛选、收集信息,并分析其内部结构之间的隐含知识关系,进一步深层次地提取、重组出与需求相匹配的知识,最终形成解决问题的方案。这样不仅使无序的信息变得有序,使固化的知识得以活化,实现知识本身的价值,也使检索、分析、加工、重组知识的服务过程的价值得以实现。

参考文献:

[1][6](英)迈尔·舍恩伯格,库克耶.大数据时代[M]. 盛杨燕,周 涛,译.杭州:浙江人民出版社,2013.

[2]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012,(5):37-40.

[3]梁瑞华.高校图书馆知识服务体系研究[M]. 开封:河南大学出版社,2010,(6):97-98.

[4][7]石薇芬.大数据时代的图书馆信息服务[J].社科纵横,2013,(6):269-270.

[5]百度百科[EB/OL].http:Mbaike. baidu. com/view/6954399.Htm2013-11-02.

猜你喜欢

结构化图书馆时代
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
图书馆
e时代
e时代
e时代
去图书馆