APP下载

大数据环境下高校图书馆服务转型探析

2014-02-28曲佳彬

图书馆学刊 2014年6期
关键词:图书馆用户服务

曲佳彬

(烟台大学图书馆,山东 烟台 264005)

大数据环境下高校图书馆服务转型探析

曲佳彬

(烟台大学图书馆,山东 烟台 264005)

大数据的发展带来了高校图书馆服务模式的变革,从云计算、物联网、社交网络方面分析大数据来“缘”,阐述大数据对高校图书馆的影响,最后探讨了大数据驱动下高校图书馆服务转型的方向。

大数据 图书馆服务 高校图书馆 数据挖掘

云计算方兴未艾,“大数据”又悄然兴起,在云计算、物联网、移动互联等技术的推动下,全球已步入了“大数据”时代。中国科学院院士郑有炓指出,大数据带来的信息风暴正在变革人类的生活、工作和思维,开启了一次重大的时代转型[1]。大数据时代,数据已经渗透到当今每一个行业,成为重要的生产要素,如何对海量资源加以高效利用并开发出其中的价值,已成为IT领域、企业界、科研工作者等普遍关注的问题。高校图书馆生命所在是服务学生和教师,使他们能够快捷、有效地利用图书馆的文献信息及其他各种电子资源进行学习和科研。在大数据环境下,高校图书馆要抓住机遇,迎接挑战,提升服务质量,由以提供资料为主的服务转变为以教师、学生需求为导向挖掘其隐性需求,统一监管、保存学校各院系、部门的科研数据形成更大的数据联合库,提高图书馆的智能化服务水平,树立图书馆的知识形象,使图书馆真正成为广大教师和学生求知创新的学习场所。

1 大数据概述

1.1 大数据时代到来

大数据让人眼前一亮,也让人捉摸不定。著名信息技术分析公司Gartner发布《2013年大数据普及程度背后的炒作》报告,指出2013年30%的企业已开始大数据研究工作,而另外34%的企业计划在两年内开始。但这些企业大多告诉调查者,不知道自己在做什么,也不知道为什么要做大数据工作[2]。尽管商界对大数据带来的商机津津乐道,但一开始讨论大数据时代的是科学家,生命与医疗、粒子物理、天气预报、基因学、地震预报等已经是数据密集型应用了。在此背景下,《自然》杂志2008年的big data专辑推出大数据专刊,探讨科研形态变化,大数据才成为未来的研究重点[3]。随后2011年5月全球知名咨询公司麦肯锡(Mckinsey and Company)发布了《大数据:创新、竞争和生产力的下一个前沿领域》报告,首次提出了“大数据”的概念,并在报告中对大数据的影响、关键技术和应用领域等进行了详尽的分析[4]。2012年后,国内外知名IT企业加入大数据研究行列、奥巴马政府宣布将“大数据战略”上升为国家意志、大数据基金会的成立等种种迹象表明大数据时代的到来毋庸置疑。

大数据的发展席卷全球,通过Google趋势工具同时搜索“cloud computing”和“big data”,发现在全球范围内,从2011年以来“big data”搜索指数呈现急剧上升趋势,其热度和2011年左右的“cloud compting”相当,如图1所示。

通过百度指数搜索“云计算”和“大数据”,可以得出2010~2012年为云计算之年,从2012年开始国内对大数据的关注度急剧上升,用户和媒体对此都表现出了极大兴趣,在不久的将来大数据很可能会成为时代的翘楚。

图1 谷歌趋势搜索“cloud computing”和“big data”

图2 百度指数搜索“云计算”和“大数据”

1.2 大数据来“缘”及影响

笔者认为,大数据是生产、生活中人们对这个世界的不断数据化,比方说谷歌搜索、Facebook的帖子和微博消息等使得人们的行为和情绪的细节化测量成为可能,而这些量化的信息不断积累形成了大数据。在互联网环境中,大数据就是互联网发展到今天的一种表象或者特征,在云计算为代表的技术创新大幕的衬托下,原本很难收集和使用的数据开始容易被利用起来,比如说微博信息、网页搜索习惯、购物习惯等,再如物联网、射频技术的发展,人和物的所有轨迹都可以被记录下来。因此可以断言,未来的移动互联网中任何事物都可能被记录并且保持下来,形成大的数据集合,通过各行各业的不断创新,数据共享、交叉复用以获得大数据的价值。大数据的来“缘”主要从以下几个方面分析:①互联网、信息技术的发展使得信息基础设施持续完善,为大数据的存储和传播准备了物质基础[5]。②Web2.0时代使得大数据的产生有了质的不同,Web2.0更加注重用户的交互作用,催生了社交网络,以微博、博客、facebook等为代表。加上智能终端、移动互联网的发展,使得人们不受地域、空间限制产生了很多数据。③新技术的发展为大数据的分析、存储提供了条件,云计算为大数据的集中管理和分布式访问提供了必要的场所和分享渠道,大数据的出现使云计算落地了,云计算提供基础架构平台,而大数据应用运行在这个平台之上。④当下物联网、移动终端、传感器等运转在社会的每个角落,持续不断地产生大量数据,并且数据类型丰富、内容鲜活,是大数据重要的来源。

当社交网络兴起,移动互联网快速发展,数据传感器的大量应用以及云计算带来了新一轮的数据大集中,在这个时代“数据”出现了爆炸式的增长[6],并给各行各业带来了根本性的变革。大数据帮助政府实现市场经济调控、公共卫生安全防范、灾难预警,帮助医疗机构建立患者的疾病风险跟踪机制,帮助电子商务公司向用户推荐商品和服务,甚至是社交网络中好友的推荐等,总之,通过大数据分析能够了解行业动向,并做出更加正确的决策以实现价值[7]。笔者认为大数据的魅力在于:通过对本行业大数据的收集、存储、分析、研究,从中挖掘潜在的价值信息,预测行业未来的发展,实现持续的创新与成长。大数据时代引发的变革,主要有3个方面:大数据的思维方式、数据的重要性、大数据技术,这三者是相辅相成、环环相扣的。拥有数据固然重要,但同时也要有处理、分析大数据的技术,否则数据就会像一盘散沙,毫无意义。信息技术飞速发展的今天,已经有办法去收集、处理大数据,比如云计算、虚拟化技术、分布式处理技术(Hadoop)等。因此,大数据时代如何发挥数据的价值取决于大数据思维,与其说是大数据创造了价值,不如说是大数据思维触发了新的价值增长。如最近天猫的“双十一”个性服务,基于交易大数据的“千人千面”服务正是有了大数据的思维,才打造了不同消费者的专属会场[8]。

大数据是一把双刃剑。大数据的整合让数据从分散变得集中,让数据变得很“大”,也就意味着比分布式要面临更大的风险,一旦数据遭受入侵,损失也要大得多。因此在数据整合中,基础架构的安全性是首要考虑的因素之一,这也是各个行业共同努力的一个方向。

2 大数据引发的高校图书馆思考

2.1 海量数据

高校图书馆本身拥有很多纸本资源,随着信息化建设的发展,大量的数字资源,如电子图书、期刊、数据、网络资源涌入高校图书馆。智能手机、平板电脑等移动终端的普及使读者不受时空限制即可获取知识,随之而来的是高校图书馆的移动客户端、wap网站、数字图书馆等如雨后春笋般涌现,使用户的数据量爆发增长。笔者认为面对如此海量的数据,高校图书馆应主要分析、挖掘用户的借阅记录、查询日志、社交活动、移动终端使用记录等各类半结构化数据,因为这些数据中包含了很多隐性价值,对改善服务方案、提高服务效率、开展个性化服务有很大帮助。

2.2 读者流失

随着各种新信息技术的不断发展,网上数据库、网上书城以及公开免费的网上图书资源充斥着互联网,给传统的高校图书馆带来了压力,读者流失日益严重。而大数据为高校图书馆解决这一问题提供了新的思路。高校图书馆可以借助大数据技术对读者需求数据(包括借阅记录、咨询记录、荐购记录等)进行分析,不仅可以了解读者的信息行为、需求意愿及知识运用能力,还可以深度挖掘读者在交互型知识服务过程中的潜在需求,从而有针对性地开展服务并吸引读者,以应对生存危机,同时利用读者不断增长的信息需求促使高校图书馆的拓展服务持续延伸、完善。

2.3 大数据应用

高校图书馆的核心价值就是为学生、教师服务,教师的科研成果、学生的论文成果在某种程度上代表着高校的教学、科研水平。图书馆只有了解师生的需求,掌握其阅读习惯,才能量体裁衣提供优质服务,进而提升整个学校的科研水平。高校图书馆要充分利用大数据技术和大数据思维,发现潜在价值信息,为师生提供高效、智慧的服务,这是未来高校图书馆发展必须做到的。

首先,高校图书馆应用大数据具有现实可行性。教师、学生在使用图书馆时会留下使用痕迹、用户行为日志等,这就形成了很多有价值的数据。其次,高校作为科研重地,对新技术、新思想的敏感性很强,在高校图书馆中使用大数据技术并不是什么难题。此外,大数据技术不是一项具体的技术,而是数据采集、数据存取、数据处理、数据挖掘等技术的融合,这些技术相对来说已经很成熟。高校图书馆面对新技术、新思维的冲击,要抓住发展契机,转变服务模式,实现可持续发展。

2.4 隐私保护

大数据是一把“双刃剑”,它涉及隐私问题,包括用户姓名、邮箱、电话号码等,具有关联性和累计性,一旦信息泄露、滥用,将对用户造成极大危害。高校图书馆中存在着大量的读者数据,如用户查询记录、用户借阅数据及手机客户端访问日志等。图书馆为了改善服务方式,提供优质服务,需要对这些数据进行分析,通过数据挖掘、知识发现等技术,了解用户阅读行为。另外,这些数据除了用于记录读者的个人信息外,还隐藏着许多重要信息,如电话号码、邮箱、行为记录、社交网络信息等。高校图书馆应高度重视读者隐私,树立高尚的职业操守,在正当、合法的范围内使用读者数据。

3 大数据环境下高校图书馆的服务转型

3.1 基于数据挖掘的图书采购

高校图书馆的采访工作是图书馆工作的重要组成部分,图书采访水平的高低,直接影响着馆藏建设的数量和质量,更关系到图书馆提供科研服务和教学服务的水平[9]。图书馆有限的经费、文献出版的混乱、文献价格的逐年上涨给图书馆采访人员带来了巨大的挑战,采访人员的个人能力、信息素养有限,很难从全局观念出发,采购既能满足本校教学和科研需要又具有一定价值的文献。大数据环境下,有效地分析读者需求成为可能,在图书馆的OPAC系统中有大量的搜索记录、借阅系统中有借阅记录、读者荐购系统中有荐购记录,另外开通的官方微博、微信中有很多读者潜在的需求数据,通过对这些数据进行挖掘、分析,能准确定位读者需求,从而为其提供有价值的文献资源而不是仅仅依靠图书馆的荐购系统或采访人员的经验去采购图书。

以烟台大学图书馆为例,图书管理系统、OPAC系统都由本馆自行开发完成,获得读者使用图书馆留下的数据变为可能,在图书采访工作上已经有了显著的成效,大数据的收集、分析将是本馆推出特色服务的开始,未来的工作重心也必会向以读者为导向的服务发展。

3.2 大数据支持的虚拟参考咨询服务

参考咨询部门主要负责解答读者在利用图书馆过程中产生的各种问题,在通讯技术和网络技术普及应用的条件下,实时虚拟参考咨询应运而生,咨询员不再受地域、时间的限制,可在网上实时解答读者问题。随着技术的发展实时虚拟参考咨询系统主要有国内的国家科技图书文献中心(NSTL)实时咨询服务系统、CALIS分布式联合虚拟参考咨询系统[10]、商用及时通讯工具(QQ、MSN)、图书馆微博、微信。这些实时咨询系统的共同点是参考馆员必须实时在线,实时守候,参考馆员的知识能力、非上班时间的时效性、工作量大等因素势必影响参考咨询的质量,降低图书馆的服务水平。

高校图书馆开展了多年的咨询服务,在读者咨询的问题中,有很多都是相似的,咨询员通过整理分析后形成了精选的FAQ,同时也积累了大量宝贵的咨询记录。这些数据日积月累形成了图书馆的大数据,对其进行挖掘、分析,能够帮助图书馆提供优质、完善的咨询服务。将人工智能运用到图书馆参考咨询中,是一种新的尝试,清华大学图书馆设计的“小图”是一个很好的代表,另外还有重庆文理学院的AIMLBot智能机器人[11]。基于人工智能的实时虚拟参考咨询的成功尝试离不开图书馆咨询服务累积下来的数据支持,它们的核心语料库都以咨询服务累积的数据为基础,实现了全天候、快速响应、个性化、准确性的咨询服务,使传统的参考咨询服务有了质的飞跃。

3.3 高校科研数据的知识整合

大数据时代,握有数据同时具备大数据思维才能在未来的发展中占领先机。随着数字化的发展,高校图书馆加快了数字化进程,纷纷购进电子图书、网上数据库,然而教师和学生通常都把图书馆当作提供免费资源的部门,只是检索、下载所需的网上资源,忽视了图书馆的重要性。为了摆脱尴尬困境,高校图书馆应该积极行动起来。不但要提供文献资源、电子资源、空间资源,更要加强对高校各个院系、校属科研单位的实验数据、科研成果、学术报告等进行收集、监管、整合以证明自己对学校、社会的价值,进而受到重视。通过对这些数据的分析,挖掘出高校科研前沿、教学新动向,提供定时上门服务、电话咨询等方便灵活的借阅方式,为学校科研、教学的发展做出贡献。另外,高校图书馆应长期监管保存高校院系、校属科研单位的科研数据,构建特色资源库,保持科研的延续性。

3.4 基于数据分析的嵌入式学科馆员服务

学科馆员制度逐渐成为高校图书馆提高竞争力的主要服务,反映了高校图书馆服务领域的变革和创新,表明高校图书馆工作已经形成了与学科、学者、读者联系起来的互动式服务。

随着服务理念的深化以及用户需求的变化,嵌入式学科馆员应运而生。与传统的学科馆员不同,嵌入式学科馆员将服务深入到用户中,参与到用户的学习、科研中,为用户随时随地地提供个性化的、学科化、知识化、泛在化的服务;以用户需求为中心,用户需要什么图书馆就提供什么,深层次发掘用户需求。这就要求学科馆员以院系学科为导向,将院系用户在图书馆检索和浏览电子资源、文献资源留下的行为数据进行数据分类,挖掘用户浏览下载的文献出处、关键词、摘要等,归纳出用户感兴趣的主题,从而提供有针对性的增值服务。大数据环境给嵌入式学科馆员服务提出了新的要求,通过对大数据的分析来提升嵌入式服务的水平,也是未来图书馆服务值得探讨的方向。

[1]中国科学院.郑有炓:大数据带来信息风暴变革人类生活[EB/OL].[2013-12-02].http://www.cas.cn/xw/zjsd/201311/ t20131118_3980073.shtml.

[2]大数据时代:热潮中切忌一哄而上[EB/OL].[2013-12-27]. http://datacenter.ctocio.com.cn/145/12787145.shtml.

[3]孟小峰.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013(50):146-169.

[4]Big data:The next frontier for innovation,competition and productivity[EB/OL].[2013-12-02].http//www.mckinsey.com/Insights/MGI/Research/Technology_and_Innova -tion/Big_data_The_next_frontier_for_innovation.

[5]赵国栋.大数据时代的历史机遇——产业变革与数据科学[M].清华大学出版社,2013(7).

[6]大数据带来IT大挑战 安全整合是关键[EB/OL].[2013-11-12].http://server.chinabyte.com/376/12425376.shtml.

[7]大数据究竟是什么?一篇文章让你认识并读懂大数据[EB/OL].[2013-12-04].http://www.thebigdata.cn/YeJieDong Tai/7180.html.

[8]双十一大数据打造“千人千面”个性服务[EB/OL].[2013-12-07].http://it.gmw.cn/2013-11/07/content_9414420.htm.

[9]资芸,钟叔玉,董毅明.高校图书馆图书采访决策模型研究[J].情报杂志,2007(6):145-147.

[10]姚飞,等.实时虚拟参考咨询服务新尝试——清华大学图书馆智能聊天机器人[J].现代图书情报技术,2011(4):77-81.

[11]李文江,陈诗琴.AIMLBot智能机器人在实时虚拟参考咨询中的应用[J].现代图书情报技术,2012(7):127-132.

曲佳彬男,1986年生。硕士,助理馆员。研究方向:数字图书馆、知识组织。

G250

2014-02-11;责编:王天泥。)

猜你喜欢

图书馆用户服务
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
图书馆
招行30年:从“满意服务”到“感动服务”
关注用户
关注用户
关注用户
如何获取一亿海外用户
去图书馆