APP下载

大数据时代与图书馆

2014-02-11宓永迪

图书馆研究与工作 2014年3期
关键词:图书馆服务

宓永迪

(浙江图书馆,浙江 杭州 310007)

1 大数据时代

大数据(big data)指的是:所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。现在人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、物联网应用更加丰富,更多的传感设备、移动终端接入到网络,由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。例如国内最主要的搜索引擎百度,光是其首页导航每天就要从超过1.5PB的数据中进行挖掘,这些数据如果打印出来将超过5千亿张A4纸。全部摞起来超过4万公里高,接近地球同步卫星轨道,平铺可以铺满海南岛。如今,只需两天就能创造出自文明诞生以来到2003年所产生的数据总量。哈佛大学的社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”我们已经迎来了一个“大数据”时代[1]。

2 图书馆数据增加的原因与利用现状

“大数据”的显著特征表现为:“大量(Volume)、多样 (Variety)、价值(Value)和快速 (Velocity)”。从互联网的角度看,这可以归结为三个基本原因。第一,网络用户的高速增长和用户平均网络使用时间的不断延长,使得用户网络行为数据大增;第二,网络服务从单一的文字形式走向图像、语音和影像等多媒体形式,导致数据量大增;第三,网络终端由过去单一的台式机变为台式机、笔记本电脑、平板电脑、电子书阅读器、手机和电视等多终端,极大扩充了网络服务的内容与范围,大大提高了用户对互联网的依赖度,也就大大增加了数据量[2]。

目前,随着图书馆向数字化、信息化迈进,图书馆拥有、掌握的数据也在日益增加。传统图书馆的数据主要是流通、书目、采访数据,数据量不大,一台普通服务器几十个GB的硬盘即可存放。现在越来越多的读者在网上访问图书馆的文字和多媒体数字资源,也有越来越多的读者携带自己的笔记本电脑、平板电脑、智能手机等移动终端来图书馆,通过无线网络访问图书馆内网和互联网。这些趋势使得图书馆的数据大为增加,除了大量本地多媒体数字资源外,还包括了相应的读者对数字资源的访问日志、网站的浏览点击量、电子阅览室的上网记录、无线网络读者登录数据;引入RFID技术后增加的RFID标签写入数据,RFID自助设备流通、盘点数据、书刊定位信息;门禁系统的读者进出统计信息、视频监控数据,已经需要TB级的存储阵列才能满足要求。今后随着智能书架的应用,智能图书馆的出现,数据量还可能暴增,包括读者实时阅览数据,书刊实时架位信息、被取阅情况;馆内电子支付信息,环境、设备监测信息等等。

虽然图书馆掌握的数据量在不断增加,然而对这些数据的分析、挖掘、利用还远远没有充分开展。各个部门的统计数据仍然是几个较为传统、粗略的项目:新增读者量,读者流量,图书借阅量,采购书刊数量、种类,电子阅览室读者量等,既缺少总体层面上定量的综合性分析、判断、评估,更少见针对某个具体项目或服务的实时动态、精细化的数据表达和解析。如果能够对大量的数据进行深入发掘,就可以更精确地了解图书馆书刊、资源的利用情况,以及读者数量的变化趋势、阅读偏好、行为模式,各项服务的实际效果等,为实际的服务、管理工作提供及时、有效的数据参考和评价指标。

3 图书馆的机遇与挑战

大数据时代为网络业带来了新的机遇。数据量的增加为网络公司提供了精确把握用户群体和个体网络行为模式的基础,如果能够充分利用,就可以探索个性化、精确化和智能化地进行广告推送和服务推广等服务,创立比现有广告和产品推广形式性价比高得多的全新商业模式。同时,通过对大数据的把握,可以寻找出增加用户粘性、开发新产品和服务、降低运营成本等更多的方法和途径。淘宝的统计表明,当前商家80%以上的数据需求是针对消费者购买行为的分析,比如点击量、跨店铺点击、订单流转量甚至旺旺聊天信息的收集和分析等,都是商家极为关心的[3]。

虽然图书馆的目的是为读者提供公益性的服务,网络企业的目的是赢利,但是都是秉承“以用户为中心”的服务理念,在如何满足用户需要、节约用户成本等方面有着许多共同点。因此,大数据时代同样为图书馆更深入、准确了解读者行为和馆藏资源利用情况,并充分了解我们自己,提高自身服务、管理水平提供了过去无法获得的宝贵数据和手段。

例如,通过对各个门类图书借阅量的统计,而不是只统计一个总的流通量,就可以发现利用率明显偏高和偏低的图书种类,从而有意识地增加热门种类图书的采购品种和复本量,降低冷门种类图书的采购数量;进一步分析新书上架后历年的借阅情况,还能看到有些种类的图书其借阅量随时间下降很快,另外一些图书的借阅量则随时间缓慢变化,对于二者,就应该适用不同的剔旧年限,而非现在的一刀切方式。更可以在剔除时精确到单本书,对利用率特别高的热门书暂缓下架。而分析OPAC读者检索情况,包括关键词使用的频率、检索命中的结果数量、在检索结果列表中点击了哪条记录以及预约续借等情况,可以了解读者感兴趣的内容和其检索习惯、效果等。如有大量的续借,是否说明借期偏短;某本书预约排队很长,是否意味需要追加采购量。

通过对读者数据的分析挖掘,则有利于把握读者的行为方式,并根据不同读者的特点开展个性化服务。如分析本馆读者数据时发现,20到30年龄段的读者占了读者量的近60%,而他们的活跃程度则最低。因此,如果能吸引更多的年轻读者,设法增加其粘度,就可起到事半功倍的效果。又例如在统计每年新增读者基础上,跟踪新读者随注册年限变化的动态借阅数量,即可估算出读者的流失情况,如本馆2011年新增读者当年的借阅比例是80%,而2007年注册读者2011年的借阅比例只有20%多,这说明读者的粘度不够,图书馆在如何留住现有读者方面还大有潜力可挖。进一步对读者借阅情况按月份进行细分,发现读者借书高峰期是3月到5月,而低谷出现在9月,暑假则是学生最集中的时段,这些数据有助于图书馆细分读者群,以便在合适的时间开展针对不同读者的活动。还可以分析每个读者的阅读喜好及其变化趋势,有选择地开展精准化的新书推荐、活动通知等服务。

图书馆网上的日志数据也为我们定量精确分析图书馆网络服务提供了手段。现在许多图书馆都建立了专门针对使用移动终端、主要是手机读者的移动图书馆,还开展了全文数字资源的移动阅读服务,但是效果究竟如何,特别是目前手机屏幕越来越大,分辨率越来越高,使用手机等移动终端的读者是否还需要专门的移动图书馆?如果能对网站的服务器日志进行分析,统计出手机图书馆网站的访问量与传统图书馆网站访问量之比,再更细化地从传统网站访问量中抽取出使用移动终端访问的数量,就可以获得相关的数据,得出比较有说服力的结论。又如目前图书馆电子阅览室一般都可凭身份证免费上网,分析本馆电子阅览室的上网日志,可发现有一批以外地年轻打工者为主的读者,经常用身份证上网却不愿意花押金办借书证。图书馆如能深入了解其需求,降低办证门槛,激发引导其阅读兴趣,也许就能将这些“准读者”中的很多人转化为真正的读者。

大数据对于图书馆的挑战表现在几个方面。首先,大数据挑战着图书馆的战略决策能力。大量数据提供的信息可能纷繁复杂,互相之间也可能有矛盾,或者和以前的观念和思路相悖。这就需要能够透过现象抓住本质,找出关键所在,以数据为王,同时综合考虑其他方面因素,大胆进行工作流程和思路的调整。例如如果发现移动图书馆效果不佳,就应果断叫停,把精力集中在传统图书馆网站的改造上,以使其适合多种终端设备,在固定和移动终端上都能有满意的读者体验。

其次,大数据挑战着图书馆的技术开发、数据处理能力和组织能力。大数据的出现以及潜在的价值不仅要求图书馆配置使用更多的数据存储设备和有关的软硬件,而且更要求有专门的数据分析方法和体系。对海量数据的分析不能仅仅局限在一般数据规律和模型的把握水平上,而且要有理论思维和全面把握的综合深入能力。一方面要从过去基于单个部门、服务、项目的碎片式静态统计分析转向全面、完整、动态、实时的分析方法;另一方面要能够从大量的数据中筛选出真正对提高图书馆服务、管理水平有用的数据,并提炼出合适的算法、模型和表达方式。因此,图书馆既需要有数据工程师开发数据分析挖掘程序,也需要有专门的数据管理和分析专家,制定分析的思路、路径,对结果进行比较、判断,为决策提供可靠参考。

图书馆的数据正在日益快速增加,我们应该充分利用这些宝贵的信息资源,以改善图书馆的服务和管理,使得图书馆的服务和管理向精细化、定量化发展。

〔1〕大数据时代:个人信息安全该如何保障[EB/OL].http://www.cnw.com.cn/cloud-computing/htm2012/20120802_251525.shtml

〔2〕DCCI发布:大数据时代互联网营销的5个转变[EB/OL].http://media.people.com.cn/n/2012/0727/c40728-18612202.html

〔3〕 迎 接 大 数 据 时 代[EB/OL].http://www.kaixin001.com/repaste/88276192_6865276452.html#rel ation=parent&message=%7B%22loginprobe%22%3A1%7D&_=0.6974899288499503

猜你喜欢

图书馆服务
图书馆
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
时间重叠的图书馆
图书馆
招行30年:从“满意服务”到“感动服务”
去图书馆