大数据时代小数据在高校图书馆的应用价值研究★
2016-05-11孙英月
孙英月
(大连职业技术学院图书馆 辽宁 大连 116035)
大数据时代小数据在高校图书馆的应用价值研究★
孙英月
(大连职业技术学院图书馆辽宁 大连116035)
摘要:通过论述大数据时代小数据在高校图书馆各部门业务中的作用及地位,指出小数据在高校图书馆发展中不可或缺的作用,并对小数据如何更好利用进行了深入细致地探讨,提出切实可行的方案。
关键词:大数据;高校图书馆;小数据应用
短短几年间,大数据就以势不可挡的势头迅速遍布了各个领域,成为引领各行业发展的积极因素。笔者从CNKI中检索2015年高校图书馆有关大数据的文章就有300条之多,几乎涉及到高校图书馆的所有业务范围。大数据诞生之前,我们一直用作分析处理事物的小数据是否已经失去它存在的价值,笔者认为不然。大数据固然有其不可替代的作用,但对于高校图书馆而言,小数据的作用更不容小觑。
1小数据与大数据的区别
小数据(iData),并不是指数据量小,而是指以个人为中心全方位的数据及其配套数据的收集、处理、分析和对外交互的综合系统,是一个富有个人色彩的数据系统,小数据的特点在于以单个人为对象,重点在于深度。大数据(Big Data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。大数据的特点,简单总结为高容量、多元化、持续性、高价值[1]。大数据要回答的是“What”,即“是什么”,而小数据要知道的是“Why”,即“为什么”;大数据注重对眼前形势的分析,而小数据则侧重对
长远发展的探究。大数据对于一些行业,尤其是一些服务群体或客户范围是不特定的、大量的行业最具价值,而小数据对于高校图书馆这样一个服务对象固定,数据也非大量的个体来说则更重要。
2大数据时代小数据在高校图书馆各部门的应用价值
2.1小数据在数据库选购方面的应用
数据库的选购对于任何高校图书馆来说都是一项看似容易抉择难的工作。数据库种类繁多,国内的、国外的,不同专业的、不同层次的、不同价格的,要将这些因素与本单位专业设置、读者层次、购买能力这些情况相结合来决定取舍。首先,决策者一定要清楚本单位读者群状况。一个数据库不管有多知名,应用多广泛,只要不适合本单位读者群就不是一个好的选择对象。例如,大部分专科院校对于博士论文库的采购都要斟酌,因为除了少数几个专科(如医学)外,多数专科院校的学术很难达到这一水平,如果购买,势必会产生曲高和寡,无人问津的后果。再如,读者群如果外语水平没有达到可以无障碍阅读外文文献的层次,就不能大量购买外文数据库。其次,还要考虑数据库之间的相似性、重复性。另外,还可以根据在数据库中浏览的读者人次、人员类型和时间,判断一种数据库的应用前景、被读者接受的程度以决定是否购买。不合理的选购一方面会造成资源浪费,另一方面又会使适合的数据库因缺乏资金而失去被选择的机会。以上这些都要通过对小数据的精心分析才会有最终正确的选择。
2.2小数据在流通统计中的应用
高校图书馆工作中看似随意的安排,其实要想安排得当,其背后对于小数据的分析必不可少。例如,每个图书馆基本都有固定时间闭馆的规定。通过连续几个月中读者到馆人次最少天的小数据统计来确定这一天,既达到了使图书馆休养生息的目的又将闭馆给部分读者带来的影响降至最小。再如,智能系统为图书馆提供了实时数据,其中,闸机系统对于进入图书馆的人员进行了实时记录,我们可以从这些人员的类型、单位、专业,甚至性别来分析,从而得出我们需要的结论并加以利用,可以通过查看某一时期读者到馆量最多及最少的院系,分析排名背后的原因,看是否与院系人数相对多少有关,还是与所学专业有关,或者与图书馆自身馆藏资源结构及相关服务有关。利用这些小数据加以分析,既有利于高校图书馆工作又很好地兼顾了读者利益。与大数据的统计方式正好相反,这些小数据的统计是一种主动的选择。
2.3小数据在信息检索中的应用
信息检索部门的服务很多时候就是小数据的服务,为个别读者提供有针对性的个性化服务,通常为被动形式的服务。有服务要求的读者会提出服务的范围、主题等,信息检索部门的工作人员要根据这些信息,提供检索、查重、推送等服务。因为这种小数据服务与个性化相关,因此信息检索部门的工作更具挑战性,时时处处都要对小数据加以分析,去伪存真。例如,一位读者要查找一篇学位论文,当查找遇到困难时,求助于信息检索部的工作人员,在认真分析了所提供的线索之后,工作人员发现其要找的并不是一篇学位论文,而是一篇会议论文,据此也就顺利地查找到了。信息检索部的工作要想做得尽如人意,就离不开对小数据缜密地分析,需要挖掘小数据中蕴含的有价值的信息,提取出具有鲜明特征的小数据,这种分析正是大数据所忽略的对因果关系的探索。
2.4小数据在采访中的应用
为提高图书利用率,很多高校图书馆都改变了原先单一的采购方式,即图书采购由以采购人员为中心向读者需求为导向转移。图书馆的文献建设工作可以博采众长,让有阅读爱好的读者将其个性化的阅读习惯带入到高校图书馆的采购中,使文献结构体现多样化,以满足更多读者个性化阅读的需求。读者可以通过OPAC进行图书荐购,向采购人员推荐自己认为有阅读价值的书目;一些高校图书馆会将院系教师所选书目订单作为图书采购的一部分;如果书商在本地,甚至可以邀请部分读者随同采购;还可以通过读者借阅情况的小数据分析,查看图书采购中是不是忽略了某些专业图书,或者某些读者群的需求。这些措施的采用将会最大限度地激发读者的阅读兴趣。聆听小数据的声音,体现了对个体的尊重,求同存异,让任何一个有阅读爱好的读者都可以在图书馆找到属于他的那本书。
3大数据时代高校图书馆在小数据应用方面存在的问题
3.1小数据容易被忽视
2014年某高校图书馆购进智能设备,借书还书实现全自助。自助设备投入应用一年后,对借阅的数据进行了统计,结果借阅量呈倍数增长,用大数据的理论看,只关注数据本身就可以了,可是如果用小数据来条分缕析一下就会发现,事实并非完全如此,通过表1可以看出这一年当中还有一些与以往不同的情况。
表1 读者借阅量增加的原因分析
以上种种原因都可能促使图书借阅量增大,而非仅如数据所反映的那么绝对化、表面化。如果不了解大数据背后的这些小数据,不去细分枝节,就会盲目乐观、脱离问题的情境、忽略本质,它不但不能保证因果关系,还可能误导决策。
3.2小数据容易被轻视
小数据很重要,可往往因其渺小而被轻视,在高校图书馆小数据被轻视的例子屡见不鲜,例如,寒暑假前,总有读者询问假期前所借图书到期日。工作人员只能反复解释:假期顺延。相同的问题会被周而复始地提出并解答。如果我们在意这样的小数据,就会试图在这个问题上进行思考,主动让读者得知假期所借图书的归还日期,从而打消读者对于假期所借图书是否会超期的疑虑,并且如果从读者与图书馆的双重利益来考量还可以由此及彼地来想这个问题:既然很多读者都有在假期读书的打算,并且寒暑假基本都有一个多月的时间可以看书,何不在此期间适当放开读者最大借阅册数,这样既可以提高图书的借阅率,也满足了读者的需求。而这些数据通常因为微小而被轻视,这些被轻视的数据如果被重视起来,无疑会对高校图书馆的发展起到举足轻重的作用。
3.3小数据应用不够科学合理
一些高校图书馆对小数据的重要性虽然也有所认识,但落实到具体应用方面却缺乏一定的科学性和合理性。首先,没有具体的部门负责小数据的统计、整理与分析,在一些项目或者事件需要具体数据加以佐证或据以做出决策时无从下手,更不知该由哪些部门给出具体数据。因为高校图书馆各个部门业务在内容上都有一定程度的交叉,这种交叉性容易造成互相依赖又相互推诿,例如自动化部负责全馆的工作系统管理,一些数据只能由自动化部基于一定的技术给出统计数字,但涉及到具体的业务,如采编数据、流通借阅数据等还是应由相应部门给出。由于索取数据的部门往往对于高校图书馆各部门业务并不熟知,就容易造成责任混乱、统计数据不准确的后果。其次,对小数据的应用不够系统,缺乏一定相关性与内在逻辑性,通常只在需要的时候临时收集,缺少规划性,这样的小数据即使被利用,也达不到理想效果。
4大数据时代小数据在高校图书馆有效应用对策
4.1重视小数据应用
关于小数据重要性极其形象的一个例子:“啤酒+尿布。”一家沃尔玛店铺的工作人员在不经意间发现,每个夏季,啤酒销量会伴随婴儿尿布销量增减,经过对销售记录的分析发现,夏季傍晚会有很多年轻爸爸来超市购买尿布,当他们离开时多半会顺便给自己买两罐啤酒,于是他们遵循了这个商品销售规律,有意将啤酒与尿布一并摆放。这是小数据在销售行业有效应用的小案例[2]。
要把握自己的命运就要了解关于自己精确的个体化数据。在高校图书馆,小数据的重要性也处处被体现,它记录了每个读者在图书馆的阅读行为以及图书馆工作人员以读者为中心的服务行为。小数据分析最终将证明其投入的精力和成本是值得的,数据分析成果对业务的推动作用将远超所产生的成本,最终将会为高校图书馆在业务创新和读者管理方面提供决策依据。
4.2拓展小数据应用的深度和广度
从高校图书馆内部的小数据看,可利用的数据源包括读者信息、借阅记录、采访数据、编目数据、检索记录等。例如,读者信息模块,通过对读者人数、性别、单位、院系、专业等自然状况的分析,有针对性地组织高校图书馆资源,合理调整资源分布,使读者状况与图书馆资源的配比达到一个最佳契合点。对流通数据分析,如对图书借阅率的对比,可以适时改变采购图书类型的配比,使馆藏图书结构更趋合理。从高校图书馆外部信息看,包括各院系信息数据和校外信息数据。各院系信息数据,例如国际商务语言系新增留学班,就需要增加相关外语类书籍;某专科要改为专升本,需要增加此专业的本科层次图书;学院实行教学改革,就要根据教改内容及时提供相应服务。校外信息源,如莫言获得诺贝尔文学奖,其相关的书籍在一定时期内必然会受到热读,因而就要考虑适当增加这些书籍的复本。另外政策法规变化以及对其他院校图书馆先进技术与经验的学习研究都是一些相关的校外信息。这些内外部信息是高校图书馆自我调整与改造的原因和动力,都需要对小数据收集整理与分析,得出有价值、有指导意义的结论。
4.3成立小数据应用研究部门
高校图书馆应成立小数据研究部门,收集并解读已经生成的内、外部数据。小数据分析看似简单实则繁杂,同采编与流通等部门相比,它的工作特点更具无形性、零散性,大部分工作都不在表面,但重要性一点也不逊色于其他业务部门,因为小数据研究不仅关乎读者服务,也关乎高校图书馆的决策与发展,一个看似不经意的小数据,却与未来的发展息息相关。比如中国的海尔,运用服务工程师收集的信息推动了创新,最知名的可洗土豆的洗衣机就是在上世纪90年代末,工程师发现一些农村消费者用洗衣机清洗蔬菜造成了堵塞,海尔运用该信息开发了一款在洗衣服之外兼顾清洗土豆、红薯和花生的新型洗衣机,打开了农村这个广阔的市场[3]。
小数据应用研究部门执行特殊的数据分析程序来对一系列的小数据进行收集、存储、管理和分析,识别关键数据信息,以便提供更好的决策。分析人员要有统计、图书资料及心理学方面的相关知识。小数据研究部门可以采取不同的方式方法收集与高校图书馆业务与管理相关的小数据,例如可以组织善于思考的成熟读者组成读者小组,在改革创新图书馆业务的过程中听取读者小组的建议。还可以做一些实际的调研工作,对与高校图书馆相关的内部、外部数据加以收集、整理、研究,使高校图书馆的业务与管理实现精细化和科学化。
4.4实现信息共享与协同
在建立小数据研究部门的基础上,各部门间要实现信息共享与协同,互相协作,建立一个统一的数据信息平台,把涉及本部门的数据信息适时发布在此平台上,供其他部门参考。例如流通部与采编部门是两个在业务上衔接紧密的部门,流通信息的反馈对于采编工作有着极其重要的作用,同样,采编部的信息对于流通部开展工作也不可或缺。而以往各部门之间的信息交流通常是一种被动的交流,即通常在出现问题后才进行沟通,如果建立这样一个数据信息交流平台,无疑会加强各部门之间的协作,使许多问题能够防患于未然,减少人力财力的消耗,也更有利于服务读者。
5结语
“一切数据存在的根本在于人,人的需求是所有科技变革发展的动力。”[4]对于高校图书馆而言,其发展的永恒动力就是读者的需求。从数据中找寻为读者服务的方式方法和途径就是高校图书馆工作的不竭动力。大数据固然有它不容忽视的价值,但在预测股市、战争、地震方面,不管大数据阵容有多大,其最终的作用却微乎其微,而在每次地震海啸过后,人们都会不禁想起那些可以预警的小数据,如果当时有人注意到了,结局将会是不同的。不管是大数据还是小数据,他们都有各自的作用,对于高校图书馆而言,服务对象是固定的读者群,不需要海量的数据对他们的阅读行为进行分析研究,因此更多时候需要小数据发挥作用,我们要让小数据在这个舞台上展现充分,才会使高校图书馆赢得足够多的读者。
参考文献
[1]郭新平、黄贻俊.浅析大数据时代的小数据[J].现代经济信息,2014,(20):149.
[2]鲍勇剑.为什么小数据更重要?[N].第一财经日报:管理周刊,2014-01-17(B04).
[3]徐晋.小数据战略决胜大数据时代[J].数字商业时代,2014,(7):66-68.
[4]陈臣,马晓亭.基于小数据的图书馆个性化推送服务与服务质量保证研究[J]. 情报理论与实践,2015,38(10):95-99.
(收稿日期:2015-11-31责任编辑:孙炜)
中图分类号:G250.76
文献标识码:A
基金项目:★本文系2015年度辽宁省高等学校图书情报工作委员会基金项目“基于微媒体的大学生数字阅读推广研究”(L2015018)的阶段性成果。