图书馆长尾服务中大数据技术的应用研究
2019-12-12谢福明
关键词:图书馆;长尾服务;大数据技术
摘 要:文章通过对长尾理论内涵以及图书馆开发长尾服务具体策略的分析,探讨了基于大数据技术的图书馆长尾服务体系构建,以期拓宽长尾理论的应用范围,使图书馆服务理论得到创新发展,提升图书馆的服务质量。
中图分类号:G250文献标识码:A文章编号:1003-1588(2019)11-0102-03
1 背景
目前,电子信息以及网络内容出版商都在不断拓展自身在图书信息市场所占的份额,各种信息咨询企业以及搜索引擎企业等也开始提供创新的信息知识咨询服务。受到这些因素的影响,图书馆用户在使用黏性方面出现了急剧下降的趋势,很多读者更青睐网络大数据资源。我国图书馆面对的市场环境不断恶化,市场竞争呈现白热化发展态势。应如何突破以往落后的发展模式,把其所拥有的资源优势更好地与现代科学技术相融合,进一步提升图书馆的服务水平,不被时代所淘汰,是现阶段图书馆亟待解决的重要问题。因此,结合大数据技术,同时引入长尾理论,树立长尾服务理念,是图书馆服务工作中非常重要的创新策略。
2 长尾理论内涵
最早提出长尾理论的学者是克里斯·安德森,他在《长尾》一书中非常全面和深入地探讨了长尾理论。长尾理论就是在网络环境下,产品制造的成本进一步降低,而且产品的流通渠道越来越多样化,产品储存相关平台规模日益扩大,之前看似存在很少需求的一些商品同样有潜在需求,简言之就是“任意一种商品,都会有一定的市場”。虽然很多商品市场的需求数量相对较小,而且销售数量也不多,但所有这些产品对应的市场份额却与主流商品所占据份额相当,在特殊情况下还拥有更大的优势(见图1)。
在长尾理论中,人们可以将长尾理解为是对统计学的一种通俗表达。对于图书馆而言,长尾代表的是图书馆有20%左右的信息资源能够为80%左右的读者提供服务,图书馆应当重视这20%信息资源的管理工作,但是,还有80%的信息资源由于利用率低而不被图书馆所重视,而在长尾理论中,图书馆应同样重视这80%的信息资源。现阶段,图书馆借助于大数据技术,对利用率相对较低的80%的信息资源进行挖掘与分析,在进行流程的优化设置之后,能够更好地利用这些信息资源,确保图书馆为读者提供更丰富、更优质的服务,在实现供需平衡的基础上确保读者的满意度也随之提升。
3 图书馆开发长尾服务的具体策略
对于图书馆而言,其拥有相对丰富的信息资源,另外还能够借助馆际互借以及交流等方式确保图书馆信息资源更加丰富与多样化,这为图书馆开展各项服务工作提供了最为可靠的基础保障。依照长尾理论相关内容,从聚合供应以及聚合需求等相关成本进行分析,目前图书馆在为读者提供服务的过程中应当认识到自身独有的优势,进一步优化所提供的服务内容与方式,而长尾理论相关内容为图书馆服务的进一步优化与创新找到了契合点。笔者结合自身的实践经验,以读者实际需求为切入点,探讨了图书馆开发长尾服务的具体策略。
3.1 满足需求
如果企业仅仅拥有单一利基产品,则无法确保会达到相对高的销售数量,而当所有的利基产品聚合到一起后,它们在市场中所占份额就可以与热销的商品相比拟。在图书馆服务优化与创新过程中,引入长尾理论正是应用了这一内容。现阶段,我国已经进入了大数据时代,读者对于信息的需求同样也呈现出急剧增加的态势,无论是从需求强度抑或是需求频次等方面,读者的实际需求均显著增加。然而,在大数据环境下,读者在图书馆检索、获取信息存在较大困难。图书馆基于满足需求的长尾服务策略就是在读者和各种信息资源之间构建起一座桥梁,其中最具代表性的服务种类就是图书馆所开展的个性化荐读服务。
由于读者之间实际的信息需求存在较大差异,而对于图书馆而言其长尾需求所拥有的真实价值就是每一个读者个性化信息需求之和。要想确保实现满足所有读者个性化信息需求这一目标,图书馆在提供长尾服务的过程中要对所有读者的实际需求都给予重视,确保所有读者的信息需求均得到满足,而得到满足的需求聚合在一起,就可以使图书馆取得非常巨大的服务效益。
3.2 创造需求
通过分析长尾理论相关内容可知,在特定的条件下,所有以往认为需求非常少的产品,只要能为顾客提供,便会有顾客购买。这一理论也让人们了解到,图书馆所提供的长尾服务中,很多从表面上看好像没有人需求的服务内容,同样存在一定的长尾价值。图书馆所提供的长尾服务在很多情况下属于潜在服务、非显性服务。图书馆长尾服务由满足需求逐渐向着创造需求这一方向转变,这与大数据时代下产品设计理念正好相契合。
在图书馆向读者提供各种服务的同时,也会产生与之对应的各种类型的信息,这些信息汇聚到一起便成为“富信息”。图书馆通过对这些数据信息的应用,可以进一步、更精准地创新服务模式,预测未来发展态势等。图书馆结合创造需求这一长尾服务策略,重点对资源内容进行挖掘,可以更好地满足读者的信息需求,为读者提供更为优质的信息服务。
图书馆开发长尾服务的具体策略对比分析如表1所示,本研究是基于“创造需求”策略开发图书馆长尾服务。
4 基于大数据技术的图书馆长尾服务体系构建
基于“创造需求”策略的长尾服务主要是挖掘更为深层的信息与知识,仅仅通过一些简单信息统计分析无法达到大数据挖掘的实际需求。因此,通过独特的方法确保大数据潜在价值得到充分挖掘,从大数据中找出有用的信息与知识,是图书馆长尾服务开展的基础与保障。
4.1 业务理解
图书馆长尾服务体系的最终目的是为了建立图书馆的长尾服务模式,并利用长尾服务模式对现阶段图书馆服务加以优化和创新,提升图书馆服务质量,确保长尾重构的目标得到实现,进一步提升长尾服务的实际价值。而在进行数据挖掘的过程中,图书馆需要应用大数据技术,对各项工作开展过程中形成的各种类型的数据信息进行收集,这些信息不仅包含图书馆自身的信息,同时也包含读者的行为信息以及双方共同形成的其他信息。图书馆在利用大数据技术进行数据信息分析后,可以从中发现与热门服务不同的长尾服务需求,并将其应用到图书馆服务优化中。
4.2 数据获取
图书馆在开展各项工作的过程中,所形成的数据信息类型是多种多样的,其中不仅包含读书借阅信息、数字化图书订阅信息等结构化信息,同时也包含读者行为信息、文献资源评价信息等半结构化和非结构化信息。图书馆在利用大数据技术对这两种信息进行数据挖掘的过程中,涉及以下两个方面的内容:①直接对数据库信息进行迁移或转换。图书馆在迁移或转换数据库信息时,应格外重视各个数据库相互兼容的问题,要确保各个数据库之间的数据类型是一致的,同时还应确保对图书馆以及图书馆用户个人隐私进行有效保护,避免出现隐私泄露问题。②主动获取服务信息。大数据时代,互联网已得到普及,读者在网络中检索信息的相关数据会被储存在数字图书馆客户端以及图书馆日志等相关数据库中,为图书馆获得读者阅读行为数据信息提供了便利。在图书馆获取读者行为数据信息时,所利用的大数据技术主要包含数据挖掘技术、网络爬虫技术以及门户追踪技术等。
4.3 大数据预处理
图书馆在收集大数据信息时,由于所包含的信息量非常巨大,不可避免地会出现信息缺失以及噪音等问题。要想确保所获取数据信息的高质量,图书馆应将相关信息进行转换、选择与集成处理,最终将数据储存在数据仓库中。因为长尾模式的重构需要应用离散点大数据挖掘相关技术,所以图书馆在进行数据信息的预处理过程中应当确保数据处理的科学性及客观性,将一些带有明显错误的数据全部删除。在完成数据的预处理后和开展大数据挖掘工作前,图书馆应当利用统计方法梳理及分析相关数据信息,从中发现数据信息所拥有的统计学特性,基于这些特性开展大数据挖掘工作,以便确保后续工作能够更加顺利地进行。
4.4 大数据转化
图书馆应参考数据的不同类型以及数据的度量标准进行大数据的转化,而在一些关系型数据库中,各种数据的形态相对而言所受到的约束较大。因此,图书馆在对连续变量开展离散处理工作时,应把其中的异常数值转变为指定数值。此外,对于一些属于半结构数据或非结构数据的文本数据而言,一般不会存在这样的约束条件,图书馆在开展数据信息转化工作时要在分析语义及信息特征的基础上,进一步对文本信息中的分词、主题词等进行准确提取,确保把非结构类型的数据转化为结构类型,便于后续大数据挖掘工作的顺利开展。
4.5 长尾服务识别
在图书馆开发长尾服务模式的过程中,最为关键的就是对长尾服务模式进行准确识别。只有有效地识别了长尾服务模式,才能为长尾服务数据挖掘模型的建立提供可靠的基础。在此环节中,图书馆应对大数据挖掘技术进行充分、合理的应用,结合实际问题制订有针对性的大数据挖掘方案,同时还应勇于创新,构建完善的长尾服务模式。
4.6 图书馆长尾服务模式评价指标
由于目前对长尾服务的相关研究还不太成熟,仍处于探索阶段,图书馆在长尾服务模式重构过程中未能建立较为统一的评价指标。为此,笔者结合自身的工作实践,同时依照长尾服务最终的目标及内涵,制定了以下评价指标:①长尾指数评价指标。长尾指数指的是所挖掘的需求模式和长尾理论自身特征之间的匹配程度。如果在经过大数据挖掘之后所得到的长尾模式属于大众模式、热门模式等,那么就与长尾模式的实际要求不相符。②统计指数评价指标。统计指数是以定量的方法对所挖掘的长尾模式进行评价,如通过应用均方误差的方法对长尾模式所擁有的聚类效果加以评判。③大数据自身特征评价指标。大数据特征是以定性的方法对长尾模式进行评价,是基于元数据特征以及长尾模式的现实意义等内容对其开展评价。④图书馆目前实施的服务评价指标。虽然图书馆长尾服务属于一种创新的服务模式,但其仍属于图书馆提供的一种服务,因此同样能够借助图书馆目前实施的评价指标对长尾模式开展评价工作。
4.7 长尾服务模式表达
图书馆长尾服务模式表达就是将通过大数据挖掘所得出的长尾服务模式应用到图书馆服务工作中,将长尾服务呈现在用户面前,确保用户能够更为精准与快速地检索到所需的信息资源。图书馆通过对读者阅读行为信息进行收集和梳理,可以利用推荐算法将符合长尾服务模式的相关信息资源实时推送到用户手中。基于大数据技术的图书馆长尾服务体系构建流程如图2所示。
5 结语
目前,网络技术的广泛应用为图书馆的发展提供了良好的机遇,同时也使图书馆面临严峻挑战。图书馆传统的服务模式僵化落后,使馆藏信息资源无法得到充分的利用,信息化程度相对偏低。在图书馆服务中引入长尾理论,构建图书馆长尾服务模式,可以更全面地挖掘数据信息的潜在价值。把长尾服务模式进一步提炼为长尾知识,并将其应用到图书馆服务优化与创新工作中,可以更好地推动图书馆的发展,确保为读者提供更为优质的服务。
参考文献:
[1]李迪,颜斌.长尾理论在图书馆馆藏建设中的指导意义[J].河南图书馆学刊,2017(10):110-112.
[2]赵蓉英,汪馨雨.基于长尾理论的图书馆众包服务模式初探[J].图书馆杂志,2017(3):20-26,57.
[3]徐健晖.长尾理论对图书馆用户服务工作的启示[J].内蒙古科技与经济,2016(19):128-129.
[4]陈淑平.二八定律和长尾理论在图书馆事业发展中的共生应用研究[J].情报探索,2015(12):123-126.
(编校:崔 萌)
收稿日期:2019-10-17
作者简介:谢福明(1982— ),福建师范大学图书馆馆员。