APP下载

数字图书馆中长尾效应的实证研究

2023-11-11帆,李

江苏科技信息 2023年27期
关键词:长尾次数图书

袁 帆,李 佳

(1.上海第二工业大学 图书馆,上海 201209;2.华东师范大学 教育学部,上海 200062)

0 引言

二八定律也被称为80/20法则,是一种基于“重要的少数与琐碎的多数”原则的量化标准,该原理由19世纪意大利经济学家维弗雷多·帕累托提出,他发现20%的产品或活动通常占用了80%的资源或收益。在管理学中,二八定律通常用于识别和优化关键的20%因素,以获得80%的成果[1]。“长尾”一词由克里斯·安德森于2004年在《连线》杂志上提出,与80/20法则的解释截然不同,常用于解释如亚马逊和Netflix的在线商业和经济模型,最初它指的是销量较小或不被重视的产品或服务。由于它们的种类繁多,总销量庞大,并且累计总收入超过主流热门产品的收入,随着互联网和产品信息化的发展,数字产品存储成本的压力逐渐降低甚至抵消,当存货存储成本不再是一个重大问题时,长尾理论的应用就蓬勃发展[2]。

长尾理论在图书馆领域并不陌生,自2004年长尾理论提出以来,美国图书馆协会(American Library Association,ALA)多次邀请安德森进行演讲,探讨数字化和互联网环境中的信息资源建设和用户服务等问题,ALA确信长尾理论能够对拓展信息用户范围、全面保障用户需求产生积极作用。在以纸质图书收藏为主的传统图书馆文献资源建设中即有学者提出要抓住20%具有特色的馆藏资源进行重点建设以改变过去仅依靠经验办事的做法,避免信息资源建设中的盲目性和随意性[3]。而进入信息时代后,随着图书馆的数字化转型,图书馆正通过提高数字资源的质量和数量逐步加强数字资源的建设,相关学者开始关注长尾理论在图书馆服务中的应用。倪娟等[4]认为图书馆应该积极应用长尾理论,拓展新服务,发掘新的服务增长点;周欢等[5]提出了图书馆利用长尾理论中生产普及、传播普及和供需相连3种力量推广全民阅读的策略。

过去,数字图书馆在讨论长尾理论时主要聚焦于数字资源,如电子期刊资源建设和电子图书的利用情况等。随着数字图书馆用户群体的不断增加,用户需求逐渐呈现多元化,如何挖掘图书馆潜在的“长尾”,以扩大资源和服务的利用率,进而提升对读者的服务质量,已成为数字化时代图书馆转型与发展的重要使命[6]。而长尾理论在图书馆应用中的实证研究较少,可能缺乏准确、全面的数据证明其存在性,大部分研究停留在讨论、分析和评论等方面。在数字环境中是否有确切证据表明图书馆信息资源利用情况呈现长尾现象?图书馆如何在资源建设或用户服务中运用相关理论来有效提升其管理效率和服务质量?本文希望在以上问题上展开分析与探讨。

1 理论基础

长尾概念被广泛应用于在线商务、大众传媒、知识管理、社交网络传播、市场营销等领域,主要面向需求较低或不太受欢迎的产品,安德森认为这些产品实际上可以增加利润率,因为消费者正在远离主流市场。随着互联网的发展,电子商务平台的出现打破了传统的销售模式,使得长尾产品也能够获得更广泛的市场机会。通过互联网和电子商务平台,商家可以将长尾产品与潜在的小众消费者连接起来,从而实现销售和利润的增长。这种模式可以为消费者提供更多元化的选择,并为商家创造更多销售机会[7]。长尾理论的数学模型体现在两个变量之间的关系成为幂律。由于长尾非常长,长尾的面积与头部的面积相同。在实际应用中,X轴通常表示产品种类/文献资源种数,Y轴表示商品销售量/文献资源销售量,传统关注头部(20%)的80/20法则在长尾细分市场则强调尾部(见图1)。

图1 长尾现象

过往图书馆在采购图书和其他信息资源时通常更注重热门和畅销的文献,对利用率较低的资源采购较少。然而长尾理论认为即使利用率较低的“长尾”资源也具有一定的使用价值,并可能在整体利用中占据重要比例。这与二八法则不同,但同样适用于图书馆管理决策,即图书馆不仅应关注主流读者、馆藏资源和服务,还应善于挖掘潜在用户需求。随着读者群体的多样性增加,特别是综合性研究型图书馆和大型公共图书馆,如何识别非主流图书馆读者需求、进一步了解并满足这一群体的需求以扩大图书馆资源服务的广度与深度,已成为图书馆数字化转型过程中信息服务的重要任务。

2 研究设计

印度图书馆学家阮冈纳赞(S.R. Ranganathan)于1931年提出了图书馆学五定律,被国际图书馆界誉为“我们职业最简明的表述”。这五定律是:书是为了用的;每个读者有其书;每本书有其读者;为读者节省时间;图书馆是一个生长着的有机体[8]。这五定律强调了图书馆的成长性、多样性和以读者为中心的核心理念。本研究即基于以读者为中心的信息资源建设与服务视角,探索长尾理论在图书馆中的应用,基于读者借阅数据以探索可能存在的“长尾分布”现象,并进一步分析其特征,为以读者为中心的信息资源建设与服务模式提供参考依据。

本研究以大学数字图书馆国际合作计划(China-America Digital Academic Library,CADAL)网站的用户借阅数据为分析对象,CADAL是一个由国家投资建设的数字图书馆项目,旨在构建多学科、多类型、多语种的海量数字资源。目前,CADAL已经拥有近280万册(件)的数据,而本研究选取了2022年CADAL网站完整的322 084条借阅数据作为分析基础。为了保护图书馆读者的隐私,在获取和分析数据之前,CADAL项目管理中心对由数据提供单位提供的41 587 374条涉及网站用户、资源、检索记录、借阅记录和浏览记录等相关信息进行了预处理操作,删除了能够识别读者隐私的数据,如读者姓名、电话号码等。

长尾理论旨在探讨高流通率和低流通率产品,本研究将图书馆的文献资源视为图书馆的产品,并将图书的利润定义为被读者借阅的次数,因此借阅次数更多的图书被视为高流通率的产品。本次研究对图书的借阅次数进行排序,然后计算与借阅次数对应的图书数量,从借阅次数最大和最小的端点开始累积图书的借阅次数,并检查当这两个累积数字最接近或相等时的情况,以确定是否呈现长尾现象。

3 研究结论

本研究以每本书的借阅次数作为衡量其受欢迎程度的指标,借阅次数越多表示该书越受欢迎,可以被视为热门图书。研究根据322 084条借阅记录对图书的借阅次数进行聚合,并得到了98 707种图书的有效借阅量统计表。最高和最低的累计借阅次数分别位于两端,如表1所示。

表1 CADAL图书资源借阅统计

研究根据不同借阅图书种类和对应的借阅量,统计了各区间图书借阅总量及其占比,以确定CADAL的信息资源利用情况是否呈现长尾分布(见表2),并在表2数据基础上绘制CADAL信息资源利用分布情况图(见图2)。

图2 CADAL图书资源利用情况

结合表1和图2的数据分析,如果从借阅次数最高的312次开始并将借阅次数进行累积,在长尾曲线中会有一个头部和长尾的分割点。因此,研究将322 084本借阅次数为6次的书籍分为两部分,可以发现头部区域的面积等于长尾的面积,也就是图书馆借阅的书籍数量和书籍借阅次数之间的累计借阅次(册)数是相等的,因此可以确定CADAL的书籍借阅次数与图书馆借阅数量之间呈现长尾现象。

4 研究启示

长尾理论认为通过优化资源的组织,可以提高资源的利用率。图书馆传统观念中那些低流通率的“冷门”文献资源,虽然单个来看利用率很低,但由于其数量巨大,汇集起来的利用总量是巨大的。根据统计分析,本文认为图书馆不仅关注热门的畅销书和热门话题,还应纳入更多的冷门主题和专业领域的书籍,特别是对于综合型图书馆,在不受复本数限制的数字文献资源建设中,应优先考虑扩大馆藏范围,尽可能提供更多长尾资源的数字版本以满足读者多样化的需求,提供更广泛的知识覆盖。

传统图书馆通常根据热门度或借阅量进行图书推荐,本次研究表明用户的兴趣和需求是多样化的,他们可能对某些较小众的主题或领域感兴趣。此外,为了建设更多元、更广泛的信息资源,本文认为图书馆可与其他机构或资源平台合作,提供更广泛的信息服务,通过共享资源和知识,促进“长尾”需求的满足。

5 讨论

图书馆的信息资源建设应将有限的经费和人力投入对读者最重要和最有价值的资源建设上,通过分析读者的借阅情况和反馈可以确定哪些资源最受读者欢迎和最有价值,这些资源应成为图书馆重点建设的对象。本次研究可以确定CADAL的读者对资源利用情况确实呈现长尾现象,因此本文认为图书馆应该尽可能扩展数字资源的范围,提供多样化的信息服务以满足读者“长尾”需求,不应忽视学习和研究的多样性。

但通过进一步数据分析,本文还发现约20%的常用图书可以满足约61%的读者需求,有70%的冷门信息资源利用率不到30%,借阅次数少于10次的书籍利用率约占89.92%,大约40%的书籍仅被借阅一次。因此本文还认为对于资源有限的图书馆,应将有限的采购经费优先用于购买占据读者需求的重要资源,如对于需求量较大、借阅量较高的学科主题,可以加大资源采购力度,确保这些学科主题的资源建设得到更多的重视和投入,这样能在有限的条件下最大限度地满足读者的借阅需求。而在图书馆的布局设计中,可以将重要资源、热门区域或服务放置在易于访问和吸引人的位置,对于数字资源平台,可以将热门资源放在首页或推荐板块,以提高资源的可获取性和利用率。

猜你喜欢

长尾次数图书
机场航站楼年雷击次数计算
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
一类无界算子的二次数值域和谱
图书推荐
欢迎来到图书借阅角
长尾直销产品图鉴
长尾豹马修
追踪长尾豹马修
班里有个图书角
依据“次数”求概率