APP下载

基于紧缺程度的图书复本策略优化与验证*

2023-11-16丁玉东韩雪飞

图书馆学刊 2023年10期
关键词:日志流通馆藏

丁玉东 姜 波 韩雪飞

(燕山大学图书馆,河北 秦皇岛 066004)

复本或复本数是图书馆纸质文献资源建设中的一个重要概念,是图书馆馆藏发展政策中的重要内容之一。图书的种类决定文献保障率,而复本数的多少直接影响图书的满足率,进而影响读者对图书馆的满意度。但随着时代的发展,预测复本数愈加困难。读者兴趣、阅读载体、阅读行为快速变化;开放存取、PDA采购、新媒体的发展等诸多因素降低了读者对纸质图书的依赖。同时,馆藏空间不足、图书出版价格快速上涨以及因新冠肺炎疫情带来的经费缩减也对图书馆的馆藏结构及图书采购工作产生重大影响。

1 现有复本采购模式存在的问题

1.1 预置复本采购模式缺点明显

在较长时期内,图书馆依据经验或计算等方式推测每个学科分类的图书应配置的册数。从闭架管理时期对复本概念的辨析和对复本数[1-2]的计算,到利用复杂的数学模型对影响复本量的因素以及图书流通数据进行量化分析[3-10],以期给出未来一段时间采购图书时应配置的复本数,笔者称之为“预置复本”。但这种采购模式的缺点也非常明显。如经费使用效益低、浪费空间和人力资源、馆藏质量下降等[11]。另外,影响复本数的因素很多并且难以量化[12],学者提出的各种数学计算模型又非常复杂,无法广泛用于采访实践[4];对学科分类进行平均复本数估算而不是具体图书,也缺乏精准性。甚至有学者认为“传统的复本采购方式以自我为中心,并非以读者需求为中心”[13]。

1.2 “单复本”采购模式中重订因素有待商榷

随着信息环境的变化,越来越多的高校图书馆采取“保种类,降复本”[14]或“单复本”[15]的采购策略以应对上述变化。如暨南大学[16]、复旦大学、上海海事大学、青岛大学[17]、南京工业大学[14]等高校图书馆,普遍采取初订时仅采购一个复本,后续根据读者使用情况予以重订的采购方式。在重订复本时,如何更简单有效地掌握读者的实际需求成为精准采访的首要问题。有学者提出应该抓住影响复本数的主要因素,简化计算方法,利用图书的流通次数和预约次数判断图书的紧缺程度[12-13],即通过图书的实际使用情况所反映的读者需求有针对性地重订,既可以满足读者需要,又规避了上述预置复本采购模式的缺点。

但笔者在工作实践中发现,如果仅凭借图书的流通次数和预约次数作为重订复本的参考依据,仍存在缺陷:(1)流通次数并不直接反映图书的紧缺程度。对于人文、社科类非学术图书,读者阅读速度快、周转率高,但其学术价值较低;而需要细致研读的图书,读者借阅后会倾向于长时间保留在手中,叠加寒暑假自动延长借期、续借等因素,其全年最大流通次数一般不会超过6次。另外,在一定时期内,流通次数与图书的复本数量也呈正相关性[18]。因此,以流通次数来决定是否重订复本会漏掉部分学术价值较大的图书,失之偏颇。(2)预约数据不全面且包含偶发因素。预约行为主要发生在读者需求明确且通过检索发现图书已借出时,而读者在书架中随机浏览时无法看到已借出的图书,被迫降低期望选择其他图书,导致上述图书无预约数据或预约量低;另外,受社会热点、社团活动或个别推荐书单的影响,存在短期内大量预约而过后无人问津的情况,原则上这种情况无需补充复本。甚至有图书馆因为人员、技术等原因没有开放预约功能,无法获取这一数据。

纸质图书目前仍然是馆藏文献资源建设的重要组成部分,是学生读者的重要学术信息来源,也是阅读推广工作的重要载体,构建更加简单、合理和实用的图书复本策略仍有现实意义。为解决上述问题,笔者提出一种“单复本”采购模式下利用“图书借出天数”与“图书馆藏天数”的比值来判断图书紧缺程度的方法,进而辅助图书复本采购的策略,经过与读者预约数据相互验证,认为具有较高的可行性。为表述方便,笔者所述“复本”的概念采用日常工作和交流中常用的意思,即同一种图书的其中一册为一个复本,不再有意区分“正本”和“复本”,并且涉及复本数的内容均指流通复本数,不考虑保存本或样本书。

2 研究思路及实施过程

2.1 解决问题的思路

复本策略的提出基于以下认知:

(1)图书借阅是读者间接参与馆藏文献资源建设的重要方式。读者的需求、兴趣及其所反映出的图书主题、借还时点、持有时间等信息均隐含在图书借阅日志中,对借阅记录数据进行挖掘和分析,可以在很大程度上确定读者的需求,比读者抽样调查数据更全面、更有意义。

(2)采购经费决定图书采购数量。图书馆每年采购图书的册数受限于学校拨付的经费、图书的平均销售价格和采购折扣。其中采购折扣相对稳定,平均售价可由上一年度采购的图书价格预估,因此采购经费直接决定年度采购册数。

(3)紧缺的图书会经常处于借出状态。一种图书,无论其复本数量多少、学术价值高低、读者人数多少、半衰期长短以及学科主题和借阅制度,如果读者需求明显,那么同一个读者或不同的读者会尽可能地持有和使用,归还后也会在短时间内再次被借出流转,即在架时间短、借出时间长,呈现持续紧缺的状态。所以,某种图书在一个较长周期(如一年)内的累计借出时长可以反映图书的被需求程度。但是考虑到不同种类图书的复本量不一样,或者图书的多个复本入藏时间不一致,入藏时间早的复本,其累计借出时长一般要大于入藏时间晚的复本。所以累计借出时长同样无法直接用于衡量某种图书的紧缺程度。

因此,笔者引入“馆藏时长”这一指标,即在考察周期内,图书已经入藏的时间长短。如考察周期为2021年,则2020年及之前入藏的图书在2021年的馆藏时长为365天,2021年当年入藏的新书或新复本的馆藏时长为从典藏时间起至2021年12月31日之间的天数。

2.2 构建复本采购决策指标

综合上述因素,对同一种书,其所有复本在一个周期内的累计借出时长,与这些复本在该周期内的馆藏时长之和的比值,称为“紧缺指数”。用公式可以表示为:

其中,累计借出时长指一种图书的所有流通复本在考察周期内被读者持有的天数之和。馆藏总时长指一种图书的所有流通复本在考察周期内的已典藏天数之和。“紧缺指数”值越大,说明总借出时长占馆藏时长的比重越大,该图书滞留在读者手中的时间越长,其他读者借到的可能性就越低,越需要补充复本。理论上其最大值为1,即从入藏当天起一直被借出,在读者手中的时长等于馆藏时长。综上,在具体采访实践中,根据学校拨付的经费可以确定当年采购图书总册数;对于采访馆员认定会有较大需求的图书,可以直接多复本采购,其他新增图书只采购一个复本;通过计算上一周期流通图书的“紧缺指数”估算需要重订复本的数量。至此即可大致确定当年采访的新增种类和复本数量,前者负责资源建设中的文献保障率,后者负责文献保障条件下的满足率。

2.3 数据获取与处理流程

燕山大学图书馆使用江苏汇文软件有限公司的Libsys业务管理系统,可按时间段导出流通日志和馆藏清单。每册图书具有唯一的财产号,每种图书具有唯一的索书号。预约权限仅向研究生和教师开放,本科生的预约需求无法体现,导致预约数据只能在部分程度上反映图书的紧缺程度。年采购新书约5万册,平均复本数约2.3册,其中包括一册保存本(除文学作品外)。

为计算方便,笔者以一年为周期进行考察。2020—2021年因新冠肺炎疫情、新馆搬迁等因素影响,读者在校时间短,部分图书被打包存放,导致数据不完整,因此笔者选取2019年的流通数据进行分析。

第一步:导出2018—2019两年的流通日志,但2018年的数据中仅需要保留2018年借出、2019年归还的记录,删掉2018年当年借出当年归还的记录。

第二步:对于2018年借出、2019年归还的图书,借出时长从2019年1月1日开始计算;对于2019年借出、截至2019年12月31日尚未归还的图书,借出时长截至2019年12月31日。即得到2019年内全部有借出和归还记录的图书的流通日志,只保留可以计入2019年内的借出时长。

第三步:利用归还日期减去借出日期再加一天(日期均为上一步截取之后的日期),得到该次流通在2019年产生的借出时长。之所以“加一天”,是考虑日期之间的差值比图书实际被占用的时间少一天。

第四步:按照财产号进行分组聚类,可获得每册图书的借出次数(每册图书的一条流通记录即为一次借出)、累计借出时长(对每册图书每次借出的天数求和),并保留索书号字段。聚类后生成的新表格内不再有重复的财产号。

第五步:导出2019年新入藏的图书及入藏日期。利用“2019-12-31”减去当年入藏图书的入藏日期,得到该册图书当年的馆藏时长。

第六步:为第四步生成的新表格匹配第五步生成的每册新入藏图书的馆藏时长。对于2018年及以前入藏的图书,默认填充其在2019年的馆藏时长为365天。

第七步:按照索书号对第六步的数据进行分组聚类,可获得每种图书的累计借出时长(对每个复本的累计借出时长进行求和)、每种图书的馆藏总时长(对每个复本的馆藏时长进行求和),同时还可以得到每种图书参与流通的复本数(每个索书号对应几个财产号即为几个复本)、每种图书的流通总次数(对同一索书号的借出次数求和)。

至此,得到每种图书在一年内的流通复本数、流通总次数、累计借出时长和馆藏总时长。用借出总时长除以馆藏总时长,即可得到紧缺指数。借助得到的流通复本数、流通总次数,还可计算出每个复本的平均馆藏时长和平均借出天数,用于辅助采访馆员决策。同时,由于当年入藏图书的馆藏时长不足365天,因此如果馆藏总时长不是365的倍数,即可判断该种图书的复本中含有2019年当年入藏的新书。用索书号匹配到图书书名,可以更好地帮助采访馆员做出是否重订的决定。

2.4 根据紧缺指数进行重订

根据计算得到的紧缺指数,结合图书采购工作实践,在具体重订时可分为以下几种情况:(1)复本数已达最大值。对于复本数已达到馆藏发展政策中规定的最大复本数的,可以直接忽略,或给予特殊重订。(2)紧缺指数大于1,即平均借出时长大于365天。通过流通日志可以发现这类图书仅有1个复本,均为特殊读者长期占用,因其归还后立即借阅,每次借阅会产生1天的借出时长,导致计算时累计借出时长超过365天。这种图书数量极少,一般无需重订,或需要结合学科特征单独分析。(3)平均馆藏时长小于365天。如果平均馆藏时长小于一定时间,如60天(两个借阅周期),说明该图书入藏时间较短,借出时长和借出次数尚不足以考察其紧缺程度,则紧缺指数意义较小,在重订时可忽略或酌情考虑。如果平均馆藏时长大于60天,说明该图书为2019年11月份及之前入藏的新书,或存在2019年新增的复本,该指数能体现图书的紧缺程度,可供参考。(4)平均馆藏时长为365天。说明该图书的所有复本均为2019年以前入藏,该指数能体现图书的紧缺程度,采访馆员可在馆藏发展政策的控制下,结合已有复本数、分类号、借出次数等指标综合判断是否重订。

3 数据验证及有效性分析

为进一步检验上述复本策略的有效性,根据燕山大学图书馆2019年的流通日志计算出当年的图书紧缺指数,并把得到的数据与当年读者预约数据进行匹配和比较。

3.1 按照紧缺指数分布的图书种类及其占比

按照流通日志和上述计算得到的数据,2019年共有68908种图书被借出,去除平均入藏时间60天以内的图书890种,对剩余68018种图书按紧缺指数分组(以0.9代指0.90~0.99区间,下同),各阶段所包含的图书种类及其比例分布如表1所示。

表1 2019年紧缺指数分布(种数,占所有种类的比例)

从表1可以看出,当年所有有流通记录的图书种类中,紧缺指数0.6以下的图书占比超过90%,即绝大多数图书有半年以上的时间是在架状态,读者使用频次不高。

3.2 预约次数与紧缺指数的相互关系

仍以2019年数据为例,共有996种图书被预约1753次,单种图书最大预约次数为20次,平均预约次数为1.76次,预约中位数为一次。相对来说,预约次数高的图书种类少,被预约一次的图书有659种,占总预约种类的66.2%,占预约次数的37.6%,如表2、表3所示。

表2 2019年预约次数分布及其平均紧缺指数

表3 2019年按紧缺指数分组囊括的预约次数

结合表1~3可以看出,紧缺指数越低的图书种类越多,但被预约的次数越少,正符合日常工作的认知。同时也说明紧缺图书相对较少,多数图书拥有相当长的在馆时间。随着紧缺指数的减小,重订这些图书的复本对满足读者预约需求和借阅需求的边际效益在降低。

3.3 重订复本后的借阅表现

笔者随机选取了6种2019年紧缺指数超过0.9,2019年及之前采购且在2020年重订复本至3册的图书,观察其后续借阅情况(见表4)。

表4 重订复本图书在2020—2021年的借阅表现

3.4 紧缺指数的有效性分析

3.4.1 紧缺指数可以作为复本重订的重要判断依据

以表1中的数据为例,考虑指数介于0.7~1之间的图书需要补充复本,即全年365天平均每种图书有110天(略大于寒暑假总天数)属于在架状态,则仅有1742种(约占流通种类的2.6%)的图书需要考虑重订。与预约数据相匹配,这些图书包含493种图书的1134次预约,即全年预约图书种类的49.5%,预约次数的64.7%,在图书馆年度采购量中占比很小。

从表2的平均紧缺指数来看,被预约3次及以上图书的平均紧缺指数均大于0.7。在详细数据中,被预约3次及以上的153种图书中仅有21种图书的紧缺指数小于0.7,笔者进一步分析流通日志和预约时间,发现这21种图书均属于短期内较为集中的需求。即紧缺指数的高低与图书预约次数有明显的正相关性但覆盖更加全面,可以作为复本重订的重要判断依据。同时也说明少量的预约次数并非图书重订的指征,图书每个复本的在架时长更能反映图书的紧缺程度。

从表4的借阅数据来看,重订图书的紧缺指数在2020—2021年仍然维持在高位,但随着时间的推移,紧缺指数整体呈现下降趋势,紧缺程度相对缓解。其中虽然有文献老化、需求趋缓等因素的影响,但也反映了利用紧缺指数辅助重订决策的有效性。

3.4.2 紧缺指数弥补了流通和预约数据的不足

根据计算,在2019年紧缺指数介于0.7~1之间的1742种图书中,每册图书全年平均流通次数为6次及以下的图书为1444种,占比82.9%;有预约记录的图书为493种,约占被预约图书总量的50%。即读者有明显需求的图书流通频次反而不高,仅以流通次数或预约次数判断图书是否需要重订存在缺陷,导致大量需要补充复本的图书未被发现,并未真实反映读者需求。而紧缺指数可以避免这一缺陷,引导采访馆员更有针对性地重订复本。

4 结语

利用同样的方法,笔者进一步分析了2017—2018年流通图书的紧缺指数,发现与2019年数据呈现的规律基本一致。

综上所述,紧缺指数这一指标弥补了常用的复本重订策略的不足,其优点在于:(1)对读者实际需求和图书紧缺程度的体现更加完全和准确;(2)针对每种图书而非学科分类进行测算,更加精准和易于控制;(3)仅需要流通日志和当年入藏记录,参与计算的变量少且易于获取,无需考虑续借、超期归还等因素;(4)淡化了复本入藏时间对流通次数的影响,馆员日常工作中可以随时重订;(5)进一步提高经费使用效益,在经费不稳定的情况下兼顾图书的保障率和满足率;(6)计算简单,易于使用和推广。数据的获取和计算利用Office软件中的Access或Excel即可完成,并且使用的SQL语句或函数均为基本功能,如Left()、Count()、Sum()等函数及“GRORP BY”语句,便于馆员理解和掌握。另外,获取的数据也可以为电子图书的PDA选购提供决策参考。对数据的进一步处理可以得到更多有价值的信息,比如提取索书号中的分类号进行聚类分析,可以判断某一个学科分类图书的需求和紧缺情况;或根据图书出版社进行聚类分析,可以判断馆藏图书的核心出版社。

其缺点包括:(1)未考虑寒暑假开馆、因疫情而推迟返校等情况对流通日志的影响,但从整体数据上对所有图书一视同仁;(2)未考虑同一种书多个版本的区别;(3)指数难以体现馆藏时间较短的图书的紧缺程度;(4)以一年为周期进行考察,少数图书可能会因为售罄而无法补充复本。

需要说明的是,图书采访不是机械操作,算法和数据只能辅助决策,采访工作需要发挥采访馆员或学科馆员的主观能动性,结合馆藏发展政策采取经验和定量相结合的方式进行,而不应教条地按照计算指标采购图书。因此在重订复本时需要根据采购经费和图书馆自身发展特点综合判断,必要时为不同的学科采用不同的紧缺指数阈值。

猜你喜欢

日志流通馆藏
馆藏
一名老党员的工作日志
扶贫日志
博物馆的生存之道:馆藏能否变卖?
圣物的流通——蕃尼古道上的尼泊尔鎏金铜佛流通考察
知还印馆藏印选——古印篇
游学日志
“流通空间”的中西方比较
介绍两件馆藏青铜器
商贸流通