基研究于图*书资源利用数据时间序列模型的图书采购质量控制
2018-03-08
(宁夏医科大学图书馆 宁夏银川 750004)
1 引言
在高等教育评估中,图书馆生均册书、近5年生均购新书量都成为普通高等学校图书馆评估中馆藏量的指标[1],这一指标充分发挥着对现有图书馆馆藏资源建设的推进作用。图书采购工作是图书馆各项业务的第一步,是完善馆藏结构、满足读者需求的核心环节,图书采购的质量在一定程度上决定了馆藏结构与读者需求的符合程度。书价上涨、经费短缺、文献载体多样化、图书市场多元化发展等原因影响着图书采购工作。目前,我国很多图书馆的图书采购工作仍停留在采购人员的经验或者在统计分析读者借阅、图书利用情况上简单的定量分析,不能对读者需求进行精确分析和预测,从而使读者需求不能得到满足,经常出现采购的图书无人借阅、读者需要的图书没有及时采购的现象。读者的真实需求隐藏在他们利用图书馆时诸如借阅历史、检索历史等数据中,如何从这些复杂的历史数据中分析出读者的实际诉求,为图书采购工作者提供有价值的决策依据,是摆在图书馆工作者面前的一个重要课题。
本文利用定量的时间序列Winter加性季节指数平滑模型,对图书资源利用数据时间序列进行量化分析,确定出最佳模型的加权参数,模型的检验效能较好,并利用该模型对2017年1—12月的流通量进行了预测,在实证分析中探讨资源使用状况的演化规律。根据预测流通量的季节特性,从采购时间和采购内容两个维度对如何提升图书采购质量的工作模式进行了探讨。
2 样本数据的收集及统计分析
2.1 样本数据的收集
大量的流通信息从宏观或不同群体的层面上反映了读者对图书馆馆藏图书的使用情况,同时也能反映出图书馆藏书的结构采购策略的有效性。因此,为了能够较为真实全面地寻找出流通信息与图书采购决策之间的内在依赖关系,本文以笔者所在的宁夏师范学院图书馆(以下简称“我馆”)为例,收集整理了其在2011—2016年期间按类目的流通量(百分比)、按读者类型的流通量(百分比)、按月份的借还流通总量及人次数据。由于我馆采用了金盘图书馆管理系统,收集上述数据较为便捷,统计分析主要利用SPSS(Version 23.0)来实现。
2.2 藏书分布数据分析
根据布拉德福文献分散与集中的分布规律,鉴于宁夏师范学院是地方性师范院校,专业设置集中在语、数、外、物理、化学、艺术等师范类专业上,因此我馆现有的图书分布也较为符合这样的规律。从表1可看出,文学、数理化、文科教体类的图书所占比重较大。同时,各个学科门类的图书平均复本量为4.97±0.36本,差异不是非常显著,如图1所示。
表1 馆藏资源图书按学科门类的频数分布表
2.3 流通量统计分析
图1 22个门类图书的复本量条图
表2 按读者类型的流通量统计表
首先,对2011—2016年按读者类型的流通量进行统计(见表2)。从表2可以看出,2011—2016年,图书的流通总量变化不大,基本维持在10万册/年这一水平上(均值为99 004册/年),但是研究生、本科生、馆员、教职工和离退休人员之间的图书流通量百分比不同。分别对各类型读者在2011—2016年间流通量百分比进行卡方检验和趋势2χ检验,结果如表3所示:Pearson卡方值为4 420.331,P<0.01,说明不同类型读者的流通量是极有差异的;同时,趋势2χ检验统计量(Linear-by-Linear Association)为1 003.831,P<0.01,因此可认为读者类型与不同年份的流通量之间存在线性趋势。
表3 Pearson 2χ检验结果
进一步由2011—2016年不同类型读者流通量的堆栈图(见图2)可以看出,对流通量作出绝对性贡献的主要是本科生。由于宁夏师范学院2013年才具有硕士研究生的招生资格,因此在2011—2013年的堆栈图上缺少硕士生的图书流通量信息。
图2 2011—2016年不同类型读者流通量的堆栈图
根据2011—2016年按月份的借还流通总量及人次数据(见图3)及按学科分类年度流通量(见图4)可知,每年的借还总流通量具有一定的周期性和随机波动性,不同学科门类的图书流通量在每年的变化基本保持一定相似性。
图3 2011—2016年按月的借还总流通量时间序列图
图4 2011—2016年按学科分类年度流通量图
3 基于时间序列模型的图书流通量分析预测
3.1 Winter加性季节指数模型
图书馆的借还流通量是描述图书馆图书利用率的一个重要指标,能够从总体上反映图书的利用率和分布合理程度。因此,我们利用Winter加性季节指数平滑模型对2011—2016年的借还书流通总量进行拟合,并对2017年1—12月的借还书流通总量进行预测。Winter加性季节指数模型主要由季节性、趋势性和随机性三部分构成[7-8]:
其中季节指数I是原始时间序列数据xt与时间序列的一次平滑数It−L的比值,由于一次平滑数仅仅包含了随机性和趋势性,故需要用季节性加权参数It−L对季节指数进行校正,并给前一季季节指数It−L加权γ。为了能平滑时间序列的趋势性,可用趋势加权参数γ对一次平滑数增量进行加权,用bt−1加权趋势值bt−1。基于上述公式,Winter加性季节指数平滑法的预测公式为:
其中,m是从当前周期到所要预测周期的周期数目,是不同年度同一季节的平均值,是总体平均值。
3.2 模型识别
选择恰当的Winter加性季节指数平滑模型,关键就是确定模型的权重参数α、β、γ,利用SPSS时间序列模块,可估计出相应的参数为:α=0.203,β=1.332×10-5,γ=0.01,对应的可决系数R2=0.76,滞后1~20的残差相对于的自相关图(ACF)和偏自相关图(PACF)如图5所示,表面在滞后1~20的范围内残差的自相关函数与偏自相关函数均没有显著性,因此,该组参数的预测模型拟合效果较好。
图5 对借还书流通总量进行估计的残差ACF和PACF图
3.3 模型拟合及预测
上述识别结果表明,Winter加性季节指数平滑模型对我馆2011—2016年借还书流通量的历史数据能够较好地拟合,如图5所示,并利用公式(2)进一步对2017年1—12月的借还书流通总量数据进行外推预测,预测结果及95%置信区间如表4及图6所示。
4 基于图书流通量有效预测的图书采购质量控制策略
图书采购的质量主要取决于采购的图书针对性是否明确、采购计划是否完备、有限的经费能否采购到高价值的文献、能否根据本校的实情采购高利用率的特色文献等。而对上述图书采购质量原则的好坏,最主要的评价指标就是读者的借阅率和图书的流通率,当然,也可以将上述影响图书采购质量的主要因素归结为:①采购质量控制与本校专业学科类别有关;②采购质量控制与馆内现有图书的流通量有关;③采购质量控制与图书入藏时间有关;④采购质量控制与图书内容有关。
因此,要想提升我馆图书采购质量,充分发挥资金的利用率,就必须首先对本馆的情况充分掌握,从而根据我馆的实际文献分布、学术专业、对借阅的文献类别的喜爱程度等信息较为准确地制定出符合下一年流通预测结果的采购策略,并适时根据流通量的季节特性,有时间针对性地编制采购计划和严格执行采购方案,从采购时间和采购内容两个维度提升图书采购质量。
图6 根据模型(1)对我馆2011年1月—2016年12月借还书流通量的实际数据进行拟合、预测值的时间序列图
表4 2017年1—12月的借还书流通总量数据预测结果及其95%置信区间
4.1 基于采购时间维度的图书采购质量控制策略
由于目前的出版市场出版物质量参差不齐,且各类出版物种类繁多,给采购时间的选择带来了许多困难。例如,许多学生参加各类公务员事业单位考试,导致时事政治类出版物借阅量大增。在学生备考阶段前,我们就需要对这类图书进行及时采购更新。然而,如果在相关出版社进行按需出版,虽然能赶上采购的时间要求,但价格却是正常定价的若干倍。因此,这类时效性强的出版物通常都会有很强的采购时间制约性。同时,采购方式也制约着采购时间维度的质量,如利用书目征订通常到书率仅有75%(以我馆历年到书情况为例进行统计所得),但如果采用到场现采的手段则到书率能高达95%[9]。
借鉴工业、制造管理中的时间节点管理思想,对整个采购的关键节点根据流通量的季节特性,有针对性地在相应时间节点完成采购的不同工序,如图7所示。结合图书流通总量的预测,对采购的整体安排进行相应的时间节点控制,如分别在两次流通高峰来临之前实施两次现采,而在流量较为平缓的年末实施一次订单式采购,对零散需求进行补充完善,这样就能充分地体现出采购工作的时效性和与流通量变化的及时对接性。可将市场调研、采编人员培训、考察书商资质等业务放在对采购方案修改或订单式补充采购之前,可有效弥补信息不足的劣势,同时在每学期末可开展文献利用反馈信息收集工作。
这样的优势可以及时根据对下一年度图书流通总量等信息的预测结果,对下一年度的采购工作进行时间维度的质量控制,以期能最大程度地提高工作效率,一定程度上克服了无序安排导致的重复劳动,增加了文献服务的时效性,势必能更好地为提高图书利用率和读者借阅率作出贡献。
4.2 基于采购内容维度的图书采购质量控制策略
采购质量控制的好坏在很大程度上由采购的图书质量决定,而提高采购图书质量的关键就是充分提取已有图书的流通信息,有针对性、计划性、多元性、特色性地采购那些流通量大的图书,制定出优质的采购目录。因此,在整个采购的全过程中都引入基于流通量数据的决策支持,从而避免了传统方式在采购目录征订过程中的经验主义或者缺乏量化的不足之处。
采购的过程中,根据上述图书采购时间节点质量管理控制模式确定的进度计划,按时完成相应的工作。关键的内容控制措施来源于精准的量化分析图书流通数据,通过图书流通数据确定高流通量书目类别,在采购资金分配过程中以更多的权重给予倾斜。由于流通数据占比重最多的是本科生,因此,对各学院的资金分配主要以考虑各学院本科生的需求为主。与此同时,根据流通数据中的各院系学生对流通量的贡献大小,从学院的角度给予权重匹配。当然,针对数据的变化应对资金分配、门类分配应持续完善修改,主要因为每年的流通数据并不是一成不变的,故需要根据下一年相应的预测结果对上述权重作出相应的调整。
图7 基于图书资源利用数据分析的图书采购时间节点管理质量控制模式图
以我馆的数据为例,可根据各个学院对图书流通量的贡献率来分配下一年的采购金额,如表5所示。例如人文学院对整个流通量的贡献比为19.35%,说明如果下一年的采购给予人文学院19.35%的配额(即每万元分配给人文学院1 935元),那么就能够有效地提高图书的流通使用,按流通需要进行定量的采购金额分配。
表5 各学院按照流通量分配的每万元可支配采购金额分配
当然,上述匹配权重的过程仅仅考虑了流通量,缺乏对其他因素的控制,如图8所示,可对上述将流通量作为质量控制的一种量化标定,对整个采购的过程进行质量控制,持续改进优化采购方案。
图8 基于图书资源利用数据分析的图书采购内容质量控制模式图
5 结语
图书流通过程中产生了大量的数据,能否从这些数据中梳理出对下一步图书采购工作有益的信息,对图书采购的质量提升起到积极的辅助作用,这是图书采编工作者必须面对的问题。而合理挖掘出读者的使用痕迹,从而优化和控制采购质量,是在大数据背景下的一种有效解决方案:通过实证分析季节模式图书资源利用的数据,建立提高图书采购质量的时间和内容两维度的控制模式。本文从图书馆的实际流通数据出发,对流通数据进行了统计分析,梳理出了图书馆文献资源的用户主体,并进一步对用户主体的使用行为利用Winter加性季节指数平滑模型进行拟合和预测,所得模型的结果较好地预测了2017年1—12月流通的演化趋势。进一步对预测的结果深度利用,结合流通量的季节特性,有时间针对性地编制采购计划和严格执行采购方案,从采购时间和采购内容两个维度来提升图书采购质量。
当然,本文仅仅是从流通数据的浅表去挖掘一些规律性的特性,对采购内容的权重分配也仅仅用了较为简单的方式,进一步更为详尽的权重分配内容将会在下一步的实证分析中深入考虑,例如利用关联规则对各学院对应的图书流通数据进行综合评价和权重测算。同时,对图书供应商的定量评价和分析,对于合理甄选供应商的决策支持同样具有重要的作用。当然,对图书文献流通量、服务人次等信息的有效预测,也能够成为对图书馆精细化管理的有力的技术支持。
[1] 教育部.教育部关于印发《普通高等学校图书馆规程》的通知:教高[2014]14号[EB/OL].(2015-12-31)[2017-09-10].http:// www.moe.edu.cn/srcsite/A08/moe_736/s3886/201601/t20160120_228487.html.
[2] 徐国祥.统计预测和决策[M].上海:上海财经大学出版社,2002:184-190.
[3] YAFFEE R A,MCGEE M.An Introduction to Time Series Analysis and Forecasting:With Applications of SAS and SPSS[M]. London: Academic Press,2000:151-189.
[4] 阮飞轮,周立,杨洋.高校图书馆图书采购质量控制探讨[J].大学图书情报学刊,2009,27(6):25-28.