基于图书盘点的智能剔旧系统的研究
2019-08-22张明杨辉黄炳家郑秋梅
张明, 杨辉, 黄炳家, 郑秋梅
(中国石油大学(华东) 1. 图书馆; 2. 计算机与通信工程学院, 青岛 266580)
0 引言
随着现代电子资源的逐渐发展,纸质图书资源虽然比例逐年减少,但是高校图书馆纸质资源仍然以每年万册左右的数量在增长,如何实现有效的图书剔旧一直是高校图书馆面临的难题[1]。图书剔旧不仅工作量巨大,而且涉及的因素多且复杂[2]。为了解决上述问题,本文首先采用因素分析法[3]将图书剔旧的各种因素分级分类,再利用层次分析法[4]生成中国石油大学(华东)图书馆(以下简称石大馆)特有的图书剔旧指标体系,最后结合图书盘点设备、汇文系统、图书数据库系统和自动分拣机设计出一套基于图书盘点的智能剔旧系统,不仅能大大降低图书剔旧的工作量,而且能实现智能化图书剔旧。
1 石大馆剔旧工作简述
石大馆主要分为四大书库,分别是文艺书库、社科书库、科技书库和保存本书库。目前总藏书130万册左右,在现有空间条件下藏书量已经达到饱和,但是仍然以每年7.5万册的数量在增加,若要实现动态零增长[5],就要求图书馆每年剔除7.5万册左右旧书,工作量相当大。在实际操作过程中,有些图书根据简单的剔残和剔错原则就能被剔除,但是更多图书需要进行各种因素的综合考量。石大馆在充分调研其他高校图书馆剔旧情况的基础上提出“四剔”和“四不剔”原则,“四剔”包括:剔残、剔错、剔年、剔期刊,“四不剔”分包括不剔地方文献、不剔核心馆藏、不剔珍本、不剔本校师生著作[6]。在结合以上原则的基础上,利用因素分析法和层次分析法综合分析图书剔旧的因素,最后结合图书盘点设备、汇文系统、图书数据库系统和自动分拣机,实现图书的智能化大批量剔除。
2 图书的剔旧指标体系
2.1 图书剔旧流程
在认真学习和调研的基础上,根据定性法和定量法,石大馆建立了自己特有的图书剔旧指标体系。在定性法中,一般图书可以直接根据损坏程度或者内容不合适等因素直接被剔除,但是大部分图书还需要考虑综合因素,例如流通因素,价格因素和著名因素等,根据图书数据库中的各种参数使用定量法分析能保证剔旧指标的客观性和有效性。石大馆的剔旧流程大体如图1所示:
图1 图书剔旧流程图
2.2 图书剔旧指标体系
石大馆在调研其他图书馆的基础上并结合自身情况,引入因素分析法和层次分析法构建剔旧指标(BWI)作为剔旧依据。
2.2.1 因素分析法
因为影响图书剔旧的因素很多,选取的指标因素不仅要容易获得而且要容易量化分析,所以根据因素分析法建立如下指标体系,如表1所示。
表1 剔旧指标体系
从表1中可以看出,剔旧指标体系主要包括5个一级指标,每个一级指标又可以细分成1个或2个二级指标,共8个二级指标。
2.2.2 层次分析法
因为每个指标在图书剔旧过程中的影响权重是不一样的,所以在征集石大馆工作委员会和学校部分学生、教师意见的前提下,引用层次分析法计算各指标权重。
(1) 首先以一级指标为例计算,根据因素的重要程度,构造判断矩阵,如表2所示。
表2 判断矩阵表
(2) 计算矩阵每一行乘积Ni的n次方根Xi的值,
其中N1=12,N2=1,N3=90,N4=1/9,N5=1/120。
(3) 对向量ϖ(i)做归一化处理[7]
(4) 一致性检验
计算矩阵的最大特征根:
式中,向量AW如下
计算一次性指标:
式中,RI=0.9。
求得CR=0.065<0.10,符合矩阵的一致性要求。因此求得的各因素权重值是能够体现各指标相对重要性,即Y1、Y2、Y3、Y4、Y5的权重值分别是0.232 2、0.216 3、0.443 0、0.046 1、0.062 4。
根据上述方法,计算剔旧二级指标的权重,计算结果如表3所示。
表3 剔旧指标权重表
2.2.3 计算剔旧指数(BWI)
根据表3计算得到的各指标权重,最后计算剔旧指数(BWI),公式如下:
式中,Qi和qi分别为一级指标和二级指标的权重。
各因素设值:
出版年代A1:踢旧当代年限设值为0,上一年为1,以此类推。
版本A2:最新版本为设值0,前一版为1,以此类推。
出版社B1:根据国家出版社排名分类为三个等级,第一等级设值为0,第二等级设值为1,第三等级设值为2.
作者B2:获省级以上重大奖项或者职称为正高级别的设值为0,获市级以上省级以下奖项获职称为副高级别的设值为1,其他设值为2。
副本量C1:1本副本量设值为1,2本副本量设值为2,以此类推。
单书流通频次C2:借阅频次最高的设值为1,次高设值为2,以此类推。
定价D:价格100元以上的图书设值为0,50-100元设值为1,30-50元设值为2,30元以下设值为3。
电子形式E:有电子图书设值为1,无电子图书设值为0。
通过因素分析法和层次分析法得到的剔旧指数,是石大馆图书剔旧的重要依据。剔旧指数越小,代表该书被剔除的程度越小,相反剔旧指数越大被剔除的程度越大,从而实现行之有效的剔书流程。图书采购过程中也可以将剔旧指数作为采购依据,有效的保证藏书质量。
3 图书智能剔旧系统的设计与实现
3.1 图书智能剔旧系统的设计
根据藏书量的要求,石大馆每年剔除书籍的数量将近7.5万册左右,以前所有工作都是由馆员手动亲自完成,工作量不仅大而且繁琐,所以根据汇文系统、图书盘点设备、图书数据库系统和自动分拣系统设计了一套图书智能剔旧系统,在图书自动分拣和图书盘点过程中实现智能剔旧,大大减少了馆员的工作量。
3.1.1 图书智能剔旧系统的工作原理
图书数据库系统存储着石大馆所有图书的各种信息,包括书名、索书号和副本量等内容。通过在数据库中加一个状态字段(state)来判定每本书是否处于在架状态,数值0表示已经被剔旧,1表示在架,同时建立一个单独的数据表Off_Book来储存需要剔旧的图书,并与图书盘点设备和自动分拣机设备对接。
图书智能剔旧系统根据剔旧指数(BWI)定时对所有图书进行筛选,并将筛选出的图书列表存入Off_Book数据表中。馆员利用盘点设备进行图书盘点时,当盘点到Off_Book表中需要剔旧的图书时,盘点设备自动报警,然后馆员通过确认终端是否剔旧的指令最终实现图书的剔旧过程,同时图书数据库系统中的state字段自动变为0。在自动分拣过程中,系统识别到Off_Book表中需要剔旧的图书时,自动将书分拣到剔旧的一类中,并自动改变图书数据库系统中的state字段的值。
3.1.2 图书智能剔旧系统的组成模块
图书智能剔旧系统主要包括剔旧指数(BWI)自动计算功能、定时筛选剔除书籍功能、人工审核和查询图书功能以及设备接口对接功能,如图2所示。
图2 图书智能剔旧系统模块
(1) 剔旧指数计算模块
剔旧指数计算是智能剔旧系统最大的计算模块,也是最重要的核心。石大馆馆藏300多万册图书,存储信息将近4000万个数据量,为了提高系统工作效率,必须优化设计计算BWI的类和算法,并在服务器端引入并行计算,大大减少了计算BWI所花费的时间[8]。
(2) 定时筛选模块
系统可以设置定时功能,按照设定的时间依据BWI规则对图书数据库中的数据进行筛选,并缓存在数据库中,以备馆员进行图书剔旧的初步筛选。定时功能避免了数据筛选过程中因为BWI指数计算花费的大量时间,减少了系统的负荷。
(3) 审核和查询模块
馆员可以根据图书的信息例如书架、流通率、索书号、书名和副本量等进行单因素查询筛选,同时可以对系统筛选出的数据进行审核,确定是否要对某本书进行初步剔旧。当馆员通过RFID设备盘点到需要剔旧的图书信息时,可以点击确认剔除实现图书的最终下架,同时数据库中的state字段自动变为0。
(4) 数据库管理模块
为了提高系统的计算和查询效率,在图书数据库中增加一字段来判断某本书是否处于在架状态,同时创建图书剔旧系统数据库,用来存储剔旧指数筛选后的数据,并能生成各种统计报表。
(5) 设备对接模块
利用图书数据库系统和RFID盘点设备提供的接口,设计图书剔旧智能系统可靠的对接模块,实现他们之间数据的交互和实时更新。
3.2 图书智能剔旧系统的实现
图书智能剔旧系统选用Visio Studio 2017为开发工具,数据库系统为SQL Server 2008,由于图书数据量较多且剔旧指标体系计算较复杂,选用基于MVC框架[9]
的客户端和服务器(C/S)框架结构[10],提高了检索和审核效率。
图书智能剔旧系统可以定时或者人工手动进行BWI指数筛选图书,也可以根据图书的单因素例如书架、流通率或者索书号等进行查询筛选,然后审核选定要剔旧的图书点击确认剔除。
图书智能剔旧系统在正式上线前,在非繁忙时段根据数据量的大小对系统进行了有效的测试和评估,结果如表4所示。
表4 系统测试评估表
通过对系统的有效测试,系统未出现任何异常,从表4可以看出,反应时间均在合理范围内。由于汇文系统在每天8点到晚上10点属于借还书,采编等繁忙时段,石大馆根据具体情况将剔旧系统设定在每天凌晨0点自动进行全部图书剔旧指数的计算,避免了高峰期可能造成系统不稳定等风险,而根据图书单因素进行的查询筛选,任何时段系统都未产生问题。
系统剔旧指数计算后将图书数据进行初步排序,随后由人工进行审核和筛选,最终确定要剔旧的图书,界面如图3所示。
图3 图书智能剔旧系统查询和审核界面
当馆员用图书盘点设备盘点到需要剔旧的图书时,盘点设备将报警并在终端将弹出剔旧界面,如图4所示。
图4 盘点终端对话框
然后只要点击确定,将实现此书的最终剔旧并自动在后台图书数据库中将此书剔除,点击取消将略过此书。当自动分拣设备遇到需要剔旧的图书时直接将剔旧的图书分拣到剔旧一类,然后有馆员最终确定是否剔旧。
4 总结
为了解决图书馆图书剔旧繁琐、不规范等问题,石大馆根据图书数据库的信息,并利用因素分析法和层次分析法建立了自己特有的剔旧指标体系,并结合汇文系统、图书盘点设备、自动分拣设备和数据库系统设计了一套智能图书剔旧系统,大大减少了馆员的工作量,具有广泛的应用价值。