馆配商采访数据及其入藏与流通情况实证研究
2013-12-03李伟
李 伟
(江苏农林职业技术学院图书馆,江苏 句容 212400)
高校图书馆的采访工作是图书馆文献资源建设的源头,直接影响了图书流通和读者阅读需求。采访工作的起点是从采访数据开始的,从数据流向的角度来看,采访数据包括两个方面,一是图书馆接收馆配商(下文简称书商)的书目数据,二是书商接收图书馆的图书订购数据。采访数据是图书采访质量量化的体现,考量采访数据质量高低、是否实用,不仅要对采访数据进行量化分析,还要对采访图书到馆入藏、被读者利用等相关数据进行跟踪分析,这样才能比较全面地评价采访数据,为优化采访策略、有效控制采访数据提供第一手资料。笔者以江苏农林职业技术学院图书馆(下文称我馆)为案例,对书目数据、图书订购数据、图书入藏数据和图书利用数据等方面数据进行处理和分析,以期充分评价采访数据,为我馆选择书商、调整采访范围和复本提供依据。
1 样本数据的采集
1.1 书目数据
由于书商提供的书目数据成为图书馆获取书目信息的主要来源[1],与我馆合作的书商是通过招标形式确定的,因而,采访的书目数据主要来源于中标书商(书商A 和书商B)。本文书目数据采集的样本是2010年和2011年两个年度书商A 和书商B 提供的书目数据。为保证样本数据采集的全面性,书目数据包括预订书目数据和现场采购图书的数据,并对这些数据的来源书商、年份和批次进行了标识。为确保书目数据的可靠性和准确性,笔者批量核查了所有数据的关键字段,包括ISBN、分类号、出版日期等字段。
1.2 图书订购数据
图书订购数据包括2010年和2011年两个年度内提交给书商A 和书商B 的所有图书订购数据,包括现场采购图书的数据。我馆所有现采数据必须经过确认程序,即书商将现采数据发给采访人员,进行二次查重,删除因操作不当而产生的重复数据,并微调部分图书的品种和复本,以采访人员确认后的数据为最终的现采数据。这是保证采访人员能够有效控制现采图书的品种和复本的一个举措。
1.3 图书入藏数据和图书流通数据
图书入藏数据和流通数据是从图书管理系统(汇文系统)批量导出的,时间跨度从2010年1月1日至2012年6月30日(下文称为统计时段)。比图书订购数据采集的时间延迟了半年,基于三个因素,一是我馆与书商的图书采购合同约定:合同期满后六个月内仍有义务接收并结算我馆预订的图书,我馆于每年1月初进行图书招标;二是预订图书绝大部分在六个月左右能够到馆;三是最大限度地把上一年度绝大部分预订图书到馆及其流通情况统计在内。
另外,在图书入藏数据中添加了到馆日期字段。因为入藏日期是汇文系统自动产生的,造成了到馆时间相同的一批图书,入藏时间不一样。所以,我馆对到馆图书实行登记制,即书商送到我馆的每批图书都进行登记,包括送达日期、件数和接收人等信息。验收、编目时,再在登记表上填写这批图书的起止财产号。再将到馆日期批量添加到图书入藏数据中,这对准确统计采访图书到馆周期是十分必要的,同时,还能了解图书编目加工周期。
1.4 数据处理工具
由于采集的样本数据为原始数据,采集与处理的数据量比较大,基本上都是进行批量处理,必须依赖于计算机软件,本文采用的数据处理软件为Visual Fox Pro(9.0 版)和Office Excel(2003 版)。
2 书目数据统计与分析
2010年和2011年两个年度中,与我馆合作的两个书商向我馆提供的书目数据均包括期货、现货和专题三种预订书目数据和现采书目数据。每个书商的四种书目数据之间相互重复比例较高,两个书商之间的书目数据重复比例更高,因此,必须对书目数据进行有效性处理,即重复书目数据只保留的最先发送的书目数据记录,第二次及其之后的重复数据不计入统计数据。
2.1 书目数据重复性处理与分析
书商A 在2010 和2011年度中提供了565 期、293,286 种预订书目数据以及4 批、7,054 种现采图书数据,累计有300,340 种书目数据,经过数据有效性处理之后,只有216,573 条记录,重复率达27.89%,没有重复过的书目数据只占49.05%。重复记录最多次数达5 次,重复次数、记录及其比例如表1 所示。书商B 在两个年度中提供了642 期、266,244 种预订书目数据以及8 批、24,441 种现采图书数据,累计有290,685 种书目数据,剔除重复记录后,共有212,122 条记录。重复率达27.03%,没有重复的记录有53. 07%,重复记录最多次数达6次,重复次数、记录及其比例如表1 所示。书商A 的书目数据中有163,086 条书目记录与书商B 的书目数据重复,占总记录比例为75.27%;书商B 的书目数据中有165,083 条记录与书商A 的书目数据重复,占总记录比例为76.55%,可见,两者相互重复比例非常高。
表1 书商A、书商B 书目数据重复数量、次数及比例
书商A 和书商B 累计提供了591,026 条(计重复)书目数据,各自删除重复数据之和为428,695 条记录,将两个书商数据合并后,剔除了162,945 条重复数据,最终剩下265,750 条记录,重复率也有38.01%。而2010年和2011年全国各类图书初版395,516 种、重印300,746 种[2-3],两个书商的书目数据只占初版的67.19%、总数的38.17%,这固然与两个书商提供有针对性的书目数据有关,但书目数据提供数量还是偏少。
笔者认为,造成重复比例较高的原因有四种情况:①出版商重复提供书目数据给书商,一般情况下,出版商会向书商发送期货预订书目和现货发行书目。②出版商的期货书目与社科新书目、科技新书目和地科新书目重复。③书商现货与其他书目重复提供给图书馆。④现采图书与其他书目数据重复,现采也有书市、新书展销会以及书商库房集中选购等形式之分,重新印刷的旧版图书也时常充斥于新书之中,无形中增加了重复比例。
2.2 书目数据分类统计与分析
将书商A、书商B 提供的书目数据(不计重复)按《中国图书馆分类法》进行分类统计,分布的柱形图如图1 所示(左右两侧)。两个书商书目数据合并后数据的类别分布情况如图1 中书商AB 所示(中间)。
图1 采访数据分类统计柱形图
书商A 和书商B 书目数据分类统计的结果表明:二十二大类中排在前十位的类别相同,顺序有所区别。排在前四位的类别顺序完全相同,数量多少依次排列为T、F、I、D,后面六个类别次序略有不同,书商A 的类别次序为H、K、B、G、R、J,书商B 的次序为K、G、H、J、B、R,这十个大类书目数量占书商A 和书商B 总书目数比例分别为88.66%、88.14%。排在前十位的大类与2010年和2011年全国各类图书出版种数的统计数据相一致[2-3],顺序略有差异(G、T、I、F、J、D、K、H、R、B),所占比例比较接近(90.44%)。但每个类别的数量相差甚远,最突出的类别是G 大类,书商只提供了17,335 种,而同期全国初版图书有109,437 种,只占15.84%。
两个书商提供书目数量最多的类别都是T 大类(工业技术),分别占书商A 和书商B 书目总数的18.56%和17.32%,比排在后十二个大类数量总和(11.34%、11.86%)还多,排在前五位的二级类目都是TP、TU、TS、TN、TM,数量多少的排列顺序也一样,这五个二级类目书目数量占书商A 和书商B 的T 大类书目数量的比例分别为78.13%、74.58%,其中,TP 类和TU 类书目的数量较多,占T 大类书目数量的比例分别为30.73%、19.78%。
2.3 当年出版的新书统计与分析
书商A 和书商B 提供的当年新书书目数据分别占总书目记录的78.60%和78.14%,所占比例非常接近。书商A 和书商B 的现采书目数据占总书目记录分别为3.26%、11.52%,两者相差较大。将两个书商的现采书目数据与预订书目数据进行重复性比较,结果表明:现采书目大部分(书商A 有80.34%、书商B 有85.65%)与预订书目数据相同。这个现象说明了现采图书中只有部分(不到20%)图书在此之前的预订书目数据中没有出现过,而且出于商业利益的需要,在现采之后,书商还会将所有参展的书目数据发给图书馆,现采只是打了个时间差,提前将新书提供给图书馆选购。
在现采图书中,书商A 和书商B 当年新书所占的比例分别只有5.78%和5.05%,而绝大部分是前一年度甚至更早出版的图书。当然,这个统计数字并不代表书商提供现采的新书很少,而是适合我馆收藏的绝大部分当年新书在此之前已预订过了。其实,这种情形在意料之中,原因是书商提供现采的绝大部分图书是与此合作的出版商提供的,而这些出版商必然会提供预订书目数据给书商。笔者的体会是:书商库房现采的主要目的是馆藏或预订补缺,而类似于新书展销会的现采策略则是优先挑选与书商没有或很少合作的出版商提供的图书,这样才能减少适合馆藏的遗漏图书,降低现采图书与预订书目的重复率,这就要求采访人员平时要留心书商预订书目的出版商信息,或在现采之前收集与书商合作的出版商信息,有备而采,因为新书展销会或书市的布展基本上是以出版商为单元来布局的,这种策略在实际操作中是可行的。
3 图书征订数据统计与分析
2010年和2011年我馆根据书商提供的书目数据定期征订(包括现采数据)图书,将图书订购数据以E-mail 形式发送给书商。在此期间,我馆采访人员向书商A 发送了49个批次、21,125 种(31,624册)图书征订数据;向书商B 发送了59个批次、23,162种(33,401 册)图书;向两个书商共计采访了108个批次、44,287 种(65,025 册)图书,平均每个批次410 种,平均每种图书复本率为1.47 册,书商A和书商B 品种所占比例分别为47.94%和52.06%。图书订购品种的分类统计如图2(中间柱形)所示。订购数量排在前十位的类别依次为T、F、I、H、B、S、G、J、K、C,共39,334 种,所占比例为88.82%,最多是T 大类,有11,380 种,所占比例为25.70%,是排在后十二大类的2.3 倍。
图2 图书征订分类统计柱形图
3.1 订购图书未到馆统计与分析
订购图书中有3,483 种图书未到馆,总体未到馆率为7.86%,其中,现采图书未到馆率为5.08%,预订图书未到馆率为9.63%;书商A 图书未到馆率为5.80%,书商B 图书未到馆率为9.76%。未到馆图书中,书商A 和书商B 所占比例分别为35.37%和64.63%,书商B 未到馆比例明显高于书商A,是其的1.83 倍。未到馆的订购图书分类统计如图2(右侧柱形)。从每个类别的绝对数量来看,数量较多的前十个类别是T、H、S、I、F、G、J、B、K、C,与订购图书数量前十位排列一样,顺序略有不同。图书订购数量多,未到馆数量也会较多,这是正常现象。每个类别的未到馆订购图书与订购图书比例的统计结果表明:比总体未到馆率(7.86%)高的类别有十一个,比例最高的类是S 大类(14.97%),另外十个大类依次是A、G、P、E、H、Q、N、J、O、K,比例分别为13.75%、12. 83%、12. 61%、11. 93%、10. 08%、9.81%、9.33%、8.94%、8.55%、8.54%。从这个结果的另外一个方面来看,在书目数据及其订购的数量排前十位的类别中分别有七个类(T、I、F、J、D、R、B)和六个类(T、F、I、B、G、C)的图书未到馆率低于平均数。说明书目数据类别数量、图书订购类别数量与图书未到馆率之间没有必然联系。
3.2 征订图书到馆统计与分析
征订图书中有40,804 种、59,868 册到馆,总体到馆率为92.14%。到馆图书中,书商A 和书商B所占品种比例分别为49.01%和50.99%,书商A 和书商B 的征订图书综合到馆率分别为94. 20% 和90.24%,书商A 比书商B 高出4个百分点左右。到馆图书品种的分类统计如图2(左侧柱形),排在前十个类别与征订数据相同,共有36,227 种,所占比例为88.78%,到馆最多是T 大类,有10,657 种,占到馆图书总数的26.12%,是排在后十二大类的2.33 倍。T 大类中,排在前五位的二级类目是TP、TU、TS、TH、TG,有9,199 种,占T 大类的86.32%。最多的二级类目是TP,有4,017 种,占二十二大类总数的9.84%。将每个类别图书的到馆数量与订购数量进行比较,比例最高的类别是V 类(100%),最低的是S 类,比例较高的类别还有F(95.27%)、Z(95.26%)、R(94.59%)、D(93.73%)、T(93.65%)、B(93.24%)、U(92.94%)、X(92.93%)九个类别。
图书到馆周期和到馆率是图书馆比较关心的,我馆在图书采购合同条款中对图书到馆周期有明确要求。由于我馆实行图书到馆登记制度,我们把每种图书到馆日期与订购日期(以E-mail 发出日期为准)的时间差作为到馆周期,图书到馆数量(种)与订购数量的比例(百分比)作为图书到馆率。笔者对图书到馆周期及到馆率进行了细化统计,将图书到馆周期按10 天内、30 天内、60 天内、90 天内、180天内、365 天以内以及一年以上七个时段进行统计,各个时段的图书到馆率如表2 所示。到馆图书平均到馆周期为69 天。
表2 图书到馆周期及到馆率统计表
从表2 可以看出,书商A 和书商B 的图书到馆周期都没有规律可循,都没有出现理想化的正态分布,而是呈现各自的波浪状。在一个月和二个月时间内书商A 比书商B 的图书到馆率分别高13. 43%、6.33%;在三个月、半年和一年内书商A 比书商B 的图书到馆率分别低0.66%、1.26%、2.78%,呈递减趋势。两个书商的综合到馆情况:一个月内图书到馆率为33.43%;两个月内图书到馆率为52.54%;三个月内图书到馆率为67. 18%;半年内图书到馆率为87.15%;一年内图书到馆率为91.55%。
4 图书利用统计与分析
2010年和2012年度入藏的订购图书有40,804种(59,868 册),在统计时段内有290 种(290 册)图书属于工具书,入藏在本馆参考咨询室,只限于室内阅览,无法统计其利用情况,也就没有计入图书利用情况统计范围。因此,在入藏图书中,零借阅图书的记录就由原来的28,692 种调整为28,402 种(39,447 册),占订购图书品种的比例为69.61%。在此期间入藏图书有流通记录有12,112 种(59,868 册)图书,品种流通率为29.90%。在统计时段内累计流通了34,100 册(次)图书,册数流率为56.96%。
4.1 零借阅图书统计与分析
在零借阅记录图书中书商A 有14,466 种(20,175 册)图书,所占比例为50. 42%;书商B 有14,226 种(19,562 册),所占比例为49.58%,几乎各占一半,比较接近。从侧面反映了我馆采访人员对两个书商没有偏颇,尺度掌握得较好。
将零借阅记录图书进行分类统计,统计结果如图3 左侧柱形所示,数量最多的前十个类别依次是T、F、H、I、B、G、S、J、C、K,占零借阅记录图书总数的88.01%,其中T 大类占27.10%,比其他十二个类别所占比例还多。在T 大类中最多的五个类别依次是TP、TU、TS、TG、TH,占T 大类的81.97%,其中TP 占36.88%,是其他十四类别的两倍多。
笔者还统计了零借阅记录图书各个类别的品种数量占统计时段内入藏图书类别的品种数量的百分比,结果表明:排在前十位的大类依次是V、A、F、U、D、N、G、X、O、P,最多大类(V)达90%,最少大类(P)也有78.64%。这十个类别品种数量占零借阅记录图书的品种总数的比例为31.27%,占统计时段内入藏图书品种总数的比例为25.87%。从类别角度分析,这十个类别的图书利用率较低,在以后采访中要控制这十个类别的品种及复本数量。在品种数量上和类别比例上,零借阅图书类别较多的类有F 和G两个类别,特别是F 大类,笔者认为这两个类别的品种和复本都有适当减少,要对这两个类别进一步深入分析、细化采访范围。
另外,零借阅图书中2010年入藏了12,052 种,其中当年(2010年)出版的图书有9,627 种,所占比例为79.88%;2011年入藏了16,357 种,其中当年(2011年)出版的图书有12,816 种,所占比例为78.35%,这二年中,当年出版图书占入藏图书的比例为79%。从侧面说明图书出版时间并不是造成读者零借阅率高的主要原因。
图3 图书流通分类统计柱形图
4.2 借阅图书分析
4.2.1 品种利用分析
将有借阅记录图书的品种数量进行分类统计,结果如图3(右侧柱形)所示,书商A 和B 分别占有比例为47.66%、52.34%。品种数量最多的前十个大类依次是T、I、H、F、B、K、S、J、R、C,占91.63%,前四个类占64.09%,接近三分之二,是读者借阅的主要类别,也是订购和入藏数量前四位的类别;T 大类所占比例最多(23.41%),主要分布在TP、TU、TS 三个二级类目中,占T 大类的87.13%,这与计算机等级考试、计算机技术普及以及学校开设了与计算机、风景园林和食品加工相关专业或专业课程有关。
从图3 可以得出品种分类利用比例的情况,即各个大类的借阅图书品种(左侧柱形)与入藏图书品种(中间柱形)的比例,排在前十位的大类依次是Z(54.19%)、I(53.51%)、R(46.51%)、K (43.14%)、H(41.36%)、B(31.48%)、S(31.19%)、J(28.02%)、T(26.87%)、E(26.56%),其中,高出品种流通百分比平均值(29.90%)的大类有Z、I、R、K、H、B、S 七个大类。这七个大类图书品种利用率相对较高,在采访时,可以调整采访策略,适当增加这七个类别的图书品种数量或复本,这不仅可以提高图书品种利用率,降低图书零借阅率,更主要的是可以更好地满足读者对图书品种的需求。虽然T 大类和F 大类图书品种流通数量较多,占图书品种流通总数的30.64%,但品种分类利用比例较低,特别是F 大类,只有14.83%,是品种流通百分比平均值(29.90%)的二分之一,并且这两个大类图书品种占零借阅品种总数的44.88%,是零借阅率较高的主要因子,因此,在采访过程,对T 大类和F 大类图书采访策略要进一步细化、优化,才能提高品种利用率、降低零借阅率。订购和到馆图书类别较多的G 大类,其流通数量和相对比例都较低,应引起采访人员的注意。
5 结语
将流通图书、到馆图书、订购图书和书目数据(不计重复)按品种进行纵向比较,得出四种数据的比例为1:3.37:3.66:21.94,书目数据中最终被读者利用的图书只有4.56%,被采访人员选择的图书有16.66%。如果按册次进行纵向比较,得出前三个数据的比例为1:1.76:1.91,比品种比例高出很多。
书商A 的书目数据略多于书商B,高出2.06%,书商B 在图书订购数量(品种)、到馆数量(品种)和流通数量(品种)方面多于书商A,分别高出7.92%、8.49%和8.93%。图书到馆周期和到馆率,书商B也比书商A 有优势。总体而言,书商B 的综合指标略高于书商A,在其他指标相同的情况下,书商B 稍有优势,但不是非常明显。
如果能对书商的书目数据及其延伸数据进行持续、深入、细化的研究,并融入采访理念,必然会对科学地选择书商、降低图书零借阅率、提高图书利用率大有裨益。
[1]麻娜娜.书目信息与到货率:全国图书馆采购最看重的和最纠结的[N]. 中国图书商报,2011-04-26.
[2]2010年全国新闻出版业基本情况[N].中国新闻出版报,2011-09-06.
[3]2011年全国新闻出版业基本情况[N].中国新闻出版报,2012-08-06.