图书情报资料编目数据质量宏观监控探索
2015-03-18王军平
□ 王军平
图书情报资料系统管理软件有好几种,图书馆用的系统多种多样,外包公司的编目员不可能都很熟悉所有图书情报系统软件,不太可能掌握常用的所有数据编目软件操作,常见的图书情报界系统编目软件有:博菲特、丹诚、北邮、ILAS(图书馆自动化集成系统)、汇文、清大新洋、图腾、妙思、冠景、金盘等。再者,中国图书机读目录规则与机读编目格式标准都很琐碎繁杂,加上图书分类法也是比词典厚。外包加工编目员给图书馆做的编目数据出错总是难以避免,但作为监督一方图书馆必须高度负责地严格监督编目数据的质量。笔者经过多年的数据编目和审校锻炼,总结经验教训,得出了一些方法较为高效快捷地监控图书编目数据质量,与同行们分享。
一、输出验收单
(一)改换项目。进入格式设计点击某项,右键→属性→字段1,换其他项目或自主写入项目代码即可改变提取项目。格式设计中默认的数据提取项目只有出版社、题名、条码、价格、责任者、索取号、馆藏地点、ISBN、卷页等。这些基本项目,但想找到绝大部分错误还是不可能的,需要增加提取项目。经过多年探索,认为增加如下项目,能达到事半功倍的效果:光盘号、分类号、版本、数量、记录号、文献流通类型、批号、010d、总价、附件、馆藏分配地点、出版年、馆藏地点等。这些项目代码有些是系统里有的,有些是没有的,需要寻找再粘贴上。在这里只需增加些项目,就能让审校数据高效省力,还能最大程度地找出数据错误,后期一条条审校数据时,只要看住几个重点,而不用细看每个点那样费事了。
(二)增添提取项。进入格式设计,双击其中一个提取项目,这个表格中线就会呈黄绿色,拖拽它,这就增加了一个项目,接着修改它提取代码。
(三)提取代码。若无自带代码,要试验、寻找相应项目代码,再粘贴在字段1代码处就行。经过试验寻找到了如下项目代码:总价:ACQl*ACQo;出版年:210d;附件:215e,010d:010d;馆藏地点:HLDe;文献流通类型:HLDf,091d:091d;光盘号:307a;记录号:ACQd。
(四)页面调整。左上角的输出条件,左右上下都居中,为了便于观看、打印用稍大字体。为了缩短长度,可让使用率低的两个项目共用表格,用到哪个项目就设哪个代码。根据内容适当设置表格宽度,重要项目靠前,要比较的项目相邻设置。
(五)字段合计。数量、索取号、价格、分类号、总价等需要选上字段合计。统计后比对每页的合计结果,看看结果是否异样;检查分类号与索取号的合计结果能看出两项是否一致;再看看价格对比是否一致,还要看看出版年合计是否异样,可能月份多写。
(六)检查输出验收单。
1.题名、出版社、作者、ISBN、数量、页码等。这些错误情况简单、相似,比如依照出版社排列,看看出版社项是否异样。提取数据时,如果批号前端一样,那么同一条编目数据的多批次或到书的条码会输出在前后相近,看有无异常。
2.检查条码项。记住个别登记帐的条码可选合并,也只提取加了条码的编目数据,无条码的则不输出来,提取时合并条码,若用某大批号提取,会把同一条数据下不同小批次但批号前方跟提取条件的大批号一致的数据都输出,且条码合并在一起,这导致它们的价格、数量合计失去了准确性。输出验收单不存在前述情况,提取的条码虽是合并的,但只合并某一个小批次同一数据同一到书条的条码,不合并条码,会显示每一次到书有一条编目数据。另外它还会把条码没输入的数据也提取出来。一排序,没有条码的编目数据就会排在最前面。这些空白条码数据有些是条码漏输了,有些是到书多余了,不同的是个别登记账不能提取出空白条码的数据,在这里清晰显示全部条码空白的数据。大致浏览所有条码,看有无异常显示的,也看看排最后面的,改正错误的。
3.馆藏分配地点。排序后先看前后头有无异常的,如出现空白、0或异常于购书册数的数字,或分配地点有异于常规的,有则修改。
4.记录号、批号。这两个主要用作查询其他数据,当然也可看看批号有无显示异常,也可能是批号写错了。
5.版本。合计勾选上,合计如果是零,就是没有多版次版本;大于零则有多版次版本,看看排列的版本有无异常。
6.光盘号。有光盘的数提取此项就是要检查是否都正确添加上了光盘号,还要和附件项对比一致。
7.分类号。看与索取号的合计是否一致,不一致则看原因。
8.文献流通类型。排序后看看有无异常的流通类型出现。其他项也相似,如果都对了,那就排列着很好看的整齐序列,看有无异常情况出现。
二、个别登记帐
(一)格式设计。点开格式设计,设计的方法同输出验收单,还能从输出验收单处复制来格式设计粘贴到此。
(二)运用个别登记帐。
1.条码。检查每册书的馆藏地点、条码、流通类型时,条码要不合并输出,要一一细看每条数据条码情况。检查其他输出提取项目大部分合并条码,合并后提取的编目数据数量变少。当选择合并编目数据的条码后输出,同一条数据上的几次到书,凡是前头一致的几个批号的到书会合并输出。图书复本条码一般是连续输出的,依条码排列顺序,先检查编目数据排列的两头有无异样的条码。假如其中哪条数据的条码连续异常,依照记录号或批号查找到具体问题数据,然后修改错误。编目数据记录号具有唯一性和简单性,是一串大致1~7位的数字,因此使用记录号来检索数据是最便捷高效的。
2.版本、210d、ISBN、文献流通类型、光盘号、分类号、索取号、责任者、出版社与馆藏地点等其他的。这都与检查条码类似,一一按某项目排序,见到数据异常,就检索到并改正它。
三、验收分类统计
(一)自主格式设计。验收分类统计,用作22大分类或扩展T后共39大分类的基本统计,经常被用来审核编目验收过的各分类编目数据的各类结果。点击采访管理进入采访统计,进入验收分类统计的格式设计,进入属性选项,填上全部基本分类号,让纵向空白。统计可选参数有:种数、册数、数量(ILASII有册数选项,ILASIII无此项),下面选择上其他、合计。这样设置参数后就有册数与数量横向比较,它们的结果相同才是正确的,哪个分类号统计结果不同哪里就有问题。不过自从系统升级为ILASIII后,那个册数就不显示了,很遗憾。另外“其他”很有用,凡是分类号有问题,不能在38大类里统计的,都会归集到“其他”类里,就像个垃圾袋,凡是被装到这里的都有问题。
(二)统计。一般用批号检索,统计一个批号时,右边键值限定空着。其他如馆藏地点验收日期等可以根据需要选择,没必要滥选,以免带来不必要的干扰。
(三)运用验收分类统计。
1.比对数量与册数(ILASII有此项,ILASIII要用验收分类统计与书目分类统计比对,前者是册数即条码数,后者是即到书事填的数字)。总括登记账中数量是无效的,与册数统计一样,两者都是册数也就是条码的合计,并不是验收到书时填的数。另外书目分类统计中没有数量项目统计(有册数,ILASIII中它的册数其实统计的是数量,或许是ILAS公司没把后台软件装好等)。ILASII中验收分类统计中数量是验收到书时填的数量,能与册数相比较,两者若相同,则一般此两项都对,另外也有可能是册数和数量都不对,这就意味着是较为高级疑难的问题,或许数量与册书错得一样多,这也会导致最终两者的结果一样,这需要解决的过程就复杂很多了。若两者结果不一致,那肯定有问题,或许数量输错,又或许条码有出入等。遇到这些两者不一致的问题,就需要查清哪个分类的两者数字不一致。依照表格顺序找到某类,导出这批此分类的具体数据,就是输出验收单(跟个别登记账相似),用列表式输出验收单的较为方便,按分类号顺序排序,一一查看数量与条码数是否相同。若是遇到某个批次有问题分类号的数据量太大,按一般排序难以查找到问题数据,还可以再逐步细分有问题的分类号,细分的程度要看分类号复杂程度与数据量大小酌情适当细分。再次统计,仔细比对找出册数与数量不相符的小分类号,在详细数据中顺序查找到问题数据,用记录号等检索到数据,改正错误。还可以比对册数和数量从个数少的着手,能提高效率。若是数量结果少,就可以先按数量排序,空白数量的数据就会排在前面,问题很明显。假如所购图书复本量基本是三册,检查排序后的数据,就可以先直接查看数量不是三的编目数据,先忽略数量是三的,这能极大提高检查速度。同样的,假如是册数结果少,那就先按册书的直接相关项即条码排序,没有输入条码的数据就排在前面了,其他情况大体如前,也有很多方法都可以在实践中摸索出来。
2.其他分类项。在格式设计中一定要勾选这个,它是设置的常规分类号以外的大箩筐,也是数据中索取号正确率的直观标志。假如其他项数字相当大,那很有可能是一个分类或几个分类无法归入统计表,那或是漏了某个大分类,也可能是统计表中某个大分类填写错误,这种情况还比较好检查。再者,也可能大小写字母错误,或者大写字母O错写成数字0,在一般文档上看0与O有清楚区别,但在ILAS系统中它们是不一样的,实质上电脑认大写字母O是一个分类,但它认得数字0就不是分类,那些被错写成数字0的分类都会被归到其他分类项里,大写字母O和数字0在系统里只是看着一样,极易混淆。如果其他项分类结果不大,以分类号排序,系统自动把分类写成数字开头的或空白分类号排前头,也有其他问题分类的排后头,检索到问题数据改正它们。
[1]深圳图书馆 ILAS研制中心.ILASII2.0系统管理手册[Z].深圳:深圳图书馆
[2]朱玉强.基于易语言的ILAS辅助程序设计[J].现代图书情报技术,2010,12
[3]深圳图书馆 ILAS研制中心.ILASII2.0系统操作手册[Z].深圳:深圳图书馆
[4]赵伯兴,戴行德.论编目业务外包环境下的书目质量控制[J].国家图书馆学刊,2008,4
[5]国家图书馆《中国图书馆分类法》编辑委员会.中国图书馆分类法[M].北京:国家图书馆出版社,2010