联机编目环境下图书馆编目数据质量控制研究
2022-01-10苏冬冬阚丽红
苏冬冬,阚丽红
(鞍山师范学院 图书馆,辽宁 鞍山 114007)
机读目录的诞生是图书情报界在文献目录发展史上的一次重大飞跃[1],为图书馆的发展带来了生机与活力,丰富了图书馆传统的卡片目录的著录项目,更深刻揭示了图书的外部特征和内容信息,提高了读者对具体文献识别与利用效率,为图书馆工作的顺利开展提供了极其便利的条件.随着以CALIS(中国高等教育文献保障系统)和国家图书馆为代表的联合编目联盟的发展和完善,图书编目工作发生了巨大的变化,编目工作不再是单个编目人员面对纸质文献孤军作战,取而代之的是一种与网络信息技术相适应的新的工作方式与管理模式——套录编目.套录编目缩短了图书馆编目的时间,提高了书目数据的规范化和标准化,促进了机读目录的交流、共建与共享.但同时要清醒地认识到,套录编目是一把双刃剑,图书馆在利用外部数据编目过程中,如果不考虑本馆的实际情况盲目套录,会造成本馆馆藏书目数据库数据混乱,从而影响图书馆各项业务工作的开展和读者对文献的检索与利用.
1 套录数据的来源
套录编目是指编目员在编目时,对从外部数据源获取的书目数据根据本编目机构的著录、标引规则进行相应的修改(即本地化修改),使之转换为本编目机构书目数据库记录的过程[2].编目套录数据主要来源有两种:一是来自权威图书情报机构,如国家图书馆联合编目中心、中国高等教育文献保障系统编目中心等;二是来自各馆选定的图书供应商.文献编目中心对上传的编目数据有严格的审核程序,数据质量相对较高,图书供应商提供的数据质量却参差不齐,实力越小的书商所提供的数据质量越差.由于书商提供的数据一般与所采购的图书一同到馆,并且可以集中下载到本地,为采访和编目人员节省了大量的时间和精力,因此,许多图书馆尤其是中小型图书馆编目数据的主要来源为书商提供的数据.
2 套录编目数据存在的主要问题
套录外部数据源作为本馆的馆藏数据后,编目人员一定要根据著录规则及本馆的编目细则对数据进行增、删、改,对每一条记录、字段进行逐一检查,以免产生不规范甚至错误的编目数据.然而在实际工作中,还是有一些不容忽视的问题出现.笔者以鞍山师范学院图书馆馆藏书目数据库作为研究对象,就书目数据库存在的问题进行分析,以期提高采编数据的质量.
2.1 个别字段著录错误
机读目录的编制是一个复杂的过程,随着 CNMARC(中国机读目录)格式的不断完善,其内容的描述越来越准确和完整.图书编目应遵循《新版中国机读目录格式使用手册》和《中文书目数据制作》,尽管CALIS和国家图书馆每年都举办编目业务培训班,但是由于编目人员的专业背景不同,对机读目录的掌握程度不同,特别是书商的编目人员,大部分没有系统学习过图书分类编目课程,只是经过一些简单的培训即上岗,著录人员对CNMARC格式的各个字段理解会存在偏差,这也是导致编目质量低甚至错误书目数据的原因.
2.1.1 对字段代码所代表的内容掌握不熟练 每个字段及子字段代码都有特定的含义,如果著录的内容与字段含义不匹配,就会造成应该著录的字段漏著或错误著录在其他字段等问题.
2.1.2 对文献外部信息的识别有误 例如《秦汉史》一书,作者为吕思勉,图书馆先后两次采购此书,第一次入馆时,200字段的著录为:2001#$a秦汉史$f吕思勉著;第二次进馆时,200字段的著录为:2001#$a吕思勉 秦汉史$f吕思勉著.很明显,在$a子字段著录时,著录人员误将作者吕思勉著录到了正题名子字段.
2.1.3 人为录入错误 有些编目人员在著录题名或责任者项时遇到生僻汉字,经常会用同音字、空格或符号等来代替,有时由于著录人员粗心大意也会导致录入错误,如2001#$a人性的弱点$f(美)戴尔?卡耐基著$f Dale Carnegie$g陶曚译,在责任者字段误将戴尔·卡耐基录入为戴尔?卡耐基.
2.2 分类标引前后不一致
分类标引前后一致是指将同种或同类图书分配相同的分类号,避免同书异号.分类标引的一致性是每个图书馆应遵循的基本分类原则,也是知识集聚的基本要求,否则图书的组织和图书的排架将是杂乱无章的.我国著名图书馆学家刘国钧先生曾经说过:始终一贯、前后一致是图书分类的基本要求.在同一图书馆中,绝对不能将同一性质的书或两部内容同一的书分归不同的类,绝对不容许在分类上产生自相矛盾、前后不同的现象[3].然而,由于学科的交叉融合、分类法的重复列类,导致图书分类工作越来越复杂,受主观和客观等多种因素的影响,分类标引不一致是影响书目数据质量的重要因素.
2.2.1 同种图书标引不一致 同种书一般是指内容完全相同图书的重复购买,包括相同版本、不同版次、不同出版社、不同装帧形式的图书[4].在分编过程中,如果不能将这些图书集中归类,就会使同一种书出现在书架的不同位置,如吕思勉著《秦汉史》一书,图书馆先后多次购入,分别分配分类号为K232、K232.07和K232.09,详见表1.
表1 同书异号例表
出现这种情况的主要原因是采编人员在套录外部数据时对查重工作以及对复本的认定存在一定问题,造成内容完全相同的图书分散到书库的不同位置,违背了图书分类的基本原则,给读者检索、利用文献带来一定的困扰.
2.2.2 同类图书标引不一致 同类书是指研究的主题内容相似的图书.由于学科的交叉融合,在图书分类法的编制上必定有一些重复列类的现象,对于这类图书的分类标引无所谓正确和错误之别,只有一般和最佳之分.对于这类图书的分类,要求所有图书馆给出相同的分类号是不现实的.例如,儿童绘本书可以归入I287.8(文学类中图画故事),也可以归入G613.3(学前教育中的常识、故事),不同分类人员可能会给出不同的分类号,归入哪一类都可以,但是在同一个图书馆内图书分类标准一定要始终一贯,详见表2.
从表2的例子可以看出,同一系列的图书被分别分到I287.8和G613.3两类.因此,采编人员在套录外部数据时一定要慎重,确保同类图书在本馆分类标引的一致性、连续性.
表2 同书异号例表
2.2.3 丛书、多卷书系列出版物标引原则不一致 丛书、多卷书是普通书籍中常见的出版刊物种类.近年来,以丛书、多卷书形式出版的图书种类繁多,由于一些丛书、多卷书出版形式不规范,导致丛书、多卷书的分类和著录成为编目工作的难点.丛书、多卷书的著录一般有集中著录和分散著录两种方法.集中著录是以整套图书作为一个著录单元进行分类、著录,能集中展现全套图书的内容概要,使读者对整套图书有比较全面的了解,整套图书在书架上集中排列,方便读者的检索利用;分散著录是按照每个分册图书的内容属性进行合理归类,其弊端是不利于读者对整套图书的检索与利用.对于丛书、多卷书是采用集中著录还是分散著录,并没有一个统一的标准和规定,对编目工作而言,每一种方法都有其存在的意义和价值.每个图书馆应充分考虑本馆的藏书特点、学校的专业设置及读者的检索习惯,依据丛书、多卷书的分类和著录的基本原则,选择适合本馆的统一标准,形成本馆的丛书、多卷书著录细则,从而保证丛书、多卷书的分类和著录的一致性[5].如果盲目套录外部数据,在同一个图书馆就会出现同一套丛书或多卷书既有集中著录也有分散著录的情况发生.
2.3 书目数据和与之相对应的图书信息不匹配
书目数据是对文献的外部特征和内容特征的描述,每一条书目对应一种图书的馆藏信息,也就是说,图书的书名、著者、索书号等信息必须与馆藏书目数据保持一致.然而,在实际工作中偶尔也会发现一些馆藏书目数据与图书信息不符,读者在馆藏书目检索系统中检索到图书的索书号,到书库中发现这个索书号对应的并不是读者想找的那本书,图书无法正常流通,给读者带来不愉快的借阅体验,影响图书馆在读者心目中的形象.主要原因是在套录编目过程中,没有认真遵循套录编目的每道工序和环节,将书商提供的编目数据全部导入本地库,没有严格地核对书名、作者、分类等信息.
3 规范编目数据,提高馆藏书目数据质量的对策
3.1 修改、完善本馆的分编细则
大部分图书馆有本馆的编目细则,也有一些图书馆并没有明确的分编细则,也就是分编细则没有形成书面文字,只是停留在口头,在人员调换交接时也是口口相传,编目数据的质量也就可想而知了.在联机编目的环境下,图书馆的分编细则也需要同步更新.然而,有些图书馆编目业务外包,编目工作在图书馆的业务工作中已经处于边缘化,编目工作被理解成简单的外部数据的套录.这种做法与联机联合编目的初衷相违背,如果没有本馆的分编细则,即使编目人员套录的数据本身是标准的、规范的,但是如果不考虑本馆的实际情况盲目套录,可能会适得其反,造成本馆馆藏书目数据库的混乱.因此,各图书馆在保持与联合编目中心的各项标准一致的框架下,一定要制定与本馆相适应的图书著录、标引、规范控制等方面的编目工作细则,如哪些字段需要保留、哪些字段需要删除、哪些字段需要增加,丛书、多卷书采用集中还是分散著录的参照标准等,使编目人员在工作中有章可循、有据可依,以保证本馆馆藏书目数据的统一性,同时有些图书的分类也要兼顾本校的学科设置,方便师生利用图书.
3.2 强化编目人员业务能力和职业道德
编目工作是专业性比较强的基础性业务工作,图书标引、著录是一个复杂的过程,由于文献学科属性的复杂性,以及从方便读者识别文献、检索利用文献的角度出发,编目人员的业务素质、知识面等都面临比较高的要求.因此,编目人员的业务能力和知识水平的提升是编制高质量书目数据的关键.在联机编目环境下,图书馆每年应选派编目人员参加CALIS编目中心举办的培训班以及各种编目经验交流会等,使编目人员学习和掌握联机编目的特点及各项规则,及时跟踪编目标准的变化及编目发展趋势.另外,要培养编目人员的主人翁意识,强化职业道德教育,增强编目人员的责任感.在书目数据编制过程中,编目人员的工作态度直接影响书目数据的质量,工作中的一点点疏忽,诸如著录时全角半角的选择,多一个字符或少一个字符都会降低书目数据的准确性.同时,应保持编目人员队伍相对稳定,不宜频繁变动.文献编目工作是一个经验积累的过程,在长期的工作实践中,会使编目人员的业务能力不断提升.因此,建设一支具有较高综合素质的编目人员队伍,也是确保书目数据质量的重要因素[6].
3.3 建立健全编目数据质量审核制度
中文图书编目有 “三分著录,七分审校”的说法[7].编目人员的业务能力、工作态度以及对馆藏情况的了解程度不同,编制的书目数据在质量方面一定会存在差异.为了保证书目数据的质量,图书馆必须设专人对编目数据进行审校.图书编目审校是书目数据加工的最后流程,也是非常关键的一个环节,在编目数据审校过程中,无论是外来数据,如CALIS编目中心的数据、书商提供的数据,还是本馆原编数据,都要认真校对,把好质量关.审校工作应由具有丰富的分编实践经验、熟练掌握机读目录格式以及有责任感和事业心的编目部门负责人承担,发现问题后要与数据编制人员认真沟通,找出问题的症结,并定期开展业务讨论会,避免同样的问题再次发生.同时,建立奖惩制度,避免编目人员因工作懈怠而影响编目数据的质量[8].
3.4 加强部门间的业务合作
图书编目的质量直接影响图书馆的各项业务工作正常开展,例如,编目数据与图书本身信息不符,在图书流通过程中会产生拒借现象,引起读者的不满;馆藏数据检索点不完整,会影响读者的查全率和查准率;在文献采购、著录查重时,查重不准确会产生重复订购或同书异号的现象;在图书资料统计报表方面,因为重复数据、分类错误数据等的干扰,统计结果的准确性将大打折扣.因此,馆藏书目数据的维护工作需要图书馆各业务部门积极参与、互相支持、通力合作,建立健全反馈、沟通机制,发现问题及时反馈、沟通、处理.编目部门要严格遵循编目规则及本馆的编目细则,对编目数据进行严格的质量控制,减少错误的、非标准的数据产生.图书进入流通环节后,流通部门的工作人员在图书上架、整架的过程中以及读者借阅图书时,会最早发现存在问题的书目数据,流通部门应及时反馈,编目人员用最短的时间将错误数据加以修改,保证图书正常流通.技术部门为图书馆管理系统正常运转提供保障,应该加强数据的日常维护,及时发现非标准机读数据,及时更新升级文献管理系统,并在技术上给予其他部门指导和支持,保证馆藏书目数据库的正常运行.
4 结语
馆藏书目数据库是图书馆馆藏文献的缩影,它不仅具有揭示馆藏文献的作用,而且也是沟通读者和文献之间的桥梁和纽带,编目数据事关馆藏书目数据库的建设.在联机联合编目的环境下,套录数据确实给编目工作带来便利,但是图书馆不应该过度依赖外部数据,弱化本馆的编目工作,一定要结合本馆的实际情况加以研判,形成有本馆特色的书目数据,以保障建设高质量的馆藏书目数据库.