套录数据在编目中的问题及改进建议
2010-04-05杨旭闽
杨旭闽
(福建中医药大学,福州 350108)
套录编目指的是编目员在编制书目记录时,先对所获得的外部书目数据进行必要的编辑加工,然后转换成本馆书目记录的过程。套录编目是计算机编目模式的进一步发展,它使编目员逐步从重复、繁琐的事务性劳动中解放出来,提高了编目的效率。但在实际的编目工作中,我们也发现套录数据的标准化、规范化仍存在着不少问题,如果在套录过程中不加以科学分析、修改,就会造成书目数据的错误和混乱,进而影响文献的开发和利用。下面结合多年的工作实践,就数据套录工作中所发现的问题谈谈自己的看法。
1 套录数据的现行来源
1.1 合作书商所提供的书目数据
现在大型的书商都提供编目数据,主要是聘请编目人员对图书馆所采购的图书进行编目,其编目质量是与其聘请的编目人员水平密切相关的。由于编目人员的水平参差不齐,人员经常更换,造成书目数据质量良莠不齐,不利于编目格式的统一规范。但其优点在于随时随赠数据,所有数据能够一次集中转换入库,保证了图书和数据的及时性和统一性。因此是当前主要的套录数据来源。
1.2 利用大型图书馆的OPAC数据
在需要的情况下,如书商提供的书目数据不完整、一些不在书商提供范围之内的本校教师著作、外交图书、赠送图书等,对于这些文献的编目,编目员就要去访问一些大型图书馆的联机书目公共查询系统来获取数据。如国家图书馆、北京大学图书馆等。这是一种比较便捷的检索方式,能够帮助编目员参考所取的分类号和主题词标引以及文献内容提要的撰写。由于受到时效性和地域性的限制,可以直接套录到的数据较少,只起到补充和参考的作用。
1.3 图书本身附带的在版编目数据(CIP)
图书本身附带的在版编目数据,其缺点在于数据的质量差,所提供的主题词和分类号标引时常有误,通常只有在前两者都无法获取数据的情况下才考虑使用其数据作为编目参考。
2 套录数据在实际编目中所存在的问题
2.1 分类标引问题
2.1.1 分类号与图书馆所制定的分类细则不相符
许多图书馆都有制定反映馆藏特点的分类细则,图书馆分类细则突出反映了以中医药文献为主体的馆藏体系,其中最重要的是规定了中西医、中西医结合内容的图书,应归入到中医药R2各类,不应归入西医药类或其它类目中。而目前没有书目数据机构能够按要求做到。例如:《台湾地区中医药概览》,2010年科学出版社出版,康达书店和国家图书馆的数据都是归入R-092“医学史”,但根据福建中医大学图书馆的细则要求应该归入R2-09“中医学史”。
2.1.2 同类书被分到不同的分类号
由于书商的编目人员对文献内容理解的差异,而导致相同内容的图书在不同的套录数据中的分类相差甚远。如:《药理学实验》,汪晖主编,2005年湖北科学技术出版社出版,厦门外图的数据所给出的分类号为R965.2;而相同内容的《药理学实验》,邹莉波主编,2007年中国医药科技出版社出版,人天书店的数据所给出的分类号为R965。
2.1.3 分类号与图书内容的学科不相符
由于对图书内容分析的不全面或是对分类号的理解错误,导致在有的套录数据中,所给出的分类号与图书的学科属性不符。例如:《英汉皮肤病学词汇》,2010年第二军医大学出版社出版,根据对书的内容的判断是属于R751“皮肤病学”,康达书店却将其归到了R68“骨科学”。又如:《演说精粹》,2009年中国社会科学出版社出版,根据对书的内容的判断是属于116“世界散文集”,人天书店却将其分到了H019-49“演讲术”。
2.1.4 组配标引问题
(1)通用复分标引不规范。图书的内容可共性区分的,应当使用相同的通用复分号标引。然而在套录数据中,对于此类图书的复分标引不尽相同。例如《脑血管病临床手册系列》共有12册图书,在通用复分上有的书加了“一62”(手册),有的则没有加。
(2)专类复分标引错误。例如:《胃癌根治术图谱》,(日)子三津留,垣添忠生原著,2009年人民卫生出版社出版。康达书店的数据标引为R735.205-64,它是参照了《中图法》中的医药学类R5/8的专类复分表里面的“-0.5治疗学”,而根据《中图法》的规定:除R73外,医学类R5/8各科均可采用该专类复分表[1]。因此,上述的标引是错误的,正确的分类标引应为:R735.2-64。
(3)通用复分和专类复分标引相混淆。如:《篮球技艺图解》,2010年安徽科学技术出版社出版,刘同众主编。国家图书馆的数据标引为G841.19。而人天书店则标引为G841.19-64。表面上看书商所标引的也正确,但实际上根据《中图法》的规定,G841.19已经经过了专类复分,本身已经代表了图解的意义,再加通用复分号码-64显然是错误的。
2.2 著录问题
2.2.1 题名著录不规范
(1)由于封面或书名页的排版不规范而导致正题名选择错误。例如:《冷记忆.3:1991-1995:断片集》,(法)让·波德里亚著,2009年南京大学出版社出版,此书为多卷书《冷记忆》的第三卷。人天书店著录如下:
2001 #@a断片集@冷记忆@h3@1991-1995
由于正题名“冷记忆”的印刷字体很小且排在书名页的下方,而本书的分卷题名“断片集”的印刷字体却较大且排在书名页的显要位置,很容易导致正题名选择错误。其正确著录应为:
2001 #@a冷记忆@e断片集@/h3@e1991-1993
(2)连续出版物性质的图书书名著录不一致。此类图书包括年鉴、英语等级考试、法律考试、医学类考研和执业考试等。它们基本上是一年出版一次,前后的内容有着承上启下的关系,可做集中著录。因此,书名的正确著录就显得至关重要。然而在套录数据中经常会出现书名著录不一致,例如:《国家执业医师资格考试临床医师应试指导》,2009年出版的时候,国家图书馆数据著录如下:
2001 #@a临床医师应试指导@f《国家执业医师资格考试应试指导》专家组编
2010年出版的时候,国家图书馆数据著录如下:
2001 #@a国家执业医师资格考试临床医师应试指导@f《国家执业医师资格考试应拭指导》专家组编。
可以看出,书名前后著录不一致,就会造成本应集中归类的书被分散了,不利于排架和检索。
(3)丛书名的著录不一致。丛书往往不是一次性到馆的,而且也没有先后的顺序。因此,对内容上可以集中著录的丛书来说,丛书名的正确著录就显得至关重要。然而在套录数据中对于同一套丛书中各分册书的丛书名著录没有规范化,有的著录在225字段,有的著录在300字段。这就会造成分散著录,例如:《曹颖甫医案》,该书为《近代海上名医医案》的一分册,康达书店著录为:
2001 #@a曹颖甫医案@招萼华主编
300 #@a近代海上名医医案
而同为《近代海上名医医案》另一分册的《厦仲方医案》,康达书店著录为:
2001 #@a厦仲方医案@f张晶太奇,郑宜南编著
2252 #近代海上名医医案2.2.2责任者著录不规范
主要表现在套录数据中,多位主要责任者的著录不统一。如:《骨折诊治与康复调养》,套录数据著录如下:
2001 #@a骨折诊治与康复调养@f引刚,刘艳平,高新彦编著(三个责任者全著录)
70102 @a引刚@4编著
70102 @a刘艳平@4编著
70102 @a高新彦@4编著
而同样有三个主要责任者的,题名为《李时珍脉象学习图谱》,套录数据只著录了一个主要责任者,其著录为:
2001 #@a李时珍脉象学习图谱@f李申清等编著
314 ##@本书其它编著者为:余海根 王义。
70102 @a李申清@4编著
责任者信息对于读者检索文献具有较高的参考价值,因为在某一责任者的标目下,往往集中了相关内容的文献,具有满足族性检索的意义,所以对多个责任者的著录应尽可能详尽,这有利于提高文献的检全率和检准率[2]。因此,就目前而言,笔者倾向于第一种的著录方式。
2.2.3 版本项著录不规范
根据《中国文献编目规则》关于版本项的规定,凡是翻译图书原版版本说明不著录于版本项,在附注项说明[3]。但在套录数据中,会经常发现有的将翻译图书原版本说明著录在205项。例:《介入心脏病学》,(美)托波尔(Topol,E.J.)著,它是根据原书第5版译的,康达书店的数据著录如下:
001 @a介入心脏病学@dManagement mistakes andsucc@f(美)托波尔 T(opol,E.J.)著
2005 ##@a5版
而正确的著录格式应该是:
2001 @a介入心脏病学@dManagement mistakes andsucc@f(美))托波尔 T(opol,E.J.)著
305 ##@a据原书第5版译出
2.2.4 提要内容著录不规范
主要表现在同一种图书有的著录330字段,有的则不做300字段。例如:《中化骨科学》,王正义著,2010年人民军医出版社出版。国家图书馆著录为“本书分四篇27章。第一篇介绍足踝外科的基础知识,包括中踝部功能解剖与生物力学、足踝部物理与影像学检查、足踝外科的麻醉;第二篇介绍了中踝部创伤、骨病、肿瘤、先天与后天畸形的治疗,各种瘫痪、神经麻痹性疾病的诊治方法与经验;第三篇是近年来足踝外科的新技术,包括足踝外科的关节镜技术与微创外科技术;第四篇介绍足踝部辅具的制作、使用与恢复。”而同样的书康达书店的数据则无300字段。
2.2.5 主题标引问题
在套录数据中,存在着主题标引不准确、不规范的错误。例如:《药物洗脱支架内血栓的治疗和预防》,康达书店著录为:
2001 #@a药物洗脱支架内血栓的治疗和预防
6060 #@a冠心病@X防治
以上例子就存在着主题标引过于宽泛,不够有深度,专指性不强,从而不利于文献检索。正确著录为:
2001 #@a药物洗脱支架内血栓的治疗和预防
6060 #@a冠状血管@X动脉疾病@X防治
6060 #@a动脉疾病
2.2.6 其它著录问题
如图书的价格标错,页码标注错误,图书配有附件的时候在215字段缺少标注,在编图书套录时书商提供的数据部分缺失等,这些也都应予以重视并纠正。
3 提高套录数据质量的建议
书目数据的质量是书目数据库建设的生命线,也是图书馆各项业务工作的基础,保障它的质量直接关系到馆藏的收集、整理、组织、管理以及为用户提供服务的效果[3]。因此编目员在进行套录编目的时候,要牢记套录编目的对象不是套录数据本身,而是与之对应的文献,不能对套录数据不加分析就拿来用,否则会导致书目数据的错漏百出。在实际工作中具体应做到:
3.1 重视馆藏数据的查重工作
查重就是要检查当前在编图书有无馆藏记录,以便在著录文献时能保证本馆分类和著录的前后一致性。笔者认为要特别重视以下3种情况的查重。
3.1.1 丛书、多卷书的查重
因为它们往往不是一次性到馆的,在套录数据时由于编目员对丛书名理解不一,就会出现同一套内容相近的书分散编和集中编并存的情况。因此在查重的时候要从ISBN、题名、责任者、丛书名、其它题名等多个途径进行多次、反复的检索,做到此类图书集中分编或者与馆藏已有的分编相一致。
3.1.2 再版图书的查重
不少图书前版和后版的正题名有或多或少的差别,或者是主要责任者前后有变化,如果仅仅凭着在编图书的书名查重就有可能查不到该书前版的馆藏记录。因此,一方面要对在编图书本身的各个信息源进行仔细地分析,除了查看书名页、版权页以外,还要注意查看前言和再版说明等,另一方面要对可能是该书前版的馆藏图书进行分析,二者要互相对比分析。只有这样才能确保再版图书的查重不缺漏。
3.1.3 连续出版性质图书的查重
这些图书内容具有前后继承性,而且书名很多都带有时间特征,比如“××年”“××届”、“××期”等。对于这些图书,在查重时就要用递减法,用去掉时间或届次的题名进行检索条件为“含有”的查重,这样就可以查出馆藏是否有同一类型的书,从而保证该类图书的集中分类和排架。
3.2 重视对套录数据本身的修改工作
(1)严格把好套录数据的分类质量。《中图法》中对各个类目使用级次以及多个主题、并列主题、边缘学科、交叉学科等图书的归类问题都有明确规定。因此在校对分类的时候,应以《中图法》(第四版)为标准,同时紧密结合本馆的分类细则,对套录数据中的分类号正确地加以使用,错误的或不符合本馆要求的予以纠正,确保本馆分类的前后一致性。
(2)在套录过程中要严格按照《中国文献编目规则》、《中国机读目录格式使用手册》、本馆著录细则以及图书本身的各个信息源详细核对套录数据中的各个著录项目内容是否正确完整,是否符合本馆的著录要求,如有明显的错误和缺漏,必须对其加以修正和补充。
3.3 要重视对馆藏书目数据的日常维护
一方面,由于编目员在工作中一时疏忽所造成的错误没有及时发现。另一方面,由于编目规则在不断地更新修订,因此,进入馆藏数据库的数据仍不可避免地存在一些错误,这就要对馆藏数据进行定期修改和更新,提高数据维护的时效性。
3.3.1 从编目员本身来说,数据检查要定期化。在对新书进行编目的时候,可以利用查重功能发现以往在套录数据时产生的错误;还可利用编目系统的功能进行批校对,这样可以从整体上发现格式上的逻辑错误和字段错误[4]。
3.3.2 加强与流通部门的联系。要收集整理人员在整架和排架时所发现的分类问题,如索书号出现同书不同号、图书的分类与学科属性不符等错误,将这些都记录在编目数据质量表上,并具体落实到是哪个编目人员出的错,就由其来负责修改。采取这种方法能够增强编目员的责任心,减少差错率。
3.3.3 在读者方面,定期召开数据质量的信息反馈会或发放读者调查表,将读者所反映的有关数据质量的问题收集起来,从中找出读者在检索方面的喜好,如检索点的选取等,以便更好地改进编目数据质量为读者服务。
综上所述,套录数据在给编目工作带来了便利的同时也存在着不少问题,它不是简单地全盘照套,在实际工作中编目员应该发挥自己的主要能动性,结合本馆具体情况进行判断分析,做好套录编目工作,满足读者检索和查找文献的需要,从而真正实现套录数据所应有的作用。
[1]中国图书馆分类法编辑委员会.中国图书馆分类法(第四版)[Z].北京:北京图书馆出版社,1999.3.
[2]涂 茵.套录数据若干问题探讨[J].河南图书馆学刊,2004,(8):41-43.
[3]国家图书馆《中国文献编目规则》修订组.中国文献编目规则[Z].北京:北京图书馆出版社,2005.4.
[4]张少华.套录中文图书书目数据出现的问题及解决方法[J].科技文献信息管理,2007,(1):41-44.
[5]田乃庆.套录编目数据质量分析及改进对策[J].河南图书馆学刊,2009,(10):34-35.
(编辑:陆继玲)