计算机编目中393字段著录分析
2012-12-27
(三明学院逸夫图书馆,福建三明365004)
计算机编目中393字段著录分析
胡彩云
(三明学院逸夫图书馆,福建三明365004)
393字段是《新版中国机读目录格式使用手册》中新增的一个字段.在编制机读目录格式过程中,393字段著录出现了一些问题.通过著录分析并结合古籍著录的一些实例,总结出该字段在著录中出现的问题,即393字段与其他相关字段的配合使用问题和如何客观著录字库中未收录的古文字问题,并提出相应的解决办法.
计算机编目;393字段;100字段
随着计算机编目工作的广泛开展与完善,《新版中国机读目录格式使用手册》中较之前的版本新增了393字段,即系统外字符(OUTSYSTEM CHINESE CHARACTER NOTE).393字段的新增,是针对中国古籍进行客观如实著录而增设的.然在现实编目过程中我们发现有几个问题需注意,故在此进行分析探讨.
1 393系统外字符附注与相关字段的配合
《新版中国机读目录格式使用手册》中将393字段定义为“本字段包含有关记录中出现的字符集所缺字符的附注”[1].而韦衣昶的《特种文献的机读书目数据》中更加明确地指出“393系统外字符注是用于古籍数据录入时字符集里所缺字符的结构和读音”[2],并举例说明.然就单纯393字段出现,并不是3——附注其他字段一样配合相关字段使用,由此使393字段显得更加抽象和孤立.
其实,该字段以附注形式出现,并不是孤立的,在其他相关的必备字段是可以得到体现的.100通用处理数据字段中补充字符集,字符位30-33.《新版中国机读目录格式使用手册》中说,用两组双位字符表示最多两个在记录交换中使用的补充字符集.30-31字符位标识G2集,32-33字符位标识G3集.如果没有补充字符集,则上述字符位标识空位.在常见的机读目录中,30-33字符位一般都为####.关于字符集G2、G3,其实是由G1集完善而来的.G1集,即《GB2312-80信息交换用汉字编码字符集基本集》(双七位表示)或双八位表示的基本集辅3、辅5三个集构成的一个集合,对于处理繁体字出版物的机读目录,可将汉字编码字符集第一辅助集作为G1集,或双八位表示的辅1、辅3、辅5三个集构成的集合作为G1集.
因为汉字字集几乎囊括了常用的汉字,而对于须在393字段附注的表外字符比较少.编目员在进行中文古籍著录时如果发现须使用表外字符,在100字段的30-33字符位应体现,并且启用393字段,以实现必备字段与附注字段的对接.
2 393字段对于记录中出现的古文字的客观著录问题
393字段是对在编古籍数据录入时字符集所缺字符的结构和读音的描述记录.中国文字起源源远流长,很多古文字现在已不用,也无法确定如何发音.393字段应如何处理这个问题呢?
“字形结构描述”可使用汉字(上、下、左、右、中、左上、左下、右上、右下、内、外等)描述缺省汉字某一组成部分所在位置,也可使用约定符号“—”表示去掉汉字中某一部分,或“→”表示置换汉字中的某一部分.这一方法的使用解决了大部分表外字符的结构、字形著录难题.如下例:
韦衣昶在《特种文献的机读书目数据》中还对表外的繁体字符运用了“繁简变更”法[2],即使用符号(繁),表示用该字或该部的繁体.而对于字形复杂难以描述的字,可注明该字所在字典的页码.如下例:
如果说上述方法的运用解决了表外字符集的字形描述的难题,读音描述的问题依然存在.对于古籍中出现的一些地方通用字符,只知道字形,却不知道古音者,该如何著录?
该字是西北边塞戍守文书中流行的文字,查询古今字典,都不知道其读音,而393字段该如何进行著录呢?这时候就要求编目员有相关语音学的知识,将音标著出来.笔者结合语音学的知识提出以下解决方法:
(1)编目员可以查阅古代的韵律书籍,运用古代的反切法,将读音标出;也可以运用周殿福的国际音标将其标出.这种方法虽没办法做到将古音完全正确的标出,但是与古音已经比较接近了.
(2)如遇到完全不可考的,可由编目人员加“?”置于圆括号内,表示古音不可考,或是在圆括号内标注“不详”字样,并且在相关字段进行说明.
以上所作的分析是基于阅读《新版中国机读目录格式使用手册》及在实际的编目工作中遇到的问题而作的分析.这是国家图书馆采用的字段,而CALIS针对这个问题启用了303字段描述表外汉字.“但这种补救方式毕竟是权宜之计,既有碍书目数据的完整性,如果出现在检索字段(是常有的),还会造成难以检索的麻烦.所以在古籍书目数据整改阶段,应该使用ISO10646Level3(UNICODE)国际汉字大字符集(它应建立新字补入机制),补齐原来的系统外字(含清除“”和393字段),提高读者对古籍文献的查全率.”[4]可以说在《新版中国机读目录格式使用手册》中新设的393字段有效地解决了表外字符的著录问题,编目人员在如实著录相关信息的时候应该多运用3——段的附注,在针对古籍之类的书目著录时应发挥393字段著录的长处,准确如实的著录,而对于著录的是否完全正确有待于进一步努力.
[1]国家图书馆.新版中国机读目录格式使用手册[M].北京:北京图书馆出版社,2004:246.
[2]韦衣昶.特种文献的机读书目数据[M].北京:北京图书馆出版社,2002:86.
[3]陈彭年,丘雍.宋本广韵[M].北京:北京市中国书店,1982:6、15、99.
[4]鲍国强.古籍书目数据库整改工作构想[J].文津流殇,2005(8).
G254.362
A
1008-7974(2012)08-0099-02
2012-04-03
胡彩云(1984-),女,福建沙县人,硕士,三明学院逸夫图书馆助理馆员.
(责任编辑:徐星华)