APP下载

中文名称主题和名称规范的问题与对策

2011-05-12丁建勤

图书馆建设 2011年5期
关键词:标目词表建库

丁建勤

(上海图书馆 上海 200031)

近年来,随着编目工作的发展,业界对于名称规范和主题规范控制愈加重视,而名称主题则是其中的重要内容。所谓名称主题,一般是指用作主题的个人名称标目、团体名称标目、会议名称标目、家族名称标目、作品题名名称标目、地理名称标目(检索点)[1]171。由于名称主题兼具名称规范和主题规范双重属性,如何把握处理名称主题与名称规范的关系,一直是困扰着编目人员的问题。

1 国内中文名称主题和名称规范控制的现状及其存在的问题

国内图书馆中文主题标引工作的普遍开展始于20世纪90年代中后期,主题规范控制工具一般采用《汉语主题词表》(以下简称《汉表》)、《中国分类主题词表》(以下简称《中分表》)及其电子版。对于某些需要编入词表的名称主题,《汉表》和《中分表》一般以附表(录)①的形式列入,这也与国内长期缺乏名称规范文档的现实情况相适应。应该指出的是,虽然印本《中分表》(第2版)已取消了名称主题附录,但其电子版和2010年正式发布的Web版依然收录了相当数量的名称主题。

目前,在一些已开展名称规范控制的图书馆中,可能同时存在名称规范文档和主题规范文档,分别收录名称规范和名称主题规范数据。由于各自分别创建和维护,即采用分立控制模式,可能存在如下问题。

1.1 词形差异

所谓词形差异,指的是同一名称实体在分别被选作名称主题和名称规范时,选用不同的标目(检索点)形式,如个人的姓名与字、号、别名、笔名、艺名、网名等,团体名称的简称与全称等,见例1~例3。

1.2 结构形式差异

编目规则要求,某些名称形式需采用一定的结构化形式,而同一类型的名称在主题规范中却采用不同的结构化形式,如例4。

1.3 数据内容差异

由于名称规范和名称主题分别编制,可能导致同一名称实体在数据元素选择上存在差异,如例5。

附注:该校位于北京市西北郊。其前身为1898年12月创办的京师大学堂,于1912年5月改为现名,是一所侧重于基础科学的教学和研究的文理科综合性大学。

1.4 增词(名称)差异

编目规则对名称规范数据的创建一般不做特别限制。为达到区分的目的,《中国文献编目规则(第2版)》甚至允许对重名的不同个人的名称使用社会属性和暂时、易变信息作为名称附加,只是对选用次序做出了规定(22.2.3.3d、e、f条款)[3]341-342,如例6。而《中分表》修订时却明确要求“一般对新增的专有名称在书目数据库中词频控制在3次或3次以上,期刊论文数据库控制在5次或5次以上,可收为正式主题词”[4]23。

2 名称主题合并统一建库的控制模式

从数据库建设角度来看,名称主题规范数据的创建和维护可大致分为分立控制(分别建库)和合并统一建库控制两种模式。前者为名称规范和名称主题依据各自标准分别建库,两者之间并无必然的联系;而后者则为名称主题和名称规范统一建库,即名称主题一般不在主题规范库中创建和维护。当然也可以将名称规范和主题规范统一建库。

由于名称规范和名称主题的分立控制模式存在上述诸多问题,因此若采取合并统一建库控制模式能够较好地解决上述问题。换言之,在建有名称规范库的情况下,名称主题一般应直接取自名称规范文档,从而实现对描述性编目和主题编目的合理分工,节省人力,也可以避免冲突和差异(如例2、3),同时也免除了目前存在的某一名称形式在名称规范中是规范受控的而在名称主题里却可能是非控词的尴尬(如例1)[5]。

由于客观原因,并非所有的同一名称实体都可能同时出现在名称规范和名称主题之中,当然也不排除某些虚构人物可能需要列入主题词表[6],如《中分表》电子版收录的“玉皇”、“灶君”等。换言之,可能存在有些名称实体未必需要同时创建名称规范和名称主题,或者说只需要单独创建名称规范或名称主题,如“在普通中文图书中,作为创作者的帝王名称数量极少,大多用于标引名称主题”[7]79。应该指出的是,UNIMARC(Universal Machine-Readable Cataloging,国际书目数据通信格)规范数据格式为这个问题的解决提供了可能,其106字段“编码数据字段:用作主题标目的个人/团体/家族名称/商标”(Coded data field:personal/corporate/family name/trademark used as subject heading)的$a子字段定义了3个数值,即0代码为可以用作主题标目,1代码为不可用作主题标目,2代码为只可用作主题标目[8]。

就分类主题一体化词表而言,可能存在基于类目(如依个人、团体、地理名称等立类)对应而不得不列入一部分名称主题的情况,对于这种情况,笔者建议以注释或标引规则等方式予以说明,即要求检索名称规范文档。在电子化环境下(如《中分表》Web版)建议以技术手段提供链接服务,从而实现名称主题和名称规范的一致。

总之,无论名称规范和名称主题统一建库还是分别建库,名称主题均宜采用合并统一建库的控制模式,即名称主题或取自统一的规范库,或直接取自名称规范库。换言之,名称主题一般不在主题规范库中创建和维护,除非是某些可能需要列入主题词表的虚构人物。

3 合并统一建库控制模式下的相应措施

3.1 名称主题增词的分级自主控制

从主题规范控制的组织管理角度来看,主题规范数据的创建和维护可大致分为编目机构分级自主管理和词表管理机构集中统一管理两种方式。所谓编目机构分级自主管理是指承认编目机构具有一定的自主权,可以根据具体情况增加某些主题词(如名称主题等);而编委会集中统一管理则一般不允许编目机构自行增词,当然允许编目机构采用自由词标引方式解决某些可能需要增词的名称主题。如《国家图书馆中文图书自由词标引规则》要求“文献研究内容涉及某个人物,而词表中又没有此人物的个人名称主题词时,可先按文献研究内容概括标引,同时酌情将此人物的个人名称著录于非控主题词字段。个人名称自由词的著录格式参考个人名称主题词的显示格式,所有附加成分均排在主要成分之后的圆括号内,不同附加成分之间用空格分隔”[9]。

应该承认,国内对于名称主题的增词问题存在着一定的分歧。如前所述,《中分表》名称主题增词与学科主题基本相似,均遵循文献保证原则和标引频率统计方法[4]20,只是词频频次有所放宽,因此《〈中国分类主题词表〉(第2版)及其电子版手册》规定“词表未收的专用名称,如地理名称、机构名称、人名、文献名、会议名、产品名、商标名等,可采用自由词标引”[10]。而CALIS规定9种情形下“可直接作为新增主题词记录在各相应字段”[7]68,包括规范化的人名、规范化的团体名称和会议名称、规范化的家族名称、作品名称(统一题名)、规范化的地名等。所谓规范化的名称,应首选名称规范库中的名称形式[3]332。无独有偶,台湾的《中文主题词表》也明确规定21类情形下可“自行增补”,如人名、地名、家族名称、机关会社名称等(编例“7增词规范”条款)[11]。

若名称主题采用合并统一建库的控制模式,一般不宜再将名称实体纳入主题规范库的范畴,以避免“专有名词主题词的大量增加对书目主题词规范文档的可持续发展产生” 的不利影响,因为“书目主题词规范文档的词量是相对稳定”的[12]。而各编目机构可根据名称规范数据的编制规则和具体情况,自主决定在名称规范库中创建和维护名称规范数据,并将之引用至主题标引之中。“中文图书主题规范数据款目著录规则”5.1.1.1.2条款规定“个人名称、团体名称/会议名称、家族名称、作品题名、地理名称用作主题标目时,参照《中文图书名称规范数据款目著录规则》的有关规定执行”[1]171-172,即一般地说在名称选定上应遵循名称规范要求(如个人名称主要成分和附加成分的选择、从属团体和会议名称的结构化形式等)。

为尽可能实现名称主题与名称规范形式的一致,建议业内权威图书馆及其联合编目中心公开发布名称规范数据,并提供多种形式的服务(如镜像服务、MARC下载服务、定期MARC更新服务等),鼓励各编目机构共享利用,主题标引时可将上述名称规范数据作为名称主题的优先参考源。

3.2 协调完善名称复合主题词(词组型叙词)的编制标准

应该看到,目前《中分表》收录了一定数量的名称复合主题词(词组型叙词),对于这些主题词应根据不同情况慎重处理。具体而言,对那些已成为学科主题词的名称复合词应继续保留在主题规范文档中,当然在名称词形上应与名称规范保持一致,如“马克思主义哲学”、“牛顿力学”等,因为这些词已“属通用的专称、术语,其专指检索作用很强,可选用词组”[13]4(GB 13190-91汉语叙词表编制规则 “4.4.1.1”条款);而对那些“由事物与国家、地区、时代、人名所构成的概念”,“一般不得用词组型叙词表达”[13]3,如“日本电子工业”、“白居易诗词风格”(GB 13190-91汉语叙词表编制规则 “4.4.2.4”条款及其附例)[13]4。应注意的是,新版《中分表》对国标的这一规定“可放宽执行”,其“修订说明”规定,“如果其使用频率高于20次,可收选为主题词”[4]22,如“中国经济”、“中国经济史”、“美国对外政策”等②。当然对诸如“毛泽东传记”、“《红楼梦》评论”等由人名、作品题名复合而成且未必形成通用的专称(术语)的主题词则应慎重,因为它们冲击了可用作主题的名称规范,且标引深度极其有限,从而对标引和检索构成了过多的例外。

3.3 兼顾现实,努力减少名称主题与名称规范的差异。

鉴于国内相当一部分图书馆并没有建立名称规范文档,而主题词表已建有一部分名称主题并被广泛应用的现实情况,建议在名称规范控制工作中将主题词表中的名称主题作为重要的参考源,即名称规范可以优先考虑名称主题所确定的形式,并完善数据内容,从而减少可能的转换成本。当然对于因书名号而引起的名称主题和名称规范差异(如例3)则可去除书名号后使用。在技术支持的情况下,建议编目机构对书目数据中的相关子字段做统一批处理。

主题标引若需新增名称,应考虑建立名称规范记录,完善可用作主题的名称的词间关系。当然对那些可以用作或只可用作主题的名称还应在词间关系处理和分类号(CNMARC规范格式6--字段)确定上遵循叙词编制要求,尤其是分类主题一体化词表,如例7。

为统一起见,与名称主题相关的学科主题词的词间关系和分类号似乎仍应通过词表管理部门的审核。值得期盼的是,《中分表》Web版为实现用户和编委会的实时联系提供了可能,各编目机构可利用Web版提供的“用户评注”功能将这些数据维护信息及时传送到服务器上,便于编委会在第一时间汇总评估处理。同时笔者建议词表管理维护部门积极收集新增的名称主题,做好词间关系和分类号的编制审核,统一发布使用③。

注 释:

①《汉表》(第1版)第3卷“附表”列入了“附表一 世界各国政

区名称”、“附表二 自然地理区划名称”、“附表三 组织机构”、“附

表四 人物”;而《中分表》(第1版)第1卷第2册则收录了“附录

一 组织机构”“、附录二 人物”。

②《中分表》(第1版)为“经济——中国”、“经济史——中国”,而

③ 2007年底国家图书馆内设机构调整后,《中图法》编委会办公室

(现称名称与主题规范组)已并入中文采编部,2010年完成了《中

分表》(Web版)到ALEPH主题规范库的灌装,目前名称与主题规

范组负责同时维护《中分表》(Web版)和ALEPH主题规范库。

[1]中文图书主题规范数据款目著录规则[G]//国家图书馆图书采编部.中国机读规范格式使用手册.北京: 国家图书馆图书采编部,1999.

[2]国家图书馆《中国图书馆分类法》编辑委员会.中国分类主题词表[M].电子版.北京:北京图书馆出版社,2005.

[3]国家图书馆《中国文献编目规则》修订组. 中国文献编目规则[M].2版.北京:北京图书馆出版社,2005.

[4]国家图书馆《中国分类主题词表》编辑委员会.中国分类主题词表:第1卷[M]. 2版.北京:北京图书馆出版社,2005.

[5]丁建勤.叙词增词标引的适用及其规范化[G]//中国图书馆学会.中国图书馆学会年会论文集:2008卷.北京:国家图书馆出版社,2008.11:308-312.

[6]编目精灵.名称主题与名称规范:由国家图书馆的做法谈起[EB/OL].[2011-01-04].http://catwizard.blogbus.com/logs/3324285.html.

[7]CALIS联机合作编目中心.CALIS中文图书编目业务培训教材(普通班)[M].北京: CALIS联机合作编目中心,2006.

[8]UNIMARC Manual-Authorities Format 2001 (Concise version) [EB/OL]. [2011-01-11].http://ifla.queenslibrary.org/VI/3/p2001/guideindex.htm.

[9]曹玉强. 国家图书馆中文图书自由词标引规则[J].图书馆建设,2009(3):40-42.

[10]卜书庆.《中国分类主题词表》(第2版)及其电子版手册[M].北京:北京图书馆出版社,2006:222.

[11]中文主题词表编例[EB/OL].[2011-01-11].http://catweb.ncl.edu.tw/sect-2.htm.

[12]曹玉强.近年国家图书馆主题标引的发展及若干问题的处理[J].国家图书馆学刊,2005(2):71-74.

[13]GB 13190-91 汉语叙词表编制规则[S].北京:中国标准出版社,1992.

猜你喜欢

标目词表建库
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
《传奇汇考标目(别本)》的版本及其他
中文图书在版编目数据标目中存在的问题及对策研究
“数字温县”建设项目通过验收
高校图书馆回溯建库探微
中文期刊回溯建库的实践与思考——以贵州省图书馆为例
叙词表与其他词表的互操作标准
基于数据字典的空间数据库通用建库技术
医学论文中制表的注意事项
医学论文中制表的注意事项