MA R C 21中文罗马化书目记录编制研究
2014-02-11崔明明
崔明明
(中国国家图书馆,北京 100081)
1 拉丁化(罗马化)
拉丁化(或称罗马化)是语言学的一个术语,指将不是拉丁字母(或罗马字母)形式的拼音文字系统转换成拉丁文字系统的过程,即将被转换系统里的非拉丁字符,按照转写系统的规则和转写表,忠实地将字符(也包括字符的变音符号及单音素双字符)对号入座地转写成转换系统里的拉丁字符。被转换系统与转换系统的字符也可以逆向转写[1]。中西方的交流需要语言作为桥梁,汉字拉丁化可以实现西方人对中国文化的了解。
ISSN中国国家中心为连续性资源分配ISSN后,须为每一种连续性资源分别建立相应的书目记录,这些书目记录完成后汇集到ISSN国际中心数据库,供全球用户检索利用。ISSN国际中心规定,非罗马文字的连续性资源ISSN注册书目记录应按相应标准转换成罗马化文字。非罗马文字包括中国少数民族语文、日文、韩文等多种文字。本文中的“中文罗马化”意即“中文普通话罗马字母拼写法”。
2 中文罗马化国际标准ISO 7098的确立与修订
2.1 ISO 7098
我国代表周有光先生在1979年的ISO/TC 46会议上提出了《汉语拼音方案》作为国际标准的建议。国际标准ISO-7098是由ISO/TC46“文献工作”技术委员会制订的,并于1981年2月份发给各成员团体征求意见。1982年ISO/TC 46会议上正式通过了ISO 7098(文献工作——中文罗马字母拼写法)[2],自此,汉语拼音从中国的国家标准成为了国际标准。
2.2 ISO 7098(1991)
经过技术修改,形成了 ISO 7098(1991)。该版标准解释了中文普通话罗马字母拼写法的原则。中文普通话罗马字母拼写法在国际标准中叫做“中文罗马化”(Chinese Romanization)。 该标准在信息与文献编目、文献检索、博物馆等领域发挥了巨大的作用,架起了我国与世界沟通的桥梁。
2.3 ISO 7098在图书馆的应用
为便于读者使用汉语拼音检索并利用文献,该标准在全球很多图书馆的中文编目中得到广泛使用。美国国会图书馆在20世纪末就使用该标准对数万种中文文献进行了罗马化编目。法国国家图书馆及大学图书馆的专家还集中研究汉语分词连写问题,试图规范分词连写问题并用于编目实践中。澳大利亚国家图书馆和德国特里尔大学图书馆也采用该标准对中文文献进行罗马化编目。
2.4 ISO 7098(1991)的修订
ISO/TC 46第38届会议上我国代表冯志伟论述了ISO 7098(1991)的修订原因,如ISO 7098(1991)中3.6的规定太笼统、不充分,缺乏可操作性。使用者在实际使用汉语拼音来拼写时,对不同的音节连写还是分写,往往两者兼有,造成转写的不一致。要在国际范围内全面实行汉语拼音分词连写,特别需要得到如美国国会图书馆、法国国家图书馆、德国大学图书馆等重要文献工作部门的支持。在修订稿中仅提出了在增加有关人名、地名分词连写的规则。另外,也提出了修订稿中列举的作为参考的词表不宜太过时、缺乏时代感,应能满足当前的参考需要[3]。
3 《正词法》在书目记录罗马化转写中的应用
我国的《汉语拼音方案》成为汉语罗马化的国际标准,在《汉语拼音方案》的基础上进一步规定词的拼写规范的基本要点形成《正词法》。正词法的英语表达为“Orthography”,即“正确拼写法”之意。汉字的书写是以“字”为书写单位,不是以“词”为书写单位。《正词法》规定了用《汉语拼音方案》拼写现代汉语的规则。该标准的制定原则为:以词为拼写单位,并适当考虑语音、语义等因素,同时考虑词形长短适度[4]。 用汉语拼音来拼写普通话时,是以词作为书写单位,应该分词连写,也就使得语言中的表义单位能够在书面形式上反映出来,阅读起来比全分或全连更清楚。这是拼音书写形式与汉字书写形式的根本区别,反映了词语的实际结构,以词为单位来正确地书写汉语普通话的拼写法。
依据国家标准 《正词法》(GB/T 16159-1996)相应拼写规则,ISSN中国国家中心罗马化数据库中的书目记录转写实例有以下几种情况。
(1)表示一个整体概念的双音节和三音节结构,连写。如:
222#0 $aGangtie yanjiu(钢铁研究)
222#0 $aTushuguan luntan(图书馆论坛)
(2)四音节以上表示一个整体概念的名称,按词(或语节)分开写,不能按词(或语节)划分的,全都连写。如:
222#0 $a Tushuguanxue yanjiu(图书馆学研究)
222#0 $aZhongguo Shehui Kexueyuan Yanjiushengyuan xuebao(中国社会科学院研究生院学报)
(3)为了便于阅读和理解,在某些场合可用短横。如:
222#0 $a Gong-guan shijie(公关世界)
222#0 $aXibei Zheng-Fa Xueyuan xuebao(西北政法学院学报)
(4)名词与单音节前加成分和单音节后加成分,连写。如:
222#0 $a Feijinshu kuang(非金属矿)
222#0 $aYishujia(艺术家)
(5)名词和后面的方位词,分写。但已经成词的,连写。如:
222#0 $aHaiwai wenzhai(海外文摘)
(6)汉语人名按姓和名分写,姓和名的开头字母大写,笔名、别名等按姓名写法处理;已经专名化的称呼,连写,开头大写。如:
222#0 $aLu Xun yanjiu yuekan(鲁迅研究月刊)
222#0 $aKongzi yanjiu(孔子研究)
(7)汉语地名按照中国地名委员会文件(84)字第17号《中国地名汉语拼音字母拼写规则(汉语地名部分)》的规定拼写。汉语地名中的专名和通名分写,每一分写部分的第一个字母大写。如:
720##$aBeijing Shi Wujiaju(北京市物价局)
720##$aSichuan Sheng Shehui Kexueyuan(四川省社会科学院)
(8)非汉语人名、地名本着“名从主人”的原则,按照罗马字母原文书写;非罗马字母文字的人名、地名,按照该文字的罗马字母转写法拼写。如:
222#0 $aMakesi zhuyi yanjiu(马克思)
222#0 $aWulumuqi Chengren Jiaoyu Xueyuan x uebao(乌鲁木齐)
(9)“各”“每”“某”“本”“该”“我”“你”等和后面的名词或量词,分写。 如:
260##$aKunming:$bGai Kan Bianjibu,$c1985-(该刊编辑部)
(10)数词和量词,十一到九十九之间的整数,连写。如:
720##$aErshiyi Shiji Lianhe Chuangxin(Beijing)Yiyao Kexue Yanjiuyuan(二十一世纪)
(11)表示序数的“第”与后面的数词中间,加短横。 如:
720##$aHegongyebu Beijing Di-San Yanjiusuo(第三)
(12)虚词与其他语词分写。连词、结构助词“的”“地”“得”“之”与其他语词分写。 如:
222#0 $aQiche zhi you(汽车之友)
222#0 $aZhonghua jiehe he huxi zazhi(和)
(13)拟声词连写,如:
222#0 $aKapa(咔啪)
4 中文罗马化书目记录转写不一致情况例析
语言是在不断发展的,语言要素中的词汇又是最活跃、最敏感、最具代表性的。书目记录中的题名与责任说明项及出版发行项等涵盖名词、动词、数量词、人名、地名等,转写时虽遵循标准规则转写,但由于编目员理解上的偏差、或启用新版标准滞后、或因标准本身修订造成的转写不一致等原因,出现了非规范转写与转写不一致情况。ISSN中国国家中心书目记录拉丁化转写经历了30年的发展,为进一步实现正确转写、准确转写而对一些数据进行梳理与分析,实有必要。
(1)个别记录仍含韦氏拼音。我们惯称的韦氏拼音即威妥玛拼音(Wade–Giles system)[5],也称作威妥玛拼法或威玛式拼音、威氏拼音、威翟式拼音,是一套用于拼写中文普通话的罗马拼音系统。1979年以前,威妥玛拼音广泛运用于英文标准参考资料与所有有关中国的书籍中。尽管至今为止,绝大多数的威妥玛拼音应用都已被汉语拼音所取代,但仍有一些地名和机构名称,沿用威妥玛拼音拼写。书目记录拉丁化转写时,除清华大学(Tsinghua University)、北京大学(Peking University)、苏州大学(Soochow University)、天津(Tientsin)等一些早期用韦氏拼音并沿用至今的地名、机构名称等专有名词遵循客观著录外,均采用汉语拼音转写。以下2个例子,例1是依韦氏拼音转写;例2依汉语拼音转写,除了变异题名和机构名称客观著录外,其余则用汉语拼音进行转写。
例 1:0220#$a0577-9189
2101#$aCh'ing Hua Ta Hsueh Hsueh
Pao
222#0 $aCh'ing Hua Ta Hsueh Hsueh Pao
24613 $aJournal of Tsinghua University
24613 $aQuinghua Daxue Xuebao
24613 $aTrudy Politekhnicheskogo Insti
tuta Chin-Khua
24613 $aTsing Hua Ta Hsueh Hsueh Pao
24613 $aTsing Hua University Journal
例 2:0220#$a1673-9280
222#0 $aQinghua faxue
24510 $aQing hua fa xue.
24611 $aTsinghua Law Journal
24611 $aTsinghua Law Review
260##$aBeijing:$bGai Kan Bianjibu
720##$aQinghua Daxue
720##$aTsinghua University
(2) “陕西”的转写。 书目记录中“Shanxi”和“Shaanxi”的转写均有,原因是所依据标准不同。学术界对这个问题有不同看法。中国地名委、教育部和国家出版局出版的《中华地名大词典》(1998年)以及民政部颁发《中国政区大典》(1999年)则都采用“Shanxi”。国家测绘局编制的《中华人民共和国地名录》目录索引中则使用了“Shaanxi”。《汉语拼音正词法基本规则》起草人之一尹斌庸先生所著《新华拼写词典》对“陕西”的拼写即采用“Shaanxi”,并同时指出仅用于区分省级行政区划。
1977年,联合国第三届地名标准化会议通过了关于 “采用汉语拼音作为中国地名罗马字母拼法的国际标准”的决议。汉语拼音拼写必须按照我国法定的罗马字母拼音方案——《汉语拼音方案》,但“Shaanxi”的拼法显然违背《汉语拼音方案》的基本法则。“Shaanxi”的拼法唯一作出明确表述的国家标准是 《中文书刊名称汉语拼音拼写法》(GB3259-89)规定“某些地名可用中国地名委员会认可的特殊拼法”。如:Shaanxi Ribao(陕西日报)[6]。
(3)“加短横”问题。 《正词法》中规定“为了便于阅读和理解,在某些场合可以用短横”,如:huan-bao(环保)、gong-guan(公关)、ke-ji(科技)、gang-ao-tai(港澳台)、shui-ziyuan(水资源)、jiancai(建材)等,而书目记录中出现的如上词语有加短横也有不加短横的不一致情况。随着语言发展,“加短横”在什么情况下使用,在什么情况下不使用,用与不用如何统一?既要保持一致性又要兼顾到阅读和理解的需要,实现统一还需探讨可行性方法。
(4)大小写。《正词法》规定汉语地名中的专名和通名分写,每一分写部分的第一个字母大写。如:泰山应转写为Tai Shan,而非Taishan。这类转写错误属于未严格按标准转写。
(5)分词连写。如“古生物学文摘”转写为222#0$aGu shengwuxue wenzhai,属编目员理解偏差导致的错误转写,准确转写应为222#0$aGushengwuxue wenzhai。
(6)地名转写。地名“乌鲁木齐”转写为Wulumuqi和Urumqi的情况均有,而《正词法》(2012版)6.2.3规定“非汉语人名、地名的汉字名称,用汉语拼音拼写”。因此,这类地名应严格按照最新标准转写,以保持一致性。
除以上列举之外还有一些标准中未例举的和新词汇需要探讨。
5 结语
连续性资源编目作为知识组织的重要组成部分,在文献的有序化过程中一直发挥着重要的作用。中文罗马化书目记录的转写工作需要遵守如下三原则,即:标准化原则,对照相关标准按规范转写,对非规范转写进行修改;科学化原则,加强语言学学习和研究,必要时请教语言学家,掌握相应学科专业知识;一致性原则,对不一致转写进行分析,保持转写的一致性。为此,承担该方面编目工作的人员,要加强语言学相关知识的学习,加强对相关规范和标准的研究,加强在具体工作实践中的探讨,使中文罗马化书目记录更加准确、规范。
[1] 罗马化[EB/OL].[2013-09-07].http://baike.baidu.com/view/1918230.htm?fromId=916866.
[2] ISO 7098文献工作--中文罗马字母拼写法1982-08-01第一版[EB/OL].[2013-09-07].http://www.china-language.gov.cn/wenziguifan/shanghi/028.htm.
[3] 汉语拼音方案 _ 百度百科[EB/OL]].[2013-09-07].http://baike.baidu.com/view/104414.htm.
[4] 《汉语拼音正词法基本规则》(国家标准)GB/T 16159-1996 [EB/OL].[2013-11-30].http://hi.baidu.com/wmnet/item/e09cea7ca62858326e29f626
[5] 威妥玛拼音-维基百科 [EB/OL].[2013-09-07].http://zh.wikipedia.org/wiki/%E5%A8%81%E5%A6%A5%E7%91%AA%E6%8B%BC%E9%9F%B3.
[6] 不必为“‘Shanxi’还是‘Shaanxi’”争论[EB/OL].[2013-11-30].http://www.shyywz.com/jsp/index/show.jsp?id=4010&ne wsType=157.