从“国语罗马字拼音”与“注音符号第二式”看拼音系统的改进
2018-05-08黄伟李孜
黄伟 李孜
摘要:注音符号第二式是国语罗马字拼音的修订版,在标调方式和部分字母设置上进行了修改。通过采用音形关系指标对两种方案进行计量描写与比较发现,注音符号第二式的系统经济性、形素长度、形素载荷、字母使用度、正字法改革必要性五项指标都得到了改进,拼写系统整体性能得到优化。本文针对这一案例的定量分析,为语言文字政策的制定与评估提供了具有可操作性的量化方法与经验。
关键词:国语罗马字拼音 注音符号第二式 语言规划 音形关系 计量语言学
一、引言
1928年,南京国民政府大学院将“数人会”制订的“国语罗马字拼音”作为“国音字母第二式”正式公布,它成为第一个法定的拉丁字母汉语拼音方案。1940年,国音字母第二式改称为“译音符号”。1958年,《汉语拼音方案》开始在中国大陆地区推行使用。为了应对汉语拼音国际化进程的挑战,台湾地区开始对国语罗马字拼音进行修订。1984年,台湾“教育部”把“译音符号”改名为“国语注音符号第二式”,公布了经过修订的试用方案,并于1986年公布了正式方案。虽然国语罗马字拼音和注音符号第二式都不是现行的主流拼音方案,但這二者在汉语罗马化拼写的发展进程中都产生了一定的影响,引起了广泛关注。
国语罗马字拼音的制订,从学术上讲,十分精密。它按照汉语的特点来利用罗马字,使罗马字中国化;限用26个拉丁字母,不用新字母和附加符号;追求科学性和美观性,用字母表示声调,有详细的规则,解决了外加符号容易脱落的问题。此外,它既注重音理又坚持音位原则,用浊音字母b、d、g表示不送气清音声母,在实际使用中方便不少;注音符号中的“ㄨㄥ”被分化成两个韵母ong和ueng,而作为撮口呼的“ㄩㄥ”则写成iong,更切合实际读音。国语罗马字拼音是当时最精密的拼音方案,但是,字母标调带来优势的同时,也是以牺牲其简易性为代价的。利用字母表示声调,拼式冗长,规则复杂,这也成为后来学者对其批评的主要内容之一。
注音符号第二式对争议最大的标调法作了修改,放弃字母标调法,采用符号标调法,并调整了部分细节,比如把舌尖韵母分为z和r,把ong和iong改为ung和iung,把韵母el改为er(用作韵尾只写r)等。在针对注音符号第二式举行的教学研讨会上,专家们一致认为“注音符号第二式是一套很有价值的发音符号,有利于科技进步,值得推广采用”。
从声韵调等细节方面将两种拼写系统相比较得出的上述认识是主观的和微观的。从国语罗马字拼音到注音符号第二式的改变,究竟在多大程度上改进了汉语罗马化拼写法?如何以尽可能客观、量化的方法对这种改变进行整体、宏观的测量和比较?回答这两个问题,对汉语罗马化拼写法的制定与评估具有一定的意义和参考价值。为此,本文计算了这两种拼写系统的系统经济性、正字法不确定性、形素长度、形素载荷、字母使用度、正字法改革必要性等音形关系指标,从技术性能方面客观评价两种拼写系统的特点,观察对国语罗马字拼音的修订是否影响拼写系统的整体特性,探讨修订后的方案在哪些方面有何种改变。
二、国语罗马字拼音与注音符号第二式的计量特征
为了采用计量语言学(quantitatire linguistics)中使用的音形关系指标对国语罗马字拼音和注音符号第二式进行测量,需要先整理两种拼写系统的音形对应关系。两种拼写系统中辅音、元音和声调的音形对应关系分别如表1、表2和表3所示。
国语罗马字拼音使用了24个罗马字母(无“v”“x”),对22个辅音、14个元音、5个声调进行描写。字母“v”“x”“gn”“z”和加符字母“会”表示“今音不用或罕用之音”,暂不予以考虑;而“y”“w”“y(u)”是零声母标志或起区别韵的作用,将其纳入相应的元音中计算。
注音符号第二式使用了23个罗马字母(无“q”“v”“x”)和一个加符字母“ê”,对22个辅音、14个元音、4个声调进行描写。其中“ueng”与声母相拼写为“ung”的情况视为[u?]简写为“u”,在表2中以“∈u”表示。注音符号第二式的轻声标志(以及国语罗马字阴平调和阳平调的基本形式)为零形式,即无显性表现形式,在表3中用“#”表示。
在上述音形对应关系的基础上,我们计算了两种拼写系统的以下六种计量指标。
(一)拼写系统的经济性
拼写系统的经济性是系统中音素与形素数量的比值。国语罗马字拼音中有辅音音素22个,形素19个;元音音素14个,形素12个;声调音素5个,形素15个。因此,国语罗马字拼音的系统经济性:
注音符号第二式中有辅音音素22个,形素22个;元音音素14个,形素14个;声调音素4个,形素4个。因此,注音符号第二式的系统经济性:
(二)正字法不确定性
音素正字法的不确定性是一个音素所对应形素数量的以2为底的对数值。表4是国语罗马字拼音和注音符号第二式中每个音素的正字法不确定性。整个拼写系统的正字法不确定性以全部音素的正字法不确定性的算术平均值表示。
国语罗马字拼音的正字法不确定性:
注音符号第二式的正字法不确定性:
(三)形素长度
罗马化拼写系统中,形素长度可以用它使用的字母个数表示。整个拼写系统的形素长度为全部形素长度的算术平均值。表5是国语罗马字拼音和注音符号第二式的所有形素及其长度数据。据此计算出国语罗马字拼音的平均形素长度:
注音符号第二式的平均形素长度:
(四)字母的形素载荷
字母的形素载荷指字母参与构成形素的个数。表6给出了国语罗马字拼音与注音符号第二式中每个字母的形素载荷。国语罗马字拼音的字母形素载荷的平均值:
(五)字母的使用度
字母的使用度与其参与构成的形素数量以及它在形素中的位置有关。一个拼写系统整体的字母使用度仍是取平均值。表7列出了国语罗马字拼音与注音符号第二式中每个字母的使用度,据此计算出国语罗马字拼音的平均字母使用度为:
(六)正字法改革必要性
就一个拼写系统而言,理想的情况是形素与音素完全一一对应。然而,实际情况往往并非如此,可能存在“一音多形”或“一形多音”。实际情况与理想情况之间的差距可以用下面这个指标来测量:
其中K是拼写系统中字母使用度的集合,w是系统中不同字母使用度的集合,M是理想情况下不同字母使用度的集合。根据表7,国语罗马字拼音中K=(1,2,3,4,5,6,12,13,14),W=<9,2,3,2,1,3,1,1,2),M=(24,0,0,0,0,0,0,0,0)。根据公式计算出国语罗马字拼音的正字法改革必要性指标D=16.06。
注音符号第二式中,K=(1,2,3,5,7,9,12),w=<9,4,6,1,1,1,1),M=<23,0,0,0,0,0,0)。注音符号第二式的正字法改革必要性指标D=15.87。
三、国语罗马字拼音与注音符号第二式的比较
上述6项计量指标的计算结果汇总在表8中。对一个拼写系统而言,理想情况下,音素与形素一一对应(一音一符且一符一音),系统经济性SE=1。国语罗马字拼音使用了31个形素描写22个辅音和14个元音,但它采用字母标调法,又用15个形素表示5个声调。注音符号第二式用36个形素描写22个辅音和14个元音,用4个形素表示4个声调。从系统经济性来看,注音符号第二式优于国语罗马字拼音。然而,注音符号第二式的音形对应关系并不是“一一对应”的,存在“一音多形”(元音[u]有“u”“w”“wu”3个形素)和“一形多音”(字母“a”可表示[a][A][a][ε]4个音素)的情况。
如果拼写系统是音形“一一对应”的,则正字法不确定性为U=0。然而,系统经济性SE=1的注音符号第二式的正字法不确定性并不等于零,而是与国语罗马字拼音相等,同为U=0.42。注音符号第二式在标调法方面的改革,简化了声调音素与形素的对应关系;但是对其它细节的更改(例如舌尖韵母分为两个韵母)又增加了正字法不确定性。通过这个指标可以发现,注音符号第二式的系统经济性达到理想值是其音形对应关系中“一音多形”与“一形多音”相互抵消的结果。这也说明,使用单一的计量指标不能全面、准确地衡量拼写系统的音形关系。
对使用者来说,形素长度越短记忆负担越小,越便于使用。从表8中两种拼写系统的形素长度来看,国语罗马字拼音的形素长度大于注音符号第二式。注音符号第二式对标调方法的改革,减少了8个长度为2的形素,2个长度为3的形素,增加了4个长度为1的形素,整体上大大缩短了形素长度,更有利于学习与使用。
形素载荷方面,两种拼写系统要表达的音素数量都是36个;国语罗马字拼音使用了24个字母,注音符号第二式使用了23个字母。两种系统的字母数量都低于所要表达的音素数量,因此字母形素载荷都大于1。国语罗马字拼音的字母形素载荷为2.58,注音符号第二式的形素载荷为2.22,这说明在构成形素的过程中,字母在注音符号第二式中的使用频率更低,编码更简短。这与上一个指标形素长度的比较结果是一致的,因为形素长度与形素载荷是同一个问题的两个不同观察角度。
与形素载荷相比,字母使用度指标进一步引入了字母在形素中的位置信息,更深入地反映了拼寫系统在编码方面的复杂程度。使用度越小,编码越简单。从表8可以看出,注音符号第二式的字母使用度(2.96)明显低于国语罗马字拼音(4.42),复杂程度下降不少。
注音符号第二式的正字法改革必要性指标D=15.87,比国语罗马字拼音(D:16.06)略小。这说明,从国语罗马字拼音到注音符号第二式的改革,确实在一定程度上改进了拼写系统。但是这种改进究竟有多大?通过与其他人工设计的拼写系统和自然语言文字系统相比较(比如世界语的正字法改革必要性指标D=8.49,壮文方案D=14.42,《汉语拼音方案》D=14.49,斯洛伐克文D:17.78,意大利文D=21.6)可以发现,人工设计的拼写系统的正字法改革必要性都比自然语言文字系统的低一些。这正体现了人工干预在拼写系统或文字系统发展中的积极作用。
通过以上比较可以发现,注音符号第二式的系统经济性比国语罗马字拼音高,正字法不确定性与之相等,而形素长度、形素载荷、字母使用度、正字法改革必要性指标都比国语罗马字拼音低。其中字母使用度指标变化较大。在音形关系与拼写效率方面,注音符号第二式确实得到了改进,系统性能更加优化。
四、结语
本文采用六项计量指标定量描写了国语罗马字拼音与注音符号第二式在音形对应关系方面的特征与变化。注音符号第二式在标调方式和部分字母设置上的修改,使得除正字法不确定性指标无变化外,系统经济性、形素长度、形素载荷、字母使用度、正字法改革必要性等五项指标都向着更优化更高效的方向发生了改变。
从国语罗马字拼音到注音符号第二式的修订为汉语罗马化拼写方案的制定与评估提供了经验,对回答一直以来针对《汉语拼音方案》的各种改革与否和如何修改等问题具有借鉴作用。针对《汉语拼音方案》的修订建议大多是从字母设置角度出发进行细节上的更改,那么这种修改是否真能达到预期目标,能够在多大程度上改进拼写系统的效率,又会在多大程度上影响拼写系统的各个方面,本文提供了一个真实案例的分析方法与比较结果。
此外,在评价不同的文字系统与拼写系统时,单一指标不能全面、准确地衡量系统性能。注音符号第二式中,“一音多形”与“一形多音”相互抵消使得系统经济性指标达到理想值,很好地证明了这一点。因此,要使用多项指标从不同方面去测量和评估拼写系统或文字系统的音形关系、编码效率和系统性能。
作者简介:黄伟,北京语言大学对外汉语研究中心副研究员,研究方向为计量语言学。
李孜,北京语言大学对外汉语研究中心硕士研究生。