辨析声调的标度和归类方法
——纪念赵元任先生标调理论发表100年
2024-02-29吕士楠
吕士楠
(中国科学院声学研究所 北京 100190)
0 引言
言语的基本结构包括词汇和句法两部分。在语言分析和归纳中,词汇和边界可以通过一套区别特征在音段底层输入项目中做出标注。而且,词汇是有限的,也已得到较为成功的处理。而句法,即音系规则,是当前语言学关注的热点。近来人们十分关注乔姆斯基的语言学理论。他强调言语中的重音分配,创造性地提出用以构建言语音高重音轮廓的生成转换循环理论[1]。因此,音高的标度成为言语研究的焦点之一。早在乔姆斯基提出英语的声音模型近半个世纪前,我国语言学家赵元任、刘复和白涤洲等已经关注到音高的标度问题。除了音高在普通语言学中重要地位外,还由于汉语是一种声调语言,为音高的研究提供了得天独厚的优越条件,汉语声调研究成绩斐然。赵元任先生在1922年对汉语声调进行了音高测量,在此基础上提出了声调“五度标调”法。他提出将音域在对数坐标上四等分后,标为1、2、3、4、5 五个调值,即众所周知的、在国际上享有盛誉的声调“五度标调”法。赵元任先生根据实际标调结果将北京话的四声的调值归结为阴平5-5、阳平3-5、上声2-1-4、去声5-1。随后,1934年,白涤洲先生提出将说话人的音高音域等分成5段,由低到高,将第一段中的音高称为1 度;第二段为2 度;第三段为3度;···,提出一种声调值“归类”的计算方法。
本文旨在介绍老前辈的声调研究成果,为赵元任先生的五度标调法补充一个计算公式,以全面彰显赵元任先生声调理论的要义。本文对“标调”和“归类”两种汉语声调五度标调法做出辨析,指出“标调”比“归类”更科学,即更符合言语实际过程,和更适合语言研究和言语工程技术上的应用。
1 汉语普通话声调调值的“五度标调”法
赵元任先生是一位语言和音乐天才,审音和辨音的能力远超常人,能说多国语言、多种汉语方言,而且他还是一位研究自然科学出身的语言学家,精通自然科学哲理和掌握科学仪器实验方法。1922年,赵元任先生发表了世界上最早的汉语声调科学测量结果[2]。图1 是他设计的实验装置[2]。图中T是一个笛子;K 是吹音的口子;S 是活塞,上下移动S,可以改变笛声的音高;C是与活塞联动的笔尖,用以将笛声的音高变化记录在事先标有五线谱音调调阶的记录纸上。
图1 赵元任先生的音高测量装置[2]Fig.1 Mr.Zhao Yuanren’s pitch measurement device[2]
实验时要求被试反复聆听实验样品的字调,听准了,并牢记于心。然后开始在K 处吹笛发声,通过进退活塞,使笛声确似人发的字调的声音。这时得到画在纸上的曲线就是那个字调的音高曲线。将它改画到平常的五线谱上,如图2所示[2]。
图2 赵元任先生测得的北京话四声音高曲线[2]Fig.2 Mr.Zhao Yuanren measured the four voices of Beijing dialect pitch curve[2]
在此基础上,赵元任先生提出了五度标调理论:每一个标调字母由一条垂直的参照线构成,其高度为n,附着一条表示声调的简化的时间音高曲线,全程等分为4 段,这样就有了5 个点,编号为1、2、3、4、5,分别对应于低、半低、中、半高、高[3]。
按照这个声调五度制的理论,可以将声调调值D的计算公式表示为
其中:D的单位为度;fx、fmax和fmin分别表示音高的测量值、音高域的最大值和最小值,单位Hz。取对数是因为音高感知与基频的对数成比例,这是在音乐中早已为学术界普遍接受的结论。“×4”体现标度理论中“全程分为4段”的核心思想;“1+”表示基数是1。
若:fx=fmin,
则:D=1+0×4=1.
若:fx=fmax,
则:D=1+1×4=5.
即fx在fmin∼fmax域中变化时,如果D取整数,将得到1、2、3、4、5等5个单位为度的调值。
图3 为汉语语音合成声调模型[4-5]。它是由一位发音人,在嵌板句朗读汉语/a/、/o/、/e/、/i/、/u/、/ü/六个单韵母得到不同声调的音高平均曲线,通过公式(1)标调的结果。横坐标为归一化时长,左纵坐标为五度标调值,右纵坐标表示对应的基频值。
图3 汉语语音合成声调模型[4-5]Fig.3 Chinese speech synthesis tone model[4-5]
由图3 可见阴平的调值为5-5,阳平为3-5,上声为2-1-4,半上为3-1,去声为5-1,半去为5-2。中国科学院声学研究所研制的KX-1 合成器合成的汉语声调与传统调值符合。此外,这个标调计算准确到小数点后两位,使其呈现为平滑的曲线,以满足言语工程技术上的特殊需要。因此,公式(1)不仅完美地用数学语言表达了赵元任先生的汉语声调标调理论,也拓展了声调的五度标度法的内涵。
2 汉语普通话声调调值的五度“归类”法
20 世纪30 年代,除了赵元任先生外,刘复和白涤洲先生也在研究声调。刘复先生制作了声调推断尺,白涤洲先生利用它推断出字调不同时间的音高,获得北京话四声的音高曲线。如果用乐谱写下来,得到图4[6]。
图4 白涤洲先生测得的北京话四声[6]Fig.4 Mr.Bai Dizhou measured the four voices of Beijing dialect[6]
这项研究中的汉语四声,是与赵元任先生的观点契合的,但在如何标定四声的理念上迥然不同。白涤洲先生将说话人从最低到最高的音高域五等分,例如他在从音阶c到c′的12个半音的音高域中,使音高每升高2.4 半音,声调值增加1 度。由此将表示为半音的不同音高转换为声调的五度值,如图5所示。
图5 白涤洲先生的声调调值“归类”法[6]Fig.5 Mr.Bai Dizhou’s “classification” of tone[6]
由于这种确定声调五度值的方法简单直观、容易实施,林焘和王理嘉[7],以及曹剑芬[8]详细推荐了这个算法。该方法成为近一个世纪以来,汉语声调实验研究中普遍采用的方法。文献[7]增订版[9]引入了五度值的上述D计算公式(1)和下述T计算公式(2),删除了某一方言最低频率为100 Hz、最高为300 Hz 的调域对数值五等分的五度归类方法的阐述。
1986 年,石锋[10]提出了T值的汉语声调五度值新的计算方法,T值的计算公式为
式(2)中,a为调域的上限,b为调域的下限,x为a和b之间的测量点。他还给出了天津话不同声调的音高曲线,例如阴平调如图6所示[10]。
图6 天津话阴平调的声调曲线[10]Fig.6 The first tone pitch curve of Tianjin dialect[10]
图6 中粗线表示单字音声调;细线表示阴平做前字时的声调,a、b、c、d、o 表示后字分别为阴、阳、上、去、轻声。由公式(2)和图5 可以发现,T有0、1、2、3、4、5 六个调值,与赵元任先生的五度标调理论迥然不同。因此在1991 年,石锋[11]把T值改称为参考值,对定调法作出如下补充:“(T)从0 到1 之间大体可以看作五度值的1 度;1 到2 之间看作2 度;2到3 之间看作3 度;3 到4 之间看作4 度;4 到5 之间看作5 度”。由此可见,T值定调法就是白涤洲先生的五度“归类”法。
3 讨论
罗常培等[6]同时介绍了赵元任和白涤洲两位先生的声调研究,但笔触的力度不同。对白涤洲先生的工作,书中阐述为“北京话的基本调型”,声调研究的进展;而将赵元任先生的工作,推崇为“五度记调”法,一种具有开创性的汉语声调理论。
汉语声调五度标调法的重大理论价值,在于它是符合所有物理量度量规则的,为语音音高度量最先建立的度量制度。它又与一般的绝对值度量制度不同,立足于语音的感知是音高的相互比较的结果,赵元任先生的五度标调方法是一种相对值的标度。众所周知,建立一种度量制度首先必须要有明确的参照点。如测量温度,标准大气压下纯净水的冰点和沸点是可靠的参考点,科学上将冰点定义为0◦,沸点定义为100◦。中间分为100 等分,其间隔就是温度变化1◦的定义。那么对于声调,即音高的测量,这个类似温度测量中“冰点”和“沸点”点又在哪里?确实是很难确定的。赵元任先生没有拘泥于音高的绝对值,在声调标调理论中,他提出将最低的音高定义为1 度,最高的音高定义为5 度,用五度区分来应对音高的相对关系,度值表示为最低音高的倍数。这好比一杆没有定盘心的五分度木杆称,用来称量一堆有限量的重物,事先将称量最轻的重物时的称纽位置标为1,最重位置标注为5。中间四等分,分界点分别标为1、2、3、4、5。在称量实物时,若称纽落在2上,表示它是最轻质量的2倍;落在3是3倍。只要称杆足够长,配上合适的秤砣,相对质量的测量可以达到要求的精度。在声调测量中,音高的相对值往往比绝对值更有用,这点与音乐和歌唱的情形不同。赵元任先生热爱西洋音乐,从音乐中吸取精华,但又不拘泥于音乐,提出独特的相对音高的声调标调理论,因此得到国际语言学界的广泛赞誉,直至今日也是值得中国人骄傲的事。
2004 年,朱晓农[12]对声调的归一化标调的意义和方法做了详细的阐述。他归纳出6 种具有普遍的科学价值的声调归一化算法。这里引述其中的“对数半音差比(Ratio of logrithmic semiton distances,LD)”算法[13]。他给出归一化公式:
其中,Xi是声调音高值(Hz),XH和XL分别是说话人的音高域的上限和下限。比拟赵元任先生的说法,LD 是“······,全程等分为一段,这样就有了两个点,编号为0、1,分别对应于低、高”。要将LD 变换成赵先生的五度,首先要将它分为4段,即4×d1,编号从1开始,所以要+1,最后得到D=1+4×di。因此,赵元任先生提出的方法,属于“域值规范化”方法,是一种量值标度的普遍方法。但赵元任先生的理论比LD早得多。
虽然“标调”和“归类”都可以从一群音高实测数据中归纳出声调的五度值。但其结果不完全相同。图7 表示在半音标尺上一个倍频程的音高标注结果。标尺上方双向实线箭头表示调值和它的域,在“标调”中D值就是调值,在“归类”中分别列出T值和调值,虚线双箭头表示它和“标调”音高重合的部分。
图7 一个倍频程中“标调”和“归类”不同调值音高分布及其重叠域Fig.7 The “calibration” and “classified” pitch distribution and their overlapping fields in an octave
由图7可见,D值1度和5度的标志点分别居于标尺的起点和终点,表示不包含比1 小的值,也不包含比5 大的值,忠实反映赵元任先生理论假设的前提。1 度和5 度的数值空间自然比2 度、3 度、4 度的小了一半。当今,以音高上限和下限做基准的音高归一化算法并非罕见。并且,在上述自然界测量标准大气压下纯净水的温度的例子中可以发现,只要是水,能测到的最低的温度是0◦C,低于0◦C 的是冰,不是水。所以在温度计上显示的0◦C 水只占有0◦C∼0.4◦C 的0.5◦C 数值空间,同样水温的上限100◦C 也只有0.5◦C 的数值空间,而不是其他的(n±0.5)◦C 的1◦C 数值空间。所以,刻度值蕴含的数值空间不同是无可非议的。相反,对于T值,如图7 所示,“五度”被均等地分配为各占2.4 个半音,1 度被标注在1.2 半音处,无端地多出小于1 度的0∼1.2 个半音的空间;高端同样出现高于5 度的10.8∼12个半音空间,都是违背赵先生创立理论的本意的。
由图7可见,虽然两种调值大部分是重合的,但在两端有显著的差异。“归类”对“标度”的符合度见图8。“归类”应该是“标度”的近似算法。
图8 “归类”和“标调”调值的符合率Fig.8 Conformance rate of pitch value betweeb“calibration” and “classified”
因此,既不能把在国内语音研究中长期使用的“归类”定调看成是赵元任先生的五度标度,也不应否定“归类”算法。由于“归类”直观、简单,受到实验语音学家的青睐,在已有的许多声调研究中做出了重要的贡献,这是一个重要的历史事实,必须得到尊重。
客观地说,赵元任先生的“标调”更科学,更具普适性。在实际应用中和“归类”比较起来,至少有两个优点:其一是准确。对于“归类”认为每一类中成员是无区别,没有进一步细分的条件。虽然在声调感知,即音系学的调位研究中,五度足以满足要求,但就声调的语音特征,粗犷的5 个等级是远远不够的。公式(1)在汉语四声的研究中,将D表示成整数,是5 度值,但它可以是带小数点的实数,如图3的汉语合成的声调模型,D值准确到小数点后两位,保证声调模型是光滑的曲线,而不是在5 个级别中变化的折线,以避免合成语音中的“卡拉声”。其二是灵活。对于“归类”,五度是定死了的,只能应用在孤立音节的声调分析和辨认中,“标调”恰不然。
在汉语语调的研究中,一个特殊的问题是声调对语调的干扰,因为汉语语句的音高曲线是声调和语调共同作用的结果。根据赵元任先生提出的大波浪加小波浪理论,声调曲线应该是“骑”在语调曲线上的,但要将它们分离,技术上遇到不少困难。沈炯[14]在处理这个问题时,反其道而行之,不是“分离”声调和语调,而是把四声分别聚合到不同句型的同一个句子中,观察四声聚合的功能语句中,不同语法功能、不同位置的音节的声调调域的上下限和宽度的变化。图9 表示一个九音节陈述句(组一)的5 位(2 男3 女)发音人的四声聚合音高测量结果的实例。纵坐标表示音高值,是半音标度的;横坐标上面的方框表示音节的排列,其中的尖括号中的数字表示序号,框上下的数字表示音高的上下限,框内的数字表示域宽。他通过对6 组不同句法结构的四声聚合语句的音高数据分析和观察,得到语调是由有一连串声调音域组织起来的音高调节形式,语调对声调音域有调节作用,上限的调节变化与语意的加强有关,下限与节奏相关的重要结论。
本文不更多讨论声调聚合研究的贡献,更关心的是沈炯的音高标度。他引用的是音乐上以半音为单位的音阶“标度”方法,但有两点区别:一是改变了以256 Hz 为中央C 的基准,将0 点分别设置为男声为55 Hz、女声为80 Hz,使得音域不同的音高可以放到同一个坐标轴上比较。二是将调值标出小数点来,将音高的变化表示得更细致。它与“归类”迥然不同,但与“标调”有异曲同工之妙。设想如果将赵元任先生的声调标度理论应用到汉语语调的研究,即以四声孤立音节发音得到的音域上下限为基础,标注自然语言的音高曲线,根据吴宗济先生[15]的研究结果,预期在词一级的音高变化可以保持在声调五度的范围中。在语调短语中超出五度的属于语调变化。语调的“音高下倾”可能造成音高曲线低于1 度;“重音”、“焦点”和“语气”等可能引起音高高于5 度。笔者认为通过对这些泛五度的音高精细数据的分析,进一步考察声调和语调交互作用,是一个自然语言中,回避四声聚合困难,非常值得研究的问题。
4 结论
综上所述,鉴于赵元任先生对言语中的音高现象的深邃洞察力,和对语言学,尤其是语调和声调理论的卓越贡献,本文推崇他的标调理论,辨析汉语声调两种定调方法的差异。由于“归类”方法直观、简单,受到实验语音学家的青睐,在已有的许多声调研究中做出了重要的贡献。本文尊重这一历史事实,无意排斥“归类”。但为推进我国语音学和言语工程技术的发展,衷心地推荐在赵元任先生的理论指导下推演的声调的计算公式。“标调”的优点,不仅可以得到汉语四声范围内的细粒度的调值,也可望延拓到四声以外汉语语调的研究。
致谢 李子殷老师鼓励我完成文稿,他阅读了全文,提出了许多宝贵的修改意见,在此表示衷心感谢!