语速对语句内部音高变化的影响
2015-05-18江海燕
江海燕
一、引言
普通话的四声以高平、高升、曲折和高降的基频特征相互区别,但是进入语流以后,受语速、语境以及韵律句法位置、组合结构等因素的影响会发生各种变化。关于汉语变调的研究一直倍受研究者关注,但多集中于词内或者短语内的变调规则的探讨,由于不同的语速变化对整个句子韵律表现的影响问题较少有人涉及。
语速问题对于语言的经济性原则和信息传递的清晰度及有效性有很大关联,不同领域和不同时代,语速的变化都与我们的生活息息相关。比如朗读播音、语音信号处理、汉语教学等都会涉及到语速问题。通常语音合成系统改变语速的策略都是线性调整时长,而实际上,语速变化也会在一定程度上改变音高,甚至是使基频曲线发生调位性改变。
汉语语音学界对语流语速问题研究得比较少,《汉语普通话语句时长分布的基本格局》①曹剑芬: 《汉语普通话语句时长分布的基本格局》,《中国语言学报》1995年第7 期。关注到语句的时长变化具有相对稳定的格局。《汉语语调格局在不同语速中的表现》②石锋: 《汉语语调格局在不同语速中的表现》,载石锋、潘悟云编:《中国语言学的新拓展》,香港城市大学出版社,1999年版。转载石锋著《语音格局——语音学与音系学的交汇点》,北京:商务印书馆,2008年版,第324-336 页。沈炯《北京话声调的音域和语调》,《北京语音实验录》,北京:北京大学出版社,1985年版。一文初步展示了快、中、慢三种语速下语调基频曲线的走势。
计算机应用研究领域注意到语速是语音合成和语音识别中的重要因子,如《考虑语速和前后环境的基频Target 模型及实现》①陈高鹏、胡郁、王仁华:《考虑语速和前后环境的基频Target 模型及实现》,《中文信息学报》2004年第3 期,第81-85 页。一文,为实现一句话的基频预测,统计了音节的几个基频变量在快、中、慢不同语速下的变化情况,但该文只是基于单音节进行的建模分析,尚缺乏对句子层面的基频模型的研究。
实际语流中的语速不可能是恒定的,单音节进入不同语速语句后,音高会发生怎样的变化?本文试图对同一调类的音节组成的不同语速语句内部音高的具体变化情况做初步的透视。为对外汉语教学提供一些实验语音学方面的参考,同时也为语音合成及语音识别等信息技术提供支持。
二、研究内容
(一)语言材料
本文使用了一组实验室录音语句,在南开大学语音实验室及首都师范大学言语习得实验室录制而成,语料根据沈炯先生②石锋: 《汉语语调格局在不同语速中的表现》,载石锋、潘悟云编:《中国语言学的新拓展》,香港城市大学出版社,1999年版。转载石锋著《语音格局——语音学与音系学的交汇点》,北京:商务印书馆,2008年版,第324-336 页。沈炯《北京话声调的音域和语调》,《北京语音实验录》,北京:北京大学出版社,1985年版。设计的一组陈述句(如下)修改而来,发音人两男两女,都是在北京出生和长大的大学生。发音人被要求在自然状态下以快、中、慢三种语速说出下面的实验例句,每句说三遍,句与句之间相隔4 秒,这样共得到72个句子(3∗2∗4∗3),每句10 个音节,共720 个音节。我们把每个句子分为首、中、末三个语调调群,每个调群内部又有首、中、末三个音节,末调群前面有一个动词独立音节。从后面的分析可以看出,这是中调群和末调群之间起过渡作用的音节,受前后音节影响,音高较易发生变化,我们把这个音节称为独立音节,暂放在末调群内。
①张中斌星期天修收音机。
②吴国华重阳节回阳澄湖。
③李小宝五点整写讲演稿。
④赵树庆毕业后到教育部。
为了比较这三种不同的语速,我们将四位发音人三种语速下的句长做了平均,得到如下表1和表2 的数据:
表1 四位发音人三种语速下的平均句长(秒)
表2 四位发音人三种语速下句长比值表
从表1 和表2 中可以看出四位发音人都是中速和快速语速更接近,中速和慢速的语速差别较大。女2 号的快、慢速差异最大,其次是女1 号、男2 号,快、慢速差异最小的是男1 号。从基频曲线对比图上也可以看出来,女2 号发音人的快速基频几乎失去了四个调类之间的走势差别,尤其是在中调群和首调群内,各条基频曲线走势都趋平(参见图1)。
(二)实验内容
使用南开大学的语音分析软件“桌上语音工作室”提取每个音节的音高。在音高提取的过程中,首先通过修改基频程序去除弯头和降尾,然后每个音节提取了9 个点的基频值,表示音节韵母部分的音高变化。基频提取采用半音为单位,因为这是比较贴近人耳感知的声学单位③李爱军:《语调研究中心理和声学等价单位》,《声学技术》2005年第24 卷第3 期,第13-17 页。本文未作说明情况下音高单位都是半音。。
把每一位发音人同一个句子的三次发音样品的实验数据进行平均,再把同一个发音人所发的四个句子的平均值画在同一个图中,语句的时长采用归一的方法。在语句内部划分出不同的调群,分别作出各个调群的调域;各调群调域中最高的上线就是全句调域的上限,最低的下线就是全句调域的下限。这样就得出语句调域(全调域full range)。采用半音值为音高标度,作出语句调域图。
三、实验结果及讨论
首先我们来看一下各发音人各调群调域快、慢速基频起伏变化的音高表现。如下图1:
图1 各调群调域快、慢速基频起伏
快速陈述句和慢速句子相比在音高上有如下变化:
1. 相对于快速的语句来讲,慢速语句的调域扩大了。
表3 四发音人首、中、末调群快、慢速调域值
表4 四位发音人首、中、末调域快、慢速差值
从表3 看出,慢速语句的调域相对于快速语句的调域一般来说是扩大了的,数据支持语速变慢会使调域扩大之说。从快速句长来看语速最快的是男2 号,其次是女2 号、女1 号、男1 号,但结合表4 看,调域的扩大程度并不跟语速成正比,也就是说虽然调域随语速变慢而扩大,但并非语速越慢调域就越大。首、中、末三个调群调域的扩大也不均衡,中调群调域扩大的程度最大,末调群最小。可见,句末调群的调域受语速影响最小,有两组(女1 号、女2 号)甚至末调群调域慢速语句的更小一些。这是边界调的作用,边界调稳定性较强,一般很少受语速影响。中调群调域稳定性最差,快速语句受到压缩的主要是中调群调域,其次是首调群调域。
2.慢速语句的调域扩大主要是靠调域下线的下降来实现的。调域上、下线列表如下(见表5),表中“上、下”表示调域上线、调域下线,“快、慢”表示语速:
表5 各调群快、慢速语句中的上下线值
四位发音人的所有调群,包括男女发音人的所有首、中、末调群的下线在慢速语句中都有不同程度的下降,只有一处反例——女2 号的句末调群,原因上文已述。
但调域上线则不同,两位男发音人的上线基本是随语速变慢而抬高(只有男1 号末调群上线音高是持平的),两位女发音人的上线则全部是随语速变慢而降低。
3.对于阴阳上去四个调类来说,语速对阴平的音高影响是最小的,如下图,音长归一后,四位发音人的阴平在不同语速语句中的音高表现一致性非常高。慢速语句中的阴平比快速语句中的阴平略低一点,这个低的程度非常小,几乎可以看作持平。
图2 阴平调在快、慢速语流中的音高对比① 深色线为快速语句的基频表现,灰色线为慢速语句的基频表现,下同。
从图2 中我们看到阴平音节在纯粹平声的环境中是不需要变调的,语速的变化对它也几乎没有影响。而阳、上、去三个调类的音高表现因语速的不同而有一定的差异。这可以解释为什么在语音习得中,包括一语习得和二语习得,阴平是最早习得的声调,同时也是进入语流后最少出错的声调。
4.对于阳、上、去三个调类来讲,同样是慢速的音高比快速的略低,下图3-图5 显示慢速语句的基频曲线基本都是在快速句的略下方。有时慢速语句中的基频音高起点更高些,比如去声男1 号的发音,但同时降得也更低些,以至于慢速语句音高总体略低。
图3 阳平调在快、慢速语流中的基频对比
图4 上声调在快、慢速语流中的音高对比
图5 去声调在快、慢速语流中的音高对比
5.关于汉语的音高下倾和降阶问题学界一直是有争论的,许毅认为汉语没有音高下倾,只有降阶。他认为“猫咪摸猫咪”中后一个高平调“咪”与前一个“咪”的音高绝对值相同,说明汉语没有音高下倾,而“猫咪摸马刀”的“刀”比前面的“咪”的音高绝对值低很多,许毅认为这是降阶的作用,而没有低音成分出现的第一句的所有的高平调都不降低。王安红等认为汉语既有音高下倾也有降阶,“咪”的音高不下降是因为它处于句重音的位置,句重音提高了音高,抵消了音高下倾的作用。
从我们的语料看,汉语有音高下倾,只是在不同调类构成的句子中表现有差异,由阴平音节构成的句子音高下倾的表现非常微弱,以至于在“猫咪摸猫咪”这样的五音节短句中根本体现不出来,但在本文使用的较长的十音节例句中则有所体现,具体数据参见表6。
由阳、上、去三个调类的音节构成的句子音高下倾比较明显,处在句末位置上的音节总是比处在句首位置上的同调类音节要低,具体数据参见表6,也可以从上图5 中得到比较直观的印证。下表6 列出了每个句子位于句首和句末韵律位置的音高平均值。所谓音高平均值是平均了三次发音后取每个音节的音高中值,即将三次发音的音高值平均后,取每个音节音高最大值和最小值的中值。
表6 首、末音节快慢、速音高中值比较表
6. 当语速达到一定快的程度时,阳、上、去调类都可以失去其原来的高升、曲折或高降调型,而变得与阴平调的持平走势趋同,比如女2 号快速的发音就体现了这一点,但这并不影响听音人正确地辨别语义。无论句中的调型走势怎样变化,句末音节一般会保持与原字调的近似走势,如图3-图5,这是边界调作用的体现。
上声在语流中会发生音位系统层面的变调。在句子里,全部由上声组成的句子几乎都是阳平或半上调型。一般来说,句末重读音节会保持上声的完整调形——曲折调形走势,但实际上我们的实验中只有极个别例子能保持上声曲折调形,见图4,男1 号慢速和男2 号快速的末尾音节“稿”,男2 号慢速句中音节“整”。只有这三例保持了上声全调的曲折走势,其他都是半上或阳平。同时我们也看到,阳平和半上在语速达到一定快的情况下都会被趋平的走势所遮盖。
四、结语
语速对音高整体的影响是慢速使音高降低,主要体现在调域下线的下降,调域下线的降低是导致调域扩大的更重要因素。语速快导致调域变窄,窄调域必然导致调类之间的区别度降低,四个声调趋同。这一点上文图3、图4、图5 表现得特别明显。在快速语调中的阳平、上声和去声调几乎都变成了平的走势。四个调类中阴平调的音高表现最稳定,受语速影响最小。这说明平调是四个调类中的基本调,
其他调类均不同程度受语速影响,比如因语速变慢而降低音阶。音高下倾在这三个调类的句子中体现比由阴平构成的句子要强烈。语速快到一定程度会改变句中阳、上、去调类的音高走势,使基频曲线趋平,但因为边界调的作用,这种趋平走势往往影响不了句末音节。
在对外汉语教学中,留学生最突出的语音问题就是洋腔洋调,而教学中克服洋腔洋调往往是加强阴、阳、上、去四个声调的区分练习,但收效甚微。通过本文实验,我们建议适当弱化单字调教学,加强句调或语调单元中的声调练习。同时对于语音合成和语音识别等言语工程学来说,声调作为区别意义的单元在慢速语句中更有效,在快速语句中如果还固守升、降、平、曲的区别特征则会适得其反。