烟台话单字调的格局与变异
2022-09-19张琦
张 琦
(东华大学 外语学院, 上海 201620)
一、 引 言
汉语各方言声调调类数以及调值不尽相同,各成系统,构成自身的“格局”。[1]音系上,格局反映了系统内部元素间的对立关系;语音上,格局还反映出元素语音表现上的分布区间。因此,用“语音格局”来分析声调的方式是一种结合了语音实验手段对音系对立关系的量化方法。这种方法可以应用于元音辅音音段,也可以应用于超音段如声调和语调。格局的分析方法应用于声调研究上,便形成了声调的格局。一个语言的声调格局反映出声学空间中各个声调的分布限度以及彼此间的对立关系。由于不同语言使用者生理条件各不相同,量化声调发音之前应对不同发音人进行归一化处理,使得不同发音人具有相同的量化指标,这样才能反映出语言使用者共有的音系认识,即声调的音系分布特征。石锋提出了基频的“T值”归一法,公式如下[2]:
这里,a为调域上限频率,b为调域下限频率,x为测量点频率,频率单位为赫兹(Hz)。鉴于调域反映了基频之间的关系,而基频的高低在感知上是相对的,因此需要对频率值进行对数变换,通过这样的换算,不同发音人的调域被统一归一化,得到的T值即为一条声调曲线中各个测量点在某个发音人整个调域范围内的相对位置。由于调域定义为五度,T值不仅可以实现不同发音人基频的归一化处理,还可以与传统的五度值记调法保持一致。[3]
“声调格局”思想被广泛应用于汉语方言声调研究中,除了描述不同方言声调系统的整体表现外,这一分析方法还被应用到语音共时变异研究之中。随着社会语音学研究(sociophonetics)的兴起,实验语音手段如声学分析通过感知实验可以精确地捕捉到语言系统中不同人群范畴内部的系统性变化[4],比如,元音的共振峰频率分析被广泛应用到元音变异的研究之中。[5]然而,相较于音段层面的变异研究,韵律的变异研究就显得极为稀少,而且其研究大都集中在语调方面。[6]声调变异方面的研究更是少之又少,Gandour研究了泰语字调在调类、年龄以及性别中的变异,通过大量的声学以及统计分析,发现声调发音人之间变异大于发音人内部变异,静态调即平调的变异大于动态调即曲折调的变异。[7]石锋、王萍使用了大量发音样本,对北京话四个声调调型取点,通过计算样点T值的标准差呈现出声调的变异指数。其中,变异较大的点(标准差大于0.5)被称为动态段,变异较小的点被称为静态段。相较而言,静态段更多地承载了核心的声调信息。[8]石锋、王萍采用同样的量化取点方法,研究了北京话不同年龄组及不同性别人群中声调的系统性差异,反映出各个社会因素对声调发音上细微的影响。[9]梁磊采用了这一方法,将研究范围扩大到多个汉语方言之中。[10]
本研究旨在运用声学与统计方法分析烟台方言的单字调格局与共时变异。烟台话属于北方官话区的“胶辽官话”区域,但它在不同县区之间差异较大。在前人的研究中,对于烟台方言三个声调,即平声、上声和去声的调值历来都存在不同的记录(参见表1)。
表1 前人文章记载的烟台方言单字调调值
由上图可见,文献中记录的烟台话单字调调值不尽相同,存在的原因可能是语言接触导致的语言演化影响,也有可能是被试人数的限制,实验结果受到个人生理、情绪以及录音设备仪器等因素的影响。本文采用多样本统计的方法,重新审视烟台方言的声调格局,尽力排除个人因素对声调调值的影响,从而能够更为客观地探讨单字调被试之间以及被试自身的变异。
二、 实验方法
为了考察烟台话单字调的变异情况,我们挑选了19位出生和生活在烟台市芝罘区的本地发音人作为被试。被试的父母也是烟台芝罘区生活和工作的本地人,他们平时工作和生活只用方言进行交流,因此方言发音受普通话影响较小。根据烟台方言的使用特点,本文将被试分为两个年龄组,20岁~39岁称为“青年组”,平均年龄为29岁,50岁~69岁称为“老年组”,平均年龄为57岁。19位被试按照年龄、性别做出分组的分布情况可参见以下图1。我们在这19位烟台话被试的单字调录音中各挑选出平声、上声、去声三个声调、10个单字音作为实验样本(参见表2)。
表2 烟台话三个声调单字音表
图1 19位发音人年龄、性别的分布情况图
在三个声调中,每个被试都各有10组发音;每个声调为190个取样,单字以随机的方式在电脑屏幕上以PPT形式出现。当字出现的时候,要求被试用烟台方言的发音将其读出来。相邻第二个单字间隔10秒出现。每个单字出现两次,我们共得到了190×3×2=1140个有效样品。所有的数据都是用Samson C01U pro录音设备在相对安静的房间里进行录制的。本文采用PRAAT进行数据标注和提取[11],利用prosodypro[12]脚本进行基频的声门脉冲错误矫正及基频数值的提取,每一条声调曲线等距提取23个测量点,为了避免辅音对元音基频的扰动(consonantal perturbation),我们将前面三个测量点去掉,保留之后的20个点的基频数据。
三、 烟台话单字调格局
首先,我们将每位被试的三个声调中所有样本的20个基频值点对点取平均值,然后把60个样点“T值”转换(3个声调×20个样点),最后整合19个被试的T值数据,求出每个声调20个点对应的均值和标准差,得出烟台方言的单字调格局,再以样点为横轴,T值为纵轴做出基频曲线(见图2—图4)。声调调型曲线不是一条线,而是一条带状包络的中线或主线。因此,烟台话声调均值可以表示声调发音的趋势,其在图中用黑色线条表示;标准差表示发音人之间存在的变异,其在图中用阴影表示声调各个点离散程度是一条带状包络。
如图2—图4所示,平声为高降,五度可表示为53;上声为降升调,五度可表示为112或212;去声为中域平调,五度可表示为33。对比普遍被接受的前人调查结果来看,平声发生了高化,由31或21升至53;上声首尾处略低,由214或213变成了112或212;去声发生调阶下降,由55降至33。[13-18]因此,烟台方言声调的变化在于调域的调整,平声高化,去声低化,上声基本不变。
图2 平声T值
图3 上声T值
图4 去声T值
从标准差的分布来看,平声起点处变异最小(标准差=0.03),尾部变异最大(标准差=0.75)。上声拐点处(时长35%处)变异最小(标准差=0.09),起点处变异较大(标准差=0.52),尾部最大(标准差=0.70)。去声声调在整体基频高度上变异较大,起点最大(标准差=0.80),尾点稍小(标准差=0.55)。根据石锋、王萍的观点,数据集中的测量点(即数据跨度较小的点)与数据离散的测量点(即数据跨度较大的点)对于声调的区分作用是不同的,前者的作用大于后者。[8]标准差大于0.5的基频段被认为是动态段,标准差小于0.5的基频段被认为是稳定段。平声的稳定段在前半段,动态段在后半段,上声的稳定段在最低点处,大概为声调总时长的35%。去声段整体标准差均大于0.5,这说明这些被试之间去声调型差异较小,音阶差异较大。我们将三个声调20个标准差数值做单因素方差分析,以不同的声调为组间因子,结果表明,声调之间的标准差具有显著差异[F(2,57)=17.675,p<0.001],三个调两两比较显示,去声的变异(0.71)显著大于上声(0.44)与平声(0.39),上声与平声之间没有差异。
四、 年龄组变异
石锋、王萍均是对每位被试单个T值进行统计分析。由于每位被试的T值是基于调类内不同发音样本的平均值,统计效力会有一定程度的损失,因此,本文不再使用平均基频值的数据,而将被试所有的发音数据进行统计分析。[8-9]首先,我们将被试中所有声调的20个量点原始数据进行T值处理。然后,我们将每一个声调20个样点以5为单位平均分成4组,前5个点为第1组,其平均值代表声调0%~25%基频高度;第6—10的点为第2组,其平均值代表声调25%~50%基频高度;第11—15的点为第3组,其平均值代表声调50%~75%基频高度;第16—20点为第4组,其平均值代表声调75%~100%的基频高度。最后,对于平、上和去三个声调,我们以4个平均的基频值测量点为重复测量变量,以年龄组为组间变量做二元方差分析。当重复测量方差分析球对称假设的条件不满足时,我们采用Greenouse-Geisser法来矫正自由度。统计结果中如果测量点显著,这说明4个点之间基频高度不等;如果年龄组主效应显著,说明年龄组之间基频高度具有差异;如果测量点与年龄组之间具有交互作用,说明青年组与老年组调型具有差别。实验结果如下:
(一) 平声
方差分析结果显示,测量点具有显著性差异[F(1.16, 183.57)=1066.30,p<0.001],这显然是由于平声调型是下降的,曲线有曲拱。年龄组主效应不显著[F(1, 330)=0.05,p=0.82],这说明老年组与青年组平声曲线之间没有高度的差异。测量点与年龄组具有交互作用[F(1.16,383.57)=5.15,p=0.02],这说明青年组与老年组在平声调型上具有差异。如图5显示,调型差异主要在于第2个测量点与第4个测量点之间,即声调25%~100%段斜率上。25%~50%段基频略低于老年组,75%~100%段基频略高于老年组,整体的斜率低于老年组。而基频的斜率可以通过基频的下降高度来量化,即第2个测量点与第4个测量点的差值。独立样本t检验显示,年龄组对基频25%~100%段的基频下降高度具有显著影响[t(1, 330)=-3.04,p<0.001],即青年组平声尾点略高,调型稍平。
图5 平声年龄组基频
(二) 上声
方差分析结果显示,测量点具有显著性差异[F(1.67,462.24) = 152.40,p<0.001],这同样是由于上声的调型并不是水平的一条线。年龄组主效应显著[F(1, 277) = 60.21,p<0.001],这说明老年组上声整体高于青年组(如图6所示)。我们对四个测量点以年龄组为分组变量,分别进行独立样本t检验,结果显示,老年组四个测量点均显著高于青年组[点1:t(1, 204.032)= -2.948,p= 0.004;点2:t(1, 98.349) = -6.509,p<0.001);点3:t(1, 229.315) = -9.220,p<0.001);点4:t(1, 277) = -10.403,p<0.001]。测量点与年龄组具有交互作用[F(1.67, 462.24)= 21.56,p<0.001],这说明青年组与老年组上声调型上具有差异。如图6显示,调型差异主要在前两个测量点上,即调型的前半段。老年组基频前半段略平,青年组前半段下降明显。前两个样点基频下降值独立样本t检验显示,年龄组对于前两个测量点基频下降幅度值具有显著影响[t(1, 277)= 7.15,p<0.001]。
图6 上声年龄组基频
(三) 去声
方差分析结果显示,测量点具有显著性差异[F(1.83, 512.89) = 35.342,p<0.001],这同样是由于去声整体呈现略微上升的趋势。年龄组主效应显著[F(1, 286)=11.83,p= 0.001],这说明老年组去声整体高于青年组(如图7所示)。我们对4个测量点以年龄组为分组变量,分别进行独立样本t检验,结果显示老年组4个测量点均显著高于青年组[点1:t(1,286)= -3.14,p=0.002;点2:t(1,194.84) =-3.62,p<0.001;点3:t(1,190.84)=-3.04,p=0.003;点4:t(1,286)=-2.90,p=0.004]。测量点与年龄组具有交互作用[F(1.83,512.90)=3.55,p=0.033],这说明青年组与老年组去声调型上具有差异。如图7显示,年龄组之间第2个测量点差异最大,第4个测量点差异最小,即第2个测量点到第4个测量点之间斜率有差别。独立样本t检验结果显示,年龄组对2、4两点基频差具有显著影响[t(1,186.63)=-2.73,p=0.007]。
图7 去声年龄组基频
五、 组内变异
由于声调调型的统计分析包含了被试的所有发音样本,因而有必要探寻被试调类内部发音的一致性,即被试声调内部变异(within-subject variation)。我们将每个被试每一个调的所有样本20个点的T值点对点取标准差,每个人的每个声调得出20个标准差数值,其中每5个点分列为一组,取每一组标准差的平均值,这样得到4个平均的标准差,分别代表每个声调0%~25%段、25%~50%段、50%~75%段以及75%~100%段变异情况。然后,我们以三个调类(即平声、上声和去声)以及4个平均测量点(声调0%~25%段、25%~50%段、50%~75%段以及75%~100%段)为组内因子、以年龄组为组间因子、以基频标准差为因变量做三元方差分析。当重复测量方差分析球对称假设不满足时,我们使用Greenouse-Geisser法来矫正自由度。结果显示,调类对标准差的分布没有显著影响[F(1.33,22.65)=0.72,p=0.443],这说明平、上、去三个调整体变异没有差别。声调与年龄组没有交互作用[F(1.33,22.65)=0.003,p=0.945],由此说明老年组与青年组声调组内变异大小相同。测量点对标准差没有显著影响[F(1.50,25.53)=0.52,p=0.100],这说明声调0%~25%段、25%~50%段、50%~75%段以及75%~100%变异大小一致。测量点与年龄组没有交互作用[F(1.50,25.53)=0.023,p=0.312],这说明老年组和青年组4个点标准差变化趋势一致。声调与测量点之间没有交互作用[F(2.60,44.26)=0.06,p=0.089],这说明平、上、去三声4个点标准差变化趋势一致。如图8—图10所示:
图8 平声标准差
图9 上声标准差
图10 去声标准差
六、 单字调时长
不同年龄组三个声调平均时长的比较见图11。老年人平声、上声、去声平均时长分别为148 ms、279 ms和178 ms,青年组三个声调的平均时长为128 ms、253 ms和189 ms。以发音人声调的平均时长为因变量、调类为重复测量变量、以年龄组为组间变量做二元方差分析,结果显示,年龄组对声调时长的影响不显著[F(1,1424.367)=0.739,p=0.402],这说明不同年龄组之间整体调长相同。当重复测量方差分析球对称假设的条件不满足时,我们采用Greenouse-Geisser法来矫正自由度,调类差异显著[F(1.91,80112.107)=179.041,p<0.001],这说明平、上、去三声调长具有差异。多重比较(HSD法)显示:平声比上声、平声比去声、去声比上声,均有显著性意义[p<0.001]。这说明上声时长大于去声、去声大于平声。年龄组和声调之间没有交互作用[F(1.918,1642.379)=3.671,p=0.38],说明两个年龄组调长差异一致,均表现为上声大于去声大于平声。
图11 年龄组单字调时长
七、 讨 论
(一)烟台方言单字调格局及演化
本研究对19位发音人单字调进行声学分析,得到了烟台方言单字调的声调格局,用五度值来表示,分别为平声53、上声212、去声33。三个声调的时长为平声最短,去声次之,上声最长。
按照每个声调20个观测点标准差分布的情况,整体变异去声大于平声和上声。依据标准差大于或小于0.5为稳定段的标准,我们对三个调类的声调分别进行了稳定段和动态段的划分:平声的稳定段在前半段,动态段在后半段;上声的稳定段在最低拐点处,大概为声调总时长的35%;去声段整体标准差虽均大于0.5,但调型差异却较小。石锋、王萍对北京话、天津话单字调统计分析,以及梁磊对4个方言区的9个方言点的大规模采样统计的结果显示,不同方言的声调稳定段和动态段分布是有差异的。[8-10]梁磊提出从调型、调域的角度来分析动态声调和稳态声调。[10]根据以往数据,在高调域的平调整体表现稳定,而在中调域的平调,如哈尔滨的阴平调,就会出现声调起点为稳定段,其他位置为动态段的现象。烟台话平调(去声)处在中调域,其音阶差异较大,标准差总体大于0.5,但去声的调型维持稳定。Ling和Li对粤语55、33、22三个平调的感知实验证明,三个平调音阶的感知空间在声学上并不是等距的,而是呈现出中域空间大、高域和低域空间小的情况。[19]因此,我们假定:在烟台方言里,去声音阶的变动性并不会引起感知上的歧义。高降调普遍表现为起点稳定、终点波动,中降调则相反。烟台方言平声的T值标准差呈现出起点较小、终点较大的趋势,这一特征符合高降调稳定段和动态段分布的普遍规律,因此进一步说明烟台方言平声为高降的论断。根据梁磊的统计,曲折调的跨度仅次于中低声调,它的稳定段集中在折点的前后位置。烟台话曲折调印证了这一点,稳定段就在占声调总时长的35%的折点处。[10]
对比前人研究发现,烟台方言的声调格局发生了系统性的调域重组,主要表现在平声调域的抬升,由31升至53;去声调域的下降,由55降至33;上声基本不变。就这一演化规律我们提出下列两种假设。一种假设是方言接触的影响,根据陈洪昕、陈甲善的记载,烟台其他地区(如福山、文登、荣成、威海、乳山、海阳等地)的阴平调值有53的记载,同样,牟平、文登、荣成、乳山、海阳等地去声有33的记载。[14]另一种假设是基于声调系统的最大感知区分度(maximum auditory distinctness)。[20]语言倾向选择具有最大感知区分度的音系系统,比如顶点元音/i u a/普遍存在于语言元音系统中。烟台方言中上声可以认为是低平调,有以下几点证据可以证明:第一,相对于平声和去声,上声占据低域;第二,上声时长最长,而低调是普遍长于高调的[21],这一方面原因是受限于人的生理发音,发低调较为困难,另一方面可能受人为控制,延长低调可以提高其区分度[22];第三,上声的稳定段在最低点,说明“低”这一特征的稳定性;第四,低平调具有不稳定性[23]。不稳定性的一种表现是:低调相连容易发生连读变调。而根据钱曾怡等和陈洪昕、陈甲善的记载,烟台方言上声相连的确发生连读变调。[13-16]而作为低平调的首尾抬升是不重要的,很大程度上是为了凸显低调特征,我们实验也证实上声起点和尾点为上声的动态段,变异较大。王力也认为北京话上声“调头的降、调尾的升,都是次要的”。[24]汉语许多方言中的低平调会呈现低降的基频曲线。如天津话的阴平调时常被分析为低平调L[25],该调具有低降的基频曲线,甚至起点可高达4度。[26]那么老派烟台话的低降调平声31和低调上声214在一定程度上会造成感知上的混淆。而把平声从31升至高调域的53便会提高平声与上声的区分度。而由于53占据了高调域便会降低与老派烟台话去声高平调55的区分度,因而便会把原本高平调的55挤到中域,形成了现在较为稳定的声调系统。据此,可以预测:调阶在烟台方言单字调的感知中具有重要作用。
(二) 年龄组变异
本文对两个年龄组的统计分析证实烟台话老年组与青年组具有系统性的差异。具体来说,青年组平声后半段相对于老年组较平,尾点略高;青年组上声整体略低于老年组,前四分之一基频段下降明显;青年组去声整体略低于老年组。青年组与老年组差异的方向性与“平声高化、去声低化”保持一致,这说明“共时语音的年龄差异有可能提供语音历时演变的轨迹”[9]。而两个年龄组组内变异大小一致,这说明声调的组间变异大于组内变异。这与Gandour对泰语字调在调类、年龄以及性别中变异情况的研究结果相一致。[7]在不同年龄、不同性别的发音人的不同调类的声调中,发音人的组间变异都要大于其组内变异。也就是说,不同发音人之间的变异要大于发音人本身的变异。发音人内部的变异是在保持自身调型不变的基础上发生在一定调域范围内音高高度的变化。
八、 结 论
综上所述,本文基于19位烟台人的样本,采用声学和统计方法得到烟台话单字调格局,即平声为53、上声为212、去声为33。通过对基频点的标准差分析得到了三个声调的稳定段和动态段的分布:平声的稳定段在前半段、动态段在后半段;上声的稳定段在最低拐点处;去声段整体都处于动态。去声的变异最大,而上声和平声的变异并没有差别。老年组与青年组的统计分析显示,组间差异大于组内差异。对比前人研究,烟台方言单字调格局的演化表现为调域的重组,即平声的抬高和去声的下降。演化的动因可能来源于相邻方言的接触以及为了满足调类之间的感知区分度。