成都话单字调的实验语音学统计

2015-12-24何婉

成都大学学报（社会科学版） 2015年1期

关键词：阴平阳平声调

何婉

(四川大学海外教育学院，四川成都 610104)

对38位成都人的发音进行语音实验和统计分析，考察了成都话单字音声调的统计特征。分析主体分布、极限分布以及对照比较，得到了每一个声调调位内部调位变体的分布趋势，从而区分出每个声调调位的稳态段和动态段。

一、成都话

(一)成都话是西南官话的代表方言之一。甑尚灵(1958)的研究描述了成都话的语音概况，本次调查研究的范围是成都市区话。

(二)前辈学者对成都话的声调调查和描写中，认为成都话有阴平、阳平、上声、去声4个调类。各家对成都话的调值分析如下:

阴平阳平上声去声甑尚灵1958 55 21 53 213杨时逢2006 45 21 42 213 1984 55 31 42/53 24何婉

上述研究都是选择数量较少的发音人并且依靠耳朵的听觉来进行的调查研究。本文准备考察成都话单字音声调的统计特征。我对38位成都人的发音进行了较大规模的实验和统计分析。其中主要是对成都话的四个调类总体分布趋势的统计分析，并且在此基础上区分了每个调位的稳态段和动态段。

二、声学实验和统计分析的基本步骤和程序

(一)制作发音表

首选例字的韵母以单元音a、i、u为佳，声母以清不送气p、t为宜。如果找不到足够多的合适音节，零声母也可考虑(朱晓龙《语音学》，2010)。根据以上标准我选择了符合要求的例字，将选中的例字做成PPT文件，每页一字，放映在电脑屏幕上让发音人读。语音样本包括阴平、阳平、上声、去声4个调类，各9个例字，一共有38*4*9=1368个样品。这样大规模地调查取样可以保证研究结果的客观性和科学性。统计学告诉我们，越是大的样本空间就越能正确地代表这一语言社团的语言实际。(沈中伟2002)

(二)选择发音人

发音人的选择要综合年龄、性别、成长环境以及家庭语言背景等因素。把发音人按年龄分为了6组:(1).20岁以下;(2).21-30岁;(3).31-40岁;(4).41-50岁;(5).51-60岁;(6).60岁以上。38位发音人按照年龄、性别背景做出分组的分布情况见图1:

图1 发音人基本情况

(三)实验测算和数据统计

以笔记本计算机为载体，使用 SONY公司的ECM-MS907话筒，调查录音软件 AdobeAuditionv 3.0以及荷兰阿姆斯特丹大学语音科学研究所Paul Boersma教授和David Weenink教授开发的一种用于语音分析与合成的软件——praat，录音参数以32000为采样率、单声道、最大录音长度5秒、波形显示长度5秒。

为了剔除性别、年龄等外部因素带来的差异，我们需要对采集的数据进行相对化和归一化的处理，这样研究的结果才会有普遍性的意义。我们利用对数z-score(LZ)方法2分别对每位发音人的语音样本进行声学分析，分为五个步骤:(1)测量点选取的方法是提取音高曲线各百分时刻的基频值，将0%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%这11个时刻点基频值分别记录下来。(2)将他们化为对数。(3)求对数值的均值和标准差。(4)进行z-score归一化。(5)将每个发音人的归一化结果加以平均并求其标准差。使用科学计算软件matlab7.0来完成计算作图工作。

(四)相对化数据的统计分析

因为每个发音人的调域差别很大，而且言语声调的音高是相对音高，为了让数据具有整体的客观性，同时剔除离群值，我们也以科学计算软件matlab7.0为工具，对数据进行统计分析。

三、声调的统计分析

(一)语音样本的总体统计分析

我对1368个语音样品的分析采用声学实验和统计分析结合的方法。具体的方法是:分别算出38位发音人每个声调的T值，每个声调选取中间9个测量点，去掉首尾两个数值，使结果能够更加准确地反映真实的调值，这样我就有38*4*9=1368个点的T值数据。然后利用统计软件，计算出每个声调各个测量点的平均值、标准差、最大值、最小值。最后再画出统计图表。

(二)语音样本的主体分布

在声调格局中，每一声调所占据的不是一条线，而是一条带状的声学空间。声调调型曲线不应该只看成一条线，而应该作为一条带状包络的中线或主线(石峰，1987)。成都话各单字音的调型曲线由上线、中线、下线构成。中线是各个发音人9个点T值平均数，上线和下线分别是这9个点T值平均数加减标准差得出。标准差是最重要的统计数据之一，它可以计算出声学空间的范围也可以排除一些偶然的个别因素，从而很好地显示各个声调的分布情况。具体见图2。

图2 成都话四个声调的主体分部总图3

图2中的每个声调都由均匀分部的三条线组成。其中，位于中间的曲线是由9个点的平均值确定的，这就是声调的主线，上方和下方的曲线分别是由平均值加减标准差得到的。图中的每个声调的音长数据都进行了归一化。从图上可以看到成都话的四个声调是一个升调，两个降调，一个降升调。从图形来看四个调型的曲线是一个基本对称的图形。

从图3我们可以清楚地看到每个声调的情况。

图3 成都话四个声调的主体分布分图

阴平调位于整个调域的中部，是一个中升调。起点的平均T值最低，为2.23;终点最高，为4.24;两点的差值为2.01。阴平调的声学空间的动态范围:起点的标准差为0.77，中间点的标准差为0.86，终点的标准差为0.74，标准差都相差半度以上，首尾两点标准差非常接近，中间点略大，。整个声调都呈现一种上升的调式，上限为45，中线为35，下限为24，所以可以将成都话的阴平调调值记为35。

阳平调位于整个调域的下部，是个低降调。起点的平均T值最高，为2.68;终点最低，为0.15;两点的差值为2.53。阳平调的声学空间的动态范围:起点的标准差为0.50，中间点的校准差为0.41，终点的标准差为0.26，标准差呈现逐渐缩小的趋势，起点最大，终点最小。整个声调都呈现一种下降的调式，上限为41，中线为31，下限为31，所以可以将成都话的阳平调调值记为31。

上声调位于调域从高部到低部的降调4。起点的平均T值为4.78;第二个点略微升高，T值为4.81，中间点T值为4.18，然后T值逐渐降低，终点最低，为1.15;两点的差值为4.02。上声的第二个点比第一个点略略升高，从图上声调有一个先升的趋势，然后再下降，上声调的声学空间的动态范围:起点的标准差为0.27，第二个点的标准点为0.21，中间点的标准差为0.48，终点的标准差为0.81，标准差呈现逐渐增大的趋势，起点较小，第二个点最小，终点最大。和阳平调刚好相反。从图上可以记录为上限为553，中线为552，下限为551，由于前面的上升趋势非常不明显，整个声调都呈现一种下降的调式，所以我们依然可以将上声记录为上限为53，中线为52，下限为51，成都话的上声调调值记为52。

去声调位于调域的下部的一个曲折调，起点的平均T值为0.94，第三点为折点，T值最低，为0.53;终点的T值最高，为1.85。去声调的动态范围:起点的标准差为0.49，折点的标准差为0.63，终点的标准差为0.79，起点标准差最小，然后逐渐增大，终点最大。上限为223，中线为212，下限为112，所以可以将成都话的去声调调值记为212。

从四个声调各个测量点的数据分布范围来看，阳平和上声均为降调，但是阳平的起点最大，终点最小;上声刚好相反，起点最小，终点最大，阴平前后都比较一致，中间稍大，首尾略小;去声的起点标准差最小，折点略增大，终点最大。

如果把标准差的数值作为声调稳态段的指标，以0.5为相对界限，就可以把标准差小于0.5的认为是较稳定的分布，把标准差大于0.5的认为是不稳定的分布，本文中较稳定的分布是:阳平的起点和终点，上声的起点，去声的起点;不稳定的分布是:阴平的起点和终点，上声的终点，去声的折点和终点。

(三)语音样本的极限分布

在统计数据中，我选择每个声调中每个测量点的两个极值:最大值和最小值，见图4，和图2比较。将两者重叠在一起成为图5，图5中可以看见极限值和均值的距离。将四个声调分别作图以便更加清楚地看到各个调类的情况，见图6。

图4 成都话四个声调的极限分布

图5 成都话四个声调统计总图

图6 成都话四个声调统计分图

阴平调上下两个极值仍然显示为升调，但是上下极值相差较远，起点的最大值为3.41，最小值为0.51;终点最大值为5.00，最小值为2.48;最大值是个高升调，调值可以记为45;最小值是个低升调，调值可以记为13。

阳平调上下两个极值仍然显示为降调，起点最大值为3.77，最小值1.60;终点最大值为1.11，最小值为0;起点相差2度，终点相差1度;最大值是个高降调，调值可以记为42;最小值是个低降调，调值可以记为21。

上声调的最大值显示为平调，最大值起点为5，第二第三点依次下降，终点为3.62;最小值显示为升降调，最小值起点为3.69;第二点略有升高为3.80，然后依次降低，终点为0;起点相差1度，终点相差3度;最小值的升调不明显，所以最大值最小值都可以记为高降调;调值最大值可以记为554，最小值可以记为441。

去声调上下两个极值显示为不同的调型，最大值起点为2.85，终点为4.04，显示为一个高升调，调值可以记为35;最小值起点为0.21，折点为0，终点为0.80，整个去声都分布在声调图的最底部，调值可以记为102或112;去声的极限分布是四个声调中相差最大的，调型也发生了变化。

四、结语

通过对成都话声调的语音实验数据的较大样本的统计分析，对成都话声调调值的描写应为阴平35、阳平31、上声52、去声212。这和以前人们仅靠听觉感受拟定的调值有一些差异，阴平调更接近于一个中升调，阳平调是一个中降调，上声是一个高降调，去声是一个非常低的曲折调。

声调包括三个组成部分:调头、调干、调尾。调头是声调前段受到声母辅音、初始态等因素影响的部分，大约是开头10% ～20%左右的音高段。调尾是声调终端受到音高衰减、非音位性喉塞音等因素影响的最后10%～20%左右的音高段。去掉调头和调尾就是调干。(朱晓龙，2010)

每个声调的声调目标是不同，一个声调有时间延续，在这时间过程中，有某些部分比另一些部分对于声调的辨认更重要。那些对于辨认声调来说重要的部分就是‘声调的语言学目标’，简称‘声调目标’。那些对于辨认声调来说不重要的部分就是‘声调的羡余成分’。

从实验结果来看，每个声调都有自己的声调目标和声调羡余成分，前面说到的稳态段就是声调的声调目标，而动态段就是声调的羡余成分，阴平起点终点的标准差都大于0.5，但是终点的标准差相对最小，应该就是阴平的声调目标;阳平各点标准差都小于0.5，都比较稳定，所以起点终点都是阳平的声调目标;上声的起点标准差小于0.5，所以起点为上声的声调目标，去声的起点标准差小于0.5，所以起点为去声的声调目标，发音人在发这些部分的时候就要努力达到一个相对较窄的音高范围，与此相反，剩下的阴平的起点、上声的终点、去声的折点和终点就是各个声调的羡余成分，发音人在发这些部分的时候音高范围的容忍度较大些。这个与后面的极限值分析结果是吻合的，声调目标部分和极限值差距比较小;声调的羡余成分和极限值差距比较大，可见人们的声调特征的信息主要集中在声调的声调目标部分，也就是稳态段，稳态段向人们传递声调信息。声调的稳态段在共时的语流和历时的演变过程中变化比较小;相反声调的羡余成分就是动态段，动态段的变化就比较大。

［1］黄尚军.成都话音系［J］.西华大学学报(哲学社会科学版)，2006(1).

［2］何婉.四川成都话音系词汇调查研究［M］.成都:四川大学出版社，2013.

［3］四川大学方言调查工作组.四川方言的音类和音值［J］.四川大学学报(哲学社会科学版)，1960(3).

［4］石峰.实验音系学探索［M］.北京:北京大学出版社，2009.

［5］夏中易.近四十年成都话语音变动现象考论［J］.成都大学学报(社科版)，2002(4).

［6］袁家骅.汉语方言概要［M］.北京:语文出版社，2001.1.

［7］甄尚灵.成都语音的初步研究［J］.四川大学学报，1958(1).

［8］周及徐.20世纪成都话音变研究［J］.四川师范大学学报(社会科学版)，2001，28(4).

［9］朱晓龙.语音学［M］.北京:商务印书馆，2010.