APP下载

博白(松旺)客家话声调模型构建

2014-05-30,姚

语言研究 2014年1期
关键词:博白客家话阳平

关 英 伟 ,姚 云

(1. 广西师范大学 文学院,广西 桂林 541004;2. 北京大学 中文系,北京 100871)

本文选择广西博白县松旺镇的新民话作为调查点和声调建模,主要考虑到松旺镇的客家话具有一定的代表性,之前没有人做过音系调查和整理工作①本文的主要发音合作人陈有,男,1985年生,广西师范大学研究生,广西玉林博白县松旺镇人,其家人都讲客家话,都是地地道道的客家人,家庭成员之间交流都使用客家话。。

一 博白松旺镇客家话声韵调

(一)声母(17个,包括零声母)

博白松旺镇客家话声母表 表1

声母说明:(1)/v /的摩擦较轻,声带振动较弱。从语音波形上看,振幅较弱,呈现长三角形状,从语图上看,没有明显的共振峰,浊音横杠比较明显;(2)/n/与细音相拼时,音值接近/ȵ/;(3)/ts,tsʰ,s/与细音相拼时,音值接近/ʨ,ʨʰ,ɕ/;(4)/ŋ/在有些字中自成音节,例如“吴蜈鱼女”。

声母特点:(1)古全浊声母已经清化,无论平仄,大都读同部位的清音声母或送气清音声母。例如:被/ phi45/,棋/ khi24/,跪/ khui31/,下/xa33/,跌/ tet3/,习/ sip5/;(2)古非敷奉母字除了少数字仍保留重唇音读法,其它大都清化。例如:飞/fui45/,浮/fou24/,纺/faŋ31/;(3)古见溪群母字多读/k,kh/。例如: 歌/kou45/,捆/ khun31/,柜/ khui33/,记/ ki33/;(4)古精庄知章组字多读/ts,tsh/,例如:租/ tsu45/,只/tsa31/,朝/tshau24/,查/ tsha24/;(5)古疑母日母字多读/n,ŋ/,例如:鹅/ ŋo24/,语/ni45/,二/ni33/,硬/ ŋaŋ33/。

(二)韵母(64个,含自成音节的)

博白松旺镇客家话韵母表 表2

韵母说明:(1)/oŋ,ioŋ/韵主要元音/o/开口度略大,实际音值为/ɔ/;(2)/eu/韵发主要元音/e/时唇形要更展些。

韵母特点:(1)鼻音韵尾/-m,-n,- ŋ /和塞音韵尾/-p,-t,-k/保留完整,例如:担/tam45/,星/sen31/,瓶/24/,鸽/kap3/,雪/set3/,吃/sik5/。但是中古阳声韵尾与入声韵尾的相匹配格局已经有所变动,因为在曾摄和梗摄有部分字韵尾为/-n/。(2)古咸摄、深摄平上去声绝大部分字今读/-m/韵尾,相应入声字读/-p/韵尾。例如:范/fam33/,金/ kim45/,踏/ tʰap3/,涩/ sep3/。(3)没有撮口呼韵母。普通话读撮口呼的字博白松旺镇客家话多读齐齿呼。

(三)声调(6个,不包括轻声),调类、调型和调值见表3:

博白松旺镇客家话声调表 表3

声调特点:(1)共有六个声调,其中平声、入声分阴阳,上声和去声不分阴阳。古平声清声母字大部分今读阴平,浊声母字大部分今读阳平。(2)古上声字绝大部分今仍然读上声。(3)古去声字绝大部分今仍然读去声。(4)古入声清声母字今读阴入,次浊声母字有的读阴入,有的读阳入,全浊声母字今读阳入。

二 博白松旺镇客家话声调建模

本文拟构建的声调模型,是根据声调基频数据构建的数学公式,它反映了声调的调型、调值和时长之间的关系特征。该模型不仅能够在计算机上动态地、交互式地再现博白松旺镇客家话声调音高、音长和声调的凹凸变化特征的真实形态,而且还能构建和预测声调的发展变化轨迹,节约存储空间。对方言保护和方言合成具有一定的意义和应用价值。

(一)实验说明。(1)语音材料。语音材料为松旺镇客家话,于2011年6月在陈有家中录音,录音软件Praat。采样率22kHz,从松旺镇客家话的阴平、阳平、上声、去声、阴入、阳入六个声调中随机选出10个字词,六个声调共得到60个实验用字,每个字读两遍,六个声调共得到120个样本(6×10×2)。(2)录音和分析软件。本次实验的录音软件为 Praat,采样率为 22kHz,单通道,采样精度为 16位。全部数据使用Excel电子表格进行统计和分析。(3)声学参数的提取和处理。首先在Praat软件上对录音样本进行声调段标注,在标注层上对声调段进行确定和标记。声调段的确定为韵母段,如果实验字(词)的声母是鼻音或边音时,声调段从鼻音、边音后面开始计算。在语图上从元音共振峰起点算起。

其次对基频进行归一化处理,用“音高提取程序”提取每个声调的时长和每个声调10个时刻点的基频数据,计算每个音节在10个采样点上的原始基频数据的平均值。再将每个发音人基频数据的平均值转换成对数,最后采用T值公式进行五度值转换,得到相对化和归一化的数据。

再利用Matlab中linspace和plot函数对归一后的基频数据进行多项式拟合,做出声调系统图,并建立松旺镇客家话声调的五度值数学模型,并进行初步的语音合成实验。

(二)声调基频曲线和五度值转换

(1)基频曲线提取方法和步骤:1)用归一化方法提取松旺镇客家话6个声调的基频数据。2)将6个声调的基频数据的平均值转化为五度值。3)用多项式拟合的方法得到基频曲线的数学表达式,建立模型,并绘制出声调模型图。

(2)松旺镇客家话声调基频曲线。表4是根据上述实验方法得到的广西博白松旺镇客家话声调基频平均值和平均时长数据,图1是根据表4做的松旺镇客家话声调基频曲线。

博白松旺镇客家话声调基频平均值数据表 表4

图1 松旺镇客家话基频曲线

从图1我们可以看到,松旺镇六个声调的基频曲线走向,阴平和阳平均为升调,升幅不大;阴平比阳平略高,阴平起点为142.1 Hz,终点为157.9 Hz,阳平起点为112Hz,终点为138.2Hz。上声为降调,起点为125.5 Hz ,终点为99.1Hz。去声、阴入和阳入均为平调,阳入分布最高,去声次之,阴入最低。

(3)松旺镇客家话声调的五度值。从声调形成的生理特征看,声调的音高变化,与声带的松紧及单位时间内声带振动的频率有关,声带拉紧,振动快,频率高,声音就高,反之则低。声调的高低可以用基频来表示,基频是一个声学概念,在语音中基频是乐音周期变化的频率;在语言学上,声调是具有语言学意义即区别词汇意义的基频变化的模式。声调与基频有一定的关系,但不完全对应。用基频来表示声调并不完全符合人耳的听感,也不便于比较,所以,我们要把基频数据转换成符合听感的五度值。

五度标调法是赵元任先生创立的记录声调调值的方法,五度值所描写的调值是相对的,不管基频的绝对频率值是多少,也不管音域本身高低宽窄的变化有多大,一律都归并到相对的五度之中,这是符合人类对声调感知的客观实际的。转换公式见公式1:

公式中X代表一个基频数据,Min代表一组基频数据中的最小值,Max代表一组基频数据中最大值。表5就是根据公式(1)得到的五度值数据。

博白松旺镇客家话声调五度值数据表 表5

根据表5数据,取横坐标为声调时长,单位ms;纵坐标为五度值,利用Matlab中linspace和plot函数作出松旺镇客家话声调五度值示意图。见图2:

图2 博白松旺镇客家话声调系统

图2中纵轴表示1-5度,横轴代表时长。从图看,阴平调和阳平调均为升调,阴平调值曲线分布在4度-5度之间;阳平调值曲线分布在2度-4度之间;上声调为降调,调值曲线分布在3度-1度之间;去声为弱降,调值分布在4度-3.5度之间,但从听感上并不明显,所以可以近似看做平调;阴入调为降调,调值曲线分布在2.5度-3.5度之间;阳入调为升调,调值曲线分布在4.5度-5度之间。从时长上看,松旺镇客家话入声调比起非入声调时长要短了一半,为200ms左右,其中阴入为193.8 ms,阳入为195.4ms;非入声调的时长都在400 ms左右,其中阴平最长,为398ms,阳平次之,为396ms,上声为349ms。从听感上,阴平、阳平、上声和去声较为舒缓,而阴入和阳入显得较为急促。由于声调时长很短,我们在记调值时不考虑调型因素。由图2我们可以得到松旺镇客家话声调的五度调值:阴平45,阳平24,上声31,去声33,阴入3,阳入5。

(三)松旺镇客家话声调数学模型。博白松旺镇客家话声调都是升调、降调或者平调,没有曲拱特征,所以其声调曲线的解析函数可以近似为一次函数,用“T=A*X+B”公式来表示,其中X表示时长,T表示声调五度值,A和B为一次函数的系数。对应声调的形态来说,A代表声调倾斜的情况,即斜率,B代表声调初始值,A如果是正值,声调为升,是负值,声调则为降。

利用Matlab中的数据拟合函数polyfit(x,y,n) ,令X=linspace(0,时长,10),单位为ms,令T=[声调的五度值],n为拟合多项式最高次次数,因为一次函数就可以满足要求,所以令n=1,这样就可以得到一次函数“T = A*X+B”中A、B的值,从而得到松旺镇六个声调的五度值函数解析式:

阴平:T1 = 0.0020 * X1+3.8344,(0 <X1 < M1;273.8 < M1 < 471.3);

阳平:T2 = 0.0043 * X2+1.6551,(0 <X2 < M2;299.7 < M2 < 493.7);

上声:T3 = -0.0056 * X3+2.9445,(0 <X3 < M3;303.4 < M3 < 390.5);

去声:T4 = -0.0010 * X4+3.8375,(0 <X4 < M4;316.2 < M4 < 533.9);

阴入:T5 = -0.0050 * X5+3.2620,(0 <X5 < M5;157.4 < M5 < 236.9);

阳入:T6 = 0.0018 * X6+4.6135,(0 <X6 < M6;72.7 < M6 < 260.3);

其中参数M是各个声调时长的取值范围。图示如下:

图3 博白松旺镇客家话声调数学模型

图3模型(数学公式)中的曲线为函数解析式的图像,是对松旺镇客家话声调的模拟,不同形状的点代表声调归一的十个采样点的五度值。曲线所表现出的高低、曲折代表声调的调型,曲线的长短代表声调的时长。

(四)松旺镇客家话声调空间。我们以基频斜率为横坐标,基频平均值为纵坐标作出“基频斜率-基频均值”二维空间的松旺镇客家话声调散点图(见图4)。通过散点图,我们可以形象地看到松旺镇客家话声调系统在二维空间中的分布情况。

基频斜率和基频平均值数据通过公式2和公式3得到。

图4 松旺镇客家话声调散点图

图4中的六个圆圈分别代表博白松旺镇客家话的六个声调。由图可见,松旺镇客家话六个声调主要分布在二维空间的右下方的大部分空间中,而且每个声调相互独立。二维空间的左上角为空白状。这种分布表明:(1) 每个方言都有其独特的声调分布空间,一个语言(方言)声调系统的各个声调之间具有其相对独立的分布空间,这种独特的分布形状可以反映出方言的一定特点。(2)二维平面中空白之处可以为方言声调的演变提供生成空间和可能,同时也可以为有更多声调的语言(方言)提供解释的理据。

(五)声调变化轨迹的构建。语言是不断处在变化当中的,作为语言要素之一的语音也是不断处在变化之中的。声调模型的建立不仅仅只是满足语音合成的需要,还应该能够对语音的演变进行跟踪和构建,这样才能使人们对语音本质有更深入的了解和认识。我们对此进行了尝试。

1 参照值的确定。构建声调的变化,必须首先确定一个参照值。参照值就是用一些指标来量化声调并作为参照标准。

描述声调的主要指标是声调的调型、调值和声调时长,参照值的确定就是在松旺镇客家话声调模型的基础上定义调型、调值和时长三个参数的值。

首先是调型的确定。调型在模型中由基频斜率表示,由于松旺镇客家话的声调调型都是升调、降调和平调,调型比较单一,所以可以用一次函数的曲线斜率来代表调型,即用声调模型“T = A*X+B”中的A值来表示。

其次是调值和时长的确定。调值是一个变化的量,它反映的是声调随时间的变化表现的高低升降的变化。可以用声调均值C来表示,参照值均值由公式(4)得到:

公式中T(0)代表声调起点的五度值,T(M)代表声调终点的五度值,M代表时长。

这样我们可以得到松旺镇客家话每个声调的参照值:A斜率(调型)、C调值、M时长三个点的数组(见表6):

松旺镇客家话声调参照数组数据 表6

2 声调变化构建轨迹

图5声调变化模型演示图

图5是对松旺镇客家话声调变化构建的三维空间图例。图中六个点T1-T6是根据表6做出的松旺镇客家话的六个声调的参照点。我们可以看到,参照点周围的箭头表示声调可能变化的方向和轨迹。无论声调的调型、调值和时长发生什么变化,也无论其向哪个方向发展变化,其变化轨迹都可以反映到这一模型上,通过与参照数组的比较,我们就能清晰地捕捉到其变化的轨迹。这将会有助于我们对声调本质更深刻的认识,也可以为声调演变提供解释的依据。

三 博白松旺镇客家话声调合成实验

语音合成,是将文字信息转化为可听的声音信息,相当于给机器装上了人工嘴巴。传统的田野调查,虽然可以录制方言的声音,记录方言的语音系统,但这种方式无论是在内容、存储、输出等方面都存在很大的限制,而且无法生成。通过计算机语音合成则可以在任何时候将方言文本转换成具有高自然度的语音,从而真正实现对方言的还原和保护。

为了检验松旺镇客家话声调模型的合理性和实用性,我们对松旺镇客家话声调模型进行合成实验测试。本文采用基频同步叠加的方法进行语音合成实验。

基频同步叠加技术(PSOLA)是合成效果较好的一种算法,其特点是能够在时域上调节语音波形的音高、音长和音强。其算法步骤主要分为三步:首先进行基频同步分析,将原始语音信号与一系列基频同步的窗函数相乘,得到有重叠的短时信号;然后对这些短时信号进行适当的时域变换,得到相应的与目标基频曲线同步的一系列合成短时信号;最后将合成的短时信号重叠相加得到合成的语音。

(一)实验设计和语料。实验采用Praat软件进行语音合成,Praat软件对基频处理的界面如下图:

图6 Praat软件基频处理界面

图6是Praat软件处理基频的界面,上方是语音波形图,每条竖线是一个脉冲,两条脉冲间隔的时间表示声带一个开闭周期,这个周期的倒数就是基频值,对应下方图中的一个基频点。我们合成语音就是对下边的基频点的位置按照声调模型的要求重新布置。

我们首先从6个调类各选出5个语音样本,一共得到30个语音样本,见表7。然后用得到的松旺镇客家话单音节声调模型的参数来改变这些语音样本的音高,之后用基音同步叠加合成(PSOLA)的方法合成出30个新的语音文件,最后进行人耳听辨实验并和真实的语料进行对比。

博白松旺镇客家话单音节语音合成样本 表7

(二)实验结果

1 合成样本

图7 “方”、“利”合成语音与原始语音对比语图

图7是利用声调模型合成的松旺镇客家话“方”和“利”以及与其相应的原始语音语图。上方两幅子图分别是“方”和“利”合成语音的语图,下方两幅子图是原始语音语图。从合成语图上可以看出,原始语音的基频曲线中间会有起伏波动,显得更加自然,而合成的基频曲线比原始语图的基频曲线显得光滑平直,不够自然。为了检验其自然度和合理性,我们对合成结果进行了听辨实验。

2 测试结果分析。(1)实验目的:对30个合成音节的调值的准确度和自然度进行判断。(2)被试:23人,都会说客家话,听力正常。(3)方法:将30个合成音节与30个原始音节随机排序,每个音节之间有2秒的间隔,要求被试在测试表上填写相应的结果,调值正确的在1处画圈,不正确的在0处画圈。自然度我们采用优、良、中、差四个等级,要求被试在相应的等级处画圈。然后汇总进行统计分析。

松旺镇客家话基频语音合成测试结果 表8

从听辨结果看,平调(去声)的合成效果最好,准确率为92%,自然度优秀和良好分别为9%和91%。其次为升调(阳平),准确率为89%,自然度优秀和良好分别为10%和90%。再次为降调(上声)。短促调阴入和阳入的合成效果不如舒声调,同为升调的阴平,合成效果也稍逊色于阳平,准确率和自然度都不如阳平。

合成语音声调调值的测试结果总体表明,我们构建的声调模型是有效可行的,但由于本实验中采用Praat软件进行语音合成,对基频参数的控制主要采取手工调制的办法,参数控制的精确性都受到很大限制,合成出的音节自然度和基频参数控制的精度还有待提高。

邓玉荣 1994 《广西贺县(莲塘)客家话音系》,《方言》第4期。

孔江平 2001 《论语言发声》,中央民族大学出版社。

罗常培、王均 2004 《普通语音学纲要》,商务印书馆。

石锋 1990 论五度值记调法,《天津师范大学学报》(社会科学版)第3期。

王士元、彭刚 2003 《语言、语音与技术》,上海教育出版社。

吴宗济、林茂灿 1989 《实验语音学概要》,高等教育出版社。

杨锋 2008 《标准壮语单音节、双音节基频曲线建模研究》,广西大学硕士论文。

Peter Ladefoged 2001Vowels and Consonants, Blackwell Publishers.

Peter Ladefoged 2001A Course in Phonetics, Harcourt College Publishers.

猜你喜欢

博白客家话阳平
广西客家话持续体标记的主要类型及历史演变
广西柳州寨隆镇壮语老中青三代声调归字差异及其原因探析
太谷方言阴平阳平教学初探
有趣的客家话
石板滩客家话与成都话的对比
浅谈广东惠州客家方言的变调
普速铁路玉林至博白段开行动车信号方案研究
无法割舍的博白味道
广西博白客家茶腔音乐的美学内涵分析
博白·客家·朱熹