塔吉克族汉语单字调习得声学实验研究
2023-09-30李素秋
李素秋
(中南民族大学文学与新闻传播学院,湖北武汉 430074)
中国塔吉克族属于高山塔吉克,主要生活在新疆喀什地区塔什库尔干塔吉克自治县,该县与阿富汗、巴基斯坦、塔吉克斯坦毗邻,平均海拔4000 米以上。塔吉克语属于印欧语系印度-伊朗语族,是无声调语言,而汉语属于汉藏语系,是旋律型声调语言,因此塔吉克族习得汉语时声调问题比较突出。但是塔吉克族习得汉语声调时存在哪些问题,目前除了李素秋[1]提及过塔吉克族声调感知问题外,尚没有人做过研究。《国家通用语言文字普及提升工程和推普助力乡村振兴计划实施方案》中强调:“推广普及国家通用语言文字,是铸牢中华民族共同体意识的重要途径。”[2]因此我们有必要探索塔吉克族在习得国家通用语言时存在的问题,这样才能在基础较薄弱的民族地区更好地普及国家通用语言。本文将针对塔吉克族成人习得汉语单字调展开声学实验研究,通过考察塔吉克族习得单字调的声学特征及存在问题,更好地帮助塔吉克族掌握国家通用语言。
一、实验设计
(一)实验对象
实验对象是从塔什库尔干县任意选取的10名塔吉克族,年龄从33 岁-56 岁不等,其中女性4人、男性6 人。这些实验对象出生在塔什库尔干县的各个乡镇,父母都是塔吉克族,能流利使用塔吉克语。他们都是“民考民”学生,从小学三年级起开始学习汉语,工作后一直生活在塔什库尔干县,期间从未间断使用汉语。实验同时邀请到普通话水平一级甲等的男女播音员各一名,以便和塔吉克族的发音进行对比。
(二)实验例字
在实验例字中,没有挑选声母是边音、鼻音和零声母的例字。这是因为声调范围主要由韵母来体现,而不是整个音节。“对浊声母和零声母字音而言,音高曲线是跟字音同时开始的,而清声母字音的音高曲线则从韵母开始”[3]。因此本实验选取例字的声母为双唇不送气清塞音[p]和舌尖前不送气清塞音[t],韵母为[a][i][u]三个元音。汉语有阴平、阳平、上声、去声四个声调,用所选取的声母、韵母和不同声调相拼,理论上可以得到24 个测试字,但是普通话中[p]与[u]相拼时,没有阴平字和阳平字,所以实际例字只有22个。22 个例字都是普通话中的常用自由语素,“所选例字没有放在负载句中,因为负载句可能会带来连字调的变化,语调效应也会影响声调的音高走向以及频域范围”[4]。因此例字都是以单字形式念出。例字选取后,随机排列如下:
八 比 答 都 敌 不 打 弟 把 度 逼
爸 补 低 拔 必 读 底 大 堵 搭 鼻
(三)实验方法
实验设在安静的房间内,采用praat 软件录音,电脑为Thinkpad X1,同时配有索尼话筒和创新声卡,采样率设置为22050Hz,采样精度16bit,单声道录制,录制完后的文件保存为“*.wav 格式”。录音前,所有例字打印在一张A4 纸上,先让发音人熟悉,当发音人准备好后再开始录制。正式录制时,一个例字打在一张PPT 上,放在电脑上让发音人读出。发音人的音量要保证适中,避免削波或者超载。所有例字重复读3 遍,为避免可能出现的连续效应,读字表时每个字之间有3s 左右的停顿,这样共得到22(字)×3(遍)×12(人)=792 个有效样品。每个样品用Praat 打开,下拉“Annotate”生成TextGird 文件,然后同时选取Sound 和TextGrid 文件进行标注。声调的起点从韵腹开始处算起,终点取在振幅下降明显、宽带图中第二共振峰模糊的地方,接着在“View”下拉菜单中点击“Time step settings”,在“Time step strategy”中选取“view-dependent”,将“Number of time steps per view”设置为11,然后点击“Pitch”中的“Pitch listing”,就可以获取十等分时长上的11 个点的基频数据,这样一共得到8712 个基频值,最后根据各个调类的平均基频值计算出时长Ms 值。因为发音会受到年龄、性别等因素的影响,所以基频值需要进行归一化处理,“以便过滤掉个人特性,消减录音时的发音风格,消除人际的随机差异,提取恒定参数,使实验数据获得具有语言学意义的信息”[5]。
本文中的声调分析采用相对归一的T 值计算法。
其中,“min 是调域的下限频率,也就是全部音高数据中的最小值;max 是调域的上限频率,也就是全部音高数据中的最大值;x 是任一测量点的频率,得到的T 值是任一测量点x 的五度值参考标度”[6]112。
根据公式(1)计算出的T 值范围会在0-5 之间,“T 值和五度值之间的对应关系是:0-1 之间相当于五度值中的1 度;1-2 之间相当于五度值中的2 度;2-3 之间相当于五度值中的3 度;3-4之间相当于五度值中的4 度;4-5 之间相当于五度值中的5 度”[7]。
二、实验数据分析
(一)塔吉克族和普通话发音人声调格局对比分析
“声调格局是由一个语言(或方言)中全部单字调所构成的格局,声调格局是声调系统的共识初始状态,是各种声调变化的基础形式,因而它是进行声调研究的起点”[6]10-11。考察塔吉克族习得汉语单字调的声调格局,可以了解塔吉克族习得汉语单字时的声学表现,因此本文对比了塔吉克族和普通话一级甲等发音人读单字时的声调格局。
从图1 可以看出,塔吉克族读阴平时,起点平均T 值为3.06,到第3 个点时T 值为3.13,然后开始持续下降,终点T 值为1.85。阴平有40%在4 度区间,50%多在3 度区间,只有不到10%在2度区间,并且听感上是一个微降调,调值可记为43。塔吉克族读阳平时,起点平均T 值为2.36,然后开始缓缓下倾,到第7 个点时T 值为1.93,然后又缓缓往上走,到第9 个点时T 值达到2.03,终点T 值为1.80。阳平中,前40%在3 度区间,中间30%在2 度区间,其后又有10%在3 度区间,最后20%降到2 度区间。听感上,阳平也是一个微降调,但是调型比阴平平直,调值可记为32。塔吉克族读上声时,起点平均T 值为1.95,然后开始下降,在第6 个点达到拐点位置,T 值为0.96,随后维持一个低平走势,第7 个点T值为0.99,接着开始上扬,终点T 值为1.78。塔吉克族读上声时,调型有一个明显的凹形,呈低凹拱。根据整体发音情况,调值可记为212。塔吉克族读去声时,起点平均T 值为3.64,然后微微上升,第2 个点、第3 个点的T 值都为3.71,然后开始持续下落,终点T 值为0.95,去声听感上是一个降调,调值可记为42。
图1 塔吉克族读单字时的声调格局
从图2 可以看出,普通话发音人读阴平时,起点平均T 值为4.39,然后微微有些下斜,到第8 个点时T 值为4.31,随后又微微上扬,第9、第10 个点的T 值均为4.33,终点T 值为4.31。可以看出,阴平虽然不是一个绝对水平的调型,但整个声调都在5 度区间,呈高平拱,[8]因此阴平调值可记为55。普通话发音人读阳平时,起点平均T 值为2.33,然后开始缓缓下降,到第3 个点时达到拐点,T 值为2.11,然后开始持续上扬,终点T 值为4.56。普通话发音人读阳平时是中升调,呈中升拱,调值可记为35。普通话发音人读上声时,起点平均T 值为1.97,然后开始下降,到第5 个点时达到拐点,T 值为0.14,保持一个基本水平态势后,第6 个点T 值为0.18,然后开始持续上扬,终点T 值为3.22。普通话发音人读上声时是低凹调,呈低凹拱,调值可记为214。普通话发音人读去声时,起点平均T 值为4.98,然后开始微微下降,到第3 个点时T 值降到4.81,随后下降开始明显,终点T 值为0.52。普通话发音人读去声时是全降调,呈高降拱。根据整体发音情况,去声调值可记为51。
图2 普通话发音人读单字时的声调格局
通过图1、图2 的对比,可以看出,普通话发音人将阴平读成了高平调,整个声调在5 度区间,而塔吉克族将阴平读成了微降调,调域在4-3 度区间;普通话发音人将阳平读成了中升调,调型保持“凹”和“升”的特征,调域在3-5 度区间,并在20%处形成一个凹形,“这是声带发音的生理物理机制自然造成的伴随特征”[7],起点T值和拐点T 值都同在3 度区间,终点在5 度区间。而塔吉克族将阳平读成了微降调,声调占据3-2 度区间。塔吉克族虽然将阴平和阳平都读成了微降调,但是阴平的降幅较大,阳平的降幅较小,两个声调各个点的基频值60%相差都在20Hz 以上,因此阴平、阳平不能归并为一调。普通话发音人将上声读成了曲折调,调型保持着“低”和“凹”的特征,起点在2 度区间,拐点在1 度区间,终点在4 度区间,而塔吉克族读上声时,虽然起点也在2 度区间,拐点在1 度区间,但是终点在2 度区间,比普通话发音人的终点低很多;普通话发音人将去声读成了高降调,调型保持着“高”和“降”的特征,声调从5 度区间一直降到1 度区间,而塔吉克族读去声时起点较低,终点较高,声调占据着4-2 度区间。
(二)塔吉克族和普通话发音人调长对比分析
研究声调,调长是一个重要的参考因素,并且声调会因调型不同而有所差别。朱晓农认为“调长不等于负载声调音节的时长,也不等于韵母的时长,而是等于韵体(韵母-韵头)的时长”[4]277-278。在实际发音过程中,发音人由于受到不同因素的影响,时长会有所不同,比如甲发音速度较快,乙发音速度较慢,这时将两个人的绝对调长进行对比就不科学,因此需要将绝对调长转换成相对调长后才能进行比较。见表1、表2。
表1 塔吉克族和普通话发音人读单字时的绝对调长(单位:Ms)
表2 塔吉克族和普通话发音人读单字时的相对调长(单位:Ms)
绝对调长转化成相对调长,采用如下方法:
表2 说明:一种语言中某一调类的相对调长值(NDi),等于这一调类的绝对调长值(Di)与这种语言中所有调类的平均绝对调长值的比值。
不同调类的长短主要由声调的音高变化,即调型来决定。从表2 可以看出来,不论是塔吉克族还是普通话发音人,曲折调都是最长的,降调都是最短的,而平调的调长介于曲折调和降调之间。塔吉克族读单字时,平均相对调长从长到短的次序是:上声>阴平>阳平>去声,而普通话发音人读单字时的相对调长次序是:上声>阳平>阴平>去声。可以看出,塔吉克族读阴平和去声时比普通话发音人长,而读阳平和上声时则比普通话发音人短。
(三)塔吉克族和普通话发音人调域对比分析
“声调的音高主要决定于基音的频率,从声调的最低音到最高音是基频的变化范围,也就是声调的调域”[9]。某一调类基频数据的最大值减去最小值可以得到这个调类的调域,所有调类基频数据的最大值减去最小值可以得到所有调类的总调域。塔吉克族和普通话发音人读单字时的调域分别见表3、表4。
表3 塔吉克族读单字时的调域(单位:Hz)
表4 普通话发音人读单字时的调域(单位:Hz)
由表3 可以看出,塔吉克族读单字时,调域宽窄次序是去声>上声>阴平>阳平,总调域非常窄,只有63Hz。
从表4 可以看出,普通话发音人读单字时,调域宽窄次序是:去声>阳平>上声>阴平,总调域220Hz,比塔吉克族发音人宽很多。
可以看出,塔吉克族读单字时,阴平调域比普通话发音人宽,而阳平、上声、去声调域则比普通话发音人窄。这是因为普通话发音人读阴平时是高平调,整个声调都在5 度区间,而塔吉克族将阴平读成了微降调,调域跨4 度和3 度区间,所以阴平调域较宽,塔吉克族读阳平、上声、去声时所占区间都比较窄,这导致总调域也非常窄。
(四)塔吉克族男女声调格局对比分析
男性和女性发音时,调高、调长、调域等声学性质会因性别不同而有所差异。为了分析性别因素是否影响单字调的发音,我们以塔吉克族女性和男性为对照组进行了声调格局的对比研究。
从图3 可以看出,塔吉克族女性读阴平时,起点平均T 值为2.74,然后微微开始上浮,到第3个点时T 值达到2.86,继而缓缓下降,到第8 个点时T 值为2.70,第9 个点时T 值升到2.74,第10个点时T 值下落到2.71,终点T 值为2.68。塔吉克族女性读阴平时,整个调类都在3 度区间,虽然不是一个非常平直的调型,却是一个中平调,呈中平拱,调值可记为33。塔吉克族女性读阳平时,起点平均T 值为1.65,然后开始下降,到第4 个点时达到拐点,T 值为1.17,接着开始慢慢上扬,终点T 值为2.30。阳平听感上是一个升调,调值可记为23。塔吉克族女性读上声时,起点平均T 值为1.38,然后开始下降,到第6 个点时达到拐点,T 值为0.17,继而开始上扬,终点T 值为2.02。上声有一个明显的凹形,调值可记为212。塔吉克族女性读去声时,起点调值为3.82,然后微微上扬,到第3 个点时T 值达到3.96,继而开始下降,终点T 值为1.10。去声听感上是一个降调,调值可记为42。
图4 塔吉克族男性读单字时的声调格局
塔吉克族女性读阳平和上声时都有“凹”的特征,但是阳平的拐点接近起点,在第4 个测量点处,而上声的拐点接近中点,在第6 个测量点处。阳平和上声各个点的基频值有50%都相差在20Hz 之上,因此不能归为一调。塔吉克族女性读单字时,形成的是四调格局。
塔吉克族男性读阴平时,起点平均T 值为3.27,然后微微上斜,到第3 个点时T 值为3.31,继而开始下降,终点T 值为1.59。阴平听感上是一个降调,因此调值可记为42。塔吉克族男性读阳平时,起点平均T 值为2.84,接着微微上扬,到第2 个点时T 值达到2.85,然后开始持续下落,终点T 值为1.87。塔吉克族男性将阳平读成了中降调,呈中降拱,调值可记为32。塔吉克族男性读上声时,起点平均T 值为2.33,然后开始下落,到第6 个点时达到拐点,T 值为1.58,随后开始上升,终点T 值为2.61。根据整体发音情况,调值可记为323。塔吉克族男性读去声时,起点平均T 值为3.52,然后微微上扬,到第2 个点时T 值达到3.59,继而开始持续下落,终点T值降至0.98。去声听感是一个降调,调值可记为42。
对比塔吉克族女性和男性的发音,可以看出女性读阴平、阳平、上声、去声时的调型都是正确的,阴平是平调,阳平是升调,上声是凹调,去声是降调。只是阴平整个都在3 度区间,没有达到标准音的5 度;阳平起点在2 度区间,终点在3度区间,没有达到标准音的起点在3 度区间,终点在5 度;上声的起点、拐点位置是正确的,但是终点落在2 度区间,没有达到标准音终点的4 度区间;去声的起点较低,在4 度区间,没有达到标准音的5 度,终点在2 度区间,没有降至标准音的1 度。可以看出塔吉克族女性读单字时,形成的是四调格局,只是每个声调的调高或调域不完全到位。而塔吉克族男性读单字时,将阴平、阳平、去声都读成了降调,并且这三个声调各个点的基频值相差在0.25-9.56Hz 之间,非常接近,可以归为一调,因此塔吉克族男性读单字时,声调格局呈现的是两调格局,即降调和低凹调。如此看来,塔吉克族女性比男性发音标准很多。
(五)塔吉克族男女调长对比分析
调长是声调持续的时间长短,是声调描写的重要参考维度。本文对比了塔吉克族女性和男性读单字时的调长。见表5。
表5 不同男女读单字时的绝对调长(单位:Ms)
表5 中首先计算出了塔吉克族男女和普通话男女读单字时的绝对调长,然后依据公式(2)将绝对调长转换成相对调长,见表6。
表6 不同男女读单字时的相对调长(单位:Ms)
从表6 可以看出,塔吉克族无论是男性还是女性,曲折调都比平调读得长,平调都比降调读得长。塔吉克族女性读阴平和阳平时比普通话女性发音人读得长,而读上声和去声时则比普通话女性发音人读得短。塔吉克族男性读阴平和去声时比普通话男性发音人读得长,而读阳平和上声时则比普通话男性发音人读得短。可以看出,塔吉克族男女阴平都读得较长,上声都读得较短。
(六)塔吉克族男女调域对比分析
塔吉克族女性和男性读单字时的调域,见表7、表8。
表7 女性读单字时的调域(单位:Hz)
表8 男性读单字时的调域(单位:Hz)
塔吉克族女性读单字时,调域宽窄次序是:去声>上声>阳平>阴平,总调域128Hz。普通话女性发音人读单字时,调域宽窄次序是去声>阳平>上声>阴平,总调域290Hz。可以看出,去声调域都是最宽的,阴平调域都是最窄的,但是普通话女性发音人的阳平、上声、去声调域以及总调域都比塔吉克族女性宽很多。
塔吉克族男性读单字时,调域宽窄次序是:去声>阴平>阳平>上声,总调域只有22Hz,非常窄。普通话男性发音人读单字时,调域宽窄次序是去声>上声>阳平>阴平,总调域158Hz。除了阴平调域以外,普通话男性发音人的阳平、上声、去声调域以及总调域要比塔吉克族男性宽很多。
可以看出塔吉克族不论男性还是女性,去声调域相对都比较宽。女性读单字时,阴平调域最窄,因为女性将阴平读成了平调,而男性阴平调域则较宽,因为男性将阴平读成了微降调。塔吉克族男生的总调域非常窄,导致声调发音曲线所占空间狭小,发音不舒展,形成了两调格局。
三、塔吉克族习得汉语单字调时存在的问题
通过对塔吉克族汉语单字调声学表现的分析,可以看出塔吉克族在习得汉语单字调时存在如下问题:汉语的阴平是高平调,但塔吉克族读成了微降调;汉语的阳平是高升调,塔吉克族也读成了微降调;汉语的上声是低凹调,塔吉克族读上声时虽然调型正确,但是终点高度不够;汉语的去声是高降调,而塔吉克族读去声时,起点T值不够高,终点T 值不够低。塔吉克族读阴平、阳平时,主要是调型上的偏误,读上声、去声时,主要是调域上的偏误。塔吉克族读单字时,曲折调读得比平调长,平调读得比降调长;阴平、去声比普通话发音人读得长,阳平、上声则比普通话发音人读得短。塔吉克族读单字时,阳平、上声、去声的调域非常窄,而阴平的调域则比普通话发音人宽,这是因为普通话发音人将阴平读成了平调,调域较窄,而塔吉克族将阴平读成了微降调,调域较宽,但是塔吉克族读阳平、上声、去声时调域较窄,导致四个声调的总调域也很窄。
相比男性而言,塔吉克族女性习得汉语单字调更好一些,阴平、阳平、上声、去声的调型都没有偏误,只是调高不到位且调域较窄。汉语的阴平在5 度区间,塔吉克族女性发音在3 度区间;汉语的阳平在3-5 度区间,而塔吉克族女性发音在2-3 度区间;汉语的上声在2-4 度区间,塔吉克族女性上声起点、拐点T 值正确,但是终点T 值较低,仅在2 度区间;汉语的去声是高降调,塔吉克族女性去声起点不够高,终点不够低。但不论怎样,塔吉克族女性读单字时形成的是四调格局。塔吉克族男生读单字调时,形成的是两调格局。阴平、阳平、去声都是降调,各个点的基频值非常接近,可归为一调;阴平、阳平调型错误;上声起点T 值、拐点T 值都较高,而终点T 值较低;去声起点T 值不够高、终点不够低;阴平调域较宽,阳平、上声、去声调域都非常窄。相比而言,女性总调域比男性宽很多,这也导致女性发音更舒展,偏误更少一些。
塔吉克族不论男女,阴平都比普通话发音人读得长,上声都比普通话发音人读得短。女性读阳平时比普通话女性发音人读得长,男性读阳平时比普通话男性发音人读得短。女性读去声时比普通话女性发音人读得短,男性读去声时比普通话男性发音人读得长。
四、结论:塔吉克族汉语单字调产生偏误的原因及其应对策略
塔吉克族在习得汉语单字调时之所以产生偏误,是因为塔吉克语属于印欧语系语言,而汉语属于汉藏语系语言,两种语言差别较大;塔吉克语是无声调语言,导致塔吉克族对调值的音高体会不够,对声调的区别特征也不敏感,因此习得声调语言比较困难;塔吉克语是有重音的语言,重音通常出现在词的最后一个音节上,受到自身塔吉克语影响,后重现象容易泛化,这使得塔吉克族读声调易形成降调;塔吉克族生活在民族聚居区,成年人日常交际以塔吉克语为主,维吾尔语使用也较多,这导致平时练习汉语的机会不很多,从而影响声调的进一步学习和提高,使声调偏误出现化石化现象。李素秋[1]在单字调区分、辨认实验中发现,塔吉克族很难区分阴平-阳平、阴平-去声、阳平-去声,阴平、阳平、去声的感知范畴尚未建立,只建立起“上声”一个声调的感知范畴。而区分、辨认不好的声调,在发音时也会受到影响,因此塔吉克族读阴平、阳平、去声时偏误较多。
塔吉克族习得汉语单字调时,调型、调域、调长的偏误都存在,只是偏误程度有所不同。阴平、阳平在习得中调型偏误较突出;上声、去声在习得中,调域偏误较多。这与塔什库尔干县师资不足、塔吉克语的迁移、中介语的影响都不无关系。
单字是学习汉语普通话声调系统的基础,是双音节词、多音节词以及语流变调的参照系统。在日常生活中,使用单音节词的概率较低,但是把每个单音节词都发到位是汉语声调习得不可或缺的过程。目前,新疆很多少数民族都在积极参加普通话水平测试,特别是在声调上苦下功夫。因此针对塔吉克族习得汉语声调出现的问题,我们认为必须要重视汉语声调目标的教学,因为目标点对声调发音非常重要。普通话四个声调的语言目标分别是:阴平从头到尾都是语言目标;阳平的语言目标在调尾终点处的峰点;上声的语言目标在拐点和最高的终点;降调的语言目标在起点。[6]声调的目标点对区别意义有着重要作用,因此发音尤其要到位。针对塔吉克族,要有针对性地进行汉语声调教学:读阴平时,起点要有意识地提高,而且调值要保持平稳,直至终点;读阳平时,调型偏误较大,所以发声后,需要立即上扬,而且尾部调值要努力拉高;读上声时调型正确,拐点位置也正确,但是终点调值不够,因此要在尾部下功夫,尽量提升终点调值;读去声时,调型正确,但是起点调值不够高,因此起点要尽力抬高。除此之外,在习得汉语单字时,阴平和去声的时长要有所控制,同时要尽量拉宽阳平、上声、去声的调域,使声调舒展,调值到位,音高走向更加明晰。只有持之以恒地不断练习,才能更好地掌握汉语单字调,从而为双音节词、短文朗读、命题说话打下坚实的基础,才能在普通话水平测试中取得满意的成绩,从而更好地掌握国家通用语言。