APP下载

不同水平的普通话学习者单字调声调感知研究

2020-03-23帕丽扎提克依木古力努尔艾尔肯米吉提阿不里米提艾斯卡尔艾木都拉

声学技术 2020年1期
关键词:阳平声调偏误

帕丽扎提·克依木,古力努尔·艾尔肯,米吉提·阿不里米提,艾斯卡尔·艾木都拉

(新疆大学信息科学与工程学院,新疆乌鲁木齐830046)

0 引 言

汉语普通话是一种有声调的语言[1]。声调是语言中能起区别意义作用的音高变化,是汉语普通话语音系统的重要特征之一[2]。汉语普通话声调是属于超音段音位,靠基频的变化来体现[3]。现代汉语普通话分为阴平、阳平、上声、去声4个声调[4]。在语音学上可以描述为高平、高升、降升和高降,关乎听话人的心理感知[5]。因此,语言研究者历来把声调研究作为汉语普通话语音研究的重要课题。

对于汉语普通话语音习得研究,声学实验有着重要作用,它使研究结果更科学、更有说服力。汉语普通话学习者的母语大致分为两类:有声调语言和无声调语言[6]。汉语声调是以无声调语言为母语的汉语普通话习得者在学习汉语普通话时碰到的难点之一[7]。无声调语言母语背景学习者在汉语普通话学习过程中,因为需要先培养声调意识,所以声调习得困难。在无声调语言的语音系统中,虽然也存在音高变化,但不区别音节和意义,其音高模式、分布以及作用都与声调语言不同,这就增加了无声调语言背景学习者的习得难度。但是有声调语言母语背景学习者的声调习得过程,也存在母语“负迁移”的影响,会表现为声调发音音高不够,或者调形曲线上声下降的力度不够。因为声调的数量、种类均有差异[8]。

无声调语言学习者习得汉语时的一大难点就是对声调的掌握。而要正确掌握声调,首先需要对声调有正确的感知。因为音高、音强、音重和音质等4 个特征是人类识别声音的特征。声调的主要特点就是音高,在声学特征上用基频F0 来表示,在感知上用半音st 来体现,其中F0 与st 之间存在着一个固定的转换公式[9]。我们可以通过有规律地更改音节的半音高度,以获得一系列音节,每个都是一个“刺激项”,这一系列刺激项目组成的整体是一个“连续统”[10],即连续取值。普通话声调感知和发音水平密切相关,正确的感知可能会带来正确的发音,但错误的感知一定会导致错误的发音[11]。因此本文针对母语是无声调语言的学习者进行汉语普通话声调感知实验。实验包括汉语普通话单字调辨认实验和区分实验,通过考察不同调类(指:阴平,阳平,上声,去声)的区分情况,不同调类辨认的偏误情况、偏误类型来分析其原因。

1 实验方法与过程

1.1 实验设计

实验分为两个部分:(1) 学习者要完成普通话单元音所有类型和普通话复合元音所有类型的4 个声调的辨认实验;(2) 学习者要包括普通话复合元音所有类型的阳平和上声的区分实验。

辨认实验要求学习者在给定的选项中选择对应的声调,区分实验要求学习者判断两个刺激语料是否相同。

1.2 实验对象

参与本次感知实验的对象共有20 名学习者,他们都是新疆大学的维吾尔族学生,年龄分布在20~25 岁(平均22 岁),没有语言和听力障碍。另外4 名被试者是来自北京的标准普通话发音人,平均年龄为23 岁。

我们需要研究的是不同水平阶段的普通话声调学习者的动态发展。因此,20 名学习者根据普通话熟练度分组,实验中我们以学习者的民族汉语考试(Minzu Hanyu Kaoshi, MHK)听力成绩为参考。详细的分组情况见表1。

1.3 实验材料及过程

从学习者的语音感知角度入手,由普通话水平达到一级乙等的4名(2男2女)汉语母语者按照听辨字表进行标准发音。参与听辨实验的20 名不同水平学习者根据听到的声调调型(阴平,阳平,上声,去声),以及在电脑屏幕上呈现出来的提示信息,在键盘上做出相应的判断。学习者使用质量较好的耳机,在安静的办公室内逐个进行双耳语音感知测试。

表1 被试分组情况Table 1 Details of the subjects in the group

两组单字调辨认实验共有336 个刺激,其中:9 个汉语普通话单元音(/ɑ/, /e/, /ɤ/, /i/, /o/, /ʅ/, /ɿ/, /u/,/y/)与4 个汉语普通话声调(用1, 2, 3, 4 标记),分别搭配构成的单元音-声调组合(/a1/, /a2/, /a3/, /a4/等),有9(单元音数)×4(声调数)×4(发音人数)=144个刺激;12 个汉语普通话复合元音(/ai/, /ei/, /ao/,/ou/, /ia/, /ie/, /uo/, /ye/, /ua/, /iao/, /uei/, /uai/)与4 个汉语普通话声调分别搭配构成的复合元音-声调组合,有 12(复合元音数)×4(声调数)×4(发音人数)=192 个单字调语音刺激。实验目的是考察非汉语母语者单字调的辨认情况、不同调类辨认的偏误情况以及不同调类辨认的偏误类型、学习者的反应时间。已随机排列的测试项目由4 名标准普通话的发音人读一遍,然后用Matlab 软件编写录音程序并录入电脑,数据每隔500 ms 断开一次,学习者对感知汉语普通话复合元音-声调组合的实验约15 min完成一个测试项目,汉语普通单元音-声调组合实验总长为10 min。区分实验中,有12 项阳平和上声的区分实验,两个声调A、B 的排列有ABB、BBA、AAB、BAA 四种方式。因此12 个测试项目组成的“上声-阳平,阳平-上声”测试有12(复合元音数)×2(声调数)×3(发音人数)=72 个语音刺激,采用ABX 形式的刺激音,让学习者判断X 是与A 相同,还是与B 相同(如:癌-矮-癌,围-委-委)。反应时间和准确率均由X-perception 软件进行记录。

2 实验结果

2.1 辨认实验

统计不同水平的普通话学习者对感知汉语普通话单元音-声调组合和汉语普通话复合元音-声调组合的声调听辨准确率和反应时间数据,对实验数据进行相关性分析,相关性模型为

式中:Cov(X,Y)为X 与Y 的协方差(X 为被试者的辨认准确率;Y 为被试者的反应时间);Var(X)为X 的方差;Var(Y)为Y 的方差。具体分析如下。

2.1.1 单元音-声调组合辨认实验结果

图1 展示了学习者在不同嗓声背景下感知汉语普通话单元音-声调组合的平均准确率,图2 是学习者的声调辨认反应时间。

将高级水平的10 名学习者对汉语普通话单元音-声调组合的声调辨认准确率和反应时间做相关性分析,结果具有较强的相关性(RHO=0.56, P=0.09)。RHO值用来评估组间差异。P 值是衡量对照组和实验组差异的指标,P 值小于0.05,表明两组之间有显著差异,P 值小于0.01[6],表示两组的差异极其显著。而对初级水平10 名学习者有较弱的相关性(RHO=0.41, P=0.14)。从图1 可以看到高级水平学习者的辨认准确率比较稳定,从图2 显示的反应时间来看,他们的辨认反应时间也比初级水平学习者短。图1、图2 有很大的个体差异,对于不同水平的学习者来说也是如此,表明声调感知偏侧化的形成也与学习者自身因素密切相关。

图1 声调听辩准确率(单元音)Fig.1 Perceptual accuracy rates (pure vowel)

图2 平均反应时间(单元音)Fig.2 Average response time (pure vowel)

2.1.2 复合元音-声调组合辨认实验结果

图3 为不同水平的学习者对汉语普通话复合元音-声调组合的感知平均准确率,图4 是声调辨认反应时间。

高级水平学习者对汉语普通话复合元音-声调组合的声调辨认准确率和反应时间具有较强的相关性(RHO=0.59, P=0.06),而初级水平学习者有较弱的相关性(RHO=0.51, P=0.11)。通过图3 和图4 可知,初级水平学习者的辨认准确率比高级水平学习者低,反应时间也长。说明学习者在某些声调的学习中感知和反应时间的相互影响较强,而在一些声调中受其他因素的影响,消弱了感知和反应时间之间的联系。

图3 声调听辩准确率(复合元音)Fig.3 Perceptual accuracy rates (compound vowel)

图4 平均反应时间(复合元音)Fig.4 Average response time (compound vowel)

2.2 不同调类辨认偏误率

每个声调都有被误听为其他声调的三种可能(例如:阴平被误听为阳平,阴平被误听为上声,阴平被误听为去声)考察各声调误听为其他声调的比例,可以看出非汉语母语者最容易混淆即难以区分的声调,在教学中应有针对性的指导,同时也契合了未来高精度识别技术对少数民族普通话高自然度语音的适用性。下面是不同水平的学习者,对汉语普通话单元音-声调组合及汉语普通话复合元音-声调的单字调辨认中各声调被误听为其他声调的比例。

2.2.1 单元音-声调组合的辨认偏误率

表2 和表3 分别统计了初级-高级水平学习者对汉语普通话单元音-声调组合的辨认偏误率,并找出各调类间偏误最多的声调数据。

(1) 由表2 可知,在阴平的听辨感知数据中,初级水平学习者阴平被误听为阳平的偏误率最高,比例为22%。同样表3 中高级水平的学习者把阴平误听为阳平的比例最高是5%。其次是表2 中阴平误听为去声的偏误率较高,初级水平学习者偏误率为12%。

(2) 从表2 和表3 中的阳平的听辨感知数据中,初级水平学习者被误听为上声的平均偏误率为27%,被误听阴平的平均偏误率为15%,比例较高。此项的高级水平学习者的误听比例也较高。由此可见,对不同水平学习者来说,阳平和上声也是容易相互混淆的两个声调。从综合声学空间图[12]来看,普通话上声的主要声学特征是“低”,有调值近23 的时长都停留在声调音域的底部。实验语音学研究指出,上声的实质是低平调,上声的调值214的2 是发音生理的调头,4 是边界现象的调尾,“调头的降,调尾的升,都是次要的”[12]。因而在上声的教学过程中,最需要强调的是“低”的特点,甚至不妨将其作为“低平调”进行教学,则可避免学生混淆上声与阳平[8]。

(3) 从数据来看,阴平被误听为上声的比例分别为15%(初级水平)和3%(高级水平),去声被误听为上声的比例分别为5%(初级水平)和4%(高级水平),即上声分别和阴平、去声比较容易区分。上声主要位于声调音域底部,阴平主要位于声调音域上部,去声作为高降调,其声调特征点也位于声调音域上部,因而上声与阴平或去声都不容易混淆。

表2 初级水平学习者的各声调偏误率(单元音)(%)Table 2 The tone deviation rate in primary learners(pure vowel)(%)

表3 高级水平学习者的各声调偏误率(单元音)(%)Table 3 The tone deviation rate in advanced learners(pure vowel)(%)

不同调类辨认的偏误率如图5 所示。

图5 不同调类平均辨认偏误率(单元音)Fig.5 Average discrimination deviation rates of different tones(pure vowel)

2.2.2 复合元音-声调组合的辨认偏误率为了考察不同水平的学习者对汉语普通话复合元音-声调组合的辨认偏误率,统计不同声调的平均偏误次数和偏误率结果如表4 和表5 所示。详细数据和分析如下:(1) 由表4 中阴平的听辨感知数据可知,初级水平学习者阴平被误听为阳平的偏误率最高,其次是阴平误听为去声的偏误率高。可见,阴平是非常容易与阳平或者去声混淆的声调。从声学空间图[12]上可以找到原因。阴平作为高平调,其声调特特征是起点和终点都位于声调音域的上部;阳平的声调特征点是尾部,其作为低声调,尾部到达声调音域的最高处。去声的声调特征点是起点,去声作为高降调,起点始于声调音域的最高处。也就是说,阴平与阳平,阴平与去声的声调特征点分别都在声调音域上部有所重台。因而,当无声调语言学习者没有较好地把握这三个调类的调型特征,即没有把握阳平的“升”,去声的“降”和阴平的“平”的特点时,很容易在听感上产生混淆[12]。(2) 从表5 可得,在4 个调类中,阳平和上声容易产生混淆。阳平和上声在辨认上呈现双向不对称状态,上声误听为阳平的比例较高,阳平误听为上声的比例较低。

表4 初级水平学习者对复合元音各声调偏误率(%)Table 4 The tone deviation rate in primary learners for compound vowel (%)

表5 高级水平学习者对复合元音各声调偏误率(%)Table 5 The tone deviation rate in advanced learners for compound vowel (%)

(3) 从表4 可得,初级水平学习者对阳平的辨认有7%被误听为去声;对去声的辨认有7%被误听为阳平。阳平和去声,一个是升调,一个是降调,两者由标准的发音人发出标准音时,其声学特征的区别应该是非常明显的,偏误率较高可能是因为测试对象混淆了两者的标调符号。

不同调类辨认的偏误率如图6 中所示。

图6 不同调类平均辨认偏误率(复合元音)Fig.6 Average discrimination deviation rates of different tones(compound vowel)

2.3 各调类准确率以及反应时间

为了考察学习者各调类(阴平,阳平,上声,去声)的辨认准确率和对各调类的反应时间,分别对汉语普通话单元音-声调组合和汉语普通话复合元音-声调辨认进行了统计,考察学习者的各调类掌握情况。

2.3.1 单元音辨认结果

图7 和图8 是学习者对汉语普通话单元音-声调组合的各调类辨认准确率和反应时间,为了进一步研究学习者各调类辨认情况,进行单因素方差分析,详细情况如下。

由图7、图8 可知,不同水平学习者去声的辨认准确率最高,反应时间也最短。上声的辨认准确率最低,反应时间也最长。单因素方差分析结果显示,高级水平学习者对汉语普通话单元音-声调组合的辨认没有显著性差异,阴平F(4.41)=5.02,P>0.05,阳平F(4.05)=6.04,P>0.05,上声F(3.84)=6.28,P>0.05,去声F(7.38)=8.38,P>0.05(其中F 值是用来评估组间差异。F 值表示整个拟合方程的重要性,F 越大,方程越有效,拟合程度越好,F 括号内的数字表示F 比率的自由度。P 值是衡量对照组和实验组差异的指标)。初级水平学习者对不同调类的声调感知有显著差异,阴平F(3.89)=9.16,P<0.01,阳平F(1.34)=9.33,P<0.01,上声F(2.32)=8.13,P<0.01,去声F(1.81)=9.08,P<0.01。

图7 平均准确率(单元音)Fig.7 Average accuracy (pure vowel)

图8 平均反应时间(单元音)Fig.8 Average response time (pure vowel)

2.3.2 复合元音辨认结果

图9、图10 是不同水平的学习者对汉语普通话复合元音-声调组合的各调类辨认准确率和反应时间,按照实验数据进行单因素方差分析,详细分析如下:

从图9 可以看出,高级水平学习者辨认准确率趋势为T4>T1>T2>T3;初级水平学习者辨认准确率为T4>T3>T2>T1。由图10 可知,不同水平学习者对去声的反应时间最短,对阳平的反应时间最长。高级水平学习者对汉语普通话单元音-声调组合的辨认没有明显性差异,阴平F(5.33)=5.04,P>0.05,阳平F(1.39)=5.54,P>0.05,上声F(1.97)=6.18,P>0.05,去声F(7.16)=8.79,P>0.05;初级水平学习者对不同调类具有显著性差异阴平F(2.46)=9.45,P<0.01,阳平F(7.8)=9.27,P<0.01,上声F(4.33)=8.52,P<0.01,去声F(7.46)=9.833,P<0.01。通过易斌等[13]对无声调语言学习者和泰国学习者的声调学习感知实验数据来看,无声调语言学习者建立汉语普通话声调系统比泰国学习者慢。不同水平的学习者的数据来看,高级水平的学习者能较早地建立声调系统。由此可知,有声调语言学习者更早建立汉语普通话声调系统。

图9 平均准确率(复合元音)Fig.9 Average accuracy (compound vowel)

图10 平均反应时间(复合元音)Fig.10 Average response time (compound vowel)

3 区分实验

区分实验的目的是测定听辨人是否能察觉到一组声学变量等距变动的样本连续体间的差异,而不关心是否能做出辨认。阳平和上声是大多数学习者学习汉语普通话声调时遇到的困难。前文提到的已有研究成果说明了不同水平学习者的声调常犯的偏误是在阳平和上声的区分上[14]。与此同时,有关阳平和上声的范畴感知研究目前仍十分有限。因此,进行不同水平学习者在阳平和上声上的感知研究以及阳平和上声的区分感知测试是十分必要的。

3.1 不同水平学习者区分差异

教学和实践都发现学习者对阳平与上声存在混淆现象,但是两者在听感上的混淆并不对称,声调听辨的混淆情况也暗示了阳平-上声的听辨比其他声调更难区分,阳平-上声的感知模式可能与其他声调间的感知模式存在差异。为了考察不同水平的学习者对阳平和上声的掌握情况,进行了详细的分析。

图11 和图12 为高级水平和初级水平学习者的阳平和上声的区分准确率图。从图11 的高水平学习者的准确率图可以看出,学习者对上声的区分准确率比阳平高,区分准确率在90%左右,而阳平的区分准确率相对来说较不稳定。由初级水平学习者的区分图可以看到,阳平和上声的区分准确率不稳定,总体来看阳平和上声的准确率在80%左右。由此可得,对无声调语言的学习者而言,阳平和上声的混淆比较严重,影响他们区分准确率除母语的影响外,还有时长和音高等因素。

图11 高级水平学习者声调区分准确率Fig.11 Tone discrimination rate of advanced learner

图12 初级水平学习者声调区分准确率Fig.12 Tone discrimination rate of primary learner

3.2 区分实验结果

为考察不同水平学习者的总体区分率,对不同水平学习者在阳平和上声的区分进行了详细分析。从图13 中的阳平和上声区分准确率图可知,高级水平学习者的曲线一直在90%左右,也比较稳定。相对而言,初级水平学习者的区分曲线变化较大。部分学习者的准确率为60%。由此可见,对无声调语言的学习者而言,阳平和上声的区分还是比较困难的。

图13 不同水平学习者区分声调总准确率(阳平-上声)Fig.13 Total accuracy of tone discrimination of Yangping and Shang tone for learners at different levels

4 结 论

本文主要研究了20 名不同水平的非汉语普通话母语者对汉语普通话单元音-声调组合和汉语普通话复合元音-声调组合的感知情况。通过设计声调辨认实验和声调区分实验得出了不同水平的学习者对普通话声调的听辨反应时间、听辨准确率以及区分准确率。结果表明,高级水平学习者对声调的听辨能力明显高于初级水平学习者;高级水平学习者的反应时间比初级水平学习者的反应时间短。

通过辨认实验可以看出,无论是高级水平还是初级水平学习者,对汉语普通话单元音-声调组合和汉语普通话复合元音-声调的单字调辨认中,去声的辨认准确率最高。初级水平学习者对普通话声调辨认准确率的趋势是:T4>T3>T2>T1。高级水平学习者无论是汉语普通话单元音-声调组合还是汉语普通话复合元音-声调组合,对上声的感知准确率最低,其次是对阳平的感知准确率。影响声调听辨的因素有基频的音高和时长,其中音高的影响更为重要。因此,改变连续统的起点音高变化会影响到学习者对所刺激的声调判断。一个特定音节的发音中,声调不同时,时长也不同。时长对声调识别有显著影响,对于相同的元音和基频模式,时长越短,越容易听成时长较短的声调。普通话四个声调中,上声时长最长,其次是阳平,阴平再次之,去声最短[10]。

通过学习者反应时间的数据可以看出,高级水平和初级水平学习者对阴平和去声的反应时间都比较短。高级-初级水平学习者对汉语普通话单元音-声调组合的辨认中阳平的反应时间最长,在汉语普通话复合元音-声调组合的声调辨认中对上声的反应时间最长。通过反应时间数据还可以看出,不同水平的学习者对汉语普通话单元音-声调组合的辨认比汉语普通话复合元音的辨认时间更短。

区分实验结果表明,在汉语普通话声调学习过程中,本民族母语的负迁移作用是关键的影响因素。学习者在高级水平阶段才基本建立起完整的汉语普通话声调系统。在学习者的学习过程中,我们可以明显地观察到,对不同水平学习者来说阳平和上声的混淆仍是他们感知声调的最大困难,原因是声调音域略窄且低,阳平起始端调值偏高,上声尾端上升不足。

在声调教学的过程中,要做到让普通话声调学习者首先掌握声调“高”、“升”、“低”、“降”的声学特征。强化不同水平阶段或非汉语普通话母语者的声调感知训练以及声调特征,是声调教育的重要部分[15]。

为了提高汉语普通话声调教育质量,给出以下两点教学建议:

(1) 普通话学习者学习声调的主要难点在于其固有的无声调发音方式。其中表现最突出的是对于阳平、上声两音的错误发音。要克服错误的发音,有效地学好声调发音,重点是多练习和纠正单字、单词。

(2) 让学习者通过多听、多写、多说、多读来提高他们的表达能力和准确的发音水平,以进一步提高汉语普通话的基本知识和基本技能[15]。

猜你喜欢

阳平声调偏误
河北沧惠片“阳平上”三调类方言的单字调与连调
声调符号位置歌
声调歌
太谷方言阴平阳平教学初探
坐着轿车学声调
单韵母扛声调
“一……就……”句式偏误研究
新HSK六级缩写常见偏误及对策
养子
介词框架“对……来说”的偏误分析