非汉语母语者的普通话元音和辅音感知研究
2020-05-09古扎丽努尔德力木拉提古力努尔艾尔肯米吉提阿不里米提艾斯卡尔艾木都拉
古扎丽努尔·德力木拉提,古力努尔·艾尔肯,米吉提·阿不里米提,艾斯卡尔·艾木都拉
非汉语母语者的普通话元音和辅音感知研究
古扎丽努尔·德力木拉提,古力努尔·艾尔肯,米吉提·阿不里米提,艾斯卡尔·艾木都拉
(新疆大学信息科学与工程学院,新疆乌鲁木齐 830046)
语音感知研究是语音学主要研究内容之一。为了解学习者对普通话元音和辅音的感知情况,并为汉语教学提供借鉴,拓宽言语学习模型的应用领域,减少教学的盲目性,根据第二语言习得理论模式,采用实验语音学和统计学的方法,设计辨认实验和区分实验,分别对普通话水平处于高级和初级水平的20名维吾尔族大学生元音、塞音、擦音和塞擦音的感知情况进行研究。辨认实验考察学习者对元音和辅音的感知反应时间和感知准确率。在区分实验中,计算元音对的频谱距离,辅音对的频谱距离,以及它们的时长差异,对学习者的区分能力进行分析。实验结果显示高级水平学习者的感知元音和辅音的能力明显高于初级水平学习者。学习者对发音部位靠后的元音反应时间快且感知准确率高,对于发音部位靠前的元音反应时间较慢且感知准确率低,对塞擦音的辨认准确率高,对擦音的辨认准确度最低。元音对的频谱距离和辅音对的时长差异会影响到学习者的区分能力,但辅音对的频谱距离和区分情况不存在密切联系。
辨认实验;区分实验;语音感知;频谱距离;时长差异
0 引言
语音感知研究是语音学的课题之一,是一个动态的、多科学的研究方向[1-2],通过语音感知研究而得到的语音近似度的结果可以为语音学的研究提供现实依据。感知研究也是语音习得过程中的第一个步骤。对第二语言(L2)音系的感知模式是中介语音系的组成部分[3]。语音感知(speech perception)指的是大脑经由听觉器官传导而来的声波进行语音识别的过程,在生理上,语音由耳廓收集传入耳道,经过耳膜和听小骨的扩大之后传入耳蜗,再由听觉神经传到大脑,被大脑解码以及编码,即大脑对语音学特征及听觉印象二者关系的处理过程来表现[4],感知与产出之间的相互关系已经在第二语言(L2)语音学和音韵学中进行了讨论,一些研究表明,感知在第二语音的产出中起着非常重要的作用[5]。通过实验获取学习者的感知数据已成为第二语言习得研究中的重要环节。
本文从语音学的角度出发,采用辨认实验(Identification task)和区分实验(Discrimination task)的方法对普通话单元音/a/, /o/, /ɤ/, /u/, /y/, /i/和/i/元音的两个音位变体/ɿ/, /ʅ/(/ɿ/出现在zi, ci, si中, /ʅ/出现在zhi, chi, shi, ri中)[6],双元音/ai/, /ei/, /ao/, /ou/, /uo/, /ia/, /ie/, /ua/以及普通话塞音(/b/, /d/, /g/, /p/, /t/, /k/),塞擦音(/zh/, /z/, /j/, /c/, /ch/, /q/),擦音(/x/, /sh/, /s/)进行感知研究。基于以往影响普通话元音和辅音感知的因素,在本文中揭示了元音及辅音知觉和语言熟练程度之间的潜在关系,也调查了语言熟练程度在第二语言习得过程中的作用。
1 实验设计
1.1 实验介绍
本研究实验数据通过X-perception工具记录和计算。为使实验结果更加科学、可信,辨认实验和区分实验使用相同的学习者。辨认实验中学习者需要用相应的按键来选择所听到的元音和辅音。通过此工具计算出学习者选择每一个刺激之间的时间间隔,得出选择元音和选择辅音的正确率,再对实验数据进行方差分析,用值和值考察两组学习者在反应时间和准确率上的差异(值是用来评估组间差异,值表示整个拟合方程的显著程度,越大,表示方程越显著,拟合程度也就越好;值是衡量控制组与实验组差异大小的指标,值小于0.05,表示两组存在显著差异,值小于0.01,表示两组的差异极其显著)。
区分实验采用AB形式的实验。刺激将会以ABB,BBA,AAB,BAA四种命令出现,其中AB两个音有微小差别,中间的音则与AB中的某个音相同。实验中所听到的音,若跟A一样,学习者选择A键。如果跟B一样,就选择B键。再通过计算元音的频谱距离和辅音频谱距离以及时长差异的方法,讨论学习者区分元音和辅音的能力。
计算频谱距离需要两个音的共振峰频率(),所以用PRAAT语音分析软件提取标准普通话话语者产出的目标音的第一共振峰(1)和第二共振峰(2)。用提取出来的元音共振峰参数(1、2)计算/ɿ/-/ʅ/、/ɤ/-/i/、/ɤ/-/ʅ/之间的频谱距离以及/uo/-/o/、/uo/-/ou/、/a/-/ia/之间的频谱距离。用辅音共振峰计算/s/-/c/, /b/-/p/、/d/-/t/、/q/-/x/、/x/-/sh/之间的频谱距离和提取时长参数计算时长差异。
计算频谱距离公式为
1.2 刺激语料
本研究所用到的感知语料是在专门的录音室对4名标准普通话发音人录音而得到的。本实验的元音感知实验语料是256个辨认实验语音刺激[8(单元音)或8(双元音)×4(连续)×4(发音人)]和132个区分实验语音刺激 [11(元音组合)×4(命令)×3(发音人)]。辅音感知实验所用的是72个辨认实验元音刺激 [36个(带有辅音的单子节词)×2个(发音人)]和80个区分实验语音刺激[10(辅音组合)×4(命令)×2(发音人)]。
1.3 实验对象
本研究选取年龄为20~24岁的20位在校非汉语母语者大学生作为研究对象(均无听力障碍)[7]。根据学习者的少数民族汉语水平等级考试(Minzu Hanyu Kaoshi, MHK)成绩把学习者分为低水平组和高水平组,分组情况如表1所示。
表1 被试分组情况
2 结果与分析
2.1 元音感知实验
2.1.1 元音辨认实验
本实验中学习者将对256个语音刺激进行判断,通过工具记录学习者选择所听到元音的感知反应时间以及准确率。学习者对普通话单元音和双元音的感知反应时间如表2所示。
由表2可知,无论是高水平还是低水平学习者,对前元音/y/、/ɿ/和元音/ʅ/的反应都较慢,对后元音/a/, /o/, /e/的反应较快。学习者对/ua/, /uo/, /ie/和/ai/, /ou/的反应较慢,对/ei/, /ao/和/ia/的反应相对较快。通过以上结果可以推出学习者对后元音的感知反应时间比前元音的短,从而可知元音发音部位可以影响到学习者的元音感知辨认能力。
表2 元音感知反应时间(ms)
从表2还可以发现学习者对双元音和单元音的感知反应时间有所差别,汉语跟维吾尔语属于不同的语系,维吾尔语有8个单元音,没有双元音。汉语普通话不但有单元音,还有9个双元音和4个三合元音。单元音发音时唇形和舌位不变。双元音包含两个因素,发音时由一个元音向另一个元音滑动。在语音学中,当联合的两个元音作为一个整体出现时,两个目标元音之间有平滑的过度,也就是说,双元音的发音牵涉到两种不同的舌位,并且从其中一种舌位滑动到另一种舌位。双元音发音时由起始元音以不同的平滑程度过渡到后接元音,通常两个元音成分中有一个比较突出,另一个相对不突出。从单元音和双元音的感知反应时间和感知准确率可知,因为双元音对于维吾尔族学习者来说是全新的概念,所以学习者对双元音的感知反应较慢,但是学习者母语中没有双元音,没有直接受到母语的影响,双元音的感知准确率比单元音的高。
通过对高水平和低水平普通话学习者单元音和双元音感知反应时间分别进行单因素方差分析,得到以下结果,对于单元音,低水平组:(2.23)= 4.12,<0.01;高水平组:(2.46)=3.86,<0.01。由此可见这两组学习者在单元音的感知反应时间上存在显著差异。对感知反应时间进行分析,得到低水平组:(2.23)=2.16,>0.05;高水平组:(2.46)= 1.21,>0.05,由此可得两组学习者在双元音反应时间上不存在显著差异。
图1和图2为学习者对普通话单元音和双元音的感知准确率。
由图1可知,低水平学习者对前元音/y/、/ɿ/和后元音/o/、/ʅ/的感知准确率较低,对后元音/a/、/e/、/u/和前元音/i/的感知准确率较高。舌尖元音/ɿ/、/ʅ/是/i/元音的音位变体,主要依靠舌尖用力的元音,舌尖元音不仅在语音性质上是特殊的,在语音系统的位置也是特殊的,这些音只能出现在/z/、/c/、/s/和/zh/、/ch/、/sh/中。学习者如果母语没有舌尖元音的相似元音,对舌尖元音发音部位和发音方法的理解就会有欠缺。由图2可知,学习者对双元音/ia/、/ie/、/uo/的感知准确率较低,对/ai/、/ao/的感知准确率较高。
图1 单元音感知准确率
图2 双元音感知准确率
通过分别对单元音和双元音的感知准确率进行单因素方差分析,得到了单元音感知准确率高水平组:(2.14)=13.84,<0.001;低水平组:(2.13)=12.53,<0.001。由此可知两组学习者在单元音的感知准确率上有显著差异。双元音感知准确率,高水平组:(2.13)=2.42,<0.05;低水平组:(2.13)=2.35,<0.05。可以得出学习者在双元音的感知准确率上存在明显差异。通过元音辨认实验发现学习者对后元音的反应较快,如元音/a/、/o/、/e/、/u/;对前元音/i/、/y/的反应慢且感知准确率较低;对后响元音/ia/、/ie/、/ua/、/uo/的反应较快且准确率高;对前响元音/ai/、/ou/的反应较慢且准确率低。
2.1.2 元音区分实验
在区分实验中,学习者将对132个语音刺激进行区分。本实验要求学习者根据两个元音的相似性区分元音。再根据计算的频谱距离结果,讨论元音区分的难度。
图3是单元音/ɿ/-/ʅ/、/ʅ/-/ɿ/、/ɤ/-/ʅ/、/ʅ/-/ɤ/、/i/-/ɤ/、/ɤ/-/i/的错误选择次数。从图3中可以看到/ɿ/-/ʅ/、/ɤ/-/ʅ/、/ʅ/-/ɤ/的区分比较难,/ʅ/-/ɿ/、/i/-/ɤ/、/ɤ/-/i/的区分比较容易。图4为/uo/-/o/、/o/-/uo/、/uo/-/ou/、/ou/-/uo/、/a/-/ia/、/ia/-/a/的错误次数。从图4中可以看出/o/-/uo/、/uo/-/o/和/uo/-/ou/的区分较难,但是/ou/-/uo/、/a/-/ia/、/ia/-/a/相对来说区分错误次数较少,容易区分。
图3 元音区分实验1的结果
图4 元音区分实验2的结果
元音对之间的频谱距离计算结果如表3所示。
表3 元音对的频谱距离和时长差异
范畴性知觉是指连续的元音刺激被感知为离散的、数量有限的语音范畴,人们对同一范畴内的语音难以区分,而对范畴间的语音则很容易识别[8]。对于单元音来说,/ɿ/和/ʅ/的频谱距离小,分析双元音得知,/uo/和/o/的频谱距离最小,因此很难区分。/ɤ/和/i/的频谱距离大,因此容易区分。元音的时长差也会影响到学习者的区分能力,如/uo/-/o/、/ɿ/-/ʅ/之间的时长差较小,较难区分。最后进一步研究较难区分的部分元音,如图5所示。
从图5可以看到学习者还对后元音/ʅ/和前元音/i/、前元音/y/和后元音/u/的区分较难,对/ao/-/ou/、/ie/-/i/的区分比较容易。通过区分实验基于两个元音声学距离越大就越难区分,反之越容易区分的理论,可以得到元音的区分难度。区分实验中还发现学习者将双元音听成单元音,比如/uo/-/o/、/ia/-/a/等情况。低水平学习者比高水平学习者对元音的区分能力差。随着语言熟练程度的提高,元音区分更容易。这说明学习者的普通话水平会影响元音区分能力。
图5 元音区分实验3的结果
2.2 辅音感知实验
2.2.1 辅音辨认实验
实验中学习者将对辅音刺激语音进行判断,表4为两组学习者对普通话辅音的感知反应时间和感知准确率。
表4 辅音感知反应时间和准确率
由表4可知,两组学习者对塞音的反应时间较短,对擦音的反应时间相对长一些。利用单因素方差分析对两组学习者的辅音感知反应时间进行进一步分析,可得低水平组:(2.01)=1.51,0.05,分析表明低水平组在感知反应时间有显著差异;高水平组:(2.01)=3.45,>0.05,高水平组对不同辅音的感知反应时间没有显著差异。两组学习者感知塞音的准确率最高,感知擦音的准确率最低。高水平组和低水平组对辅音的感知反应时间和准确率存在差异,前者不仅感知反应时间短,而且感知准确率也高。在第二语言语音范畴习得中,同样也涉及到用母语音位范畴来对第二语语音进行分类的认知过程[9]。学习者在第二语言习得过程中将经历一个“音系重构”的过程,即学习者对已有的母语语音范畴进行修正或扩展以适应第二语言语音感知的需要[10]。维吾尔语和普通话在音位和发音方法之间有相似性,也有不同之处,维吾尔语辅音音位的发音区比普通话的发音区靠后。维吾尔语中的塞音及塞擦音是与清/浊相对应,而汉语中的塞音及塞擦音是与送气/不送气相对应。维吾尔语中没有普通话中的舌尖后音/zh/、/ch/、/sh/及舌尖前音/c/;普通话中有舌尖前及舌尖后辅音,维吾尔语辅音音位中没有这些部位的辅音。因此学习者对于这些音的辨认有一定的难度。维吾尔语的/b/, /d/, /g/和普通话的/p/, /t/, /k/是两组发音较相近的辅音,其差别在于/b/, /d/, /g/发音时声带振动,是一组浊音音位;/p/, /t/, /k/发音时声带不振动,是一组不送气清辅音音位。学习者会把普通话中送气/不送气的特征同化为母语中的一个范畴,由于送气特征存在于维吾尔语清塞音的音位变体中,即学习者有送气的语音经验,可能会把维吾尔语中的清塞音的音位变体对应普通话的送气塞音,这就表明维吾尔族学习者对于不送气/送气音位具有一定的区分能力,且会把非母语的送气/不送气特征都感知为母语中的清音范畴。因此学习者的母语可能会影响到学习者的感知准确率。本文用统计分析的方法计算学习者辅音感知错误次数,列出了学习者的感知错误矩阵,结果如表5所示,表中的数字表示学习者对辅音的感知辨认错误次数。由表5可知,学习者对塞擦音/z/、/zh/的辨认准确率高,辨认准确率最低是擦音/s/,学习者便把/s/音听成塞擦音/c/、/c/音也被听成/s/和/z/。学习者在塞音和塞擦音之间容易混淆,在感知塞音/b/、/p/上也有些困难。由此可知,辅音的发音方法会影响学习者辅音的辨认能力。
表5 辅音感知错误矩阵
2.2.2 辅音区分实验
实验中,学习者对80个语音刺激进行区分。要求学习者判断每个三联体中的哪个音与其余的音不同。从语言熟练程度等方面分析区分实验的正确性。图6所示是20位学习者对辅音对的区分实验结果。
根据图6中的柱状图来看,学习者对/s/-/c/, /c-s/和/x/-/sh/, /x/-/q/的区分能力比其他几组刺激音差,容易混淆,对/b/-/p/, /d/-/t/较容易区分。
图6 辅音区分实验结果
表6是辅音对的时长差异和频谱距离结果。由表6可见,因为/q/-/x/, /x/-/sh/, /s/-/c/的时长差小于其他辅音组,所以学习者容易在区分上感知模糊,产生混淆。/b/-/p/, /d/-/t/时长差比其他三组辅音的时长差大。从而可知辅音之间的时长差可以影响到学习者的区分能力。辅音频谱距离大小排序为Sp(/x/-/sh/) 表6 辅音对的时长差异和频谱距离 由辅音感知实验可知,高水平组学习者的辨认准确率优于低水平组学习者,辨认反应时间也是前者消耗的时间小于后者的反应时间。对于塞擦音和擦音的感知准确率和反应时间,两组学习者对塞音的感知辨认准确率相对较高且反应时间短。从而可知,学习者辨认准确程度和反应时间成正比关系。本文为进一步考察学习者对辅音的感知情况设计了区分实验,通过计算各辅音对的时长差异和频谱差异,将计算结果和学习者的实验数据结合在一起研究区分情况。研究发现,辅音对的时长差异可以决定学习者的区分能力,时长差异越大,越容易区分,反之会较难区分。但是辅音间的频谱差异跟区分准确率存在一定的差异。可以推断,辅音间的频谱差异对学习者的区分准确率不一定会有影响。学习者对一些时长差异小的辅音容易混淆,较难区分,如:/q/-/x/、/x/-/sh/、/s/-/c/。 本文采用感知实验的方法对普通话元音和辅音的感知问题做了研究。通过辨认实验和区分实验,对不同普通话水平学习者的汉语感知模式进行了研究,发现学习者的感知模式随其第二语言水平的变化而变化。高水平组学习者感知普通话元音和辅音的能力优于低水平组学习者。元音间的频谱距离和辅音时长差异是影响学习者对元音对和辅音对感知区分能力的主要原因。 总之,语音感知的研究可以指导学习者了解普通话元音和辅音的发音部位。深入学习普通话元音和辅音的特征,使学习者能够提升普通话发音的准确性,能够对听觉障碍患者有一定的帮助,能够为语音识别和语音通信等应用性能的提高提供理论指导,为建立自然和谐的人机交互奠定基础。 [1] 余爽. 适用于语音感知认证体系的信息隐藏方案研究[D]. 兰州: 兰州理工大学, 2016. YU Shuang. Research on information hiding in speech perception authentication system[D]. Lanzhou: Lanzhou University of Technology, 2016. [2] 颜永红, 李军锋, 应冬文. 语音中元音和辅音的听觉感知研究[J]. 应用声学, 2013, 32(3): 231-236. YAN Yonghong, LI Junfeng, YING Dongwen. Perception of vowels and consonants in speech[J]. Journal of Applied Acoustics, 2013, 32(3): 231-236. [3] 王韫佳. 韩国,日本学生感知汉语普通话高元音的初步考察[J]. 语言教学与研究, 2001(6): 8-17. WANG Yunjia. A preliminary study of the perception of high vowels in mandarin by Korean and Japanese learners[J]. Language Teaching and Linguistic Studies, 2011(6): 8-17. [4] 杨柳新, 欧兰清, 于洪志, 等. 汉语语音感知研究综述[J]. 西北民族大学学报(自然科学版), 2014, 35(4): 51-56. YANG Liuxin, OU Lanqing, YU Hongzhi, et al. A survey of Chinese speech perception research[J]. Journal of Northwest University for Nationalities(Natural Science), 2014,35(4): 51-56. [5] KLUGE D C, RAUBER A S, REIS M S, et al. The relationship between the perception and production of English nasal codas by brazilian learners of English[C]//2007: 2297-2300. [6] 邓丹. 跨语言相似度与美国学习者汉语元音习得研究[J]. 汉语学习, 2017(3): 71-84. DENG Dan. Cross-language similarity and American learners' Chinese vowel acquisition[J]. Journal of Chinese Language Learning, 2017(3): 71-84. [7] 帕丽扎提·克依木, 古力努尔·艾尔肯, 米吉提·阿不里米提, 等.不同水平的普通话学习者单字调声调感知研究[J]. 声学技术, 2020, 39(1): 61-68. Parizat Keyim, Gulnur Arkin, Mijit Ablimit, et al. Study on the perception of monolingual tone of mandarin learners at different levels[J]. Technical Acoustics, 2020, 39(1): 61-68. [8] 张锦玉. 汉语普通话塞音的知觉研究[J]. 云南师范大学学报(对外汉语教学与研究版), 2014, 12(3): 58-64. ZHANG Jinyu. Stop consonants in Mandarin in the perspective of perception[J]. Journal of Yunnan Normal University(Teaching and Research on Chinese As A Foreign Language Edition), 2014, 12(3): 58-64. [9] 梅丽. 泰国学习者汉语普通话塞擦音知觉的实验研究[C]//第九届中国语音学学术会议论文集, 2010. MEI Li. An experimental study of Thai learners' putonghua perception[C]//Proceedings of the 9th China Conference on Phonetics, 2010. [10] 薛娣, 龚箭. 学习者英语水平对其英语辅音知觉同化及识别的影响[J]. 景德镇学院学报, 2017, 32(4): 15-20. XUE Di, GONG Jian. The Effect of the learner's English proficiency on the assimilation and recognition of English consonant perception[J]. Journal of Jingdezhen University, 2017, 32(4): 15-20. Research on Mandarin vowel and consonant perception based on comparative analysis Guzalnur Dilmurat, Gulnur Arkin, Mijit Ablimit, Askar Hamdulla (Institute of Information Science and Engineering, Xinjiang University, Urumqi 830046, Xinjiang, China) Speech perception research is one of the main research contents of phonetics. The purpose of this research is to understand the learner's perception of Mandarin vowels and consonants, and to provide a reference for Chinese teaching, broaden the application field of speech learning models and reduce the blindness of teaching. According to the theoretical model of second language acquisition, this paper uses experimental phonetics and statistical methods and designs identification experiments and distinction experiments to study the perception abilities of vowel, consonant, plosive, fricative and affricative for the 20 Uyghur college students who are at the advanced and junior levels of Putonghua respectively. The identification experiment examines the learner's perceived response time and perceived accuracy of vowels and consonants. In the distinction experiment, the spectral distances of vowel pairs, the spectral distances of consonant pairs and their duration differences are calculated to analyze the learner's distinction ability. The experimental results show that the ability perceiving vowels and consonants of the advanced level learners is significantly higher than that of the primary level learners; the learner's response time to the vowel at the back of the pronunciation is fast and the perception accuracy is high, however, the response time to the vowel at the front of the pronunciation is slow and the perception accuracy is low; in addition, the recognition accuracy of the affricative is high, and the lowest is for the fricative; the differences in the spectral distance of vowel pair and in the duration of consonant pair affect the learner's distinction ability, but the spectral distance of consonant pair is not closely related to distinction. identification task; discrimination task; speech perception; spectral distance; duration difference H107 A 1000-3630(2020)-02-0214-06 10.16300/j.cnki.1000-3630.2020.02.015 2018-09-05; 2018-11-22 国家973项目(2013CB329301)、国家自然科学基金项目(61662078)资助 古扎丽努尔·德力木拉提(1993-), 女, 维吾尔族, 新疆博乐人, 硕士研究生, 研究方向为语音信号处理。 艾斯卡尔·艾木都拉, E-mail: askarhamdulla@sina.com3 结论