基于老挝留学生发音特征的汉语语音评价体系研究
2015-04-29陈展
摘 要:结合老挝留学生的发音特征及其汉语语音偏误,提出了“汉语发音习得等级”的定义,对基于老挝留学生发音特征的汉语语音评价体系做了详细设计和分析,同时引入联动和反馈机制以科学、高效地评价老挝留学生的汉语发音水平。
关键词:老挝留学生 发音特征 汉语语音评价体系 语音偏误
一、引言
近年来,随着中国国际地位的不断提升,中国与老挝的关系越来越密切,经济文化交流日趋频繁,汉语在老挝的应用范围逐步扩大,老挝教育部越来越重视汉语教学。汉语是老挝青少年学习的热门语言,老挝青年掌握汉语者具有更加明显的就业优势,学习汉语者越来越多,汉语教学在老挝形成不断发展的态势[1]。目前,针对老挝留学生的汉语教学虽然取得了一定成效,但老挝留学生在汉语发音方面还存在一定困难,用普通话与授课教师之外的中国人交流非常困难,经常产生交流障碍,严重阻碍并制约了老挝留学生的汉语交流与学习。
传统的汉语语音评价体系[2]忽略了外国留学生发音的特殊性,缺乏特殊性评价标准,不适应留学生对汉语语音学习的需求。基于老挝留学生发音的汉语语音评价体系是一个全方位衡量和评价老挝留学生汉语语音习得程度和质量高低并且反馈发音指导建议的智能化系统,可用来提高老挝留学生的汉语发音正确率,使其能更好地掌握汉语发音的方式、方法。
二、理论及技术基础
(一)老挝留学生汉语发音偏误研究成果
自老挝留学生来华学习汉语以来,国内外语音学专家对其发音偏误进行了大量研究,总体来说,偏误可归纳为以下几点。
1.辅音方面:部分“ch、c、l”发成“x、s、sh”,部分“r”发成“l”,部分“f”发成“p”。
2.元音方面:把“ü”发成“u”,把“iong”发成“ong”,把“ue”发成“ie”[3]。
3.声调方面:发阴平调时,有时调值不够高,容易发成中平调33或44。发阳平调时,发声起点较低,平调时间较长再上扬,上扬的高度不够,调值约为224,听感上类似上声。发上声时,有时发成半上[21],有时中间下降值不够,发成323。
4.语调方面:不注意双音节词语的格式配合,平均分配两个音节的音长和音强,基本不能分辨轻声词;句中的停、连有时很随意,甚至某个词语中间也会出现停顿;不能通过句末的升调来表示疑问[4]。
(二)汉语语音偏误标记
语音偏误标记是指语音习得中能够标识学习者国籍或母语特点的、有规律出现的语音偏误问题,是该学生区别于其他国家或地区学习者的语音标志,是其他国家或地区学习者没有或不会呈规律出现的[5]。老挝留学生在学习汉语语音的过程中,其母语(老挝语)是引起发音偏误最为关键性的因素,大部分老挝留学生在说汉语时,有较明显的老挝语音,受目的语干扰的同时出现母语负迁移现象,所以在评价老挝留学生的汉语发音时,应参考其母语发音的特征,做出合理的、有针对性的评价。
(三)汉语语音识别技术
我国的汉语语音识别技术经历了30多年的探索和研究,特别是在特征提取和语音评价技术方面较为成熟,接近国外语音识别技术水平。典型代表有吕军提出的“基于语音识别的汉语发音评价系统”[6],该系统对留学生汉语发音水平的评价有一定的参考价值和广泛性,是一个基本的汉语语音评价模型。
三、汉语发音习得等级(L)
在上文提及的汉语语音评价相关理论与相关技术的基础上,本文将老挝留学生汉语发音习得等级定义如下:
假设汉语发音习得等级是一个五元组L=(L1,L2,L3,L4,H),其中:L1为元音习得等级,L2为辅音习得等级,L3为声调习得等级;L4为语调习得等级,H为权重因子。L1,L2,L3和L4的取值范围均为0~5这六个整数;H对应一组权重(4个)系列,4个权重值相加等于1,根据不同的汉语发音习得目标,可取不同的值,在一般情况下,默认为(0.25,0.25,0.25,0.25)。
L值越高,证明发音偏误率越低,发音接近标准,发音质量越高。L值越低,发音偏误率越高,发音越偏离标准,发音质量越低。
这样,搭建基于老挝留学生发音特征的汉语语音评价体系就有了数理依据,同时,汉语发音习得等级(L)为该体系中的语音评价提供了核心数据。
四、汉语发音评价体系设计
根据老挝留学生汉语发音特点以及现有语音识别技术,汉语语音评价体系由“语音识别层、语音评价层及偏误分析层”三大支撑平台构成,如图1所示:
(一)语音识别层
语音识别层由语音信号输入模块、预处理模块、特征提取模块及标准语音数据库构成,它是整个体系结构的基础,是进行汉语语音评价的前提。
图1:
当某个语音信号产生时,语音信号输入模块首先将语音转换为计算机能读取的数字信号,随后通过预处理模块分辨出语音信号及非语音信号。经预处理后的音频数据一方面会被传送到标准语音库进行备份,另一方面作为特征提取模块的输入数据。特征提取是语音识别层中的一个关键步骤,它能识别老挝留学生的汉语发音特征,其结果供语音评价层读取并处理,是评价老挝留学生汉语发音的重要技术。
标准语音库是一个由若干语音元素构成的数据库,数据采集方法为:选用数量对等的汉语发音标准的中国人和HSKK成绩优秀的老挝留学生进行语音的采集及存储,这样既能保证语音库中汉语的标准发音,又能兼顾老挝留学生汉语发音的特殊性。
(二)语音评价层
语音评价层由分割与对比模块、发音评价模块及习得等级测评模块构成,主要负责将提取出的发音特征数据逐级转化为相应汉语发音习得等级L,科学地反映老挝留学生的汉语发音水平,这是整个体系结构中最重要的部分。
首先,语音评价层会自动采集老挝留学生的汉语发音特征参数,并将其分割、细化为单个音素,将其与标准语音库发音参数进行对比分析;其次,发音评价模块通过调用一系列评价算法和函数做出发音评价。习得等级评测模块将发音评价结果转化为一个数字序列(五元组),最终得出汉语发音习得等级L。与此同时,汉语语音习得等级L则被反馈到偏误分析层。
(三)偏误分析层
偏误分析层由发音偏误判断模块及偏误语音库构成,负责对偏误语音库中的特征参数及汉语发音习得等级L做出智能化的判断,给出老挝留学生汉语发音的偏误信息,一方面由系统自动提出相应的消除发音偏误的方案和建议,另一方面系统通过联动模块,把发音质量好的语音数据反馈至标准语音库,让语音识别层与偏误分析层进行实时交互,不断更新标准语音库;同时,偏误分析层收集新旧汉语语音偏误类型及实例,为判断新的发音偏误提供比对依据。
由此可见,语音识别层、语音评价层及偏误分析层之间相互依存、相互影响、相互作用,通过联动和反馈机制不断地在其间传递语音及语音评价信息,构成了一个针对老挝留学生发音特征的高效的汉语语音评价体系。
四、结语
语音评价是第二语言学习过程中的基础内容和重要环节。对于老挝留学生来说,如何在汉语学习初期使用正确的语音进行交流和学习是极为重要的。本文提出的汉语语音评价体系和汉语语音习得等级是与汉语发音规律、老挝留学生发音规律相适应的,为降低语音评价的人工成本,大大提高语音评价的效率,帮助教师在今后的汉语教学中有针对性地安排教学及语音评价,进一步提高老挝留学生汉语语音习得的效率和质量奠定了坚实的基础。
参考文献:
[1]蒋重母.老挝汉语教学现状研究[J].东南亚研究,2010,(6):84~92.
[2]郭巧.计算机辅助汉语教学系统中语音评价体系初探[J].中文信息学报,1999,(3),49~54.
[3]付国强.老挝学生习得汉语的偏误[J].现代语文(语言研究版),2013,(11):114~116.
[4]邓瑶.老挝汉语初学者语音偏误分析及教学策略——基于昆明学院老挝学生普通话语音学习的调查[J].西南学刊(第五辑):267~274.
[5]陈晨.汉泰语音对比研究与语音偏误标记分析[J].暨南大学华文学院学报,2007,(4):22~30.
[6]施伟.一种基于语音识别的汉语发音评价系统[A].中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C].2007,(10):
632~636.
(陈展 云南昆明 昆明理工大学国际学院 650093)