区别特征单音节评测中过渡音征的影响
2017-07-05彭梦娅刘亚丽
彭梦娅,刘亚丽
(中国传媒大学 传播声学研究所,北京 100024)
区别特征单音节评测中过渡音征的影响
彭梦娅,刘亚丽
(中国传媒大学 传播声学研究所,北京 100024)
为将区别特征应用于语音评测,需分析区别特征应用的可行性及过渡音征对区别特征单音节评测的影响。利用区别特征探针参数并在区别特征决策树中逐层判断的方法进行单音节中声母和韵母的唯一确定,对含过渡音征的语音样本信号与无过渡音征的语音样本信号分别计算声母正检率,两组正检率显著性检验结果显示无显著性差异,因此建议在区别特征单音节检测中不考虑过渡音征。该结果可以为进一步将区别特征应用于普通话语音客观评测提供参考。
区别特征;过渡音征;计算机辅助评测
1 引言
目前的普通话水平测试工作中,虽有部分地区采用人工打分为主,计算机辅助评测的方式,大部分地区采用的仍是人工打分的主观评测方法。虽然主观评分能够真实地反映被试者的语言能力,但存在评分员劳动强度大、测试成本高以及测试信度受主观影响大等问题。随着实验语音学和语音识别等相关技术的进步,计算机辅助发音质量评测技术也在不断发展。当下主流的客观评测方法是基于统计模型的方法,该方法可操作性强适用范围广泛且可信度高,但统计模型缺少对语音的声学模型和语音的知觉模型内部细节问题的研究,而且系统性能的提高过于依赖数据驱动。20世纪80年代国内开始进行普通话区别特征的研究,区别特征方法可以很好地解决基于统计模型方法存在的弊端。区别特征是针对语言的本质特征的理论,可以锁定普通话评测中的发音错误和发音缺陷,将区别特征概念引入到计算机辅助发音评测,为汉语普通话语音评测提供了新的思路和方法。
关于区别特征的研究已经达到一定的深度。张家禄[1]首次建立了声韵调体系的区别特征系统。章斯宇[3]建立了基于言语知觉特性的普通话区别特征声韵调体系。遗憾的是,他们并未进行区别特征的参数化,因此无法将区别特征实际应用于语音评测。为解决这一问题,徐益华[4]和李戈[5]尝试利用探针概念基本完成了汉语普通话声母和韵母的区别特征参数化。他们完成了每个声母或韵母对应的区别特征组中的单个区别特征的检测,目的是检测区别特征探针参数的有效性,但并未利用这些参数进行判别决策树中的声韵母检测。
无论是识别还是评测中,过渡音征问题一直是难点。过渡音征现象主要由声韵过渡段表现,它使得声母的一部分特征或全部特征由韵母携带,特别是某些声母,如不送气塞音,其区别特征几乎全部由过渡段携带。在基于统计模型的方法中,普遍认为过渡音征是必须考虑的,如论文[5-8]为解决过渡音征对声母识别的影响,根据后接韵母第一音位的不同建立各种声母模型,再使用基于声韵母时长和短时能量的算法进行声韵自动切分,之后进行模式识别。该方法需要建立91种声母模型,数据量大,并且依赖声韵自动切分,切分算法改变可能会造成声母模型失效,降低了应用的普适性。区别特征理论是针对语言的本质特征的理论,在进行区别特征的研究时一般认为过渡音征问题是不需要单独考虑的,那么在将区别特征应用于普通话语音评测时过渡音征问题的影响是否需要考虑,是我们将要进行讨论的。
本文在区别特征相关研究的基础之上,针对过渡音征问题,通过提取区别特征探针参数并在区别特征决策树中逐层判断的方法进行单音节中声母和韵母的唯一确定,并对含过渡音征的语音样本信号与无过渡音征的语音样本信号分别进行声母正检率计算,对两者正检率结果之间的差异进行显著性检验,分析在区别特征单音节检测中过渡音征问题的影响。除此之外,对单音节中韵母进行正检率计算,结合单音节中含过渡音征的声母正检率,分析区别特征应用的可行性。
2 实验方法
2.1 样本的选取和处理
语音样本信号选自中国传媒大学传播声学研究所录制的语音语料数据库中的单音节数据库部分[11]。在该数据库中选取50个人的语音样本数据(男女比例1:1),年龄分布在19~21岁之间。该单音节数据库涵盖所有声韵组合,选取362种声韵组合的单音节,声调全部为一声,共18100个(50×362)。语音样本采样率为16kHz。按过渡音征有无将语音信号分别进行处理,处理方法如下:
含过渡音征样本:通过人工听辨去除不可用的单音节信号(误读或噪声过大等),最终选定单音节样本总数为14736个,包含所有可能的声韵组合情况。并通过人工观察语谱图、时域图的方法,将单音节前后的静音区去除,只保留纯净的单音节信号。
无过渡音征样本:通过人工听辨去除不可用的单音节信号(误读或噪声过大等),最终选定单音节样本总数为3247个,从声母呼读音样本中获取,如表1所示。为了得到纯净的声母信号,处理上不受后面的元音信号和过渡音征的影响,将呼读音后部的非声母部分切除。采取人工切音的方法,保留起始点和排除过渡音、韵母的干扰。切割主要根据辅音的语图特点、时域信号特点,并通过听辨进行切分。
表1 声母呼读音对照表
续表
2.2 参数选取
选用文献[4-5]的声母和韵母区别特征探针参数,用于声韵母区别特征决策树[3]中各区别特征有无的判别。
表2 声母区别特征探针参数
表3 韵母区别特征探针参数
2.3 实验流程
针对每个单音节,通过计算得出的12个声母探针参数(见表2)和24个韵母探针参数(见表3)对声韵母进行判别的流程如图1所示。
图1 单音节中声韵母正检流程图
第一步,对单音节语音样本信号进行预处理,包括预加重、分帧、加窗、声母边界初判(声母边界初判指的是,声母部分语音帧的能量值要低于整个音节语音帧的能量平均值,利用此特征实现音节中声母位置的初判);
第二步,对预处理后的语音信号进行区别特征探针参数的计算,得到1×12的声母区别特征探针参数矩阵和1×24的韵母区别特征探针参数矩阵;
第三步,将每个声母和韵母判别时用不到的区别特征探针参数矩阵值设定为0,即把不参与判别的区别特征(后称无效区别特征)去除,只考虑理论上含有的区别特征;
最后,根据区别特征探针矩阵在声母/韵母区别特征决策树[3]进行路径搜索,通过对节点处区别特征有无的判定实现对单音节中声母和韵母的唯一确定,以q为例,如图2所示,依次判别“浊音的”、“舌面的”、“送气的”和“塞擦的”四个区别特征的有无,最终确定声母q。
图2 声母“q”判决路径
将样本中所有单音节进行上述声韵母判别,判别结果用于正检率的计算,计算方法如下:
对于某一声母或某一韵母,测试集中含有该声母或韵母的单音节样本为a个,在这些样本中,通过区别特征检测出含有该声母或韵母的单音节样本为b个,则:正检率=b/a×100%。
3 实验结果及分析
使用上述流程及计算方法进行正检率计算,含过渡音征语音样本声母正检率与无过渡音征语音样本声母正检率如表4所示,韵母的正检率如表6所示。
表4显示含过渡音征语音样本声母正检率大多在60%以上,平均正检率为63%。无过渡音征语音样本声母正检率大多在60%以上,平均正检率为62%。正检结果偏低,进一步分析表4,可以得出:
(1)参与判别的区别特征个数增多正检率会相应降低,如j/q/x,其中j的判别需要3个区别特征,q和x的判别需要4个区别特征,j的正检率明显高于q和x。同样的情况还存在于z/c/s、zh/ch/sh、b/g/d等声母判别中。说明区别特征逐层判断存在误判不断累积的情况,参与判别的区别特征越多,正检率就相应越低,但由于各区别特征之间非相互独立,最终正检率并不是各参与判别的区别特征正检率的乘积。
(2)每个区别特征对于判别的贡献程度是不同的,如m有三个参与判别的区别特征:“浊音的”、“鼻音的”和“双唇的”,l也有3个参与判别区别特征:“浊音的”、“鼻音的”和“边音的”,在两者的判别中虽然只有一个参与的区别特征不同,但是正检率差距较大,说明区别特征“双唇的”和“边音的”在声母的判别中,贡献程度是不同的。同样的情况还存在于b/h等声母的判别中。
表4 含、无过渡音征语音样本声母正检率
此外,为观察过渡音征对声母判别的影响,将表4中的含过渡音征语音样本声母正检率和无过渡音征语音样本声母正检率进行如下对比分析。
含过渡音征语音样本声母正检率和无过渡音征语音样本声母正检率之间的相对变化率如表5所示,此变化率指的是无过渡音征声母正检率相对于含过渡音征声母正检率的变化率。
由表5可以看出,两组正检率之间的平均变化率为3%,变化幅度很小。将两组正检率进行显著性检验,结果为p=0.319>0.05,即含过渡音征语音样本声母正检率和无过渡音征语音样本声母正检率之间不具有显著性差异,说明从区别特征角度进行声母正检时过渡音征影响很小。
表5 声母正检率相对变化率
韵母正检率结果如表6所示,语音样本为含过渡音征的语音样本信号,正检流程如图1中韵母部分所示,计算方法与声母相同。
表6 韵母正检率
表6显示韵母正检率大多在50%以上,平均正检率为54%。相比表4中含过渡音征声母正检率,正检结果偏低,进一步分析表6,可以得出:
(1)韵母正检率同样存在参与判别的区别特征个数增多正检率降低的现象,如无介音韵母o/ou/ong,其中o的判别需要4个区别特征,o和ong的判别需要5个区别特征,o的正检率明显高于ou和ong。同样的情况还存在于a/ai/ao、o/ou/ong等韵母的判别中。韵母正检率同样存在不同区别特征对于判别的贡献程度不同的现象,如ia有4个参与判别的区别特征:“合口的”、“齐齿的”、“低的”和“后的”,iong也有4个参与判别的区别特征:“合口的”、“齐齿的”、“低的”和“开尾的”,在两者的判别中虽然只有一个区别特征不同,但是正检率差距较大,说明区别特征“低的”和“开尾的”在韵母的判别中,贡献程度是不同的。同样的情况还存在与ai/ao/an/ang等韵母的判别中。
(2)韵母中含有的音位越多,其正检率越低,如a/ai/ang、o/ou/ong、i/in/ing、u/ua/uai/uang等,音位增多的同时韵母正检率呈现由大到小的变化趋势。韵母中含有的音位增多,发音时口型和舌位都会发生不同程度的变化,区分难度随之增加,造成了正检率的降低。
(3)韵母按内部结构的不同,可以分为单韵母、复韵母和鼻韵母三类,鼻韵母所占比例最大,有16个。由表6可以看出鼻韵母正检率普遍较低,平均正检率为46%,相比于单韵母和复韵母低得多。韵母按韵尾情况分为无尾韵母、元音尾韵母和鼻音尾韵母三类,将这三类韵母正检率分别求平均值的结果如表7所示。
表7 按韵尾情况分类韵母平均正检率
由表7可以看出,无尾韵母正检率较好,鼻韵尾韵母正检率较差。鼻音相关韵母一直是韵母识别与评测中的难点,在论文[5]进行韵母区别特征“鼻韵尾的”的正检时就存在结果不理想的情况,鼻音相关的区别特征参数应进一步研究,必要时可尝试其它声学参数。
(4)含过渡音征声母正检率和韵母正检率,两者所用语音信号样本相同,但对比表4和表6可以发现声母的正检率明显好于韵母正检率。对比声韵母区别特征理论体系,韵母的区别特征体系相对复杂,许多韵母在判别中涉及的区别特征多,误判累积也会相应增多,在目前的韵母参数研究中仍有个别特征参数选取不够理想,需改进。
综上所述,从区别特征角度进行单音节中声母的检测时过渡音征问题影响很小,建议忽略。韵母中音位增多正检率随之降低,部分区别特征参数应进一步研究,必要时可尝试其它声学参数。参与判别的区别特征个数增加会造成误判累积,而且各个区别特征对最终的判别贡献程度是不同的,因此有必要对各区别特征进行权值设定,以降低误判的累积程度。
4 结论
区别特征单音节检测中声母和韵母的平均正检率可以达到60%左右,表明区别特征应用于单音节测评是可行的。但总体来说正检率偏低,这说明已有的区别特征参数仍需改进后才能应用到普通话语音评测当中。
对比含过渡音征语音样本声母正检率与无过渡音征语音样本声母正检率,两者之间的显著性检验结果说明两者之间不具有显著差异,因此从区别特征角度进行单音节检测时建议不考虑过渡音征。
韵母区别特征体系相对复杂,口型和鼻音相关区别特征对最终判别结果影响较大,应进一步研究,或尝试其它声学参数。
各区别特征之间的相互影响及误判率的累计都可能造成评判结果不理想,应当确定每个区别特征对于声母或韵母判别的贡献程度,根据每一个区别特征的在评判时的重要性进行权值的设定,权值的设定可以将区别特征之间的相互影响和误判累积程度降低。不仅如此,区别特征参数是根据已有的数据结果,按照统计判别的最佳标准而设定的,而没有结合评测人员的主观经验,完全依赖标准数据得到的参数是片面的,最终的评分机制应与主观测评相结合的合理评分机制。这也是下一步需要进行的工作。
[1]张家騄.汉语普通话区别特征系统[J].声学学报,2005,30(6):506-514.
[2]陆致极.试论普通话音位的区别特征[J].语文研究,1987,(4):10-21.
[3]章斯宇.基于言语知觉特性的普通话区别特征系统研究[D].北京:中国传媒大学博士学位论文,2011.
[4]徐益华.自然音节状态下声母区别特征检测[D].北京:中国传媒大学硕士学位论文,2015.
[5]李戈.自然音节状态下韵母区别特征检测[D].北京:中国传媒大学硕士学位论文,2016.
[6]戚建宇.普通话单字发音客观评价方法研究[D].苏州:苏州大学硕士学位论文,2006.
[7]陈丽霞.基于声韵母基元的汉语语音识别系统[D].南京:南京理工大学硕士学位论文,2005.
[8]汤霖.普通话声母的客观评测[J].计算机应用.2010,(6):30-4.
[9]刘振安.基于特征比较的语音评分方法研究.计算机应用[J].2005,(12):25-12.
[10]郑世杰.基于语音自动评测的普通话学习系统的研究[D].哈尔滨:哈尔滨师范大学硕士学位论文,2015.
[11]吕军,基于语音识别的汉语发音自动评分系统的设计与实现[J].计算机工程与设计,2007,(3):28-5.
[12]冯晓亮.普通话辅音的参数化区别特征体系构建[D].北京:中国传媒大学博士学位论文,2009.
(责任编辑:王谦)
Effect of Initial-to-Final Transition in Detecting Syllables by Distinctive Features
PENG Meng-ya,LIU Ya-li
(Communication Acoustics Laboratory,Communication University of China,Beijing 100024,China)
In order to apply distinctive feature theory in Mandarin evaluation technology,it is necessary to analyze the feasibility of application of distinctive features and effect of initial-to-final transition in detecting syllables.By extracting acoustic parameters and distinguishing layer by layer,the initial and the final in a syllable can be determined uniquely.The detective accuracy of initials in speech samples with initial-to-final transition and speech samples without initial-to-final transition shows no significant difference,so initial-to-final transition is suggested to be ignored in in detecting syllables by distinctive features.The results obtained in this paper can provide a reference for further applying the distinctive features to the objective evaluation of Mandarin.
distinctive features;initial-to-final transition;computer-assisted assessment system
2017-04-14
彭梦娅(1992-),女(汉族),安徽阜阳人,中国传媒大学硕士研究生.E-mail:yl_liu@cuc.edu.cn
O
A
1673-4793(2017)04-0064-06