句末“阳平+去声”词语重读时的音高变化
2014-02-13陈艺彤
陈艺彤
(暨南大学华文学院,广东广州510000)
句末“阳平+去声”词语重读时的音高变化
陈艺彤
(暨南大学华文学院,广东广州510000)
韵律处理是语言合成技术的重要部分,了解韵律特征及建立韵律模型是提高合成语言自然度的前提。实验利用Praat软件,在分析了32组语音实验材料,建立音高数据库的基础上,研究句末“阳平+去声”词语重读时的音高变化,初步得出重读时高音点的音高会有明显提高,且变化幅度大于低音点,阳平声调低音点的音高会有所下降的结论。
韵律特征;句末“阳平+去声”;词语重读;音高变化
语音是语言的物质外壳,是人类通过发音器官发出来的、具有一定意义的、目的是用来进行社会交际的声音。随着信息时代的到来,语音合成技术应运而生,它是一项通过机械的、电子的方法产生人造语音的技术。然而,汉语的韵律特征十分复杂,因此,韵律处理是语音合成技术的重要部分。
语流中“韵律特征”(prosodic feature),是通过音高、音长和音强的变化,即“超音段特征”(supra segmental feature)表现出来。韵律特征对合成言语的自然度关系极大,并且也会影响言语(speech)的可懂度[1]。
提高合成语音自然度的前提,就是建立和完善韵律模型。而这一工作的基础,就是要对自然对话的音高模式有一个清楚的认识[2]。音高是构成语音的要素之一,就是声音的高低,主要取决于物体振动的频率。说话者通常通过提高音高,加长时长传递有关句子重音的信息[3]。
所以,笔者在利用Praat软件(www.praat.org),分析了32组语音实验材料,建立音高数据库的基础上,以重音对句末“阳平+去声”调词语音高的影响为重点对语音材料进行了详细的考察。
一、实验方法
(一)实验材料
实验共选用四组实验句,每组实验句中共9个问句和9个答句,句子的平均长度为5个字,句子内部没有明显的停顿,可以看作是一个完整的韵律短语。采用问答匹配的方式,引导句末“阳平+去声”调词语被重读或不被重读。实验句的顺序随机排列。例如:谁答谢韩笑?林慧答谢韩笑。王浩答谢谁?王浩答谢庞迅。陈静答谢谁?陈静答谢唐倩。(划线词语为重读词语)
(二)发音人
在校具有良好普通话背景的北方方言区学生8人,调查对象男女各半。录音时首先给发音人播放问句,要求发音人朗读对应的答句,并将应该被强调的内容正确地、自然地表达出来。发音时要求读音准确,否则及时让其更正重读。本实验报告主要分析其中4名北方学生的发音(以下简称为男一、男二、女一、女二)。
(三)录音
录音在隔声效果良好的语音实验室进行,使用专业录音话筒录音,信号经外置声卡进入电脑,采样率为16kHz,保存为wav文件。
(四)实验过程
1.人工标注音节边界。为了确保研究数据的科学、准确,笔者使用Praat软件(www.praat.org)对音节边界进行了人工标注,利用波形、语图及听感的帮助准确地标注出音节的边界。
2.剔除倍频值。基频提取中会出现基频的倍频值,需要处理。笔者利用Praat软件剔除那些平滑段内偏离均值过大的值,最后对音高曲线进行人工校验,若发现不合理的结果,对原始数据进行纠正或重新测量。
The history of Sino-US space cooperation can be roughly divided into three phases.
3.建立音高数据库。用统计的方法,建立音高数据库,记录句末词语音高的最小值和最大值,观察句末重读音节与非重读音节的音高起止点和音高走势的差异,分析句末词语音高变化模式。
二、实验结果
(一)通过建立音高数据库,并经过统计分析,笔者发现在重读与非重读情况下的句末“阳平+去声”调词语音高变化模式基本有以下三种:
1.重读音节高音点升高,低音点下降
图1 男一“唐倩”重读与非重读的音高情况
图2 女二“庞迅”重读与非重读的音高情况
上图为男一和女二的音高数据,其中,“唐”、“庞”为上声,“倩”、“迅”为去声,因此前字起点与后字终点为低音点,前字终点与后字起点为高音点。从音高走势图可以看出,句中同一位置的同一词语,在非重读情况下,走势比较平缓;在重读情况下,波动幅度比较大,并且高音点的音高升高,低音点的音高降低。
2.重读音节高音点升高,低音点趋近
图3 男二“庞迅”重读与非重读的音高情况
从上图可以看出,男二的高音点的音高在重读情况下明显高于非重读音节,而低音点的音高无论是重读情况还是非重读情况都非常相近,即重读音节高音点升高,低音点趋近。
3.重读音节高音点升高,低音点升高
图4 女一“韩笑”重读与非重读的音高情况
上图中,前字起点、前字终点、后字起点的音高变化模式皆与变化模式1相似,即高音点音高升高,低音点音高降低,而后字终点(低音点),在重读情况下,音节的音高升高。
(二)数据统计
笔者一共选取了24组实验数据,分别进行归类统计,结果如下:
表1 实验数据结果统计
(三)数据分析
通过分析音高数据材料,笔者基本可以得出以下三个结论:
首先,当句末音节被重读时,音高波动幅度较大;当句末音节未被重读时,音高走势比较平稳。如图5所表示:
图5 男一“庞迅”音高变化(上为重读音节,下为非重读音节)
图6 调查者高音点重读与非重读情况高音对比(以庞迅为例)
图7 调查者低音点重读与非重读情况高音对比(以庞迅为例)
其次,当句末音节被重读时,主要体现为高音点的提高。通过分析24组实验数据,笔者发现在三种音高变化模式中,高音点的音高在重读时都有明显的提高,非重读音节音高高于重读音节的概率为0。
同时,高音点的升高幅度大于低音点。王蓓等(2002)认为,重读音节音高升高不受位置的限制,即使在韵律短语末高音点也可以升到很高。低音点在韵律短语末即使升高,升高的程度也很有限。低音点的变化不如高音点自由,受渐降的低音线限制,或者说低音点是被低音线绑住的[4]。
再次,音节重读时,低音点并不是一定表现为升或降。阳平声被重读时低音点下降,而去声调音高时降时升。王蓓等曾提出高音线一低音线渐降的语调模式[4],认为在非重读的情况下,音节在韵律短语首时高音点和低音点更高,在韵律短语末高音点和低音点都相应下降。同时,他们通过问答匹配法,发现当音节被重读时,低音点音节在句末显著升高。认为这可能是句末的低音点,在非重读情况下音高会高于重读情况的原因之一。此外,通过比较几组不同数据之间的音高差异,笔者可以看出阳平低音点(前字起点)在重读情况下往往音高更低,因此重读去声低音点(后字终点)也有可能是受到高音点被重读时音高上升的影响,带动了重读低音点音高的升高。
三、结论
本实验采用统计的方法,通过分析北方方言区在校大学生的语音材料,考察了他们在发音过程的音高变化。其中,具体分析重音对高音点、低音点的音高变化的影响。
通过进行语音实验分析,基本可以确定,重读时高音点的音高会有明显提高,且变化幅度大于低音点,阳平声低音点的音高会有所下降。因此在建立韵律模型时,应注意重音对音节的影响,遵循韵律规则,以此提高合成语音的自然度和清晰度。
参考文献:
[1]许洁萍,初敏,贺琳,等.汉语语句重音对音高和音长的影响[J].声学学报,2000(4):335-339.
[2]王茂林,林茂灿,李爱军.汉语自然对话音高研究[J].声学学报:中文版,2008(2):97-101.
[3]EADY S J,COOPER W E.Speech intonation and focus location in matched statements and questions[J].Journal Acoustic of Social America,1986,80(2):402-415.
[4]王蓓,杨玉芳,吕士楠.汉语语句中重读音节音高变化模式研究[J].声学学报,2002(3):234-240.
The Impact of Stress on the Pitch of the Words with“the Rising tone”and“the Falling Tone”at the End of a Sentence
CHEN Yi-tong
(School of Chinese,Jinan University,Guangzhou 510000,Guangdong,China)
Prosody processing is an important part of the speech synthesis technology.Understanding the prosodic features and building the prosodic model are the prerequisites for improving the naturalness of speech synthesis.Based on the variances of pitch of pronunciation through a set of experiments,and the analysis of three basic models of stressed and unstressed words with“the rising tone”and“the falling tone”at the end of a sentence and the variances ofpitch of those models,we can conclude that“the rising tone”will rise in stressed words with higher amplitude of variantion than“the falling tone”,and the“the falling tone”will decrease.
the prosodic features;“the rising tone”and“the falling tone”at the end of a sentence; stressed words;pitch change
H116.4
A
1007-5348(2014)05-0120-04
(责任编辑:吴有定)
2014-03-09
陈艺彤(1993-),女,湖南郴州人,暨南大学华文学院本科生,主要从事语言学研究。