彝语北部方言元音声学特征及其相关技术研究
2022-01-15陈顺强郭利芳
陈顺强,郭利芳
(1.西南民族大学民族文字信息处理研究中心,四川 成都 610041;2.四川省社会科学院民族与宗教研究所,四川 成都 610041)
语言声学是运用声学的方法来研究语言的产生、传递、感知和处理等问题的一门声学分支学科,在语言学领域也被称为实验语音学、仪器语音学[1].诚然,19世纪后期语音学研究技术已被语言学家运到语言研究范畴,但X光射线未出世之前语音学的研究都未进入科学的实证时代,德国科学家伦琴发明了X光后并运用到语音学研究领域,是语音学研究历程的一大飞跃,语言学研究的一个里程碑,标志着语音学从传统走向科学、走向现代化.当然语音学研究历经发展、萌芽、普遍运用几个阶段,其中最为广泛应用和肯定的是计算机技术被引入到语音学研究领域,从此计算机及其相关信息技术成为“实验语音学的研究工具”.
早期我们国家的语音学研究主要集中于对地方方言的声调和乐律的研究.20世纪初期,赵元任、刘复、李方桂、王力、岑麒祥、周辨明等人怀着“以西方之学术灌输于中国,使中国日趋于文明富强之境”的理想,赴欧美学习[2].这些老一辈语言学家回国后,在国内建立了语音实验室,开展了创造性的研究先河,“运用实验语音学方法系统地、整体性地对汉语声调进行研究,应是从刘复的《四声实验录》开始的[2].刘复的《汉语字声实验录提要》(1925),赵元任的《中国言语字调底实验研究方法》(1922)《北平语调的研究》(1929)《汉语的字调跟语调》(1933)《音位标音法的多样性》(1934)等,这些都是早期中国实验语音学方面最具有代表性的著作[2].他们引入和传播了现代语音学新思潮,开辟了中国语言学研究的新方向,拉开了新序幕,为语音学研究奠定了坚实的基础.在此基础上培养了一大批本土研究学者,推进中国实验语音学研究的步伐迈入新纪元.
随着科学技术的不断革新,新技术不断涌现,一些物理学、生理学和医学上的先进技术被应用到语音学研究中,致使学者们利用语音信号、嗓音信号、录像信号(视频信号)、电子腭位信号、呼吸信号、心率信号和指电压信号等语音的物理信息和生理信息来研究语音的特性.传统的“口耳之学”和被认为是“边缘学科”的语音学与今天的计算机科学、生理学、物理学、心理学等多种学科交叉后,研究途径越来越宽,越来越备受瞩目,展现出广阔的研究前景.
1 研究技术及方法
本课题是以彝语北部方言区圣乍土语喜德话为研究对象,也就是1980年国务院颁布的“规范彝文”,主要包括规范彝文的10个元音.
基于声学理论和方法,语音产生有三要素即声源——声带振动形成,发音器官爆破或气流摩擦形成;共鸣——声源气流经过声道,声道受到刺激形成共鸣,不同物理性质的声道产生元音共鸣和擦音共鸣;辐射——嘴唇辐射的频谱.
声源是声带在声门下压的作用下往复开合所形成发声源脉冲[3].通过声道共鸣频率方式测量彝语元音基本性质,来研究其声学特征会更加客观和科学.彝语元音共10个:i、ie、a、uo、o、e、u、ur、y、yr.彝语松紧元音对立明显,具有区别意义的特质.其中松元音有i、o、e、u、y,紧元音有ie、a、uo、ur、yr.
1.1 语谱图制作
研究声学特征就得掌握语图绘制与分析,这是极其重要的方式,也是做语音声学分析必备的技术和方法.因为受信息技术发展的因素,早期仪器设备的落后,使得早期用于制作和分析语图的语图仪只能利用电子元件也就是语谱仪对语音模拟信号进行分析.语谱仪的工作原理是语谱仪把语音信号传输到滤波器,滤波器将信号由低到高传输到记录卷纸上,语图信号的强弱由记录卷纸上的颜色的浓淡程度来表示,若输出信号强,记录卷纸上颜色为浓黑,若输出信号弱,信号记录卷纸上的颜色为淡灰,这样得出的图谱就是语音图谱.常用的语谱图横轴也就是水平方向表示时间,纵轴也就是垂直方向表示频率.语谱图反映了语音信号的动态频谱特征,在语音分析中具有重要的实用价值,被称为可视语音[4].
基于MATLAB设计的语谱图程序代码如下:
根据语音信号的特质,语图分为窄语图和宽语图.根据语音声学分析研究的目标,宽带语图可以用于分析元音的共振峰横杠、浊音横杠,擦音频率和冲直条等信号;而窄带语图可以用于分析谐波信号.
如今制作语图和分析语谱图的软件技术比较多,而且分析的结果比较精准,如MATLAB、Praat和AS等.
实验采用语音信号处理软件MATLAB.首先利用专业的录音设备采集语音,当然也可以利用MATLAB自带的wavrecord函数进行录制.
彝语“a”共振峰的提取:
假设a共振峰频率分别是240 Hz、780 Hz、1 050 Hz、2 440 Hz,编写的程序如下:
%根据共振峰发音函数
%SpeechModelGen(len,pitch,sampleRate,f)用来生成语音信号
%其中,len为生成语音长度,pitch是基音,sampleRate是采样率,f1是共振峰频率数组
图2 彝语“a”的共振峰图谱Fig.2 Yi language“a”Formant spectrum
1.2 制作语音的典型波形图与LPC谱
为了更细致地深入分析语音,有时需要对语音的某个小区段进行查看,对辅音元音以及其过渡阶段的波形变化进行分析,以便分析相应的典型波形与线性预测编码(Linear Predictive Coding)LPC谱.在SA中,通常可使用“Waveform,Spgm,Sptrm”视图方式,在Waveform区选择好要分析的起止波形小区段,结合对Spectrogram区对应的语图区段的观察,来微调典型波形的起止位置,在Spectrum区绘制出典型波形相应的LPC谱.
通常,为了更好展示LPC谱,可更改LPC谱的“Parameters”中的上下界限的dB大小,并可适当调整Spectrum区的大小.图3是对一个音节中辅音之后的元音所作的典型波形和与其对应的LPC谱.
图3 语音的典型波形与LPC谱Fig.3 Typical waveform and LPC spectrum of speech
2 彝语元音声学特征分析
2.1 元音/a/语音声学特征
元音/a/发音时候双唇张开,下颌张开张大,软腭紧贴声道后壁,舌根后缩靠近声道后壁,喉头肌肉比较紧张./a/是能自成音节的舌面元音,发音时展唇,所以声学上对/a/的发音描写是“舌面中低展唇元音”.所以彝语元音/a/的发音模型在声学特征中表现为舌位低,开口度大,舌位靠后.
元音/a/的4个声调,即/at/(55),/ax/(44),/a/(33),/ap/(21),从图4元音a的语音波形图可以清晰地看出:音节的声调不同,幅度大小不同,幅度包络不同,时长不同./at/的起始段到持续段幅度大、稳定,末段减小,时长相对较短;/ax/的起始段到中段幅度最大,中段到末段逐渐减小,时长最长;/a/的幅度中间较大,两端较小,时长次长;/ap/的幅度轮廓与/at/类似,但幅度较小,而且带有明显的摩擦成分,显示非周期性与周期性并存现象,时长最短,变化较为急剧.
图4 彝语元音/a/语音波形图Fig.4 Yi vowel/a/phonetic waveform
2.2 元音/ie/语音声学特征
元音/ie/发音时候双唇张开,下颌张开不大微开即可,软腭紧贴声道后壁,舌根后缩靠近声道后壁,喉头肌肉比较紧张.是“舌面前中展唇元音”.
元音/ie/语音波形图(图5)可以看出,其/iet/(55)振动比较大,但比较稳定,结尾部分振幅比较短,比较干脆./iex/(44)振幅相对/iet/(55)小,时长比/iet/(55)长,起始稍有一段小波,结束部分也稍有一点收音的感觉,整体比较未定./ie/(33)相对/iet/(55)和/iex/(44)振幅较大,时长短,给人感觉比较急促./iep/(21)振幅与/ie/(33)和/iet/(55)相对,时长较长,整体不稳定,结束部分振幅较小.
图5 彝语元音/ie/语音波形图Fig.5 Yi vowel/ie/phonetic waveform
2.3 元音/uo/语音声学特征
元音/uo/发音时候双唇张开,下颌张开,软腭紧贴声道后壁,舌根后缩靠近声道后壁,喉头肌肉比较紧张.是“舌面后面半低圆唇元音”.
元音/uo/语音波形(图6)可以看出,元音/uo/的44调、33调和21调,/uo/(33)振幅与/uox/(44)和/uop/(21)相对小,而/uo/(33)与/uox/(44)振幅相对稳定,/uox/(44)时长稍长些,振幅最大的是/uop/(21),但其结束部分稍微拉长,估计了发音人的因素.
图6 彝语元音/uo/语音波形图Fig.6 Yi vowel/uo/phonetic waveform
2.4 元音/ur/语音声学特征
在彝语北部方言圣乍土语中元音/ur/是一个单元音,且不能自成音节,它与辅音组成音节才有区分意义,这里我们要与辅音/b/+/ur/一起组合成/bur/./bur/彝语北部方言圣乍土语中有两个声调即/burx/(44)和/bur/(33)./ur/发音时双唇收拢但不闭合呈扁圆形,下颌微微开,软腭紧贴声道后壁,舌根后缩靠近软腭,舌的最高点在舌面,喉头肌肉比较紧张.是“舌面后高圆唇紧喉元音”.在声学特征研究的时采用最具代表性的/bur/(33)来分析.
元音/bur/语音波形图(图7)可以看出,/bur/(33)从波形上看,塞音开头的音节起始段幅度逐步增大,中间段幅度较大并有一段持续的平稳期,然后又缓慢减小,高频段有一定的摩擦成分和乱纹,呈非周期性和周期性并存现象,能量较强;低频段能量较弱,乱纹少,呈现准周期性.前后有乱纹,说明有塞音、擦音等成分存在.
图7 彝语元音/bur/语音波形图Fig.7 Yi vowel/bur/phonetic waveform
2.5 元音/yr/语音声学特征
元音/yr/是一个单元音,且不能自成音节,它与辅音组成音节才有区分意义,这里我们要与辅音/b/+/yr/一起组合成/byr/./byr/彝语北部方言圣乍土语中有两个声调即/byrx/(44)和/byr/(33).发音时双唇收拢呈圆形,下颌微微开,软腭紧贴声道后壁,舌尖前靠近齿龈前,舌的最高点在舌尖,喉头肌肉非常紧.是“舌尖前展唇紧喉元音”.在声学特征研究的时采用最具代表性的/byr/(33)来分析.
元音/byr/语音波形图(图8)可以看出,前段不规则的比较乱的波纹是辅音/b/的爆破音所致.塞音开头的音节起始段幅度逐步增大,中间段幅度较大并有一段持续的平稳期,然后又缓慢减小,高频段有一定的摩擦成分和乱纹,呈非周期性和周期性并存现象,能量较强;低频段能量较弱,乱纹少,呈现准周期性.前后有乱纹,说明有塞音、擦音等成分存在.
图8 彝语元音/byr/语音波形图Fig.8 Yi vowel/byr/phonetic waveform
2.6 元音/i/语音声学特征
元音/i/发音时双唇展开,下颌基本不张开,软腭紧贴声道后壁,舌尖靠近齿龈前,舌的最高点在舌面,舌根后缩很靠近声道后壁,喉头非常紧.是“舌面前次展唇元音”.可以自成音节,有/it/高平调(调值为55),/ix/次高调(调值为44),/i/中平调(调值为33)/ip/低降调(调值为21).
元音/i/语音波形图(图9)看出,高平调的/it/时长比次高调/ix/、中平调/i/和低降调/ip/都短,振动频率和振幅不是很规则.振幅比较大的是次高调/ix/,4个声调里是最明显的.振幅比较均匀平稳的是/i/中平调,振幅最小的是/ip/低降调.
图9 彝语元音/i/语音波形图Fig.9 Yi vowel/i/phonetic waveform
2.7 元音/o/语音声学特征
元音/o/发音时双唇展开呈圆形,下颌张开,软腭紧贴声道后壁,舌面最高点在舌面后半部分,舌根后缩很靠近声道后壁,所以在语音声学上叫“舌面后半高圆唇元音”.
/o/元音也是能自称音节的:/ot/(55)、/ox/(44)、/o/(33)和/op/(21)4个调.从图10中可以看出4个调的波形振幅各不相同,有大有小有强有弱,/ot/(55)的振幅开始比较大,结束部分慢慢变小,/ox/(44)和/o/(33)波形幅度的纹络比较平缓和稳定,比较相近./op/(21)的波形振幅较小,能量较弱.
图1 语谱图Fig.1 Spectrogram
图10 彝语元音/o/语音波形图Fig.10 Yi vowel/o/phonetic waveform
2.8 元音/e/语音声学特征
元音/e/发音时候双唇展开,下颌张开幅度不大,软腭紧贴声道后壁,舌面最高点在舌面后,舌根后缩很靠近声道后壁,所以在语音声学上叫“舌面后高圆唇元音”.在规范彝语中/e/只有/ex/(44)调和/e/(33)调2个调.
元音/e/语音波形图(图11)可以看出,/ex/(44)和/e/(33)2个的波形包络时长相当,/ex/(44)振幅稍微大些,能量比/e/(33)强些.
图11 彝语元音/e/语音波形图Fig.11 Yi vowel/e/phonetic waveform
2.9 元音/u/语音声学特征
元音/u/发音时双唇合拢,下颌微微张开,软腭紧贴声道后壁,舌面最高点在舌面后,舌根后缩很靠近声道后壁,所以在语音声学上叫“舌面后高圆唇元音”.在规范彝语中/u/不能自成音节只能与其他音节组合后才能有意义.在这里我们选择了/bu/(33)调来分析.
图12彝语元音/u/语音波形图是辅音/b/和元音/u/组合成的音节,波形图的前部不规则是乱纹是辅音/b/的擦音所致,中间元音/u/段包络比较稳定,幅度开始受前面/b/的影响幅度比后半部分大些,能量也比较强.
图12 彝语元音/u/语音波形图Fig.12 Yi vowel/u/phonetic waveform
2.10 元音/y/语音声学特征
元音/y/在彝语北部方言圣乍土语中元音/y/是一个单元,且不能自成音节,它与辅音组成音节才有区分意义,这里我们要与辅音/b/+/y/一起组合成/by/./by/彝语北部方言圣乍土语中有两个声调即/byx/(44)和/by/(33).发音时双唇收拢呈圆形,下颌微微开,软腭紧贴声道后壁,舌尖前靠近齿龈前,舌的最高点在舌尖.是“舌尖前展唇紧喉元音”.在声学特征研究的时采用最具代表性的/by/(33)来分析.
如图13元音/y/语音波形图前段不规则的比较乱的波纹是辅音/b/的爆破音所致.塞音开头的音节起始段幅度逐步增大,中间段幅度较大并有一段持续的平稳期,然后又缓慢减小,高频段有一定的摩擦成分和乱纹,呈非周期性和周期性并存现象,能量较强;低频段能量较弱,乱纹少,呈现准周期性.前后有乱纹,说明有塞音、擦音等成分存在.
图13 彝语元音/by/语音波形图Fig.13 Yi vowel/by/phonetic waveform
表1和表2是元音共振峰参数数据分析.
表1 松元音:i、o、e、u、y的共振峰参数统计表Table 1 Statistical table of formant parameters of pine vowels:i、o、e、u、y
表2 紧元音:ie、a、uo、ur、yr的共振峰参数统计表Table 2 Statistical table of formant parameters of tight vowels:ie、a、uo、ur、yr
3 结论
(1)彝语松紧元音对立方面的方法和理论曾有语言学家所涉猎,本文通过i、o、e、u、y,ie、a、uo、ur、yr10个元音的声学分析,认为由于发音器官声带的是否紧张,紧张程度的大小,口腔和咽腔共鸣的大小,舌的运动部位的前后、高低等等的不同,致使松紧元音的出现.松元音在发音的时候喉头肌肉的紧张程度没有紧元音明显,舌根比较靠后甚至靠近声道后壁,反之紧元音发音时肌肉紧张,舌根比较靠前.
(2)舌位高低与元音松紧有一定的联系.从上面表1和表2中的F1的平均值可以看出,元音/i/的频率值最小为310 Hz,元音/a/的频率值最大为996 Hz.10个元音的F1频率值(这里所说的频率值是指元音共振峰频率的平均值)从大到小依次为:/a/>/uo/>/yr/>/u/>/ie/>/ur/>/e/>/o/>/y/>/i/.F1的频率与舌位的高低成反比,说明元音/a/的舌位最低,元音/i/的舌位最高,其他元音的舌位高低依次是这样的:/uo/>/yr/>/u/>/ie/>/ur/>/e/>/o/>/y/.
(3)舌位前后与元音松紧也有一定的联系.从上面表1和表2中的F2的平均值可以看出,元音/i/的频率最高为2 399 Hz,元音/ur/的频率最低为998 Hz,元音F2的频率值为:/i/>/ie/>/y/>/a/>/e/>/u/>/uo/>/yr/>/o/>/ur/.元音共振峰F2的频率与舌位的前后成正比,说明元音/i/的舌位最靠前,元音/ur/的舌位最靠后,其他元音的舌位前后依次为:/ie/>/y/>/a/>/e/>/u/>/uo/>/yr/>/o/.