APP下载

音高处理方法的比较研究

2016-12-10谭菊英

关键词:基频声调音高

谭菊英

(上海大学 文学院,上海 宝山200444)

音高处理方法的比较研究

谭菊英

(上海大学 文学院,上海 宝山200444)

声调的音高主要取决于基音中的频率(基频),基频负载着声调的主要区别特征。然而处理音高(基频)的方法有很多种。文章以普通话为例,通过T值法、LZ值法和基频直接分析法发现T值法、LZ值法分析声调的结果一样。但是基频直接分析法消除了对数取值本身带来的差异,结果更接近于声调本身。

声调;声学语音学;T值;LZ值法;基频直接分析法

一、引言

声调又叫字调,是音节中具有区别意义的音高变化,是有声调语言的一项基本语音特征,声调的调型和调值成为汉语语音学研究的重要课题,引起了人们的广泛关注。

虽然我国古人很早的时候就已经认识到汉语是有声调的语言,但是如南朝沈约的“四声八病”也只是提出了汉语声调的语音现象。到了20世纪20年代,汉语声调研究有了迅速的发展。赵元任于1922年发表了《中国言语字调底实验研究方法》,主张用实验的方法研究声调。刘复是中国实验语音学的先驱,他于1924年出版了中国第一部实验语音学专著《四声实验录》,揭开了用实验的方法研究汉语语音的序幕,至此,人们才开始认识到声调的实质问题。

从刘复开始,很多学者将语言中单字调的调型曲线画在同一个图里来研究声调[1-4]。声调的研究涉及声调数据的处理,声调的音高主要取决于基音中的频率(基频),基频负载着声调的主要区别特征,因此目前的声调研究都是通过基频分析得出的。处理音高(基频)的方法有很多种,主要有石锋[5]的T值法以及z-score、频域分数、频域比例、对数半音化、对数z-score(LZ)和对数频域比例等声调研究方法。z-score、频域分数、频域比例、对数半音化、对数z-score(LZ)和对数频域比例这六种方法都强调基频归一化[6-7],前三种方法是线性的,后三种方法是对数的。后四种方法是朱晓农[8-10]发展出来的,通过证明和比较,他认为对数z-score(LZ)方法是最好的。这几种方法的具体含义下文将进行阐释。

无论是石锋的T值法,还是以上的六种基频归一研究声调的方法,都是取对数的方法。这里存在一个问题,正如刘复在《四声实验录》一文中声音与对数一章讲到的,以2为底或者以10为底的对数只是为了现成的便利,但是我们用对数表示音的高低,结果只是近似正确。另一方面,上文提到的六种声调研究方法都注重基频归一化,认为归一化能消减录音时发音风格的差异,消除人际随机差异,提取恒定参数,滤掉个人特性,获得具有语言学意义的信息。并且个人各自的归一化以个人的频域为坐标,显示的是个人的各个声调在空间中的分布。但归一化对基频数据取对数会不会带来新的问题呢?比如说一个人的频域范围是100~400 Hz,那么他的频域上限和频域下限的差值就是300 Hz,如果取了以10为底的对数进行归一化,那么频域的差就是log10400(log10400=2.6)减去log10100(log10100=2),结果是0.6。这300 Hz和0.6是不同的处理方法得出的结果,基频归一的目的是要消减差异,这本身又会不会带来新的差异呢?此外,个人各自的基频归一就是以个人的频域为坐标进行声学分析,而如果采用基频进行直接分析,将每个人的频域上限和下限之间的频域范围直接转换为声调的分布区域来进行描写,也能达到个人基频归一化的目的,所以为什么还需要个人基频归一呢?

本文将采用石锋的T值法、对数z-score法(六种基频归一的方法都是取对数,实质是一样的,并且朱晓农推衍了各方法之间的关系,证明了六种方法中对数z-score法是最好的,因此在这六种方法中本文只选取对数z-score法一种)和基频的直接分析三种方法对音高数据进行处理,研讨不同的方法之间是否存在差异?本文均以普通话为例进行分析,即用不同的方法对同一数据进行分析,这样可以避免不同数据之间的差异性对实验结果的干扰,也许更能窥见其间的差异。

二、实验研究

(一)发音人

谭菊英,女,24岁,四川省仪陇县人,所说方言为西南官话。上学开始学说普通话,今普通话水平一级乙等。

(二)调查材料

实验材料的选字均为单字,字表设计的原则主要是:(1)选取单元音韵母a、i、u,一般来说这三个元音是语言中最常见的韵母;(2)从声韵拼合的角度看,能和a、i、u都相拼的只有p、ph、m、t、th、n、l和零声母,因此选取的范围是p、ph、m、t、th、n、l和零声母;(3)在这些能够与a、i、u全部相拼而且阴阳上去四声齐备的只有p、t、l,考虑到t、l的发音部位相同,于是选了同为不送气的p和t声母;(4)除了考虑声韵之外,根据实际的语言状况,还分别选取了a、i、u的零声母字。根据在设计实验字表时,横向上调类一致,纵向上声韵一致,以避免不同韵母由于发音方法和发音部位不同而引起声调的变化。每个调类选取9个字,共36个字,尽量选取常用字(有的声韵调只有一字便只能选此一字),不选多音字。本文单字调的调查材料选字如表1所示。

表1 声调调查字表

(三)录音方法

发音人在录音之前,对表1中的例字进行反复练习,熟悉每个字的读音,避免读错或读为方言音,力求获得准确自然的发音。录音过程在安静的房间进行,录音的采样率为44 100 Hz单声道,解析度为16位。录音时,用Praat软件进行录入,每个字读1遍,时间间隔为2~3秒,用Praat软件进行切音并保存为wav音频格式,每个调类有9个样本。

(四)实验数据处理方法

以上各字的录音,通过Praat语音软件pitch选项提取样本的基频F0数值,实验条件如下:

采样率:44 100 Hz

声道:单声道

频率范围:75~500 Hz

具体方法:首先确定整个声调的起始范围,起点和终点之间的部分即为接下来提取声调基频的时长范围。使用Praat软件“View”菜单中的“Time Steps Setting”功能设置取点距离大致为整个时长的1/10,从起始端至末尾端每个例字共提取11个点。在本文中,提取每个样本0%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%各时刻点的基频值F0,单位为Hz。在提取时,取相对时刻的基频值,即相对百分时刻值的各调类的基频值放在同一横轴点上进行比较,使得基频值有可比性。为了避免Praat间隔取点造成的基频错误,采用窄带语图进行验证对比,如图1和图2所示是窄带图和宽带图间隔取点显示的阴平“啊”在1.637 s的基频。

图1 窄带图

图2 宽带图

如上图所示,在同一时刻点,窄带图的基频226.6 Hz和宽带图的基频226.9 Hz频率差异很小,0.6 Hz的差异在听感上是没有差异的,所以在基频分析时,统一采用宽带图所取的时刻点的数据。另一方面,三种方法都采用所取时刻点的数据,若有差异,也只是基频本身的差异,而并不是分析方法带来的差异。

此外,声调分域的方法有五度制和四度制之分。赵元任的五度制,用来记录声调是够用的,有些场合三度、四度也行,而且有人对世界上的语言做过统计,认为人类所有的语言调位等级没有超过五度的。朱晓农根据六种发声态使用四度制。本文并不研究发声态,因此采用赵元任的五度制。

(五)实验数据的处理

本文旨在分析T值法、对数z-score(LZ)法和基频的直接分析三种不同的方法在音高处理上的差异,下面介绍这三种方法。

1.T值法

其中,a为调域上限频率,即全部音高数据中的最大值;b为调域下限频率,即全部音高数据中的最小值;x为测量点的频率。石锋是这样得出T值的:0~1.0相当于五度值的1度,1.0~2.0相当于2度,2.0~3.0相当于3度,3.0~4.0相当于4度,4.0~5.0相当于5度[5]。

2.对数z-score(LZ)法

LZ=(log10(基频值)-对数平均值)/对数标准差

先求出各调类各个时刻点的基频平均值,即是各声调各个百分时刻的基频值;然后求出各声调11个百分时刻点的基频对数值,即换算成以10为底的对数值;再算出所有对数值的平均值和标准差;最后用归一化公式求出其LZ值,并转换为五度值。

3.基频直接分析法

根据各声调各字在各时刻点的基频,计算出各声调各时刻点基频值的平均值,然后用调域上限频率a减去调域下限频率b再除以5,分域五度,建立和五度制之间的关系,便得出声调的五度值。

(六)实验数据分析

普通话阴平、阳平、上声、去声四类声调的各时刻点基频的平均值 (基频平均值采用四舍五入法,但在excel计算时仍采用原始数据)如表2所示。得到的基频曲线如图3所示。

表2 基频值(单位:Hz)

图3 基频曲线图

接下来用不同的方法对基频进行数据处理。

1.T值法的数据分析

整个四声的基频值中,调域上限频率 (最大值)为380 Hz(380.897 Hz),调域下限频率(最小值)为204 Hz(203.635 Hz),根据T值计算公式得出T值,如表3所示。

根据T值转换为五度值,如图4所示。

图4 T值转换为五度值

2.对数z-score(LZ)法的数据分析

根据LZ值的计算公式,得出LZ值如表4所示。

表3 T值

表4 LZ值

LZ值转换为五度值,如图5所示。

图5 LZ值转换为五度值

3.基频直接分析法的数据分析

整个四声的基频值中,调域上限频率 (最大值)为380 Hz(380.897 Hz),调域下限频率(最小值)为204 Hz(203.635 Hz),二者基频相差大致为176 Hz,根据基频作图如图6所示。

图6 基频直接分析法

三、结语

从图上看,我们实验所得的普通话的声调调值是:阴平11(或22)、阳平25(或35)、上声212(或313)、去声53(或52)。声调调型和资料上的普通话声调调型一样,调值有很大差异。像11或22、25或35、212或313、53或52这样的差异,如石锋所说,“声调格局中,每一声调所占据的不是一条线,而是一条带状的声学空间”,可见声调的起始位置都不同,更遑论声调的带状空间了;另一方面在确定声调调值的时候,我们会考虑调头和调尾的因素,可能得出的声调调值差异不大,但这是我们在确定调值认为处理差异之后的结果,而声调本身的差异我们是不能忽视的。造成实验所得调值和普通话调值55、35、214、51差异大的原因,一方面可能是发音人方言声调对普通话声调的影响,另一方面发音人数量太少造成统计意义不显著。这里需要说明的是,本文旨在考察不同处理音高的方法之间的差异,而不是实验研究普通话的调值,所以通过对同一发音人的数据进行分析,便窥见不同方法之间的差异,这并不受发音人数量以及发音人本身的影响。

从图4、图5和图6来看,图4和图5完全相同,即图4、图5反映的声调调型和调值完全相同。T值法和LZ值法虽然计算方式不一样,但它们的实质是相同的,都是采用对数后的基频数据进行比较分析,这也就是二者相同的原因。

图6显示的声调调型的形态和图4、图5是一样的,但仔细观察发现图6中声调的调值不一样,尤其是声调起始点的位置。阴平都是低平调,但图6中的阴平在1度的上部,未到2度的位置,而图4和图5中的阴平都在2度的下部。阳平都是升调,图6中阳平声调大概有1/3的部分处于1度区间的中上部,而图4和图5中阳平全部在2度及其以上的范围内。上声都是曲折调,图6中上声的起点位置在2度区间的中上部,中间最低点大致有1/6的位置在1度的底部,结束的位置在2度与3度的交界处,而图4和图5的上声起点位置在3度的下部,中间最低点接近1度的底部,但未到底部的位置,而结束的位置在靠近三度中部的位置。去声都是降调,图6中去声结束的位置在五度值中的2度的上部位置,而图4和图5中去声的结束位置在3度的中下部位置。

通过比较分析,我们发现T值法和LZ值法分析处理声调音高的结果是一样的,即声调的调型和调值是一样的,但是二者都采用了取对数的方法,使得二者的调型虽与基频的直接分析法相同,但在调值尤其是声调的起始位置上有很大差异,所以我们认为基频的直接分析法对音高的处理消除了对数化带来的差异,更接近于声调本身。

[1]黄伯荣,廖序东.现代汉语增订第四版:上册[M].北京:高等教育出版社,2007.

[2]焦立为,冉启斌,石锋.二十世纪的中国语音学[M].太原:书海出版社,2004.

[3]林焘,王理嘉.语音学教程[M].北京:北京大学出版社,2013.

[4]屈梅娟.东平方言声调的实验研究[J].科教文汇,2014(3):83-84.

[5]石锋,廖荣蓉.语音丛稿[M].北京:北京语言学院出版社,1994.

[6]宋益丹.汉语声调实验研究回望[J].语文研究,2006(1):41-45.

[7]吴宗济.赵元任先生在汉语声调研究上的贡献[J].清华大学学报(哲学社会科学版),1996,11(3):58-63.

[8]朱晓农.上海声调实验录[M].上海:上海教育出版社,2004.

[9]朱晓农.基频归一化——如何处理声调的随机差异?[J].语言科学,2004(3):3-19.

[10]朱晓农.语音学[M].北京:商务印书馆,2013.

责任编辑:吴强

Com paring Study on Pitch Analysis M ethods

TAN Juying
(School of Liberal Arts,ShanghaiUniversity,Baoshan Shanghai200444,China)

The pitch of a tone mainly depends on the fundamental frequency,which loads the main distinguishing features of tones.Nonetheless,there aremany methods to analyze the pitch.Taking Mandarin as an example,by using the T valuemethod, LZ value method and fundamental direct analysis it shows that the result of the tones between T value method and LZ value method are the same.But the pitch direct analysismethod eliminates the differences of the logarithmic values and the result is more close to the tone itself.

tone;acoustic phonetics;T value;LZ valuemethod;the pitch directanalysismethod

H172.3

A

1673-8004(2016)04-0044-05

2016-03-14

谭菊英(1990— )女,四川仪陇人,硕士研究生,研究方向实验语音学。

猜你喜欢

基频声调音高
语音同一认定中音段长度对基频分析的影响
基于时域的基频感知语音分离方法∗
里盖蒂《小提琴协奏曲》中的“双律制音高组织”研究
声调歌
拼音宝宝扛声调
桥面铺装层对中小跨径桥梁基频影响分析
坐着轿车学声调
单韵母扛声调
改进音高轮廓创建和选择的旋律提取算法
序列的蜕变——皮埃尔·布列兹室内乐作品《无主之槌》音高组织初探