APP下载

语音计量与汉语方言研究*

2016-05-11秦绿叶邵慧君

学术研究 2016年3期
关键词:数理统计韵母声母

秦绿叶 邵慧君



语音计量与汉语方言研究*

秦绿叶邵慧君

[摘要]方言学常用描写法记录语音现象,比较语音差异及分析语音接触。随着方言学的发展,描写法难以满足更多的研究需求,需要结合其它方法作进一步深入探讨。计量方法作为一种较新而有价值的研究技术,越来越多应用于方言语音研究领域。总结这类方法的研究技术和成果,对于推动方言语音研究有重要价值。因此,本研究在汇集各类方言语音研究计量方法的基础上,归纳了方言语音数理统计方法和实验语音统计方法的差异。并探讨了语音计量方法使用的具体步骤、使用要求和相关制约因素及发展前景。

[关键词]汉语方言语音研究计量方法

*本文系2011年国家哲学社会科学基金一般项目“粤西湛茂地区粤、客、闽方言接触研究”(11BYY026,主持人邵慧君)的前期研究成果。

中国汉语方言的语音研究自赵元任以来大都采用音系描写法,[1]能够揭示方言的性质,但解决问题的力度不够。例如在方言接触的语音比较上,虽然能够描写语音接触现象,却无法说明同类方言在不同地区的接触程度和差异程度。因而方言语音研究需要在度上更新,结合使用量化分析方法即语音计量。这是语音定性分析的发展,能够提供数据支持和参考,通过语音计量才能将语音现象和机制研究透彻。

一、语音计量的方法原则

语音计量研究按照内容可以分为少数民族语和方言两大类。方言的语音计量研究包含音标、文字及音韵地位等方面;而少数民族语语音计量研究主要涉及音标。本文主要讨论方言的语音计量,已使用语音计量法的学者有郑锦全、杨鼎夫、薛才德、陆致极、沈榕秋、陈海伦、张梦翰、凌锋等。

语音计量方法有算数统计、概率统计、数理统计法和实验统计法。算数统计和概率统计是最基本的统计方法,计算总样本中符合条件的单位个数和简单百分比。在语音计量上主要用于统计符合某个语音条件的字数和分布的概率,如郑锦全、王士元研究湖南双峰话的中古浊声母变为清声母,[2]还有邵荣芬证明《切韵》的泥母和娘母可以分开。[3]算术统计有时缺乏判断标准,缺陷很明显。数理统计可分为古典概率统计和现代数理统计。运用古典概率统计方法于历史音韵研究的,例如管燮初研究上古音用到古典概率统计。[4]现代数理统计从上世纪80年代进入音韵学领域,如朱晓农《北宋中原韵辙考》用数理统计相逢概率和t-分布检验对北宋中原词人所押韵进行研究。[5]同期,现代概率统计也进入了方言学,从语音角度研究方言。如陆致极对17个方言点在声母和韵母分布方面进行研究,还用相关系数分析来研究《中原音韵》声母系统与现代各方言音系的关系。[6]麦耘认为“数理统计的判断标准有数学上的理据,根据计算结果所下的判断,其基础之坚实,与凭直觉或经验所作的判断相比,完全不是一个层次。”[7]随着语音研究的深入,有些问题采用数理统计方法无法解决,因而出现了实验统计法。这是综合运用实验语音学、方言学和统计学的研究方法,如金健对广州话长短元音进行声学分析及多元方差分析统计以及显著性分析。[8]数理统计法和实验统计法目前较常用,前者较成熟,后者正在发展阶段。

(一)数理统计法。数理统计的原则是对语音的统计项目进行数量计算,根据统计项获得数据表;在数据表的基础上分析语音统计项目的树形结构和聚类结构,从结构中解读语音之间的关系,检验和量化描写分析法中的结论;还可以做显著度的检验分析,说明语音之间差异的程度。根据统计项目的不同,方言数理统计方法,可以分为4类,但是其过程和步骤大体一致。

1.音值分类统计。郑锦全提出,杨鼎夫、薛才德、陆致极等人用它来对不同的方言材料进行分析。陆致极《汉语方言数量探索》一书提到的“汉语方言亲疏关系的数量比较方法”,[9]以汉语方言计算机字典(DOC)所收《汉语方言字汇》(1版)[10]17个方言点2722个字为统计对象。根据字的中古音的音韵地位分成小类,如帮母、东董送合口一等字;再统计小类中方言点发音不同的字数。如表1、表2所示。

表1  帮母字读音分布

表2  东韵送气合口一等字读音分布

2.音值切分统计。沈榕秋、陶芸《上海现代方音的变化速度》采用此方法。他们认为“方言定性研究重视‘位’,而方言定量研究重视‘值’”,[11]他们统计研究同一方言的代际变化,以20个发音人、3477个字为调查材料收集读音,再将每个字的读音按照声韵调进行拆分,形成20个方言发音人的声母、韵母、声调数据库。“假使两人在3477个字中,有347个字的声母不同,那么,两人在声母上的距离是:347÷3477×10000=998,换句话说,两人的声母有9.98%的差异”,[12]韵母计算方法与声母相同。

3.区分特征统计。这是陈海伦《方言间韵母系统相似度测度研究》提出的计算方法,他也以《汉语方言字汇》的字为统计对象,但统计的项目是元音和辅音的区别特征。他认为韵母主要是由元音组成,元音可从区别特征(如唇的圆展,舌位前后)赋值,从而计算出韵母之间的相似度。这些区别特征是从八个标准元音中相邻两标准元音的对立特征而来。辅音构成韵尾,可以从辅音的区别特征(有无阻塞,有无鼻音)进行赋值。赋值之后以字为单位,按韵头、韵腹、韵尾三个部分计算相似度。他的计量原则是“通过求两语音共有特征量与特征总量的比值测度两语音相似度的方法,通过求对应因子相似度的均值测度韵母相似度的方法,构成要素不同的韵母之间,阴、阳、入声韵之间相似度的测度方法,以及韵母系统相似度的测度方法,”[13]从而得到两个方言之间或者多个方言之间的韵母相似度。

4.多状态特征量化编码法。张梦翰博士论文《语言分类及计量的竞争模型》[14]选取吴语古阳声韵韵尾的消失变化特征,通过音变特征规则和历史层次,为多状态的语音特征进行编码,将原始数据数值化,为每一个方言点构建一条特征序列。具体步骤如下。(1)选取多状态特征,根据方言点的音系材料和语音特征,确定该特征的音变规律和历史发展状态。(2)对应方言特征的时间状态,最原始状态的标记为“0”,后续的特征状态标记为“1、2、3……”等,完成特征数值化。

另外,还有民族语的加权比率统计方法,如黄行列举了苗瑶语中符合某类条件的语音元素,计算它们的加权出现比率,计算公式为:

运用这种方法对主客位苗语的声、韵、调进行穷尽式的分析,以判断苗语方言的亲疏关系。[15]加权比率法适用于民族语。

(二)实验语音统计法。这是现代实验语音学基础上发展的统计方法:首先录制语音资料,其次采用语音分析软件对语音特征进行分析,随后用数理统计的方法统计特征并分析结果。例如在声调格局的研究中进行基频的语音分析和归一统计,在此基础上研究方言声调系统格局。辅音和元音也能够采用语音统计法,如张梦翰采用Matlab软件,利用短时语音信号处理技术分析水语的清鼻音材料,找出区分清鼻音和送气鼻音的信号特征。[16]元音也可以采用归一法进行处理。

二、语音计量的制约因素

(一)数理统计的材料。计量的方法选用的材料需要统一规范。如果要使用不同作者的二手方言材料,需要有音系录音材料,然后根据计量需要进行规范统一。在有声调录音数据的基础上,声调的统一可以进行基频归一后,根据朱晓农《声调类型大要》中的各类声调类型进行归类。[17]声母和韵母的统一比较复杂,例如介音和滑音在不同的方音描写系统中有不同的处理方法。韵母有严式记音和宽式记音的区别,音系经过了音位处理,掩盖了字的实际发音。这些问题在进行二手方言材料的处理上都有很多难以处理的问题。凌锋[18]设计的方言单元音韵母格局比较法,有实用性,但是也需要在原始录音材料基础上进行整理才有可比性。

在方言语音处理前,还必要面对一字多读的现象,包括文白读、新旧读法等。还有一些字处于变化中,呈现动态的面貌,例如在粤西某地粤语中有一类入声字韵尾有两种-t和-p,彼此之间没有意义区别等情况。计量的规范统一涉及到在具体操作时应该如何处理这些语音现象。在以往的研究中,这些语音处理的原则和方法都是依靠试验规定,没有具体理由。例如陈海伦对方言韵母相似度的比较,有以下8条规定。[19](l)如果一个字只有训读字音,则此字不统计。(2)一个字有文白异读时取白读,如果白读为训读时仍取文读。(3)一个字有新旧读音时取新读,有文白异读又有新旧读音时仍取新读。(4)一个字有几个异读时取第一个异读音,如果异读中有口语音时取口语音,有几个口语音时取第一个。(5)《字汇》中把广州话、阳江话中出现于零声母后的介音[i] [w]处理为半元音声母[i] [w],因而零声母后韵母少了介音标记,计算韵母对应情况时仍把这些韵母当有介音处理。(6)《字汇》中苏州、温州有半元音声母[j],我们认为有[j]声母的字其韵母实应有一个介音,所以苏州、温州有声母[j]的字,其韵母也当有介音[i]处理。(7)福州话中某些韵母因字调不同而有变韵。计算时不把它们归回原韵,而按《字汇》实际标音处理。(8)对一些韵母的标音进行了修改,例如[au]中的[a]实际发音应为[ɑ],[a]就改成了[ɑ]。这些规定具备解释力,但是都没有根据统计的实际情况进行试验比对。如果要以理服人,则需要对比采用规则前后产生的不同效果,以选择最佳方式方法。对比统计的结果差异,确定统计原则。

在语音数理统计过程中,统计的要求需要收集尽可能多的方言点的文字材料和录音,并对材料按照一定格式编排,放在方言数据处理平台进行操作。每个计量的字要对应中古音的地位,其声韵调要按照规定的格式进行记录,例如送气音有三种不同记录方式,在记录时要统一使用一种,不能混用。

(二)数理统计的方法。数理统计都有现成统计学的公式可以套用,但是统计方法的选择需要进行试用和比照。对于同一个问题采用不同的方法,结果会有差异。例如麦耘用T检验跟用X2检验算押韵问题,结果有时就不同。还有在方言距离关系上也有欧式距离和明式距离可选用。选用哪种方法需要进行试验,比照结果,结合已有的定性研究的结果才能确定。获得统计结果后,对于这些数据还要进行一个还原的步骤,把统计结果和实际研究的问题结合起来,正如麦耘所说“数字是抽象的,它代表的物理意义是具体的。对于历史音韵学者所研究的问题来说,统计结果的物理意义就是语音史上的事实。能不能正确地把数字中蕴藏的信息还原为事实,是个不易把握的问题”,[20]对于方言语音同样如此。

计量方法应用在音类研究上有加权的问题。有的学者不主张加权,例如沈榕秋提到“我们主张不加权。方言定量研究结果应该是客观性的。如果加权,势必使结果带有主观性。方言内部各种特征的地位在定量研究中应该相等”。[21]但由于各音类特征之于亲疏关系的作用或权重大小不同,例如声母清浊的分与合,韵母塞音尾的去留这两个特征在衡量方言的类型时的作用不同,所以加权成为计量法的瓶颈。若要消除这种不真实的影响,就需要给不同的特征以不同的权重,这个权重的设置影响因素太多,各专家依靠经验值有各自不同的看法。因此,以往语音研究一般以描写分析为主,很少使用计量方法。

(三)实验统计的设备与方法。实验统计的录音环境和设备要求较高,需要安静的录制环境,背景噪音不能太高。在田野调查中录音条件较差,小孩哭闹声、家禽叫声和人们交谈的声音经常成为噪音源,影响所录制语料的质量。比较理想、安静的录音地点是在宾馆、教室或把发音人请到专门的录音室录制,由于田野调查的条件限制,也不太容易实现。

在录音设备上,实验统计法需要单指向性较好的话筒(如AKG,铁三角Audio-Technica等)和国外著名厂家生产的声卡(如M-Audio,得胜TAKSTAR),以提高录音清晰度,还需要有配置较高存储量大的计算机(如联想手提笔记本ThinkPad X系列),用于安装录音软件,存储录音材料。常用录音平台和音频处理软件有4类:田野调查系统软件自带的录音软件,如上海师范大学开发的田野调查系统;实验语音处理软件的录音模块,如Praat;专业的音频处理软件录音模块,如Adobe Audition;还有专业录音机,如Tascam。除了录音设备外,还有喉头仪,鼻流计等辅助设备和其他软件用于分析语音。

录音后需要进行处理分析。实验语音处理的前提是要对音节进行声韵切分和标注,切分的方法受个人差异因素影响,而且同样的录音对象因不同的录音环境也有不同录音结果,所以在切分时需要有一定数量的语音统计样本,还要采用稳定可靠的方式方法进行切分。切分和标注一般都是人工操作,虽然采用程序切分样本能够提高切分效率,但是容易忽略在切分中的细致问题。对切分标注好的语料采用哪种统计方法,则需要根据试验比照实际情况来决定。例如在录音中对声调的基频归一就有多种方法,朱晓农总结基频归一的6种方法是:z-score归一法、频域分数法、频域比较法、对数半音差比法、对数z—score法和对数频域比例法。这些方法的作用都是消除录音中的随机差异,减少录音时的发音风格,其原理为“以本人的频域作为坐标,以显示本人的各个声调在此空问中的分布”,[22]让声调实验具有可比性。但在实际操作中,归一方法并不容易决定,需要从实际出发,经过试验才能确定。例如刘俐李在研究江淮声调时,刚开始选用了对数z—score处理方法,但是发现用对数z—score产生了两个问题:第一,各发音人的LZ值波动比较大,难以直接进行多种方言比较,需要再次处理;第二,对数z—score值法不方便声调格局的归整。[23]出于转换五度制的需要,其最终采用了石峰所提出的T值对数法。[24]

三、结语

方言语音的计量研究属于交叉学科,需要结合方言学、语音学、统计学、计算机学等多学科知识进行综合运用。目前看来,方言语音的计量没有方言词汇计量发展得那么全面,面临的难题也比较多。例如,郑锦全[25]在1979年巴黎召开的国际汉藏语言学会议上宣读的论文探讨了汉语方言亲疏关系程度的问题,针对词汇进行了全面分析。而语音形式相关系数的问题,直至1985年陆致极才在郑锦全研究的基础上进行了分析。统计方法运用在语音研究中,需要考虑材料、方法和现实意义方面等因素,受到多种限制,应用起来要面对很多困难。但是语音计量法从统计的角度研究语音,其研究地位不容忽视。麦耘总结统计学在历史音韵学的地位时认为:“发展统计、尤其是数理统计在历史音韵研究中的运用,大有可为,方法上则须更进一步”。[26]同样,发展数理统计,尤其是结合实验语音学和类型学的数理统计,在方言语音研究中虽然有很多困难需要克服,但同时它也是很有前景的一种研究方法。

[参考文献]

[1]陈海伦:《计量语言学说略》,《玉林师专学报》1996年第1期。

[2] Cheng, C.C.and William S-Y.Wang:Implementation of Phonological Change: The Shuangfeng Chinese Case,《王士元语音学论文集》,北京:世界图书出版社,2010年,第154-162页。.

[3]邵荣芬主编:《切韵研究》,北京:中国社会科学出版社,1982年,第33页。

[4]管燮初:《从〈说文〉中的谐声字看上古汉语声类》,《中国语文》1982年第1期。

[5]朱晓农:《北宋中原韵辙考》,北京:语文出版社,1989年,第36-45页。

[6]陆致极:《汉语方言间亲疏关系的计量描写》,《中国社会科学》1987年第1期。

[7][26]麦耘:《汉语历史音韵研究中的一些方法问题》,《汉语史学报》2005年第00期。

[8]金健、张梦翰:《广州方言长短元音统计分析》,《语言研究集刊》2013年第1期。

[9]陆致极:《汉语方言数量研究探索》,北京:语文出版社,1992年,第116-141页。

[10]北京大学中国语言文学系语言学教研室编:《汉语方音字汇》,北京:文字改革出版社,1989年,第1-271页。

[11][21]沈榕秋、陶芸:《上海现代方音的变化速度》,《复旦学报(社会科学版)》1992年第4期。

[12]沈榕秋:《谈汉语方言的定量研究》,《语文研究》1994年第2期。

[13][19]陈海伦:《方音系统的相似关系计算》,《语言科学》2006年第1期。

[14]张梦翰:《语言分类及竞争的计量模型研究》,上海师范大学博士学位论文,2014年,第18-20页。

[15]黄行:《苗瑶语方言亲疏关系的计量分析》,《民族语文》1999年第3期。

[16]张梦翰:《民族语中清鼻音的判断方法》,《民族语文》2011年第2期。

[17]朱晓农:《声调类型学大要——对调型的研究》,《方言》2014年第3期。

[18]凌锋:《跨方言元音系统比较的数据规整方法选择》,《语言研究集刊》2013年第1期。

[20]麦耘:《用卡方计算分析隋代押韵材料》,《语言文字学论坛(第一辑)》,北京:中国社会科学出版社,2002年,第10页。

[22]朱晓农:《基频归一化:如何处理声调的随机差异?》,《语言科学》2004年第2期。

[23]刘俐李:《江淮方言声调实验研究和折度分析》,成都:巴蜀书社,2007年,第9页。

[24]石锋、廖荣容:《语音学丛稿》,北京:北京语言大学出版社,1994年,第17页。

[25] Chin-Chuan Cheng,“A Quantification of Chinese Dialect Affinity”,Studies in the Lingnistic Sciences,no.12,1979.

责任编辑:陶原珂

作者简介秦绿叶,华南师范大学文学院博士生、广东技术师范学院机电学院教师(广东广州,510665);邵慧君,华南师范大学文学院教授、博士生导师(广东广州,510631)。

〔中图分类号〕H07

〔文献标识码〕A

〔文章编号〕1000-7326(2016)03-0172-05

猜你喜欢

数理统计韵母声母
声母韵母
线上线下混合教学模式在概率论与数理统计课程中的应用
数学实验在概率论与数理统计中的教学应用
上古汉语*kl-、*kr-类声母的舌齿音演变
声母顺口溜
声母歌
单韵母扛声调
《湘水韵》及其编撰原理要点
基于数理统计方法的发动机关键零部件加工误差统计分析系统
论《概率论与数理统计》教学改革与学生应用能力的培养