怀宁方言高洪片单字调实验研究*

2020-08-28徐奋奋

安徽农业大学学报（社会科学版） 2020年4期

徐奋奋，夏强

(1.安徽广播电视大学文法与教育学院，安徽合肥 230022；2.安徽广播电视大学科研处，安徽合肥 230022)

怀宁县位于安徽西南部，怀宁方言隶属赣方言怀岳片，其内部又分为两个方言小片：靠近江西赣语区的石牌小片(包括石牌镇和皖河区)和靠近江淮官话区的高洪小片(包括高河、新安、月山、三桥、黄龙、洪镇六个区)[1]。石牌镇靠近赣语区，并作为2002年之前的怀宁县城，石牌小片的方言研究得较为充分，《怀宁县志·方言》《安徽省志·方言志》均将石牌小片作为怀宁方言的代表。高洪小片与石牌小片在日常交际上没有什么困难，但在听感上有较大差异，在声调的调值调类上也有显著区别。目前对高洪小片单字调的研究以听辨法为主，调值调类的判断依据听者的感知，主观性较强。本文以隶属高洪小片的秀山话单字调为研究对象，采用实验语音学的方法对秀山话的声调系统作定量分析，以与传统定性研究相互补充。

一、高洪小片声调研究现状

当前对怀宁方言声调的研究较少，在知网上以“怀宁方言”“赣语怀岳片”等为关键词查找并筛选，只找到相关论文15篇，其中明确以语音或音韵为研究对象的有9篇，分别是《皖西南方言语音研究》[2]、《怀宁话高洪片语音系统》[3]、《怀宁方言高洪片单音节声调实验研究》[4]、《安徽怀宁方言语音研究》[5]、《皖、鄂、赣交界区域三片方言的音韵比较研究》[6]、《皖西南赣语精知庄章组声母的今读类型及演变》[7]、《皖西南赣语古清去字按韵尾分调现象考察》[8]、《皖西南赣语来母细音前今读塞音现象考察》[9]和《鄂皖交界地带方言[]类韵的形成及演变机制考察》[10]。其中《皖西南方言语音研究》以石牌小片为研究对象，徐建的4篇论文研究对象均包括石牌小片和高洪小片，其余4篇则以高洪小片为研究对象。其中除《怀宁方言高洪片单音节声调实验研究》是以实验语音学的定量方法研究语音，其余4篇均以传统方言学的听辨法对语音作定性分析。而《怀宁方言高洪片单音节声调实验研究》一文因写作时间较早，在将基频值归一时采用的是T值法，但作者没有给出实验的原始数据，并在“实验过程”一节中提到了“平均值和标准差”，因此无法判断作者使用的是否是石峰的T值法还是线性z-score法。另有标题虽未直接提及，但在文中对高洪小片单字调现象有论述的论文4篇，分别是《马庙镇方言调查研究》[11]、《怀宁方言的归属》[12]、《中古入声字在徽语中的演变研究》[13]和《怀宁方言的接触现象初探》[14]，以上4篇均是从音韵学的角度研究。本文将已发表论文中对高洪小片调类和调值的研究结果归纳为表1。

表1 高洪小片调类和调值的研究结果

从表1可见，研究者基本确定高洪小片有6个调类，包括阴平、阳平、上声、阴去、阳去和入声，但在具体的调值上分歧较大。阴平从221到41，阳平从13到35，上声从212到325，阴去从214到51，阳去从21到43，入声从44到55，阳去甚至还有有无的分歧。这其中部分原因是由于听辨法受研究者主观影响较大，对比例标度的选择没有统一的标准，因此本文采用朱晓农的对数z-score(LZ)法[15]3对高洪小片的单字调进行研究。五度制以比例标度为基础，对数法不但与比例标度对应，而且能够减少偏差。同时LZ法的定量研究建立在全部测量值的基础上，其数据还可供其他研究者进行人际比较时使用。

二、高洪小片单字调研究的实验方法

(一)声调的承载段

林茂璨通过实验发现，以零声母和浊声母开始的字音，音高曲线与字音同时开始；以清声母开始的字音，由于声母为噪音，故无调子高低之感，因此音高曲线从韵母开始。但不论声母清浊，音高曲线都随字音的结束而终止。但在有的情况下，不论声母清浊，音高曲线在开始时出现上升的弯头；不论韵尾是元音、鼻音或是无韵尾，曲线在结束时出现下降的收尾。实验证实弯头与字音性质无关，其在声调中出现也并无规律可循，因此与声调也无关。降尾段在去声中更易发生，但跟声调及韵尾性质都没有关系，而与发音产生气流的长短强弱有关。弯头和降尾在听辨时人们感觉不到它的存在，可能是声带运动的惯性作用所引起的。因此为了语音测量的准确，将普通话音高曲线分为弯头段、调型段和降尾段。弯头段和降尾段均为无意发出，调型段则为有意发出，因此调型段的音高变化容易为人们所感知，并具有区别意义的作用[16]。Howie进一步认为，普通话声调的定义域在主要元音和韵尾上[17]。Kratochvil在Howie的基础上主张声调分布应排除鼻音韵尾[18]。林茂灿通过感知实验发现在阳平、上声与去声中，弯头与降尾的刺激多被听为平调，或是以比来自主要元音和其过渡段的低灵敏度感知为该声调音高，由此将浊声母、介音、鼻音韵尾和元音韵尾均排除在声调分布区之外，仅留下主要元音及其过渡部分作为单字调的承载段[19]。这个界定非常准确，但在实际操作中落实却有一定难度，一是在真性复合元音上难以界定主要元音[20]；二是假性复合元音经常处在滑动中，难以界定和分开其主要元音及过渡段；三是单元音音节在开头和结尾也会受到弯头段和降尾段的影响，无法截然分开。因此本文采用去除弯头降尾后的调型段，并根据基频走势，结合第二、第三共振峰及音强曲线进行标注。

(二)对数z-score(LZ)归一法

语音信号的表现形式多样，不同的人、同一个人不同时间发出的信号都不一样，但可感知到稳定的范畴。归一化的目的就是消除这种差异，提取稳定范畴，获得音韵学层面的对立特征。LZ基频归一法，即对数z-score法，可以较好地达到这个目的。朱晓农对六种常用归一法(z-score、频域分数、频域比例、对数半音差比、对数z-score和对数频域比例)用标准指数和离散系数为标准进行比较鉴别，认为对数z-score能最大程度减少全部样本上的人际差异[15]8。刘俐李承认LZ法在数据的集中程度上表现较好，但从LZ值到五度制之间的转换不够直接[21]223。本文从减少偏差和数据进一步使用的角度选择了LZ法。LZ法首先需将全部基频值化成对数值，然后计算对数值的均值和标准差，带入z-score公式：

z=(x-μ)/σ

(1)

其中x为某一具体对数值，μ为对数均值，σ为对数标准差。

(三)五度制的转换

刘俐李认为五度制是当前普遍接受的、符合汉语实际的勾勒声调格局的方法，LZ值不能直接转换成五度制，而石峰的T值法与五度制的兼容性更好[21]224。因此大部分研究者在单字调研究中都采用T值法，以方便五度的转换。朱晓农提出将个人的LZ值汇总后求其均值，得到归一化的声调分布图，再将纵轴分为四份(基于他的分域四度理论)[22]。本文略加修改，将纵轴根据五度制等分为五份。丁琳受LPOR法的启发，基于95%的置信水平，确定了LZ值归一后的五度上下限位-c和+c，c的范围是0～3，取2和2.5最为合适。当置信区间在[-2，2]之间时，置信水平可达95.4%。c的取值首先应考虑具体情况，在包括特征点的基础上尽量置于这个区间即可[23]。

三、高洪小片单字调研究的实验过程

(一)实验准备

怀宁方言高洪小片的调类目前尚无异议，统一为6个调类，在设计字表时，按照公认的6个调类列出字表(见表2)。

表2 例字表

选择两名怀宁县秀山乡男性作为发音合作人和老年男性、青年男性的代表。男发音人M1年龄72岁，高中学历，退休职工。一直生活在秀山乡，有短期外出经历，亲属均为当地人，日常交流使用秀山话，会说带有浓厚秀山口音的普通话。男发音人M2年龄41岁，本科学历，高校在职行政人员。18岁之前一直生活在秀山乡，亲属均为当地人，与当地亲属朋友交流均使用秀山话，会说标准的普通话。

采用的录音设备为ASUS笔记本。Blue Raspberry专业电容便携式麦克风，比特精度为16bit/24bit，频响范围为20Hz-20kHz。ASUS XONAR_U7_MKII 7.1声道外置USB声卡。录音软件使用cool edit pro2.1多轨录音和音频处理软件，设置采样率16000，单声道，采样精度16位，音频文件保存为“Windows PCM(*.wav)”。用praat6.1.08语音处理软件分析和标注语言的语音信号。SPPAS语音标注音段自动对齐软件，当样本数量较多时，能够较大幅度提升工作效率。支持中文语音标注，但对方言的标注尚不完善，在其自动标注后，还需人工根据语音信息仔细调整内外边界。用Microsoft Office Excel 2016记录数据、统计分析并制作图表。

(二)实施过程

第一步，使用上述录音设备在安静的室内将字表发给两位发音人，发音人熟悉字音后在自然状态下读字表，每个字读一遍，合计收取120个样本。

第二步，将保存的音频文件导入praat中，在频谱图中去除弯头段和降尾段，保留调型段并生成TextGrid文件后运行“将连续声音文件切成小单位文件”脚本，把录制的连续音频文件切分为单字文件，共120个文件。

第三步，将保存的各文件逐一导入praat软件中，生成pitch对象，参照宽带语图，手工删除、增加或移动基频点。对丢失基频需要精确修改的，借助窄带语图在pitchTier对象里执行补点操作。修改后的文件均保存为pitchTier。

第四步，语音标注。分为自动标注和人工标注。自动标注由SPPAS完成，人工标注则根据语图，对标注错误的边界或音标进行修正并保存。标注分为三层，第一层为“hz”(汉字层)、第二层为“yb”(音标层)、第三层为“sd”(声调层)(见图1)。

图1 秀山话“杯”phei的声调语音标注示意图

在praat中运行“提取时长及基频信息”脚本，每个样本获取十等分点上的基频数据，加上声调开始时的基频数据，合计11个。运行完成后，将所有数据导入Excel 2016中，按照0%、10%、20%、30%、40%、50%、60%、70%、80%、90%和100%的顺序排列。

(三)数据处理

包括LZ归一化、五度制转换和声调作图。对数z-score(LZ)归一的步骤包括：求基频均值，化为对数，求对数值的均值和标准差，带入z-score公式，将两人的LZ值平均，根据最大值和最小值确定五度值的上限和下限，纵轴五等分并归一化到1～5的范围内作图，采用等长时间作图方法。

四、高洪小片单字调实验语音数据分析

(一)基频及基频曲线图

根据测量的数据，计算每个测量点上数据的平均值和标准差，单位是赫兹。计算后的数据见表3和表4，其中m为平均值，s为标准差，n为样本数。标准差反映了数据集的离散程度，0%和100%处会由于声母或是声带的影响出现个体差异而导致标准差可能偏大，其他测量点的标准差均小于20，结果可信。

表3 M1单字调基频均值及标准差(n=60) Hz

表4 M2单字调基频均值及标准差(n=60) Hz

根据表3绘制M1基频曲线图(见图2)，根据表4绘制M2基频曲线图(见图3)。

图2 M1基频曲线图

图3 M2基频曲线图

两者的基频曲线图都较为集中，M1的基频为110～200，M2的基频为80～160，M1发音绝对频率较高，M2较低，这与声带松紧和发音习惯有关，也与基频本身分布不均衡、呈正偏差有关，但声调的总体趋势是相同的。

各调类基频曲线见图4～图9。

图4 阴平基频曲线图

图5 阳平基频曲线图

图6 上声基频曲线图

图7 阴去基频曲线图

图8 阳去基频曲线图

图9 入声基频曲线图

由各基频曲线图可以看出：阴平整体呈下降趋势，且为缓降型。阳平则平缓中略有上升。上声为曲折调,有明显的曲折变化。去声可以分为阴去和阳去，阴去整体呈下降趋势，幅度较大，并可分为直降型和缓降型，M1为缓降，M2为直降。阳去的趋势为下降，但在下降幅度上，M1与M2有明显差异。入声则整体较为平缓，尾部略有下降。这只是根据基频数据做的初步分析，由于以赫兹为单位的原始基频值固有的本身分布不均衡，还需要将两者的数据进行归整后进一步查看。

(二)单字调基频数据的归一化处理及五度转换

1.单字调基频数据的归一化处理

采用对数z-score(LZ)法对基频进行归一化处理。首先将M1和M2的数据(已经是原始数值的平均值)对数化，对数化后取均值和标准差，并带入z=(x-μ)/σ公式计算。需要注意的是：调型段的开始和结束部分会受到弯头、降尾和声母的影响。单字调在0%时刻点的基频值会受声母和弯头的影响而使得标准差增大，“反映了由辅音引起的基频波动在不同的人身上所产生的很大的不同效应，所以最好略去不顾”[24],故在基频归一时所有调类在0%时刻点的值不列入计算。从基频曲线图可见，阴平、阴去、阳去是降调，由于上声的凹点是喉门主动控制的最低点，即说话人主动把基频降到这个特定的高度后再往上升，是个人际常数。而由图2和图3可见，阴平、阴去和阳去的基频降尾超过了上声的凹点，说明这三个声调的基频终点是降调的自然结果，理论上它们可以自由地下降到低频区的任何位置，由此可见阴平、阴去和阳去的终点基频是个依人而定的变量，所以在提取声调的不变性质的过程中应当去除[15]9。入声在100%时点的基频值反映的是音节尾声带关闭阶段，且其下降调型的尾部与降尾段的界限难以截然分开，故基频归一时入声在100%时刻点的值也应当去除[15]8。综上所述，所有声调在0%时刻点的值，阴平、阴去、阳去和入声在100%的基频值，由于其因人、依音段不同而不同，具有更大的随机差异而不被列入计算。单字调基频进行LZ转换的最终结果见表5。

表5 单字调基频数据的LZ值①

绘制成调型图见图10～图15。

图10 阴平LZ值图

图11 阳平LZ值图

图12 上声LZ值图

图13 阴去LZ值图

图14 阳去LZ值图

图15 入声LZ值图

2.五度制转换

经过LZ法处理之后，去除了部分由年龄造成的差异，两个人的曲线在同一声调上较之基频图显示了更大的一致性。但是可以看到，部分声调曲线不够贴合，这是由于偏差值减小的程度不同，也是刘俐李指出的发音人LZ值波动比较大[21]223，但这不影响LZ法是目前归一化程度相对较好的方法。接下来把两个发音人的归一化结果加以平均(见表6)。

表6 单字调基频数据LZ值均值①

由表6可见，最大值为1.73，最小值为-1.66，c取2较为合适，定为[-2，2]，并根据五度制将纵轴五等分，作等长时间LZ值曲线图(见图16)。

图16 等长时间LZ值曲线图

根据曲线图，可以看到阴平是直降型，从4度降到2度，调值定为42。阳平是缓中有升，幅度不大，阳平曲线均在3度内，故调值定为33。上声有明显曲折，上声曲线起点在3度，最低点在2度，最高点在4度，故调值定为324。阴去是一个高降调，从最高点5度降至最低点1度，调值定为51。阳去则是中降调，从3度降至1度，幅度也较为平缓，调值定为31。入声是短促且平的声音，其两端处于4度的高点，稳定段处于5度内，这可能也是入声调值产生分歧的原因：根据曲线两端的区间，可定为44；根据曲线稳定段，可定为55；体现曲线横跨两个区间，可定为45。综合入声曲线的分布状况，以及听感上入声的韵尾已经消失并逐渐舒化的实际，将入声调值拟为55。阳平和入声都为平调，阳平为中平调，入声为高平调。阴平、阴去和阳去虽然都为降调，但是下降的幅度以及所处的音区有差异。下降的幅度上，阴去下降幅度最大，阴平次之，阳去最小。且阴平和阴去均为高降，阳去则为中降(见表7)。