APP下载

山东运河区域新派方言语音库建设

2020-11-19翟红华山东农业大学外国语学院

长江丛刊 2020年11期
关键词:新派语料运河

■赵 瑾 翟红华/山东农业大学外国语学院

山东方言属于官话方言区的中原官话、冀鲁官话和胶辽官话的交界区,方言现象非常复杂,有官话方言的特征,也有自己的特点。山东运河区域是指明清时期京杭大运河在山东境内流经的州县及辐射州县,大体包括今枣庄、济宁、聊城三市及德州市的德城、陵县、武城、夏津、平原,菏泽东部的单县、巨野、郓城,泰安市的东平,济南的平阴等近40 个县市。随着时代的变迁,运河区域各方言呈现出老派与新派的差异。老派主要指中老年人使用的方言,新派主要指年轻人使用的方言。老派方言比较稳定,能较全面地反映临某一方言的历史特点;新派方言主要是受普通话影响而形成的,其在语音系统、声调系统等方面均与普通话趋同。

一、山东运河区域方言语音研究现状

为了了解目前学界对山东运河区域老派及新派方言的研究现状,笔者以万方数据库、中国知网、中国期刊全文数据库及中国优秀硕博士论文全文数据库等为检索范围,以“山东运河区域方言语音研究”为主题词对1979-2020年的文献进行了检索,发现相关文献非常之少。再逐一以“某地(山东运河区域的40 个县市区)的方言语音研究”为关键词进行梳理,并重点关注所采集语音数据老派与新派之分。发现目前对山东运河区域方言的语音研究呈现以下几个特点:其一,针对老派方言的研究已较深入,相比之下,关注新派方言发展状况及进行新老派方言对比研究的文献较为不足;其二,多数论文着重研究某一地区主要方言点的整体发展状况及影响;其三,部分论文集中分析某一个方言点的语音数据;其四,少数论文对多个方言点的语音数据进行了对比研究;此外,极少数论文尝试运用先进的音系学理论深入分析语音现象。然而,随着社会的变迁,山东运河区域各方言老派人数呈下降趋势,且各老派方言均不同程度上受到相邻地区的影响。如今,在普通话这一强势语言的影响下,这些地区的新派方言又产生了社会变异,其语音系统、声调系统都在一定程度上产生了变化,关注新派方言的发展、展开新派方言调查和研究势在必行。

二、山东运河区域新派方言语音库建设

语料库(corpora)是应用计算机技术对海量自然语言材料进行处理、存 储 以 供 检 索(retrieval)、索 引(concordance)以及统计分析的大型资料库。基于语料库的研究方法已经成为当代语言学和应用语言学的一种主流方法。建立山东运河区域新派方言语音库的目的就是要建立起一个面向山东运河区域所有方言区的新派方言大规模语音库,并在语音库的基础上,基于语音学的标注,对不同方言区新派方言的音段和语调特征进行研究。

(一)语音语料库的建设方法

1、确定发音素材

在建立新派方言语音库之前,首要的工作是完成发音文本的制作,并检验该文本的可用性。在文本设计时,需要最大限度地考察方言区新派方言的发音特征,使任务类型多样化,尽可能全面、客观地对发音人的语音特点进行概括。语料库中包含大量的朗读语料,可供专家学者针对新派方言特征开展基础研究。

2、确定发音人

山东运河区域大体包括今枣庄、济宁、聊城三市及德州市的德城、陵县、武城、夏津、平原,菏泽东部的单县、巨野、郓城,泰安市的东平,济南的平阴等近40 个县市。每个县市选取两男两女,个别县市内部方言差别较大的,则增加受试人。由于语音库中方言类型为新派方言,因此发音人年龄控制在17 至22岁,必须来自山东运河沿线地区,从小未曾离开家乡到外地生活或求学,且从小以方言为主要交流语言。对其父母也有要求,也是未曾离开本地,平时用方言交流等。

3、控制实地录音

录音过程在专业的录音室完成,在条件不允许的情况下,使用高性能定向话筒、高性能声卡、专门配置的电脑等设备在安静的环境下录制,以尽可能地保证录音质量,确保信噪比在合理的范围内。录音软件委托计算机领域的专家依本次录音实验目的进行开发研制。在该录音软件中,录音界面里可以显示句子、篇章等信息,采样频率为16000 赫兹,存储精度:16 位,单声道。一个单词或一个句子保存为一个独立的“wav”文件,以便于后期进行语音处理和分析。在录音时,发音人配戴耳麦,并坐在电脑屏幕前,录音由操作员来完成。

4、进行语音标注

语音库标注分为基础标注和扩展标注。基础标注就是对正则发音的标注。扩展标注包括语音实际发音的标注和韵律标注。语音库的标注非常费时费力。标注系统是多层次的,采用Praat 标注软件。方言的切分主要依靠手工,符号集用SAMAP-C。

5、实施数据库管理

录音开始前,建立录音人档案,以说明所有实际录音的重要信息,如:日期、说话人的ID 码及个人特性、录音场所及环境、背景噪音源、录音采样率等。

需要指出的是,该新派方言语音库提供给用户的是语音的物理性质和基本文本描述,这些参数在语言学上的意义仍需用户去做进一步的研究和评价,因此语音库是一个描述性的但非评价性的数据库。同时,语音库是一个开放而非封闭性的数据库,可进行后续的补充和修正。

(二)语料内容

山东运河区域新派方言语音库录音语料参考钱曾怡等(2001)《山东方言研究》中的字词,同时也参考中国社会科学院《方言调查字表》(2006)的语料,以保证能够最大限度地考察方言区发音人的方言特征。由于位于运河沿线的这40 个县市区分属于山东方言的西鲁和西齐分片,语料尽量包括了山东方言这两个分片中都包含的、且有该方言特点的语料。文本设计时任务类型多样化,能够比较全面、客观地对发音人的语音特点进行概括。针对方言语音研究,语音语料库中提供的语料内容有:单音节、双音节、三音节,以及短语。单音节尽量包括所有的声母和韵母的组合,且每个音节都包括所有的声调。两字组和三字组语料则主要考虑连读变调的特征,包含了两字组和三字组中所有的声调组合。短语则收集方言常用的特色短语,可供研究者对发音人语音特征进行基础研究。方言语料中还包括焦点句,目的是考察方言发音人在表达焦点句时的发音特征。该句型主要包括所有声调组合的两字组焦点成分,其位于句中时,其前后声调分别包括阴平、阳平、上声和去声的窄焦点句和宽焦点句。方言语料中还包括方言版的“北风与太阳”,目的是考察方言发音人在表达方言篇章时的特征。

(三)依托语音库可开展的研究

该语音语料库可用于调查山东运河区域新派方言的发展状况,了解新派方言发音人的声母、韵母、声调和音变等语音现象,并将其与老派方言和普通话进行对比研究并对此做出音系学的阐释。此外,还可以对运河区域多个方言点进行对比研究。基于语音语料库的研究,其结果具有理论和实践意义。就其理论意义而言,将实验语音学的实证研究方法与理论音系学的理论阐释相结合,是对以往方言研究,特别是新派方言研究的重要补充。就其实践意义而言,对于新派方言的研究不但可以反映出当今山东运河区域方言的真实面貌,在一定程度上预测该地区方言未来的发展趋势并为大运河区域丰富的方言资源的保护与传承提出实际有效的策略,也有利于研究者深入挖掘大运河方言发展历史。

三、结语

山东运河区域新派方言语音库始建于2017 年9 月,耗时两年多建成,覆盖山东运河区域近40 个县市,为今后进行方言对比研究提供了系统完善的语音语料。基于语音库所开展的方言对比研究将极大地丰富山东运河区域新派方言的特征研究。在山东省重点提倡文化建省的大好形势下,这将有助于深入挖掘大运河区域丰富的方言资源,有助于方言保护与传承,有助于国内外相关研究者进一步了解大运河方言变迁的历史渊源及影响。

猜你喜欢

新派语料运河
独占鳌头的运河传奇
海量标注语料库智能构建系统的设计与实现
文化,让运河“活”起来
银河哪比运河乡——《诗咏运河》读后感
浅谈视频语料在对外汉语教学中的运用
可比语料库构建与可比度计算研究综述
运河博物馆:讲述大运河的前世今生
长沙方言的亲属称谓
兴义系军阀派系斗争及其对近代贵州的统治
楚原新派武侠电影诗学:历史、身体与气质