APP下载

生态语言学视域下胶东方言语料库建设和应用

2024-03-19王文玲强欣宇方小玉

枣庄学院学报 2024年1期
关键词:胶东语料库发音

王文玲 强欣宇 方小玉

(1.鲁东大学 文学院,山东 烟台 264025;2.鲁东大学 辞书编纂与术语协调研究基地,山东 烟台 264025)

20世纪70年代,挪威语言学家豪根(Einar Ingvald Haugen)提出了“语言生态”概念,为语言学研究提供了一种新的角度,也奠定了生态语言学的基础。在国内,许多学者认为生态语言学的核心问题是“语言与环境之间的相互作用”,将“生态”视为一种隐喻,主要研究环境因素对语言表达效能的增强或削弱。[1](P113)当语言所依赖的外部环境发生变化或受损时,语言也会发生变化,甚至可能消失。随着国家通用语的不断普及,方言的活力和作用有所损耗,虽然通用语有着便于交流沟通、理解会意的绝对作用,但仍无法代替方言中的民族文化认同感和情感联系功能。[2](P2)与此同时,方言和生态之间存在着紧密的联系,方言的完善和平衡将影响整个语言生态系统的发展。因此,我们迫切需要从生态语言学的视角对胶东方言展开相关研究。

一、胶东方言及语料库建设

(一)胶东方言

胶东方言是具有独特特点的胶辽官话,在山东省的胶东半岛和辽宁省的辽东半岛广泛使用。作为一种语言,方言具有自己的语音、词汇和语法规律,下面从这三个方面简要总结胶东方言的特点:

1.语音方面

胶东方言语音特点鲜明,而且也会随着地理环境和人文历史因素的变化而有所变化。首先,古清音声母字入声今读上声;其次,古日母字大部分读作零声母;再次,古知庄章三组声母字在不同地区多分为两类声母;[3](P365~366)胶东方言的声调较少,一般分为阴平、上声和去声三种,阳平和去声合并成一类。[4](P74~75)对胶辽官话的不同语音问题进行研究的学者有张树铮、林珈亦(2023)和罗福腾(2016)等,他们研究分析了方言中古知庄章三组声母二分的音值及其与精组声母的关系,以及各方言点尖团音声母读音类型、各方言点今团音声母与其他发音部位声母的分合现象。

2.词汇方面

胶东方言在词汇方面形象生动且富有趣味,如将“松针”叫做“松柴毛”,将“蝙蝠”叫做“元宝户儿”。在胶东方言中,名词、动词和形容词的比例最高,副词次之,而代词和量词的使用频率最低。胶东方言善于在名词后加词缀“子”,在词语后进行儿化,单音节动词也较为常见。针对胶辽官话的方言词汇进行研究的学者有刘辰雨(2017)、周琳(2021)等,他们从不同角度研究了方言特征词的使用情况和变化原因,进而提出相关的方言保护建议,为方言分区问题提供词汇方面的依据。

3.语法方面

相较于语音和词汇,方言中的语法规则与国家通用语的语法规则基本一致,但也存在一些差异较小、独特的语法结构。在构词方面,胶东方言使用了多种前缀和后缀,其中以“子”为后缀的词语较为常见,如“杌札子”“埝子”“泥勒够子”等;还有以“巴”为后缀的词语,如“挤巴”“捻巴”“摁巴”“洗巴”等。在句法结构方面,也存在一些独特的特定句式,如用句式“动词/形容词+人”表示某人的内心感受,所以“够人”就用来表示做事让人厌烦,“噘人”表示骂人等。此外,胶东方言还习惯于频繁使用正反问句,如:“课是没上?”“你是不去上课?”“院里是没下雨?”胶辽官话研究中,付新军(2017)、张明辉(2020)、赵欣(2020)、韩传瑜(2022)等学者分别从句法、词类、构形等方面进行研究,他们研究了青岛方言中的“害+V/A”构式对近代汉语的传承,并分析了该构式在现代方言中的使用情况,为进一步深化胶辽官话研究提供了有益的参考。

(二)方言语料库建设与研究

1.语料库开发建设

语料库能将口头语言转化为书面文字,从而保存了那些瞬息即逝的口头表达,为方言语音语料大规模、系统的调查、收集、储存和研究提供了机会。语料库最大限度地保存和保护了方言语音资料,挽救了濒临消亡的特色方言,并促进了具有社会历史价值的语言文化遗产的发展。

国内学者在方言语料库和语言资源库开发建设方面取得了较多成果。例如,中国社会科学院支持的“北方方言基本词汇数据库”描述了2000多条北方方言的基本词汇;“国家高技术研究发展计划”(简称“863计划”)项目中开发了“四大地方普通话语音语料库”,收录了上海、广州、重庆和厦门四地的方言,并将其分为口语和朗读部分,其中,口语部分设立了160个话题供发音人自由发挥,每个话题控制在4分钟左右,朗读部分总共包含2800句话;北京语言大学开发了“北京口语语料查询系统”,收录了包含84万字的北京口语语料,并根据录音进行了转写、校对和整理;教育部和国家语委开发了“中国语言资源有声数据库”;等等。

2.胶东方言语料库研究

早期学者致力于探讨语料库在语言研究中的重要性。2004年,张绍麒等学者阐述了语料库建设的意义、原则及步骤,进一步说明了胶东方言语音词典编纂的价值;同时,他们还开发了“CADI系统”,详细介绍了语音语料库的建设目标、使用方法和应用途径。基于前人的研究成果,我们可以总结出:在国家通用语的不断推广中,学界开始逐渐重视方言独特的传承价值,但是主要停留在语音层面,而且语料的采集也以自然、日常和原始的口语为主。虽然这些方言语料库为后来的研究打下了基础,但是,不可否认,方言种类有限、收录词汇量不足、原始语音信息缺失以及语料库功能单一等问题尚待优化。

建立语料库,不仅有利于方言资源共享平台建设,更能促进独特方言文化的保护传承。烟台市和威海市作为胶东方言的主要使用区域,保存了相对完整且具有代表性的胶东方言文化,所以对这些地区方言词汇的整理收录富有建设意义和研究价值。未来,语料库的建设和研究应针对以往不足之处,全面收集整理各个层面的语言数据,以提升其服务功能和研究价值。

二、胶东方言词汇语料库建设架构设计

(一)建库目的

1.更好地存储和传承胶东方言

尽管胶东地区的居民仍然使用胶东话进行日常交流,但是随着普通话的推广和人口迁移的发展,胶东方言的语言功能和使用频率逐渐衰退。然而,胶东方言作为该地区文化的主要载体,有必要加以传承,要尽可能多地记录和保存胶东方言的词汇,并保留其原始的有声语料。这是建立胶东方言语料库的主要目的。

2.便于学习和掌握胶东方言

目前,对胶东方言的记录主要是使用汉语拼音或国际音标,但这两种方法都存在一定的局限性。汉语拼音标注方言发音时精确度不高,而使用国际音标标注时,尚未接触过国际音标的学习者在阅读和识读方面会有一定的难度,不利于其学习和模仿胶东方言。因此,建立有声语料库,直接展示发音,将更有助于学习者跟读和学习胶东方言。

3.推进相关学术研究

胶东方言语料库中的词汇资料能在胶东文化研究、国家通用语推广以及外语教学研究等领域产生推动作用。语料库中的录音资料将支持声学特征库的建设和语音合成技术的研发。此外,语料库中保存的当前语料对于历时性和共时性语言研究的开展也具有重要意义。

总之,建立胶东方言语料库,便于学习和传承胶东方言,能够有效推动多个相关领域的研究,而且对于保护和弘扬胶东方言及其文化具有重要的作用。

(二)语料库词目表

学界对于语料库所收集的词汇数量和类别并没有统一要求。在构建语料库时,首先需要根据某个标准设定一个方言词目表。为此,我们主要参考中国社会科学院研究所方言研究室资料室所编订的《汉语方言词语调查条目表》中的词汇分类,拟定《胶东方言语料库词目表》。该表具体构成如下:

1.注音与转写。胶东方言词汇与国家通用语言文字并非一一对应,所以为了实现语音的精确性,主要采用国际音标标注注音,同时辅助使用汉语拼音。

2.翻译与释义。使用对译和意译的形式对方言词汇进行释义。对译是指保持方言词汇的原始结构,进行同步直译。而意译则是对方言词汇进行一定的加工,用更通用的语言进行表达。

3.说明与注释。对方言词汇的原始声音语料的含义、语用场景和使用规则进行说明和注释。例如,“小嫚儿”指的是十几岁的漂亮小女孩,需要清楚,这个词通常是年长者称呼晚辈女孩的,表示亲昵的感觉。单纯从通用语的翻译来看,可能不会有什么问题,但是需要用直观的通用语言进行注释,以阐明该方言词的语用规则和背后隐含的族群文化。

4.统计与分析。使用语用语言模型的方法对词汇的使用频率、分布地点和类别进行统计和分析。

5.归类与整理。词汇作为语言的重要组成部分,充分体现了与众不同的特征和规律。在对词汇进行分类时,应该根据胶东方言在日常生活中的使用频率和情况进行设计。本文主要参考中国社会科学院研究所《汉语方言词语调查条目表》中的词汇分类,将收集的词汇分为29个大类,并在大类下设更具体的子类别。详细的分类如表1所示。

表1 胶东词汇分类表

(三) 语料库结构设计

为了解决词汇长度和数量不一致的问题,以及提高语料库的处理速度,胶东方言语料库的设计采用了按音节数量划分子库的方式,将其分为单音节库、双音节库和多音节库;同时,还建立了文本数据库和方言知识库,以收集各个子库中的真实语言数据。

词汇子库包括字库、词库、句库等内容,其中包含以下信息:词语号码、普通话词条、方言词、方言词地区(分片)、方言词标音和发音、词语结构特征、方言例句和普通话转译等。其中,“词语号码”用于关联相关信息,方便快速访问所属库。“普通话词条”展示了词语在普通话中的信息,而“方言词”则展示了方言中的发音和写法。“方言词地区(分片)”记录了方言词所属的地理位置,可以详细到区(县)、乡(镇)。“方言词标音和发音”可以使用国际音标进行标注,并提供标准的示范发音,以帮助用户正确理解方言词的发音。“词语结构特征”存储了词语的结构类型,如“前缀+词根/词根+后缀=附加式”“词根+词根=复合式”等。“方言例句和普通话转译”将方言词语放入合适的语境中,并提供普通话翻译,方便用户理解词语的含义。词汇库的查询界面如图1所示。

图1 词汇查询结果显示界面

文本数据库包含收录胶东方言的相关特征词和基本词等文本材料、词汇的相关标注等信息,以及方言词汇库、胶东文化库、方言地区库等内容。

方言知识库包含收录胶东方言的相关字典、词典、民俗知识等内容,它是一个集胶东文化知识、词汇知识和胶东方言语言关系的综合系统,可以进一步划分为胶东词汇规则知识库、胶东方言语素知识库等子库。

因此,胶东方言语料库的构建基于生态语言学和语料库语言学的理论框架,在词汇子库、文本数据库和方言知识库的基础上进行功能分析和结构设计。这样的设计有助于深入了解和研究胶东方言的真实语言结构。具体的语料库结构如图2所示。

图2 语料库结构图

(四)语料库多功能检索

完备的语料库功能对于实现语料库的应用价值来说至关重要。一个方言词汇语料库应该具备以下多种功能,具体功能如图3所示。

图3 语料库查询界面

1.多条件检索功能。使用者可以根据多种条件选择所需的方言词汇。这些条件包括词义、词素、近义词和方言点等,每个条件下还可以设置更细致的子条件。其中,词义可以根据史皓圆(美国学者,英文名为Richard VanNess Simmons)、顾黔、石汝杰编著的《汉语方言词汇调查手册》(中华书局2006年版)中的类型进行划分;词素可以按照数量进行分类,包括单个词素、两个词素或多个词素;近义词可以基于词汇意义进行分类,包括褒义和贬义两种类型;借助方言点,可以根据三级地名信息搜索相关的方言词汇。

2.归类统计功能。能够将统计的词汇按照方言片和音节数量进行归类和统计,根据用户需求进行分类和统计。

3.对比分析功能。能够对方言词语语音、语素、词的结构特征等方面进行对比分析。例如,可以对比普通话和方言的音变类型、词的结构类型、词义的构成类型等。语料库可以通过建立不同知识库之间的联系,对比分析胶东方言不同方言片的语法或语用等信息,确定查询结果和输出内容。

4.示范发声功能。在使用普通话词语查询到相应的方言词后,可以利用方言词的示范发音功能,通过点击词语听到地道的方言发音。

5.场景应用功能。能够根据不同的语用场景将词汇进行归类和匹配,从而确定不同场景中适合使用的词汇。

6.词汇文本及示范音转存功能。在语料库中设置筛选选项,用户可以根据自身需求,选择词汇意义、例句、近义词、发音音频等内容进行下载和保存。

7.辅助功能。提供胶东方言系统的介绍、调查表和语音对照表等辅助功能,为用户提供帮助。

语言是文化的载体,方言更能体现某个地域历史文化和风俗习惯的独特之处,所以对方言保护和传承的重视日益增强。胶东方言的分布范围存在争议,考虑到时间和人员数量的因素,本文将语料库建设的重点主要限定在威海和烟台地区。未来的研究中,可将胶东方言语料库建设和研究的对象范围扩展到胶莱河以东的地区。

三、胶东方言语料库的应用

(一)胶东方言与胶东文化传承研究

“语言是文化的载体,方言更是具有语言化石的价值,保留了大量历史与文化信息,具备独特的文化认同功能和情感系联功能,它所发挥的语言职能在一定区域内是普通话无法取代的。”[5](P141)各个地区都拥有自己独特的文化,而地方性语言,即方言,则是地方文化不可或缺的承载者。语言与文化关系密切,而且将后者记录下来,这对于一个族群来说,有助于增强文化认同感和历史传承感。胶东方言是胶东地区显著的标志,它不仅记录了胶东的历史文化和居住环境,还记录了每一代胶东人民日常生活中衣食住行等方面的变化。因此,胶东方言语料库本身就是延续和传承胶东文化历史的重要媒介,是实现胶东地区群体文化认同感的途径之一。

由于胶东人民居住的地形复杂多样,包括湖泊、洼地和海岛等,所以一些地名明显地反映出胶东地区的地貌特征。例如,当通过多条件检索功能搜索与地形相关的词语时,可以获得胶东方言中由“夼”“塔”“岚”“岘”等词素组合而成的词语。胶东地区还是重要的海防军事驻地,一些地名中出现的“寨”“所”“墩”等词素也反映了胶东地区的军事文化。因此,基于生态语言学的概念,胶东方言研究者可以在胶东方言语料库建设的过程中深入调查和分析丰富的胶东文化,追溯胶东文化的语言历史渊源,探索其独特的语言特点,领悟和传承胶东文化的内在精髓,促进语言生态环境的协调发展。

(二)胶东方言区国家通用语推广研究

“国家推广普及国家通用语并不是要消灭方言和少数民族语言,而需要在推广普通话和保护语言资源多样性和丰富性之间寻求平衡。”[6](P167)国家通用语实质上是基于北方方言,摒弃土话因素发展而来的。不同方言背景的学习者在通用语的语音矫正中会有不同的需求,所以有必要为每个学习者安排针对性的发音矫正练习。由于受众范围过于广泛,语音矫正工作在国家通用语推广过程中的重要性日益凸显。如果在胶东地区推广普通话,可以以胶东方言语料库为基础,根据方言语料库统计的结果进行分析,用真实可靠的数据展示方言与通用语之间的发音和表达差异,并针对学习者的问题进行纠正。

通过对方言词语发音的分类和整理,可以总结出某地方言的若干发音特点,从而在推广普通话的过程中有针对性地解决问题。胶东方言容易出现“吃字”的问题,包括平卷舌、尖团音、发音部位不准确等问题,例如,“找”说成“早”,“真”说成“今”,学习者在“zh”“ch”“sh”与“e”相拼时会发出“ie”音;声母的发音也时常发生变化,例如,“折”读成“结”,“车”读成“切”,“蛇”读成“鞋”。利用统计数据为后续的矫正提供案例,有助于改进和完善各个学校的国家通用语教学和测试。

(三)胶东方言片区外语教学研究

“外语是一种武器,又是一种工具,要把学好外语看成掌握一项技能。而方言是连接传统文化与现代文明的纽带,应当得以继承与发扬。正确认识与处理好两者之间的关系,能更好地促进英语学习”[7](P150)在二语教学界,人们普遍认为学习者的母语会对目标语的习得产生一定影响。如果目标语和母语在知识方面存在一些重叠,学习者会由此产生正迁移,有利于掌握目标语;反之,可能会产生负作用。

充分发挥语言库的对比分析功能,将方言的发音情况与外语的发音情况进行对比,利用方言的正迁移优势进行外语发音教学。一般情况下,学者会将国家通用语作为代表,分析整体汉语对外语学习者的迁移影响情况,并以此为基础进行外语教学。然而,中国拥有复杂多样的方言,学习者的母语方言对外语学习的影响远远超过国家通用语对其的影响。尤其是在偏远地区,方言的影响更为显著。因此,基于国家通用语的推广范围和程度,仅仅将学生的语言背景默认为国家通用语来研究外语教学是不够全面的。

一旦建立了胶东方言语料库,胶东地区的外语教学者就可以基于该语料库,针对学习者所在地方言的特点有针对性地开展外语教学研究。例如,胶东方言中一个显著问题是开口呼的开口度不够饱满,发音较为扁平,所以学习者在碰到类似蝴蝶音/æ/的发音时,由于口腔开口较小,其发音就可能不标准。因此,要充分考虑学习者的方言背景,才能探索出有价值的“方言片区学习者外语教学规律”,这将极大地提升教学效果和效率。

四、总结与展望

在经济快速发展、文化不断更新的当下,语言生态环境逐渐恶化,少数地区的方言面临着被边缘化的尴尬局面,以方言为载体的珍贵的文化遗产面临着传承和创新方面的危机,随之而来的将是文化多样性逐渐衰弱甚至消失。因此,我们亟需尽快扭转人类语言生态环境的恶化趋势,在方言库建设和研究等方面提出有力举措。而胶东方言是我国民族语言文化不可或缺的一部分,目前出现了濒危迹象,所以有必要通过建立胶东方言语料库等重要手段,对胶东话进行保存、保护和研究。这不仅能实现对胶东方言原生态语料的保存和展示,而且对于研究胶东方言的生态面貌也具有重要意义。方言作为语言生态系统的重要组成部分,是维护语言多样性的重要元素,所以做好方言保护与传承工作是促进语言多样化发展的关键。

猜你喜欢

胶东语料库发音
I’m a Little Teapot
胶东面塑——花饽饽
《语料库翻译文体学》评介
把课文的优美表达存进语料库
诞生于抗战时期的胶东育儿所
胶东徐福文化旅游的开发利用研究
Playing with h
基于JAVAEE的维吾尔中介语语料库开发与实现
胶东沿海的“妈祖”遗产
Playing with /eI/