泉州语言资源有声数据库建构设想
2015-05-30王勇卫曾德万戴朝阳
王勇卫 曾德万 戴朝阳
泉州语言资源有声数据库建设是一项泉州本地闽南话的普查,意义重大。论述了泉州语言资源的种类、建构设想及实施方案,提出了这一工作的后续展望。
泉州语言资源有声数据库实施方案闽南方言是古代汉语的活化石,它保存了古代汉语的许多语音、词汇、语法特点。泉州闽南方言的声母与上古音系很接近,泉州闽南方言的韵母、声调则更接近于中古音系。语言是文化的载体。许多在现代汉语普通话、其它各大方言中找不到的汉语特点,往往在闽南方言中一览无余。一种语言或方言消失了,其所负载的信息资源和文化资源自然也将随之消亡。随着社会的不断向前发展,越来越多的年轻父母把现代汉语普通话当成了教育孩子的首要语言,所以我们看到,许多泉州本地的孩子不能听懂闽南话,更遑论说闽南话了。
一、大背景下的泉州语言资源种类
1.地方方言包括闽南话单字,闽南话词语和闽南话句子,以及用方言讲述的地方故事,用方言传唱的地方戏曲
一种语言是由语音、词汇和语法三要素构成的,语音是语言符号的声音要素,是它的物质外壳;词汇是语言符号的总汇,是它的建筑材料;语法是语言符号的形态变化和组合规则,是它的结构规律。话语的设置,则是测试发音人运用方言的流畅程度,是表情达意的直接体现。
2.地方普通话则主要是用普通话讲述的故事和文本朗读
地方普通话包括三种:地普1,地普2,地普3,这主要是考察在方言的影响下普通话的应用情况,也就是带有地方特色的普通话。一个地方的方言,势必会深深地影响普通话的运用。
二、不同类型有声语言的建构设想
就语言本体而言,专家学者的前期论证,如曹志耘的《中国语言普查论证报告——汉语方言,汉语方言语音调查表和调查规范》,李如龙的《汉语方言词汇调查表和调查规范》,刘丹青的《汉语方言语法调查表和调查规范》等对全国语言调查有着建设性的指导意义。这些论证同样适合于泉州闽南方言的调查。
1.地方方言发音人
有4个,分别是老年男子,青年男子,老年女子,青年女子。4人有不同的任务,主要是考查老男和青男的声韵调系统和语音,主要任务都是由老男完成的。因为女子的生理特点决定了她的话语腔调容易变化,而且女子在成年后嫁入夫家,夫唱妇随,女子的语音面貌会有大的改变。老年男子是重点,有语音系统,单字,词汇,例句、话语、对话六大项,青男任务其次,有语音系统、单字、话语、对话四项,老女和青女的任务一样,只有话语、对话两项。因为老男任务繁重,整个音系主要是以老男展开的。所以选好老男是调查成功的一半。
老男和青男的设置,主要是为了区别新老派的不同,绿皮书规定,老男出生年份为1940~1950之间,青男出生年份为1970~1980之音,前后相差30岁,我们在培训发音人时,应避免老男和青男互相就单字的读法交流,其目的是为了保证新老派发音的纯正。
2.调查项目
(1)按照统一规范的《中国语言资源有声数据库建设调查手册》(文中简称为绿皮书)单字有1000个,涵盖了中古的36字母,16摄,平上去入,是数量不大而能反映一种语言概况的小型数据。此项工作重点考察该字在日常生活中的用法,也就是要求发音人不读训读字、假借字、同音字、同义字,而是要读本字。
(2)词语1200条,主要是反映日常常用的,因为是照顾全国,所以有些词语偏于北方,而在南方方言中不太常用,此时可以补充同样意思的另一种说法,亦即同一所指不同的能指。此项都有具体的语境,所以应该不会有文白读的区别。在调查时,一定要发音人牢牢记住是说法,而不是读字。
(3)句子只有50条,每个例句都有不同的考察目标,比如宾语省略、语序不同、前后倒置等。发音人不能照文本用方言读,而是要在理解例句意思的基础上,用地方方言表达,这种表达肯定和普通话是有不同的,我们可以按常用度的大小,列出同一句子的多种读法。总之,例句是说的,而不是读的。数量看起来是少了些,但是麻雀虽小,五脏俱全。
(4)话语包括规定故事和自选话题两部份,前者是用地方方言讲出牛郎织女的故事,讲述时不能对照文本,讲述者必须提前熟悉故事和情节,在讲述时用方言讲述,情节可扩充,内容可增可删,这要求讲述10分钟。如果不能保证讲到10分钟,一定要保证它的讲述和自选话题合在一块达到20分钟。自选话题有10个题目,但是发音人应优先选择前面5个,而且不能和规定故事重复。话题内容应该能反映地方特色,如民谣,民俗,地方小吃等。如果一定要讲故事的话,注意不能和规定故事重复。
(5)地方方言除了以上的单字、词语、例句、话语之外,调查手册还要求发音人进行多人对话。绿皮书规定三人以上即可,但我们一般是选四个人来对话,即老男发音人,青男发音人,老女发音人、青女发音人。话题的范围在话语的10个题目中选,这一项要求时间为40钟以上。
3.地方普通话发音人
分为地方普通话1(以下简称地普1),地普2,地普3,如果用汉语普通话测试等级来说,要求地普1测试70~80之间,相当于三甲,地普2在60~70之间,接近三乙,地普3在60下以下,不入籍,接近于方言。地普的任务都是2项,先是讲述,用普通话讲述牛郎织女的故事,不能照着书本读,而是和方言发音人一样,在理解的基础上,在不看文本的前提下,用普通话讲述。另一项是用普通话朗读2篇绿皮书指定的散文。这主在是考察语言在方言影响之下的变化。
三、实施方案
1.政府主导。“泉州市语言资源有声数据库”是一项庞大而复杂的系统工程,是一次泉州地区闽南话的全面调查,它涉及到全市4个市辖区——鲤城、丰泽、洛江、泉港,3个县级市——晋江、石狮、南安,5个县(包括金门县)——永春、德化、安溪、惠安、金门以及它们管辖下的一百多个乡镇;覆盖面广,具有语言普查的性质。本项目的成功建设需要政府相关部门的主导和资金支持,需要得到语言学、社会学、信息学、统计学等相关学科领域的人才支持,及软硬件研发相关部门的技术支持。所以,这一项目的建设最好由市委牵头立项,统一规划安排实施。调查时,需要当地教育部门的大力支持,需要他们发布发音人的遴选公告,这应该是多渠道的,包括纸质,有声和网络及朋友介绍、现场宣传,需要他们提供当地的记音场所和录音录像场所,包括场所的布置,及人员往来的接待等等。
2.学者承担。“泉州市语言资源有声数据库”建设,需要专家学者的全程参与。他们的参与为数据库理论建设提供了有力的学科支持和技术支持,在数据建设中起引领的作用。可从高校抽调语言学、信息学、社会学等相关学科的专家学者组成专家团,进行前期考察与论证性研究,制定一系列工作规范和技术规范。这一工作已由国家层面的专家做好,我们在建泉州语言资源数据库建设时可借鉴使用。
田野语料采集过程中,需要有专家学者的专业知识对口头语言进行文本转写与国际音标转写。这一过程需要大量的时间、人力和物力。语言的调查和整理是一项慢工出细活的工作,时间长,工作细,来不得半点马虎。
数据采录过程,同样需要专业的设备和人员,这全程都是由专业技术人员操作完成的。资料采录后需要专家学者对其进行战略性、针对性、前瞻性的研究。
3.社会参与。语言有声数据库的采集来自于活生生的语言,所以,需要社会大众的广泛参与,发音侯选者越多,专家团队就能选出更好的发音人,课题需要选取出4位方言发音人和3位地方普通话的发音人。
除此之外,我们也应发动当地的宣传部门,当地的电视台和网络、报纸等多种媒体。一方面,他们能让社会上更多的人知晓这一项目的重要性,另一方面,他们能让社会了解这一事件的进展情况,能够让调查的成果公之于众。
四、后续工作
泉州闽南方言有声数据库采录完成后,要充分重视数据库的开发运用,数据库的建设可与泉州的文化建设的“十二五”规划,与泉州的重点文化建设的项目,比如博物馆、文化馆、展览馆、公共文化设施的建设结合起来,在本地的文化建设中,发挥语言文字资源的独特作用,使这个资源能够共享。
特别值得一提的是,泉州是东亚文化之都,我们可以利用语言有声资源库,为文化建设添砖加瓦,历史上的泉州,是丝绸之路的起点,当时的泉州方言,势必在本地、全国、东亚、亚洲乃至在全世界都有着深刻的影响,我们可以利用这一数据库和当时的语言比较,得出它们的演变、发展和滞留。另一方面,我们也可以利用这个数据库,把实时状态的闽南方言发扬光大,扩大它的影响。以上两点,可以与泉州师范学院的“中国社会科学院闽南文化研究基地”和华侨大学的“丝绸学院”直接挂上钩。
我们可以借鉴国内其它地方的先进经验,可以在有声数据采录完成后,在网上推出一个展示网,后续的可以收集采录地方戏曲,民间歌谣,民间口头艺术等,用有声、可视的形式永久保存各种语言资源。
参考文献:
[1]张甘荔.泉州方言与文化[M].鹭江出版社出版,1994,15.
[2]李宇明.论中国语言资源有声数据库的建设[J].中国语文,2010,(4):356
[3]郑国权.方言乃地方戏曲之母.
[4]欧阳红红,程妹芳.福建省语言资源有声数据库建设构想[J].情报探索,2013,(10):62-64.67.
[5]中国语言资源有声数据库建设领导办公室.中国语言资源有声数据库调查手册汉语方言[M].商务印书馆,2010.39-177.
本文系泉州市2014年社科重点项目(编号2014s10)的科研成果。