少数民族语言语料的深度研究和开发
2017-01-24高扬
高扬
摘要: 本文将从对木雅语具体研究过程中遇到的问题及拟解决方案为例,首先,对一个语言本体研究者来说,如何从语言本身、共时和历时方面及类型学比较角度,对中国少数民族语言语料进行深入研究;而后,就这些语言语料在今天现代技术为载体的新媒体中的开发应用,进行些许讨论。
Abstract: In this paper, we are going to take the Menya language, an endangered Qiangic language, as an example to discuss how an intensive study of a minority language can be done from synchronic, diachronic, typological and comparative perspectives, and furthermore to put forward a preliminary discussion on the exploitation of linguistic resources using modern technology.
关键词: 语言语料;木雅语;研究;开发
Key words: corpora;Menya;intensive study;exploitation
中图分类号:G642 文献标识码:A 文章编号:1006-4311(2017)01-0232-04
0 引言
木雅语为汉藏语系藏缅语族的一门语言,操木雅语的人口,民族成分为藏族。木雅语分东部方言和西部方言,两个方言区域被贡嘎山脉一分为二。东部方言分布在四川省雅安地区的石棉县;西部方言分布在四川省甘孜州的康定、雅江和九龙区域。前人学者曾经对木雅语进行过研究,也有一些相关发表,如孙宏开老师1983年在《六江流域的民族语言及其系属分类》中对木雅语的语音、词汇及语法分别进行了概括性的描述;黄布凡老师在1991年的《藏缅语15种》里对木雅语的语言体系也进行了较为系统的描述;另外,日本学者池田巧对该语言也进行过资料采集和分析工作。自2015年由教育部、国家语委启动的中国语言资源保护工程(简称“语保工程”),在全国范围已经全面展开。本文将以本人研究的羌语支的木雅语的东部方言为例(以下简称“木雅语”),具体介绍如何基于“后语保”的语言资源对少数民族语言进行深度有效的研究和开发。
1 语言语料的研究
身为语言本体研究者,我们更注重的是对语言的语音、词法、句法系统的研究,即语言资源物质基础的研究。下面,以本人研究的木雅语为例,具体阐述如何利用最全面的语言语料,对像木雅语一样的少数民族濒危语言进行语言本体研究、共时性和历时性的分析,乃至跨语言的类型学比较。
1.1 语言本身的深度描述
我们都知道,“语保工程”的目的是对原有的中国语言资源有声数据库建设的进一步扩充、整合,其目标则是利用现代化技术手段,收集记录汉语方言、少数民族语言和口头语言文化的实态语料。所收集的大量语言资源,在经过科学的整理加工之后,从而建成大规模、可持续增长的多媒体语言资源库。对于语言本体研究者来说,这样一个资源库将对推进语言的深度研究提供极具价值的大量基础数据。
通过语保工程,对木雅语及其方言各种形式的资料有了更全面的收集和加工,为针对木雅语更为深入的描述和分析提供了极为重要的资源库。这些更全和更新的语料,对我们更近一步的了解这门复杂的语言至关重要。
1.1.1 语音
“后语保”工程所收集的高质量的音频甚至视频资料,可以为我们从实验语音学的角度分析和认识语言中某些具有特点的发音提供数据。
以木雅语“紧元音”为例,被我们大家普遍称为木雅语中的“紧元音”的具体发音特点,目前尚不十分确定,也没有人就木雅语的紧元音进行过专门的共时分析。通常情况下,就被描述语言特点的不同,“松/紧”元音的对立可以指代“非软颚化/软颚化”、“非小舌化/小舌化”、“非咽化/咽化”或者“非声门化/声门化”之间的对立。根据前人学者的记录,普遍认为木雅语中存在“松/紧”元音的对立,也曾经对木雅语的“紧元音”进行过描述和分析,例如马学良老师的“汉藏语概论”(2003:220),根据马学良老师的描述,木雅语的紧元音类似我们在下列两种情况下发出的声音:
- 当A模仿B生气时说话的时候发出的声音;
- 看京剧时,台下观众叫“好”的时候的声音。
通过我们的观察,首先,当听到发音人发出“紧元音”时,能明确将其与“松元音”区分开来;另外,“紧元音”的发音较“松元音”要更加短促,所消耗的力量更大些。但是这一切都是我们从主观上对木雅语“紧元音”的描述,我们缺乏具体的数据来证明“紧元音”的特性,以及与其他语言“紧元音”的区别是什么,甚至由此我们可以推断其来源。因此,我们可以对“后语保”大量有关“紧元音”的高质量音频数据进行频谱分析,进行专门针对“紧元音”发音部位及发音方式的实验语音学分析,例如:对相同环境下“松紧元音”F1、F2及F3的数值进行比较,从而确定木雅语“紧元音”就发音部位及发音方式上较其对应的“松元音”区别在哪里,并最终判断木雅语所谓“紧元音”真正的发音特点。
1.1.2 词汇
通过语保工程,关于被调查语言的词汇积累会有一个很明显的量的增加,尤其是动词数目的增加尤为重要。我们需要对动词形态的多样性及其变化规律进行研究和总结,以便更深入的了解语言本身的语法特点。
就拿木雅语的动词趋向前缀来说,木雅语趋向前缀可以表达六种不同的方向,每个方向都有7组不同形态。目前我们知道其中4组为其他3组动词词干末元音的条件变体。但就这3组趋向前缀形态的关系,目前还存在疑问。以下为木雅语这3组趋向前缀的形态:
1组:t?藜-,n?蘧-,?酌?藜-,?揿?着,th?蘧-,?耷ɡ?藜-
2组:ti-,ni-,?酌i-,?揿i-,thi-,?耷ɡi-
3组:tu-,nu-,?酌u-,?揿u-,thu-,?耷ɡu-
第1、2、3组各个方向的不同形态中,辅音都是相同的,仅元音出现变化;并且第1组内较第2、3组而言,元音的变化更多,出现三个不同元音[?藜]、[?蘧]和[?着]。基于以上原因,我们推测,木雅语这三组趋向前缀的不同形态中,第1组为其原始形态,第2、3组则为其变体形式。鉴于第2、3组中,不同方向的趋向前缀的元音均相同,为[i]或[u],由此,我们假设第2、3组的形成是在第1组基础之上,即在趋向前缀基础形态与动词词干之间添加了一个前缀i-或u-,伴随着趋向前缀原来元音的丢失,得到了目前我们看到的第2、3组的形态。通过对现有数据的观察和比较,我们初步可以确定前缀i-为使动前缀,但仍无法准确的为前缀u-定性。我们可以利用语保工程收集到的大量关于动词数据资料,首先来验证关于动词趋向前缀基本形态组的分析;另外,扩大动词表,用以理解所有带有前缀i-的不及物动词,因为这部分动词与我们之前i-为使动前缀的假设相矛盾;最后,如果有可能,可以通过对大量带有前缀u-的动词词干的观察和分析,来给其定性。
1.1.3 传统故事
通过语保工程,对于本民族传统故事的音频及视频资料会得到大量的丰富,这对于语言本身的语法研究至关重要。很多我们对语言系统的分析和假设,如果能在自然语料中得到验证,分析和假设的准确性会大大提高。另外,还有很多难以在平常被动或者半被动的启发式调查(Controlled elicitation and Semi-Controlled elicitation)中很难被发现的语言现象,都会在自然语料中流露出来。
比如,无论是孙宏开老师的数据(1983),还是黄布凡老师的纪录(1991),均提到木雅语中存在一个第三人称前缀标记,位于动词词干和趋向前缀之间。调查过程中,我们也发现动词词干上会出现一个u-前缀(或者其紧元音形式u-),该前缀只出现在及物动词词干前,同时动词的施者论元为第三人称,并且在带有过去时含义的表达中,如例1所示。
例 1:
1?耷?藜-ji 1tse?耷g?藜 1th?蘧-phel?覬-?耷?蘧
(a) 我-ERG① 衣服 DIR-补.1S-PRF.EGO
我补了衣服。
1?耷?着-ji 1tse?耷g?藜 1th?蘧-phel?着=?拮?蘧
(b) 你-ERG 衣服 DIR-补.1S=PRF.ESTIM
你补了衣服。
1?着m?蘧-ji 1tse?耷g?藜 1th?蘧-phel?着=?拮?蘧
(c) 1?着m?蘧-ji 1tse?耷g?藜 1th?蘧--phel?着=?拮?蘧
妈妈-ERG 衣服 DIR-<3A>-补=PRF.
妈妈补了衣服。
从上面几个例句中动词的变化,可以看出:在一个表示过去含义的句子中,当一个及物动词的施动论元为非第三人称时,趋向前缀与动词词干之间不会出现u-标记;而当及物动词的施动论元为第三人称时,该标记可出现在动词词干与动词趋向前缀之间,同时伴随有趋向前缀自身元音的脱落。
这一现象告诉我们,在木雅语中,有一个以动词前缀形式存在的用以标注施动论元第三人称的标记u-。通过对木雅语“后语保”语言资料的搜集和分析,尤其是在对传统故事进行录制和转写后,首先,检验该标记是不是的确只能出现在过去含义的句子中;其次,分析和确定该前缀与反向前缀(Direct/Inverse Marker)之间是否存在关系;最后,确认该前缀是否仅仅是一个与有过去含义的时、体、态(TAM)后缀结合使用的一个标记。以上几个工作步骤,将会让我们有充分的证据来定义木雅语中的这个u-前缀。
1.2 共时和历时研究
索绪尔提出了语言存在的两种形态的概念,即语言的历时态和共时态,正如他自己所说,“共时态和历时态分别指语言的状态和演化阶段”。当然,尽管索绪尔自己明确的提出“共时和历时的对立是绝对的,不允许有任何妥协的”,但是这并不能说明两者没有任何联系,它们之间虽有对立的一面,同时也有相互依存的一面,所以两者之间存在着一种既对立又统一的关系。
比如,语言的共时状态能帮助我们理解其历时发展过程,历时比较能帮助我们更好的理解共时状态该语言的某些特殊、违反常规的形态。下面我们就分别从这两个角度,来介绍我们语言语料的研究。
1.2.1 共时研究对历时认识的作用
对于我国绝大多数少数民族语言来说,大都处在劣势位置,会受到一门、两门、甚至几门强势语言的影响甚至威胁。由于语言接触而产生的历时性的变化,会在该语言共时状态下体现出来,因此,在语言资料的积累过程中,我们要尤其关注被研究语言借词的收集和研究。
以木雅语为例,现代木雅语多受藏语和西南官话的影响,由于木雅语与藏语的接触由来已久,因此藏语借词在木雅语中出现的时间和数目远远要比西南官话重要的多,并且木雅语具体何时从何种藏语方言借来的这些词,目前都尚不清楚。鉴于木雅语的藏语借词可以追溯到非常久远的年代,并且与其有接触的藏语方言也肯定远远不止一个,我们可以第一步暂且用书面藏语为中间比较对象,分别总结出木雅语中藏语借词与书面藏语之间的声母和韵母的对应关系。以书面藏语的?捺i?耷‘田地的声母为例,木雅语中有两个词与其有密切关系,一个是1?捺imb?着‘农民中的第一个音节,保留了书面藏语zhinɡ(?捺i?耷)‘田地这个词原来的齿龈硬腭擦音[?捺];而另外一个变成了卷舌擦音1?拮?藜‘地,田地,出现了第二种对应关系[?捺]→[?拮]。从共时角度来分析,我们可以观察到,木雅语中的这两名词,都借自于藏语的同一个词,但在今天木雅语中的形态并不同,由此,我们可以推测,这两个名词虽然都是藏语借词,但是它们很有可能不是从同一个藏语方言借来的,而是来自不同藏语方言。这类问题的解决,能让我们从历时角度更好的了解木雅语。
上面的例子说明,我们需要大量借词语料数据的收集和分析,才能在未来通过借词借用的不同层次的相互对应关系,总结判断出语言在不同历时时期与其接触密切的语言有哪些,以及这些语言之间是如何相互影响,最终产生各种音变的。
1.2.2 历时研究对共时状态理解的帮助
我们在对一门语言的共时形态进行描述和分析过程中,经常会出现与我们就某一个语法点或者语法体系规律相违背的现象,很多类似现象很难利用我们对语言的共时认识来解释。这时,历时角度的分析或许能帮助我们找到答案。
同样以木雅语为例,其动词的人称范畴是通过人称后缀来实现的,大多数动词都可以根据其词干元音是否圆唇来推测其不同人称后缀的形态,大都具有一定的规律可循。但并非所有的木雅语动词都遵循我们之前介绍的人称范畴的规则变化。对于一小部分动词,其人称范畴体现出了不规律性的变化,这部分动词的某个或某些人称范畴的形态,并没有遵循我们之前总结的规律,至少有一种不规则形态。这些动词仍然需要更多的数据和更深入的分析及探究,通过了这些动词的来历及历史演变,或许才能最终解释它们在人称范畴变化中的特殊性。另外,我们可以对最新的数据资源与曾经收集的数据进行比较研究,这样就能观察出语言本身的演变,或者从中验证我们在语言共时研究中总结的相关规律。
所以说对语言语料资源进行历时性研究是更好的理解语言本身共时状态的一个非常重要的途径。
1.3 类型学研究
所谓类型学,是通过比较不同语言相同、相异的特点,从复杂的、无限的语言现象中,归纳出少量、有限的类型,寻找人类语言的普遍现象,也就是共性,从而深化我们对语言本质、语言特点的认识。
因此,“后语保”语言语料的研究和开发工作中,对各种语言的大量数据进行语言类型学的比较是至关重要的,无论是亲属型语言比较还是非亲属型语言比较。接下来,我们仍然以木雅语为例,解释利用大量语言语料进行语言类型学比较的研究及其意义。
前文提到过木雅语存在的一个及物动词第三人称过去时的u-前缀,为了有可能更好的定义该前缀,了解该前缀的来源,我们需要将其与其他相近语言进行比较,首先,通过观察发现,木雅语中的这个前缀与很多嘉绒语支语言的反向前缀w?掮-同源(DeLancey,1981;孙天心&石丹,2002;Jacques,2010;Gong,2014;Lai,2015),由此我们猜测该标记更有可能是木雅语中曾经存在的反向前缀的遗留。所以说,与周围亲属语言的类型学比较,有可能帮助我们找到确定某个语法标记的性质和来源的有价值的证据。
另外,还有上文提到关于木雅语趋向前缀与动词词干之间存在着i-和u-两个前缀,我们i-前缀为使动前缀,但并无法解释另外一个u-前缀。通过对周围亲属语言进一步的了解后,我们得知嘉戎语中的茶堡话存在着两个使动前缀,分别是■-和?掮?酌-,第一个使动■前缀使用范围更加广泛些,而?掮?酌-只会出现在个别静态动词上。茶堡话的这两个使动前缀恰好看起来与木雅语的i-和u-同源,那u-会不会是木雅语中存在的第二个使动前缀呢?根据两个语言各自大量数据的比较、观察和分析,可能会帮助我们理解木雅语中的u-前缀。
身为语言本体研究者,对语言进行深入分析,通过各种形式的发表,使得我们研究的语言的特殊性和复杂性体现出来,也让更多语言学家对我们所研究的语言产生兴趣、加大对其的关注,这样才能使语言本身的知名度提高,甚至吸引更多语言学家来研究这些少数民族语言,也让更多年轻学者、甚至学生对这个领域感兴趣,最终被吸引到这个领域中来。
2 语言语料的开发
传统意义上对某个语言进行调查研究的过程大致都是在语言描述的层面,首先是语言学家亲自到语言使用区域,进行田野调查,在调查过程中收集该语言的数据和资料;而后语言学家本人对采集回来的数据进行分析和研究;最终理解语言的语音、词法及句法系统,基本上来说,目标语言的相关数据始终都只会在相关研究学者的手中。
在今天,随着科学技术的发展,这种情况正在慢慢发生改变,某个语言学家田野调查后,都在争取让自己的数据尽可能的让更多的人看到,甚至使用。这就需要我们对“后语保”语言语料进行开发和利用的时候,考虑到其更为广泛的传播形式,例如数字词典、APP词典形式的实现,甚至新媒体平台中,将目标语言的数字化信息及音频资料提供出来,这样才能让这些数据发挥最大的作用。
2.1 数字词典
语保工程后,目标语言的常用词汇的收集已经比较全面了,对于这些词汇数据的开发利用,需要对以后的研究工作,甚至其他亲属语言、非亲属语言的比较研究有一定的价值。为了达到这个目的,除了需要将语言的词汇进行高质量的加工和处理外,还应该寻找一种能对所有研究学者开放的研究成果形式,即带有音频的数字化词典的形式。
以木雅语为例,首先,将收集到木雅词库,以尽量尊重音标转写的原则,将少数键盘难以输入或者难以识别的字体进行简化或者修改,确立为这个口传语言的转写系统;词典每个词条的翻译解释最好是汉、藏双语对照,如果有可能,可以添加英文翻译解释,并且每个词条后添加一个带有音频的例句。也可以利用今天智能手机的功能,开发相关语言的APP手机应用软件,这样一来,词典就有可能真正实现大范围推广。这种手机APP形式的词典,最主要的用途是可以开通其软件后台互动功能,其真正目的是可以吸引以相关语言为母语的年轻人群体,他们可以成为我们词典的校对者,如果词典内容与真实语言表达或者解释有偏差或者不完善,母语发音人们可以帮助我们将数据不停的完善和校准。
2.2 新媒体平台的应用
利用新媒体平台来开发和利用今天收集到的语言语料也是至关重要的,建立微博或者微信公众号,将我们收集到的传统故事音频,甚至转写翻译后,放在平台上,这样能让语言母语者们对自己的语言的认可度得以提高。我们也可以预留平台互动区域,让语言的母语群体将他们会说的或者听说过的本民族传统故事通过音频形式上传到平台,也就是说,允许语言母语者自发的扩充语言语料。这种互动、互利的新媒体平台形式,必定会成为“后语保”进一步扩充语言语料的一种有效途径,进而促进未来我们对语言资源更进一步、更深一步的研究和开发利用。
3 结语
总而言之,对于少数民族语言“后语保”语言语料的深度研究和开发的意义重大而深远,有利于我国少数民族语言承载的民族文化的保护及留存。促进加强对各民族语言的保护、抢救、记录,也是对少数民族群体的一种特殊的人文关怀,能促进民族团结和社会的健康进步,帮助本族群人民在掌握通用语的同时保留本族语。最终,从国家层面来说,全面提升我国语言资源保护、研究及开发利用水平,能为传承中华优秀传统文化、促进民族团结、维护国家安全服务。
注释:
①DIR:Directional(方向前缀),ERG:Ergative(作格),PRF:Perfect(完成体),SG:Singular(单数),TESTIM:Testimonial(亲验式),1S:1st person singular(第一人称单数),3A:3rd person agent(施动论元第三人称标记)。
参考文献:
[1]黄布凡.《藏缅语章 羌语支》,汉藏语概论[M].北京:北京大学出版,1991:208-369.
[2]孙宏开.六江流域的民族语言及其系属分类 [J].民族学报,1983,3:163-179.
[3]孙天心,石丹罗.草登嘉戎语与「认同等第」相关的语法现象[J].语言暨语言学,2002,3(1):79-99.
[4]李智,殷微.少数民族语言研究发展趋势及选题特点[J].哈尔滨学院学报,2015(01).
[5]DeLancey S. The category of direction in Tibeto-Burman[J].Linguistics of the Tibeto-Burman Area, 1981, 6 (1), 83-101.
[6]Gong X. The Personal agreement system of Zbu rGyalrong[J].Transactions of the Philological Society, 2014, 112 (1) :44-60.
[7]Ikeda T. Exploring the Mu-nya people and their language, Kyoto University Press, ZINBUN, 2006,39 : 19-147.
[8]Jacques G. The inverse in Japhug Rgyalrong [J]. Language and Linguistics, 2010,11(1) : 127-157.
[9]Lai, Y.《La morphologie affixale du lavrung wobzi》, Mémoire de master, 2013.
[10]Lai, Y. The person agreement system of Wobzi Lavrung (Rgyalrongic, Tibeto-Burman)[J]. Transactions of the Philological Society,2015,113(3) : 271-285.