俄语名词的屈折并类研究
2015-10-17祁曼婷
祁曼婷
(南京师范大学文学院,江苏南京210097)
俄语名词的屈折并类研究
祁曼婷
(南京师范大学文学院,江苏南京210097)
本篇文章主要描述一个新颖问题:以文本频率分布差异的层级体系作为参考,研究语法中名词的屈折变化的并类。借用俄语名词进行研究,这种语言中有大量语法规则的特性及出现在不同形态范畴中的语法并类。针对俄语中名词之间的关系展开,研究表明文本使用频率与屈折并类之间有很复杂的关系。我们的结论指出,层级体系中位于不同节点的特殊功能间的使用频率的分布都是不同的,低文本频率是屈折并类的一个必要条件。并类与频率之间,存在着复杂的关系。
屈折并类频率
比较语法中名词的屈折变化的并类,以一个文本频率分布差异的层级体系作为代表是缺乏继承性的。为了更好地研究这个问题,考虑借用俄语,这种语言中有大量语法规则的特性及出现在不同形态范畴中的语法并类。
俄语有丰富的形态变化,有严格的语法接格关系,它也是验证这一关系的最好候选者。本文选取俄语中的名词作为研究对象,它包括性、数、格的形态变化,针对俄语中名词之间的关系展开,研究结果表明文本使用频率与屈折并类之间有很复杂的关系。
1.简介
对于屈折并类,是指一个相同词形可作为多个功能使,理论中的一个巨大挑战是词形变化。通过不同途径来分析屈折并类:一种途径是描述不足,屈折变化的形式没有被作为功能的合并;另一种途径是参照(Zwick 1985;Stump 2001:212-41),词形与一个基础功能联合,词元的其他词形变化参考了词元与基础功能的联合,所以,涉及到的是它们性质中的非对称性,而不是描述不足。因此,我们不可避免必须要全面分析。
考虑到名词合并类的文本频率分布与俄语中词形变化形式模型其他用途之间的关系。特别是,非对称性参考是否反映在频率分布中。俄语是验证这一关系的最好候选者,因为这一语言有大量的词形变化和不同类型的屈折并类。
我将用手动编译资料的方式,将从Л.В.Климова《现代俄语中高频名词、形容词和数词研究》文章中,抽取50现代俄语中使用频率最高的名词,包括50个名词词位,共计600个词形变化。在这一资料的基础上,设立了一系列假设,并且建立一个用于描述俄语中名词的词形变化结构和文本使用频率之间关系的模型。
以俄语国家语料库(НКРЯС А.Шаров;В.Б.Касевич,2003)中的经过元语言标注和词法标注,且经过手工词法消歧和自动词法分析程序进一步改正的1300万词次的语料库为测试模型的方式来交叉—验证结论,且这一测试语料库对屈折变化进行分类和标记。由于这一语料库数据庞大,只以2015年录入的一部分语料为基础,其中包括3939份文章,9236个句子,57926个词,从而对假设进行检验。
本文接下来的结构是,第二节论述形态变化理论与频率分布;第三节提出假设并检验;第四节文章总结。
2.形态变化理论与频率
2.1屈折并类
语法中的词形变化规定了功能与形式之间的关系。一个合理的假设就是功能与形式之间一一对应。但事实相反,一种语言总是与这一理想期望相违背,总会出现一种词形对应两种及两种以上的功能。典型的就是俄语中的名词,如下图所示:
图1:功能多于词形
俄语名词有2个数类(单数和复数)和6种格类(主格、宾格、属格、与格、工具格、处所格),总共构成12种组合变化情况。尽管俄语中一个名词有12中变化,但一个典型的名词的形式不会超过10种(如图1),所以名词种类问题就决定了功能之间区别问题。例如,词形комнате“房间”同属于单数与格和处所格,所以单独写出这类词形是会造成歧义的;而词形кости“骨头”有3种歧义,它的这一个词形分别用以表达单数与格、处所、属格功能。
相似地,英语中的动词有现在时、过去时和被动分词形式。举出一个有歧义的形式,例如:词“hit”(在“Mary hit thenail with a hammer玛丽用铁锤锤钉子”,与其对立的是“Mary was hit by a meteorite”),假定这里有两个或两个以上不同的功能共用同一词形。其他动词也存在不同的功能对应不同的词形。
形式上的合并可以被视作是描述不足,即多个功能共用一个词形表达,且每个功能具有同等地位,或者这可以被视作参考依据(Zwicky 1985;Stump2001:212-41),一个词形与一个基础功能相联系,词形变化中的其他项则参考了这一基础功能项。描述不足意味着功能的地位是平等的,而基础参考方法的属性是一个功能较其他功能更重要。
语法功能在文本上重要的一个衡量就是文本频率的统计。我们将作出不同的假设,关于描述不足与依据参考之间形式上的区别,被映射在文本频率分布上的差异。本文中,将对这些假设(借助俄语名词)进行试验。作为假设的基础,将从俄语形态变化的形式理论模型出发,在形态结构网络内研究
2.2层级继承
在这一模型中,俄语中的典型四类名词及其形态变化被列在表1中:
表1:俄语中主要名词类的形态变化
我们看到类Ⅳ中名词单数кость“骨头”的歧义最多,3种词形被用作6种语法功能(一种作为主格和宾格,一种作为属格、与格、处所格,一种作为工具格)。类Ⅲ中的名词комната“房间”也有在单数与格和处所格形式的合并。俄语中的词形合并与性也有关系。俄语中的单数阳性名词的变化属于类Ⅰ,这类词中宾格词形变化是以属格形式为基础的。对于类Ⅱ、Ⅳ,分别是中性和阴性词类,它们中的主格-宾格形式是合并的。类Ⅲ主、宾格形式则明显是分开的。在复数形式中,情况要简单得多:一些动物名词形式的宾格是以属格形式为基础,一些非动物名词的形式的宾格则是以主格形式为基础。在上面的表格中只给出了非动物名词的变化形式。
以俄语50个高频名词的词形变化表明:俄语中,大约38%单数形式的词形变化标记共用同一词形的歧义形式,即我们计算的是合并类词形变化的标记占出现的词形变化标记总量的比例:1)所有类Ⅲ中的单数与格和处所格出现的标记数量;2)类Ⅰ非动物名词、类Ⅱ及类Ⅳ中单数主格与宾格出现的标记数量;3)类Ⅰ中动物名词单数主格与属格出现的数量;4)类Ⅳ中单数属格、与格、处所格出现的标记数量。俄语中一个词形变化的并类形式在上下文中可以很容易消除歧义,但是我们的假设检测是为了检验俄语中词形变化并类与频率分布的关系。词形变化体系之所以可以很好地服务于一种语言(如,俄语、德语等屈折语),在很大程度上依赖于上下文的语法规则。
我们缺乏对俄语词形变化并类的继承性分析,而是将其视作非对称性,因为一个特殊的词形被认为以一个功能作为基础。作为词形变化中的并类,我们也需要将各类屈折变化的分层结构纳入考虑之中。下面图2就表现了俄语名词词形变化的分层结构模型使用了屈折变化结构网络(Corbett和Fraser),在分层的底部是词元事例。
图2:俄语名词继承结构
需要注意两点:第一,最初的分析是以屈折变化理论为目标;第二,证明俄语中存在大量重要的特殊性,这也包括了语言中所有词汇的不规则使用的事例。
形态变化被构造为一个层级体系,这一体系中的信息使层级还未达到囊括全部情况的程度。因此,在图2层级顶部,我们可以发现一个联系所有名词的信息(例如,复数与格、工具格和处所格的词形变化)并且这一信息通过继承发展到其他项中,在层级的底部我们发现的是每一个词实际变化的情况。节点N_Ⅰ(代表类Ⅰ)和N_Ⅱ(代表类Ⅱ),这两个节点继承自节点N_O(代表了类O),词形变化中的单数属格、与格、工具格和处所格是相同的。这意味着,如名词节点下的单数处所格具有3-4种屈折类,那么符合这一特点肯定就是类Ⅳ中的词如кост-и所具有的。
我们将会运用这一模型,并将频率分布信息与名词层级的不同构成部分相联系,即模型顶部的名词,不同名词类和属于这一名词类的词元位于模型底部。
3.提出假设
以下是一系列的假设,通过俄语国家语料库来进行进行交叉检验。
3.1分层体系中的词形变化
我们列出的俄语词形变化继承模型包含了一个建立在传统词类水平上的层级结构系统。一个主要的问题就是这一词形变化的层级结构系统是否被映射了使用频率的不同。因此,我们将研究图2中层级系统各个点上语法功能的使用频率,特别是层级系统中各个点存在的功能合并类的使用频率。这一问题的研究将通过以下假设的检验实现:
假设一:位于层级系统同一位点上的各节点词形变化元素的频率分布是无差别的。
对于这一假设,Corbett已指出位于层级系统同一位点上的各节点词形变化元素的频率分布是有差别的。例如,名词性词包括名词和形容词。名词中,在N_O(包括了N_Ⅰ和N_Ⅱ)和N_Ⅲ、N_Ⅳ之间的使用频率分布是有区别的。
表2 层级体系同一位点的频率分布
很明显假设一是错误的, 层级体系中处于同一水平上的名词类之间单数和复数的频率分布是不同的。(表2)类Ⅳ中复数的文本频率最低,相对频率也最低。与之相对,类O具有最高的使用频率,相对频率也最高。
假设二:如果两个或两个以上的功能共用一个词形,那么联合的词形的使用频率将会高于不共用同一词形的类。
表3 屈折变化频率分布
为验证这一假设,我们观察了单数属格、与格、处所格不同屈折变化类频率分布, 并计算了语料库中单数词形变化所占比例(表3)。类Ⅳ中有这3个功能的合并,类Ⅲ中有2个功能的合并(单数与格和处所格),类O中有三个功能各不相同,如果这一假设是正确的,那么类O中的这些功能的相对频率应该最高,从而,我们计算了单数词形变化所占比例。但是很显然这一假设是错误的, 因为语料库并类的使用的相对频率是不同的。语料库中,类O出现最高的相对频率,类Ⅲ第二,类Ⅳ最低。
3.2并类的使用和不对称性
出现合并类中一个功能是否比另一个(或其他)功能重要,但是使用频率分布是否是平等的? 这里我们做出了以下的假设:
假设三:两个或多于两个的功能共用同一个词形,这些功能之间的频率是无差别的
表4 主、宾格并类在语料库中各自使用频率
我们观察到单数属格、与格和处所格的频率分布。在表1中,我们看到属于类N_Ⅰ和类N_Ⅱ的词元有相同的词形,但是其中的3类是可以清晰分辨。类N_Ⅲ中单数与格和处所格之间是模糊的,类N_Ⅳ中3个功能共用一个词形是完全有歧义的。俄语中,缺乏继承性的表现是名词性词的词形变化,描述不足的表现是单数处所格的NOUN节点上,这一点使用贯穿在3个词形变化中。在类Ⅲ、Ⅳ中,单数与格与处所格有相同的词尾,单数与格将接替处所格的词尾,在类Ⅳ中,单数处所格与属格的词尾有相同的词尾,单数处所格接替了属格的词尾。
因此,一个合并类中,我们可以声明与特有的功能联结的词形,也可能被用作另一个功能。在类Ⅳ中,参考构成了单数与格接替了处所格,接着是接替了属格,应用于3个功能的同一词形都带有-и。类Ⅳ有三个功能的合并的事实,但是,这对于所有名词(包括类O)都有对于不同功能都有不同的词形。事实上,我们从统计的数据中知道单数属格到处所格再到与格的使用频率是递减的。
因此,如果并类和频率之间是有联系的,这一非对称性可能是必要的,但是没有足够的证据。这一假设也是错误的。
3.3合并的环境
使用频率较高的种类,如单数,合并类少于使用频率低的种类。这一问题将通过以下假设检验:
假设四:一个类别的频率对这一类别中的并类没有影响。
这些合并事例被发现出现在俄语单数和复数词中,并且最重要影响合并因素是,合并中出现的词形变化数目的相对频率分布情况,而不是合并词元相对频率分布情况。例如,类Ⅳ中单数词形变化有最大的歧义,也是最低绝对频率。要注意这一假设与假设二的相互影响,但是这里的证据证明假设四是错误的,这也证明词形变化的数量是最重要的因素。
4.结语
我们期望看到屈折变化的合并与模型中基于一个缺乏继承性的分层系统之间的关系。我们将这一关系的研究放于俄语的名词中,结论指出,层级体系中位于不同节点的特殊功能间的使用频率的分布都是不同的。事实上,分层体系中相同节点上的并类之间确实存在联系。类Ⅳ与类Ⅲ和类O比较,它的单复数文本频率是最低的,但是它的单数屈折变化合并是最多的。这就告诉我们,低文本频率是屈折并类的一个必要条件。我们也找到证据证明了,特殊功能的文本使用频率能够直接反应在形式化的模型中,因此,一个功能与它的形式相联系具有较高的文本使用频率这可能是一个必要条件,但这不是一个充分条件。本文结论显示,并类与频率之间存在复杂的关系,这一问题有待继续研究。
[1]Климова.Лариса.Владимировна《Выскочастоные имена существительные,прилагательные и числительные в современые русском языке现代俄语中高频名词、形容词和数词研究》Екатеринбург,2004.
[2]Arnold Zwicky.How to describe inflection.In M.Niepokuj,M.Van Clay,V.Nikifordou and D.Feder,editors,Proceedings of the eleventh annual meeting of the Berkeley Linguistics Society,pages,1985:372-386.
[3]Gregory T.Stump.Inflectional Morphology.Cambridge:Cambridge University Press,2001.
[4]Nicholas Evans,Dunstan Brown and Greville G.Corbett.Dalabon prononminal prefixes and the typology of syncretism:a Network Morphology analysis,2001.
[5]Greville G.Corbett and Norman M.Fraseer.Network morphology:ADATR account of Russian nominal inflection. JOURNAL of Linguistics,1993:29:113-42.
[6]Martin Haspelmath.Understanding Morphology.Edward Arnold,London,2001.
[7]张余亮.俄语现代标注语料库的理论与实践.解放军外国语学院硕士学位论文,2006.
[8]http://proling.iitp.ru/etap(ЭТАП-3机器翻译系统网址链接)
[9]http://www.ruscorpora.ru/(俄语国家语料库在线)