生成语法对实词的研究:动向与启示
2016-11-19程工
编者按:词类是语法中较为重要的理论构件,一直备受学界关注。生成语法早期采用自上而下的计算方式,词类对词项的插入起着关键作用,采用自下而上的计算方式后,词类失去了沟通词库与句法的作用,但没有被取消,而是让它配合格理论发挥作用。随着核查理论的兴起,包括格特征在内的一些形式特征皆由功能范畴核查,这使得词汇范畴的句法作用几近为零,而功能范畴的句法作用日渐见长。在这种背景下,本刊邀请了四位学者从生成语法学的视角谈汉语词类的研究,希望藉此促进该领域的研究。
关键词: 生成语法;分布式形态学;实词
摘要: 相比于传统语法,生成语法对实词采取了去中心化和去原始化两个做法,前者使得功能语类取代了实词的部分职能,后者则用特征派生出实词的种类和性质。分布式形态学所提出的句法决定词类假说,即词类由定类语素赋予,使这两个做法实现了统一。这个假说具有理论的合理性,符合生物语言学的理念,受到心理语言学证据的支持,在事实分析中展现出了优势,也为解释汉语词类的相关现象提供了新的选项。
中图分类号: H042文献标志码: A文章编号: 10012435(2016)04041604
Key words: generative grammar; distributed morphology; lexical category
Abstract: In contradistinction to traditional grammar, generative grammar neither views lexical categories as a central part of grammar nor a primitive notion. On the one hand, the former replaces some functions of lexical categories; on the other hand, the latter attempts to derive sorts and features of lexical categories via feature matrices. Distributed morphology unites these originally separate developments by assuming the syntactic determination of lexical categories, according to which roots (lexical morphemes) are category-neutral, and are assigned a category when merging with a functional morpheme. This assumption is conceptually viable, consistent with the biolinguistic view and supported by available psycholinguistic evidence; it is empirically superior as well and promises to offer new insight in Chinese word-formation.
“实词”在本文主要指传统意义上的名词、动词和形容词三个词类。一些学者(如Haspelmath 2012)认为,生成语法对它们的研究用力不勤,成果有限[1]。对此笔者基本同意。应该说,这是一个很大的缺憾,使得生成语法在不少领域(如类型学研究)方面往往不能发挥应有的引领作用,对语言间的差异缺乏精细的分析和有说服力的解释。
尽管有上述不足,但笔者认为,仔细梳理生成语法有关实词理论的演化轨迹,可以得出结论,它基本走在正确的路径上,并且正在酝酿着重大的突破,体现在对实词的去中心化和去原始化两个方面。
首先看去中心化的情况。众所周知,传统语法为实词赋予了某种中心的地位,整个语法体系基本围绕实词展开。这一地位在生成语法中不复存在,而且随着研究的推进不断下降。在《句法结构》(Chomsky 1957)这部开山之作里,短语结构的第一层级改写就涉及实词:S→NP VP。[2]上世纪七十年代以降,在X阶标理论的触发下,随着CP,IP(TP)等功能语类语类的引入,实词在短语结构中引入的时间越来越迟。不仅如此,八十年代中期之后,随着“DP假说”和“VP壳理论”的提出[3-4],功能语类又被引入了NP和VP两个短语,前者成为限定词(D)的最大投射,后者则是轻动词(v)的最大投射,传统上很多归结于名词和动词的特性被转移到了功能语类上。到了最简方案理论之后,功能语类不断提出,作用愈加凸显,实词语类的地位和作用相应受到全方位压制。对语法体系的如此改造,不仅使得理论更加严密,跨语类的相似性得到有机反映,而且也丰富了语言描写的机制,各种纷繁复杂的语言现象借此获得了自然的解释。
生成语法对实词类做的第二项工作是去原始化,即它不再像传统语法那样把实词视为无需定义的原始(primitive)概念,而认为它们是由特征(feature)组合派生而成。这个过程肇始于Chomsky(1970)用[±N]和[±V]两组特征得出的4种词类:[+N,-V]=名词,[-N,+V]=动词,[+N,+V]=形容词,[-N,-V]=介词[5]。他的尝试尽管不太成功,但其出发点,即“消除特征与范畴的区别,把所有的语法符号都视为特征的集合”(Chomsky 1970: 208)[5],却极具理性和启发意义。后来,Baker(2003)[6]等人也相续提出了一些用于推导词类的特征,深化了认识,但作用依然不够彰显。到了九十年代,随着分布式形态学(Distributed Morphology)的出现,情况有了质的改观。
按分布式形态学所提出的“句法决定词类假说”,传统意义上的词至少由两个部分组成,其一是词根,没有词类特征,也没有其他任何语法信息,一般用“√”或“”标记。其二是“定类语素(category-assigning morpheme)”,负责给词根赋予词类。定类语素跟其他功能语类一样,由特征组合而成(参看Embick 2012:75)[7],通常用正体小写字母标记:如v(动词性)、n(名词性)、a(形容词性)等。例如,“猫”这个词是由词根“(猫”和定类语素“n”合并而成,见(1):
可见,所有传统意义上的词在DM中均为复杂结构,即由不止一个语素构成。至于传统意义上的多语素词,则是通过定类语素堆叠而成的。以英语“grammaticalize(语法化)”为例,其生成过程如下:
DM认为,(2)体现出句法规则的递归性,与短语生成没有本质不同。基于这一认识,分布式形态学取消了词的正式的理论地位,认为它和句子一样,本质上也是短语,由某个核心投射而成。
就此,生成语法对实词类的去中心化和去原始化两个看似不甚相干的做法在句法决定词类假说中达到了统一。也就是说,一方面,所有的句法终端,即树形图上的核心(X0),除了没有语法特征的词根之外,都是功能语类。如此,传统上的实词类在树形图上的位置不断下降,直至最低端的位置,这是一种合乎逻辑的发展。另一方面,在一个致力于用特征派生所有范畴的理论体系里,实词和功能词都被认为由特征组合而成,这无疑也是必然的。从这个角度,传统所谓的实词是没有句法特征的词根与定类语素的结合体,词类的语法特性都是由特征赋予的,功能语类和实词语类的对立也可以通过推导而不是硬性规定来得出:两种语类都不是原始性的,而是由特征派生而来的。
相比Chomsky(1970)[5]等人提出的特征系统,分布式形态学的句法决定词类假说与理论体系的关联性有了很大改进。与主流的词库论(lexicalism)不同,该理论的句法推导是从语素而不是从词开始的,词根只有通过定类语素才能获得词类特征,才能接受句法推导,这就使得词根与定类语素的合并成为理论不可缺失的环节。更重要的是,按Marantz(2001),Arad(2003,2005)[8-10]等人的研究,词根和定类语素的合并构成一个局部区域(local domain),其性质与Chomsky(2001)[11]所说的语段相当,该组合被送往接口进行诠释,词根意义和音系表现在此过程中也得以固定。后续的推导可以增加新的性质,但却不能消除词根与定类语素合并的语义和音系特性。就这样,句法决定词类假说在结构、语义和音系等各个方面决定着传统意义上的词的特性,成为DM理论中有机的一个部分。
有理由认为,把实词看成词根和特征的组合,理论上是一种合理的选择。首先,尽管实词在成员上具有开放性,但种类却是封闭的,基本上只有名词、动词和形容词三种。其次,词根体现索绪尔式任意性(Saussurean arbitrariness),几乎没有规律性可言,习得时只能靠记忆,理论阐述上只能靠列举。词类则具有不容置疑的规律性和内部同质性,在分布、搭配乃至形态、意义等方面具有相同或至少相似的表现。此外,如果把词根视为没有语法特性,把定类语素视为由普遍语法提供的选择,那么上述的这些现象(成员的开放性和种类的封闭性,词根的特质性和词类的规律性)就可以得到自然的解释。这是因为词根体现了特质性,并为成员的开放性提供基础,定类语素则由普遍语法提供,决定着种类的封闭性和句法上的规律性。
从生物语言学角度,做如此分析也持之有据。我们知道,人类语言出现的时间很短,不超过20万年。按照主流的观点,在此之前“思维系统就已经出现”,但是比较初步,“可能只是按‘图思物,或者是以其他什么方式。”(乔姆斯基 2015:8)[12]完全可以假设,当时思维的对象就是不含任何语法特性的词根。在语言系统出现后,词根通过与定类语素合并,从而获得语法特征。换句话说,一个符合语言演化的假设是:词根是语言外的,而在特征基础上形成的定类语素则是语言内的,是词根能够被语言计算系统使用的前提与基础。
心理和神经语言学的证据似乎也支持词根没有词类,只能通过定类语素才能变成实词的观点。Barner and Bale(2002)[13]对此做了较为详细的阐述。限于篇幅,在此仅举一例。众所周知,儿童习得词语的速度是惊人的。按Pinker(1994)[14]估算,英语母语者的儿童6岁时已掌握大约13000个单词,这意味着每小时习得2个单词的惊人速度。Barner and Bale(2002)[13]指出,如果习得词汇时必须同时掌握词类信息,以及相关的次类信息(可数、不可数)等,那么考虑到英语中严重的跨类、兼类现象,儿童习得词汇的速度必须增加一倍乃至更多,这几乎是一个无以承受的挑战。相反,如果假定儿童习得词汇主要是掌握词根,亦即意义和声音的匹配体,词类及其次类信息则由句法生成,那么这对解释儿童如此高速地习得词汇肯定是有利的。
在对语料的分析方面,句法决定词类假说与现有理论体系相比也拥有诸多优势,程工、李海(2016)[15]列举了四条:一,可以更好地反映实词的词类多样性和灵活性。二,可以体现词根和定类语素各自的贡献。三,可为“词类”这个富有争议的概念提供一个新视角。四,可以去除既有理论中一些地位可疑的操作,从而使形态理论变得更加简洁、自然。有兴趣的读者请参考原文,在此不赘。
有理由相信,上述理论为把握汉语实词性质,解决一些悬而未决的难题,优化相关事实的分析也提供了有益借鉴。笔者(2015)[16]在这个方面进行了一些尝试。我们知道,汉语复合词有联合式、偏正式、动补式和动宾式等主要类型。笔者依据词类是否可以从成分语素预测,意义是否具有组合性,内部是否具有凝聚性三个诊断标准,证实了一个由来已久的判断,即汉语中最符合词的标准的是联合式,其次是偏正式,而动补式和动宾式的句法表现则逐渐靠近短语。笔者以分布式形态学为基础,对这一连续统提出如下分析。联合式初次合并的是两个词根,定类语素是之后加上的,所以词类往往不容易预测(如“开关、大小”等是名词,“千万、好歹”是副词),意义往往不具组合性(如“骨骼、骨干、骨肉”三词的意义迥然不同),内部凝聚性也最强。在偏正式复合词中,定类语素先与被称为“正”的词根结合,形成核心-补足语关系,再与被称为“偏”的词根结合,形成核心-标志语关系。例如,“学生”一词就是定类语素(n)先与“生”合并,再与“学”合并的结果。所以,总体上它们在词类上具有更高的可预测性。但由于其中的“偏”语素是以词根身份入词的,所以语义上往往不透明,内部凝聚性较强。动补式复合词则来源于基础生成于不同节点的两个成分受双音化等因素驱动,经历形态合并而形成的,其一是动词(即词根与动词性定类语素的合体),处于结构中较高位置,其二是表示变化(become)的轻谓词。正因为如此,动补式复合词表现出较多短语的特性,如词类基本可以预测,语义较为透明等。至于动宾式复合词,则完全是短语结构凝固而成,因此毫不意外地表现出很多短语的特性,如词类可预测,语义较透明,内部凝固性弱等等。
综上所述,相比于传统语法,生成语法对词类采取了去中心化和去原始化两个做法,前者使得功能语类取代了实词的部分职能,后者则用特征派生出实词的种类和性质。分布式形态学所提出的句法决定词类假说,即词类由定类语素赋予,使这两个做法实现了统一。这个假说具有理论的合理性,符合生物语言学的理念,受到心理语言学证据的支持,在具体事实的分析中展现出了优势,也为解释汉语词类的相关现象提供了新的选项。
参考文献:
[1]Haspelmath, Martin. How to compare major wordclasses across the world's languages[A].UCLA Working Papers in Linguistics,2012 (17):109130.
[2]Chomsky, Noam.Syntactic structures[M].The Hague:Mouton,1957.
[3]Abney,Steven.The English noun phrase in its sentential aspect[D].Ph.D dissertation,MIT,Cambridge,Mass,1987.
[4]Larson,Richard.On the double object construction[J].Linguistic Inquiry,1988 (19):33592.
[5]Chomsky,Noam.Remarks on nominalization[A]∥Readings in English transformational grammar,ed.R.Jacobs and P.Rosenbaum.Waltham,Mass.:Ginn,1970,184221
[6]Baker,Mark C.Lexical categories:verbs,nouns,and adjectives[M].Cambridge:Cambridge University Press,2003.
[7]Embick,David.Roots and features (an acategorial postscript)[J].Theoretical Linguistics,2012 (38):7389.
[8]Marantz,Alec.Words[Z].Manuscript.MIT.2001.
[9]Arad,Maya.Locality constraints on the interpretation of roots:The case of Hebrew denominal verbs[J].Natural Language and Linguistic Theory ,2003 (21):737778.
[10]Arad,Maya.Roots and Patterns:Hebrew Morphosyntax[M].Springer,2005.
[11]Chomsky,Noam.Derivation by phase[A]∥M.Kenstowicz (ed.),Ken Hale:A Life in Language.Cambridge,Mass.:MIT Press,2001,152.
[12]乔姆斯基.语言的科学-詹姆斯麦克吉尔弗雷访谈录[M].曹道根,胡朋志,译.北京:商务印书馆,2015.
[13]Barner,David and Alan Bale.No nouns,no verbs:psycholinguistic arguments in favor of lexical underspecification[J].Lingua 2002 (112):771791.
[14]Pinker,Steven.The Language Instinct[M].W.Morrow,New York,1994.
[15]程工,李海.分布式形态学的最新进展[J].当代语言学,2016(1):94114.
[16] Cheng,Gong.Towards a rootandpattern analysis of wordformation in Chinese[C].Presented at the 2015 International Conference on Language Form and Function,Suzhou:Soochow University,2015.
责任编辑:凤文学