APP下载

小议汉语的复合词和词法研究

2017-03-09吴琳丁帅李映夏

海外华文教育 2017年2期
关键词:词法复合词词库

吴琳 丁帅 李映夏

(厦门大学海外教育学院,中国厦门361105;北京建筑大学国际教育学院,中国北京100044;大连理工大学,中国大连116024)

小议汉语的复合词和词法研究

吴琳 丁帅 李映夏

(厦门大学海外教育学院,中国厦门361105;北京建筑大学国际教育学院,中国北京100044;大连理工大学,中国大连116024)

汉语中复合词和短语界限不明。基于词库与词法的区分,应兼顾词汇词和词法词,对“词”从宽界定。在判断成词性时,高频使用这一标准既具有理论基础又便于实际操作。在这种语言观、词汇观的指导下,应该注意将词法词纳入研究范围,尤其要重视强势词法模式,这就需要突破一般语文词典作为词库的封闭范围,而在更为广泛、更能反映词汇在线生成能力的语料库范围内进行研究,特别要重视其中的高频成员。

复合词;词法;词高频;语料库

从内部构成单位的角度分析,汉语的词通常可以分为单纯词(由一个语素构成)和合成词(由两个或两个以上语素构成),合成词又下分为复合词(不同词根构成)、重叠词(相同词根构成)和派生词(词根加词缀构成)。(黄伯荣、廖序东,1997:251-255)中,复合词是理据性和能产性最强的一类,特别是双音复合词,不但在语义上采取意义复合的方式,而且在语音上符合一个音步(双音节),属于“意造韵律词”(冯胜利,1997:6)由于汉语重意合,并且从复合词到短语再到句子各个层面上的构造规律具有相通之处,因此双音复合词和短语之间常常界限不明。对“词”进行界定是汉语研究的一项基本工作,影响着汉语语言学的方方面面,尤其是与之直接相关的词法研究。

一、汉语的复合词

汉语的词和语(短语、词组)是一个连续统。从时间上讲,有许多复合词是短语词汇化而来的,昨天的词组转变为今天的词;在空间上看,书写形式相同的结构在不同的语用环境也可有词、语之别,有时还伴随着语音或深层结构上的差别。再加上书面语和口语、古语和今语、通语和方言之间的纠缠交织,汉语的词和语永远也划分不开,即使划分也只有模糊的界限。赵元任曾经多次表达过他对汉语词级单位的性质及名称的看法:

未必每种语言都有一种单位它的作用大致(更不用说完全了)跟英语里的word相同。在汉语里我们将会遇到各种类似word的单位,都有资格叫做词,它的范围有交叉,但都跟word不完全一致。我是照我的老办法,宁可用一个熟悉的名字,附以警告:不要做出不适当的推论;而不用一些陌生的名字,这些名字虽然保险不会被误解,可也常常保险不能被理解。(赵元任,2001:78)

“字”这个名称(这样说是因为我希望先避免把word这个词用于汉语)将和word这个词在英语中的角色相当。……为什么非要在汉语里找出其他语言中存在的实体呢?更有成效的进一步研究该是确定介乎音节词和句子之间的那级单位是什么类型的,至于把这些类型的单位叫做什么,应该是其次考虑的问题。(赵元任,1975,引自赵元任2002:892-893、899)

吕叔湘也对汉语中的“词”表示过怀疑:

汉语里的“词”之所以不容易归纳出一个令人满意的定义,就是因为本来没有这样一种现成的东西。(吕叔湘,1980:40)

“词”界限的模糊性并不是汉语或是某种特定语言类型的专利,这种现象甚至在普通语言学的范畴内都是普遍存在的。索绪尔就曾说过:

对词下任何定义都是徒劳的。(周荐,2006:574)

离合词作为词和短语之间的过渡单位,突出体现着这种界限的模糊性和汉语的灵活性、创造性。离合词多指动宾结构的复合词,但离合性质并不是仅限于动宾式才有的。赵元任(2001:203)就提出过假V-O复合词的离子化现象,如提一个醒、幽他一默、慷他人之慨、滑天下之大稽等等,都属于离合的泛化。其实,离合现象是汉语词汇结构单位的普遍现象——词汇单位的历时态为词汇单位的离合提供了可能性,在共时平面的语境中实现。(周荐,2006:610)赵洛生也认为离合性(可拆卸性)是整个汉语合成词的特点。(潘文国、叶步青、韩洋,2004:142)离合词听起来词化程度不高,但恰恰相反,它们是因为高度词化而被重新分析了。(肖晓晖,2010:55)可见,所谓的“离合性”并非离合词的专利,甚至不仅限于复合词语的范围内,而是汉语双音词语所共有的“亦词亦语”的特性。如在上例“幽他一默”中,“幽默”本身为音译而来的单纯词,此处也泛化出离合的用法。离合泛化的范围可从复合词下至单纯词,上至短语,汉语词汇双音化和复合化的势头有多么强劲可见一斑。

由于词在汉语中的非天然性、非现成性,对它的界定始终都有些棘手的问题不好解决。较为通行的词的定义是“句中最小的能够独立运用的语言单位”(黄伯荣、廖序东,1997:249),然而对“独立运用”的理解和标准选择却不尽一致。赵元任(2001:97)确定词的标准较为宽泛,具有无限制地跟某些形式类结合的能力、最小的形式即为词。董秀芳(2004:103)也采用一种较为宽泛的界定方式,即能够以整体不可分割的方式进入句法中的一个空位的形式。这样,词和小于词的不成词语素、大于词的短语就可大致分别开来,若不能独立进入句法中的空位则是不成词语素,若能独立进入句法中的空位而内部可分割则是短语。这一界定是单纯从句法角度进行的,并没有特异性和有限性方面的限制。这就涉及到一对重要的概念:词库与词法。词库(lexicon)是“一个语言中需要记忆的所有词汇单位的集合”,或者说“一个语言中具有特异性(idiosyncracy)的词汇单位的总体”。词法(morphology)指“关于一个语言中可以接受或可能出现的复杂的词的内部结构的知识”。如果不区分词库和词法,而仅从词库标准来判断词,就会将词库之外而符合词法模式的词排除在词的范围之外。词库之外而符合词法模式的词就是词法词,与之相对的词库之内的词则是词汇词。“以往的分歧就在于没把词库和词法两个概念区分开来,从而仅从词库标准来判断词,结果将一些由能产的词法模式所构成的形式排除在词的范围之外”——“注意,不在词库中存储的成分并不等于不是词,只是不需要以清单方式存储而已。”只站在词库角度界定词,就会要求词的数量具有有限性,不愿承认能产性强的词法词,不然会让词库过度膨胀而无法承受;若明确了词法在本质上具有能产性,则承认词的无限性,只不过不必一一放入词库。(董秀芳,2004:2、9-10、iii、127)赵元任(2001:102)的词汇系统也体现了类似的区分观念,复合词(他称作“句法词”)按照词汇特异性由弱到强(意义标准)依次分为临时词、复合词、不加分析的复合词。朱彦(2004:276)也注意到语义特异性对成词性的影响,语义关系越曲折越像词,反之越显豁越像短语,语义的曲折程度取决于语义跨度,跨度是可度量的,复合词按照成词度由高到低可分为三阶:典型阶(复合框架-语义曲折)、次典型阶(简单框架,成分被隔开-语义处于中间)、非典型阶(简单框架,成分没被隔开),再往上就是短语了。总之,词是词汇词和词法词的总汇。布龙菲尔德认为,尽管词素、词、词组、句子等汉语各级语言单位难以有绝对明确的划分界限,但这并不妨碍我们对语言的研究做如此的区分(张维鼎,2007:34)。

明确了“词”的内涵和外延,在对词进行研究时还须找到可操作的判断标准以明确研究范围。从韵律的角度看非常清晰,双音复合词属于“介乎音节词和句子之间”(赵元任,1975)的双音节单位,是由一个音步(foot)构成的韵律词(prosodic word)。音步是最小的“轻重”片段,必须是一个“二分”体。(冯胜利,1997:2)侧重结构、意义和使用的角度,葛本仪(2001:42-59,另见潘文国等2004)曾提出区别词和短语的主要标准为结构定型、意义融合、使用高频,参考标准为音节、读音、形态。如果参照上述三条主要标准,那么同时满足它们的只有“词”家族中最为典型的成员,而三条不能同时满足的非典型成员则被排除在外,失之过严。“结构定型”排斥可离可合等形式的变体,而离合现象在汉语词汇中又是普遍存在的;“意义融合”标准只适用于词义特异性较高的词库词,而意义透明度较高的词法词则被排斥。如此看来,既对在线生成的词法词有着一定包容度、又具有较强可操作性的标准只剩下“使用高频”一条。宋春阳(2005:92)也主张以高频为主要依据,主张能作为辞典登录项的单位都是词(例如“分之”),从信息处理角度提出定义词的工程标准。

使用频率这一看似语言外部的语用特征实际上往往是语言发展变化的决定性动因。首先看高频与成词性(历时的词汇化或共时的词化)之间的关系。石毓智(2008:54-55)在证明语法系统的非均质性时举了动补结构带宾的例外情况,本来只有补语成分语义指向宾语时动补才能带宾,指向主语则须用动词拷贝,而在“吃饱饭”、“喝醉酒”中补语语义指向主语动补结构却带了宾语,原因就是高频使用使得“吃饱”、“喝醉”越来越像复合词,词化程度提高,便产生了典型动词的典型用法——带宾。再来看高频和语法化之间的关系。高频既是语法化的动因,高频使用促生语法化;也是语法化的伴随特征,使用频率为语法化出现及程度的外显特征。此外,高频对语言接触也有影响。语言或方言借用首先发生在高频词上。(石毓智,2003:97、121)最有意思的还要属高频和规律性、能产性之间的关系。一方面,高频决定构式的能产性(Goldberg,2007:75),语法化时由高频向低频类推,反之高频词不大容易受类推影响(石毓智,2003:106、98);另一方面,高频使用会导致语法标记因功能过于繁重而磨损,从而在音系中产生例外(徐通锵,2008:297),Spencer&Zwicky (2007:245)在研究屈折与派生的关系时甚至提出越不能产越高频。前后两个方面乍看起来是矛盾的,其实二者统一于将高频视为因而非果,高频既是可类推的、能产的规律生成的原因,也是非规则形式得以保存在语言系统中而没被规则所同化的原因。也就是说,高频同时是规律性和特异性二者存在的必要条件,二者的存在是以高频为前提的;但不能反过来认为二者是高频的充分条件,二者的存在不一定保证高频。儿童习得语言的过程就体现着这种关系。先是高频使用的不规则过去式saw、took、gave较早习得,后来又习得了规则的过去式,于是恍然大悟,兴奋地开始说discovered、travelled,但同时又丢弃了最初学会的saw、took,开始说seed、taked,在那以后必须痛苦地挣扎不规则的过去式形式。(R.L.特拉斯克、比尔·梅布林:117-118)Taylor(2007:xv,84,86-87,99,109)曾提出,学语言就是学图式(规则的图式化),约定俗成的说法(convention)通过高频输入形成图示(同时仍不忘实例),然而图示有它的有限性,还有不规则的特异性形式(idioms and idiomatic expressions)也通过高频使用形成思维定势。以上都是高频作为原因的证明,那么又是什么带来的高频呢,或者说当把高频作为果时它的因又是什么呢?石毓智(2003:122)在研究动补式中动补共现的频率时得出两个结论,频率高低一是取决于动作和结果各自的语义普遍性,越普遍越高频,二是取决于动作和结果的关系,越自然越高频。这里给我们的启示有,就语言成分而言,越是贴近日常生活的基本层次范畴以及更为抽象的范畴越可能高频使用,就成分关系而言,越是符合人们心理预期的关系越可能高频使用。这还有待于进一步验证并确定范围。综上,高频使用是复合词词化程度提高的基础,也是词在汉语使用者头脑中所具有的心理现实性的主要来源,因此它是判断成词性的一个较为科学而可行的标准。

二、汉语的词法研究

如果承认一种语言中存在“词”这一级单位,那么以词为承上启下的交汇点,一种语言的语法就可以分为词法和句法两大部门(潘文国,2002:103)。董秀芳(2004:92、3)认为,词法的研究内容是词的结构类型、词与词的形式关联、一个形式成为合格的词所要满足的结构限制;句法研究的则是词的句法类型、词与词之间的组合关系、一个形式成为合格的句子所要满足的结构限制。词法与句法之分具有一定的普遍性——每种语言都有词法和句法,区别在于有多大程度的相通性和差异性。汉语的相通性较大,大量半自由语素的存在就证明了词法与句法弹性,在历史发展中有时可以互相转化。布龙菲尔德(张维鼎,2007:256)曾经断言,“各种语言的区别,在词法上比句法上更大”,而且汉语词汇的面貌与印欧语差异很大,因此更需要进行独立深入的研究。词法与句法界限模糊的一个突出表现就是复合词和粘合式结构之间的关系。朱德熙(1999:125)对述补结构的粘合式与组合式区分如下,粘合式述补结构指的是“补语直接粘附在述语后头的格式”,例如“抓紧、写完、煮熟”等,组合式述补结构指“带‘得’的述补结构”,如“写得很清楚、走得快、看得见”等。仝国斌(2009:12、18)认为它们的差异在于,结构上复合词是依词法而构成的词法词,粘合式结构则是依句法规则组合而成的句法结构;语义上复合词对应范畴,而粘合式结构对应的是次范畴;复合词更为固定,粘合式结构较临时,共同点在于结构上不具有可扩展性,并且语义上都表类指。其实上述差异并不足以将二者区分开来。第一,词法规则和句法规则本身就存在交集,而且还有不同的看法,Yafei Li(1998:23)就认为,粘合式动结式由词法生成,词法独立于句法存在。第二,相对于单音词所表示的范畴而言,二者都表示的是下位范畴,二者之间抽象程度的区别则不十分明显。第三,固定和临时之分只能从历史和频率上看,而历史长短和词化程度又不一定成正比,最后就只能参照频率来判断了。因此本文倾向于陆丙甫把复合词和粘合式结构划在一起的主张(仝国斌,2009:328)。

词法有三个传统分支:屈折、派生、复合,其实可以合并为两个类别,一个类别与句法相关,即屈折,另一个类别与句法无关,即派生和复合。(仝国斌,2009:96)这里“与句法无关”也是就共时的存在状态而言的,从历时角度看复合词就是句法结构词汇化的结果。吕叔湘(1962)曾指出在汉语中很难区分复合和派生,主要是因为词缀也是由词根虚化来的,而虚化较为彻底的“标准”词缀并不多,数量更多的是能产性强但虚化度并不很高的类词缀。类词缀很难说更接近派生词还是复合词;其意义是形成能产的词法模式(董秀芳,2004:41),而这种词法模式跟复合词的词法模式是相通的。汉语还有一种较为特别的造词方式缩略法,缩略可从广义上归入复合(缩略为单音节的除外),只不过这种复合是有蓝本的(董秀芳,2004:43)可见,在汉语词法中,复合法有着更大的包容性,其规则能够涵盖类词缀构词和缩略构词等非典型的复合情况。

现代汉语构词法一百年来的研究当中,最大的进展就是研究重点逐渐由静态的“词构”转向动态的“构词”,后者以生成为原则,关注能产性。(潘文国,2002:203)词法的能产性(productivity)可以看作是“一个特定的形式在构造新词时被运用的可能性程度的大小。”就汉语的“强势词法模式”而言,不是派生法,而是复合法,“汉语能产的词法模式是复合法。”复合词论其构成方式主要有两种,一种是词根复合(词根+词根),另一种是词复合(词+词)。词复合的方式更为常见,更具有类型学上的普遍意义,而且能产性更高。(董秀芳,2004:97、33、204、42)众所周知,语序对于汉语语法而言有着举足轻重的作用,由于汉语的语义和句法密切相关,因此“‘序’隐于字的组合,其结构原理浓缩于二字组”,从二字组中可以观察到汉语从点到线、由形及序的生成机制。(徐通锵,2008:136、130)。对于汉语这种单双互动的灵活性,早在两千多年以前,荀子就曾下过精辟的论断“单足以喻则单,单不足以喻则兼。”所谓“不足”,一是意义上的,一是节律上的,而以后者为主。(潘文国,2002:249)赵元任(1957,引自赵元任2002:906)指出汉语音节词(字)的单音节性好像会妨碍表达的伸缩性,其实反倒提供了更多的伸缩余地,这种可伸缩性甚至已经影响到中国人的思维方式。郭绍虞(1938:31、74-111、392、400)作专文《中国语词之弹性作用》对这个问题进行了详细论述,文中描绘此间妙处“单复相合,短长相配,于是整齐中含铿锵,参差中合自然”。单双音词同时产生于语言之初,并且单音节内部还要声韵二分,体现一而二、二而一之分合的辩证统一。“在词—语—句的天地里,字——一个个小精灵,排列组合、变化多端、延展紧缩、富于弹性、虚实转换、挥洒自如,真是统而不死、活而不乱。”(李如龙,2009)双音复合词之所以对于汉语及其研究如此重要,根源就在于它处在汉语词汇单位的生成方式由形而序的转折点上,单双配合使用是汉语灵活性的一个最为突出的表现,因此从双音复合词入手探索词汇层面的规律(能产的词法模式)是符合汉语特点的研究途径。

在方法论的层面上,在确定研究范围和研究对象时,应基于词库与词法的区分,注意兼顾词汇词和词法词,因此,将具有一定规模并且更能反映语言现实面貌的语料库作为语料来源就优于一般语文词典。一般语文词典收录的范围主要是词汇词,即“不能见字知义”的条目,而常用接续库的条目都是可“见字知义”、“可以用自由类推的规则建造”的。语料库则能够在一定程度上克服词典的封闭性,兼顾有相当的数量分布,同时又是能产性较强的“活着的构词模式”,可以更好地反映出语言具有生成性和创造力的现实面貌。二者也可结合使用,词典更接近于语言使用者心理词库的核心内容,语料库较多地反映动态的词法造词,参照词典可以确定由某种词法模式造出的形式的词汇化程度的高低,由此也就可知该词法模式与词库联系紧密与否。(董秀芳,2004:39-40、106)

总之,汉语中复合词和短语界限不明,无论是从一般语感的自然性还是学术研究的科学性出发,对“词”都应从宽界定,在明确词库与词法之区别的基础上,兼顾词汇词和词法词。在判断成词性时,高频使用这一标准既具有理论基础又便于实际操作。在这种语言观、词汇观的指导下,应该注意将词法词纳入研究范围,尤其要重视强势词法模式,这就需要突破一般语文词典作为词库的封闭范围,而在更为广泛、更能反映词汇在线生成能力的语料库范围内进行研究,特别要重视其中的高频成员。

董秀芳:《汉语的词库与词法》,北京:北京大学出版社,2004年。

冯胜利:《汉语的韵律、词法与句法》,北京:北京大学出版社,1997年。

葛本仪:《现代汉语词汇学》,济南:山东人民出版社,2001年。

郭绍虞:《中国语词之弹性作用》(1938),郭绍虞,《照虞室语言文字论集》,上海:上海古籍出版社,1985年,74页。

黄伯荣、廖序东:《现代汉语(增订二版)(上册)》,北京:高等教育出版社,1997年。

李如龙:《论汉语和汉字的关系及其相关的研究》,《语言教学与研究》,2009年第4期。

吕叔湘:《说“自由”与“黏着”》,《中国语文》,1962年第1期。

吕叔湘:《语文常谈》,北京:三联书店,1980年。

潘文国、叶步青、韩洋:《汉语的构词法研究》,上海:华东师范大学出版社,2004年。

潘文国:《字本位与汉语研究》,上海:华东师范大学出版社,2002年。

石毓智:《认知能力与语言学理论》,上海:学林出版社,2008年。

石毓智:《现代汉语语法系统的建立——动补结构的产生及其影响》,北京:北京语言大学出版社,2003年。

宋春阳:《面向信息处理的现代汉语“名+名”逻辑语义研究》,上海:学林出版社,2005年。

仝国斌:《现代汉语粘合式结构范畴化研究》,合肥:安徽大学出版社,2009年。

肖晓晖:《汉语并列双音词构词规律研究——以<墨子>语料为中心》,北京:中国传媒大学出版社,2010年。

徐通锵:《汉语字本位语法导论》,济南:山东教育出版社,2008年。

张维鼎:《意义与认知范畴化》,成都:四川大学出版社,2007年。

赵元任:《汉语词的概念及其结构和节奏》(1975),《赵元任语言学论文集》,北京:商务印书馆,2002年。

赵元任:《汉语口语语法》(吕叔湘译),北京:商务印书馆,2001年。

周荐:《汉语词汇研究百年史》,北京:外语教学与研究出版社,2006年。

朱德熙:《语法讲义》,北京:商务印书馆,1999年。

朱彦:《汉语复合词语义构词法研究》,北京:北京大学出版社,2004年。

Goldberg,Adele E.:《构式——论元结构的构式语法研究》(吴海波译),北京:北京大学出版社,2007年。

R.L.特拉斯克,比尔·梅布林:《视读语言学》(沈椿萱译),合肥:安徽文艺出版社,2009年。

Li,Yafei.Chinese Resultative Constructions and the Uniformity of Theta Assignment Hypothesis.In Packard,Jerome L.(ed.)New Approaches to ChineseWord Formation.Berlin;New York:Mouton de Gruyter,1998.286,305.

Spencer,Andrew&Zwicky,Arnold M.(ed.)The handbook ofmorphology.Beijing:Beijing University Press,2007.

Taylor,John.Ten Lectureson Applied Cognitive Linguistics by John Taylor.Gao,Yuan&Li,Fuyin(ed.).Beijing:Foreign Language Teaching and Research Press,2007.

Chinese Compounds and M orphology Study

WU Lin&DING Shuai&LIYingxia
(Overseas Education College Of Xiamen University,Xiamen 361105 China; International Education College Of School of International Education,Beijing 100044 China; DaLian University of Technology,Dalian 116024 China)

In the Chinese language,the demarcation line between compounds and phrases is not distinct.Based on distinguishing lexicon and morphology,lexical words and morphologicalwords both deserve attention.Thus“words”should be defined from a wide aspect.High frequency of use is a proper standard when judging wordhood,both theoretically and practically.From such view of language and vocabulary,morphological words should be concluded in the range of study,especially those strong morphological modes.Therefore,the study of wordsmust go beyond a closed range of common dictionaries as lexicon,butexceed to a wider range of corpus with bettermanifestation of online generating capacity,in which high-frequency members should particularly be paid due attention.

compounds;morphological words;high frequency;corpus

H146

:A

:2221-9056(2017)02-0189-06

10.14095/j.cnki.oce.2017.02.006

2016-05-02

吴琳,厦门大学海外教育学院讲师,汉语言文字学博士,研究方向为现代汉语词汇、语法理论及应用研究。Email:oecwulin@xmu.edu.cn

丁帅,北京建筑大学国际教育学院副院长,讲师,语言学及应用语言学研究生,研究方向为汉语词汇、语义研究。Email:dingsh@bucea.edu.cn

李映夏,大连理工大学讲师,外国语言学及应用语言学专业研究生,研究方向为认知语言学和神经语言学交叉学科研究,二语教学与习得。Email:liyingxia@dlut.edu.cn

本研究获得以下项目资助,教育部人文社会科学研究项目“动补式复合词成分与构式之间的互动选择研究”(15YJC740098),福建省教育厅社会科学研究项目“汉语动补式复合词的认知域研究”(20720151270),厦门大学海外教育学院国际学院培育项目“动补式复合词教学重点性序列研究”,特此致谢。

猜你喜欢

词法复合词词库
基于对外汉语的结果义与虚化义动补式复合词分析
一“吃”多用
西部裕固语的并列复合词
输入法词库取证比较研究
南昌方言“X 人”式复合词考察
应用于词法分析器的算法分析优化
输入法词库乾坤大挪移
从构式语法角度分析英语复合词
语文学习方法之组词法浅谈
2010年高考英语“相似”考题例析