几种离合词词典编纂问题研究
2017-11-06姜德军
姜德军
摘 要 文章在定量分析与定性研究相结合、语言理论研究与语言实践应用相结合的基础上,对词典中的离合词收录和离散性标识等问题展开探讨,指出了一些离合词词典编纂中存在的问题,并尝试提出了相关问题的解决方式。
关键词 汉语离合词 现代汉语词典 离散形式 配例 离散性
一、 离合词的特点
(一) 离合词的概念
“离合词”也称为“可分离词”。我们认为,如果一个汉语双音节词,既可以在聚合时作为一个词来单独使用,又可以在语句中借助一定的语法手段、词汇手段来离散使用,且离散后仍然是一个语法关系上相互照应、语义关系上凝固稳定的整体,只能从整体上去看待其功能、理解其意义,这样的双音节词就是“离合词”。
(二) 离合词的两种形式
离合词有两种形式。如用A和B分别代表离合词的两个音节,“AB”为“聚合形式”(简称“合式”),意义上具有凝固性;中间插入别的成分或者重叠前面成分,便构成“A……B”或“AAB”等“离散形式”(简称“离式”)。如“帮忙”可以离散为“帮了一个忙”“帮帮忙”(本文用下划线标识离合词的离散形式;用方括号标识非离散形式的短语扩展形式)。
(三) 离合词的类型
离合词的类型,目前获得学界认可最多的有动宾、动补两大类,而《现代汉语词典》(以下简称《现汉》)认定并收录的离合词类型有动宾、动补、主谓三种,其中动宾式离合词又占了绝大多数。《现汉》第6版收录的离合词中,动宾式约占97%,动补式约占1.6%,主谓式约占1.4%。
离合词的词性,大部分是动词,也有一些是形容词或副词。
(四) 界定离合词时需要注意的问题
在离合词的界定中需要注意两点。
1. 离合词的合式只能是双音节词
我们认为,离合词的合式只能是双音节词,不能是其他语言单位。《现汉》中用“∥”来标识离合词,可是标识的既有双音节词,也有三音节语言单位,我们统计《现汉》第6版中共有“沉住气、豁出去、看上眼、拉下脸、拉下马、拉下水、站住脚、无奈何”等8个三音节语言单位带有离合词标识。
我们认为,“拉下马、站住脚”之类三音节语言单位不是离合词。其一,三音节语言单位是短语性语言单位而不是离合词;其二,三音节语言单位具有的是短语的可扩展性,而不是离合词的可离散性;其三,离合词只有一个扩展口,《现汉》中的这8个三音节语言单位中,“沉住气、看上眼、拉下脸、拉下马、拉下水、站住脚”等6个有两个扩展口,两个扩展口分别出现在其“补语”前后,如既可以在前面插入“不、得”扩展成为“拉得/不下马”“站得/不住脚”,也可以用在后面插入“了、过”扩展成为“拉下了马”“(没)站住过脚”。就这点而言,这6个三音节语言单位的开口度,比“泡蘑菇、开夜车”等“1+2”格式的惯用语开口度都大,因为这些惯用语尚只有一个扩展口,如可以扩展为“泡了半天蘑菇”“开了一晚上夜车”。
基于以上考虑,我们认为,《现汉》第6版中的这8个三音节语言单位都不是离合词,而是有扩展用法的短语,且除“无奈何”是一般短语外,其余7个都是惯用语。就拿其中的“站住脚”来说,首先,“站住脚”前面的双音节语言单位“站住”,已经在《现汉》第6版中被标记为离合词,整个三音节语言单位“站住脚”又被《现汉》标记为离合词,显然矛盾。其次,既然“站住脚”有两个扩展口,按照《现汉》标识离合词的体例,就不能只是标为现有的“站∥住脚”,而是应该在“住”的前后都标上可扩展标识,即应该标为“站∥住∥脚”,具有“2+1”和“1+2”两种扩展。显然,像这样有两个扩展口的三音节语言单位不应该是离合词,而是短语。如果把这类语言单位也作为离合词,就会造成离合词外延的无限扩大。
其实,《现汉》的标准也不统一,带有“∥”标识的8个三音节语言单位,除了“豁出去”标注为动词外,其他7个都没有标词性;其他可以扩展的“撕破脸”“抓破脸”等三音节单位也没有标“∥”。不过,后者倒是正确的做法。
2. 离合词的离式区别于近似形式的短语
(1) 离合词的离式在形式上与近似短语有所区别
离散形式,在形式上与固定短语、一般短语均有所不同。离散形式与固定短语有别,离散形式中插入的其他单词是不固定的;也与一般的短语有别,离散形式是其他词插在一个词的中间将之分隔开。
离散形式中,离合词的两个词素结合十分紧密,插入的其他语言成分与两个词素结合并不紧密;惯用语中,几个词素的结构关系具有固定性,不是由一个词中间插入固定单词构成,而是几个词素固定而又紧密结合继而构成一个整体独立的熟语。离合词“说话”的离散形式“说半天话”“说完了话”与惯用语“说好话”“说大话”有所区别。
离散形式中,离合词的两个词素不被插入的其他语言成分拆开,仍合在一起作为一个整体的语言单位与其他成分组合;在一般短语中,增添的其他成分会拆散原有词素之间的结构关系,并与其中之一产生更加紧密的关系而合构成独立的词或熟语。离散形式“打了三年仗”“睡了一会儿觉”与一般短语“打胜仗”“睡午觉”等有所区别。“打[胜仗]”“睡[午觉]”“说[大话]”“唱[对台戏]”“动[恻隐之心]”“费了[九牛二虎之力]”“报[一箭之仇]”这类形式中的“胜仗”“午觉”“大话”“对台戏”“恻隐之心”“九牛二虎之力”等已经被《现汉》收录为词或熟语。简单地说,离散形式中添加的词不改变原有词素间的关系,而一般短语中添加的词会改变原有词素的相互关系。
(2) 离合词的离式在功能上与近似短语有所区别
离合词的离式在功能上与近似短语有所区别,主要是指离散形式在功能上区别于近似的名词性短语。一些名词性短语和名词性的短语扩展,极容易与插入相同单词的离合詞离散形式混同。现代汉语中这类问题最集中的体现,就是由助词“的”构成的短语扩展形式与由助词“的”构成的离合词离散形式的甄别问题。在以往一些研究论著和离合词词典中也出现过此类混同。本文在考察大量古今语料基础上,认为甄别二者的关键是看其功能是名词性的还是非名词性的,离散形式的功能不能是名词性的。endprint
插入助词“的”的离散形式,表完成、实现意义,“的”相当于助词“了”,往往还有强调作用。如:
“你的媳妇惹的祸,没什么说的,你拿五十,我拿五十;要不然我把吊死鬼搬到你屋里来。”(老舍《柳家大院》)
我气喘着说:“加丽亚,我为你才离的婚,你怎么……”(邓友梅《在悬崖上》)
有时插入助词“的”的形式(如“惹的祸”),其功能可能是名词性的。如:
正因如此,我们才不能不感谢白姥姥的降格相从,亲自出马,同时也足证明小白姥姥[惹的祸]大概并不小。(老舍《正红旗下》四)
根据具体语境,此例中的“惹的祸”是名词性偏正短语,不是“惹祸”的离散形式。
后面要谈到的《汉语常用“离合词”用法词典》中的配例误用问题,就是把名词性的短语当成了离散形式。如在“他是昨天刚贷的款”中,“贷的款”在语境中获得了强调性的结果实现意义,是离散形式;但是,在“这笔钱是我贷的款”中,“贷的款”不是离散形式,因为其是名词性的短语。
上面的论述,从合式和离式两个方面构成了本文对离合词所做的界定标准,是把离合词与短语区别开来的判定原则。
(五) 离合词研究的大致情况
从20世纪50年代至今,学者们对离合词进行了多方面的探索和研究,主要集中在: (1) 语法角度的界定,包括对离合词的命名和界定,对离合词是词还是短语的探讨;(2) 对离合词结构类型的探讨;(3) 对离合词从词典编纂、中文信息处理等角度进行的研究。
实际上,离合词词典的编纂与前两个方面的研究都有关联。语法角度的界定,是离合词词典编纂的理论基础;离合词结构类型的探讨,涉及离合词词典的收词范围。这两个方面的研究目前还远未达到令人满意的程度,还有不少争议。此外,现有研究并没有总结出离合词的分合规律和扩展规则,不能显示其规律性。
理论研究的不足也给离合词词典的编纂产生了不利影响。下文将分析的离合词词典编纂中的一些问题,不少是因为理论基础不够扎实而造成的。
二、 离合词在词典中的反映
目前,收录离合词的词典有第1版到第7版的《现汉》,还有四部专门的离合词学习词典: 杨庆蕙(1995)《现代汉语“离合词”用法词典》、高永安(2009)《边听边记HSK离合词》、周上之(2011)《汉语常用离合词用法词典》和王海峰(2013)《现代汉语离合词学习词典》。本文对离合词词典编纂问题的研究,主要基于第5版和第6版《现汉》,兼及其他几版《现汉》和这四种学习词典。
确定离合词数量、统计词频,无疑会对离合词理论研究和词典编纂等有促进作用。但是,离合词的数量一直是不确定的,从《现汉》第1版到第6版,收录离合词的数量逐“版”增加。依据赵金铭(1984)和王楠(2006)等对《现汉》第1版至第4版的统计,其所收离合词从2000多个增加到3400多个。《现代汉语“离合词”用法词典》收离合词4066个,但很多条目与《现汉》有出入。《边听边记HSK离合词》收录188个,《汉语常用离合词用法词典》收录268个,《现代汉语离合词学习词典》收录210个。此外,据我们统计,第5版《现汉》收离合词将近3700个,第6版收将近4000个。
实际上,离合词的数量可能远不止这些。我们曾对《现汉》第6版A—D、S—T、X—Z部中没有标记离散性的双音节词在语料库中进行离散性检索,发现有上百个词可以离合使用。施茂枝(1999)在考察述宾复合词时也提出“词典视为非离合词却能拆开来使用的为数甚多”。所以,现有词典存在的主要问题不是离散性标记过度,而是离散性标注不够。如果扩展语料库规模和集中更多力量研究,还会发现许多在词典中没有被标记的离合词。
三、 词典编纂中处理离合词的偏误与不足
《现汉》与离合词专门词典在编纂中还存在一些偏误与不足。本文谨对一些问题献疑并探讨处理方式,希望能对离合词本体理论研究和辞书编纂实践起一点促进作用。
(一) 离合词的标识
这方面存在的问题,一是离散性标识过度,二是离散性标识不足。
1. 离散性标识过度
有些词语并没有离散用法,却也被标为离合词。大致上有这样几种具体情况。
第一,有些双音节单位,是作为短语使用的,却被标为离合词。郭绍虞(1979: 652)认为“汉语中有许多词组,从它的本义讲,可说是词组,从它的引申义讲,又只能看作是词”。所以,这类双音节组合用于本义时就不是离合词的合式。像“洗车”只用于表示“清洗汽車表面,使车身清洁美观”的本义,与“洗脸”“洗牙”“洗衣”“洗碗”等一样,只是短语,不是独立的词,《现汉》却将它标为离合词。“加油”的第一个义项是“添加油料”,与“加衣”“加水”“加钱”“加纸”等一样,也是短语,只有在第二个义项“努力,加劲儿”上才是一个词。《现汉》却把两个义项都标为有离散用法。
第二,有些双音节组合单位,在语法结构上就是短语,却也被标为离合词。如《现代汉语“离合词”用法词典》中就有这样的讹误,把“穿过”标为离合词。我们知道,“穿过”中的“过”是趋向动词,用在动词后表示“经过”义,所以“穿过”应该是短语而不是离合词。
第三,有些双音节多义词在某个意义上不能离散使用,却在整体上被标为离合词。《现汉》的体例说明区分义项标注离散性,但是实际上并不统一。有些词在词目后整体标识为离散,但是其有的义项能够离合,有的义项是没有离散形式的。如“出来”,整体标注为离合词,但我们检索大量语料,没有查检到其在第二个义项“出现”上有离散形式。再如“打败”,也是整体标注为离合词,但是对其第二个义项“在战争中或竞争中失败;打败仗”,我们检索大量语料后也没有查检到有离散形式,而且根据意义,在这个义项上恐怕无法离散使用。
2. 离散性标识不足endprint
有些词语实际上存在离散用法,词典没有标明是离合词。大致上有这样几种情况。
第一,缺少历时视角,没有历时溯源,一些沿用下来的离合词往往被漏标了离散性。如“济事”“作难”,在几版《现汉》中都没标识,实际上从近代汉语到现代汉语,它们一直存在着离散的用法。如:
若要合下便做一次排遣,无此理,亦不济得事。(《朱子语类》卷第十八)
这下把我难住了,想来想去,想到自己家里刚磨下四十八斤玉米面,把这给牲口吃了不是也能济点事吗?(王传河《一心为了革命》,《人民日报》19650620)
只见贾母叹道:“别的事都好说。林丫头倒没有什么,若宝玉真是这样,这可叫人作了难了。”(《红楼梦》第九十六回)
元孩听了听风,着实作了难: 上级不叫动中農,如今不动中农,一方面没有东西填窟窿,一方面积极分子分不到果实不干,任务就完不成。(赵树理《邪不压正》三)
再如,有的研究者认为是析词的“咳嗽”,离散用法也很常见:
心里胡思乱想,听那女子也叹一口气,咳一回嗽,直闹个整夜。(《孽海花》第七回)
饭桌上有一种沉郁的气氛。我们不论说一句话,动一下筷子,咳一声嗽,都显得很勉强似的。(巴金《憩园》三十六)
第二,缺少语料库依托,一些在现实语言生活中有离散用法的词,词典未标记离散性。例如,《现汉》直到第7版也没有标识离散性的“糊口”“染色”,不乏离散用法:
年年数九隆冬,天寒地冻,我们卖艺糊不了口,就到救济会的粥场打粥喝。(刘绍棠《狼烟》四)
他们大多数都觉得挣不了多少钱,顶多只能自己糊个口,拿不了多少钱回家,还经常被欺负。(王比学等《招工扶贫: 农村脱贫有效方式》,《人民日报》20040709)
有的人把工作服染了色,改了样,给自己的家属穿。(石林《新三年 旧三年 洗洗补补又三年》,《人民日报》19580120)
还有一次,一位染色徒工染一件粘胶纤维衣料,染锅里放了盐基品蓝染料,可是衣料怎么也染不上色。(沈骊珠《访北京服务学校》,《人民日报》19620409)
由此看来,只有依托真实语料库,才能尽量减少词典中对一些双音节词的离散性标注不足的问题。
第三,明显具有动词性的双音节词的离散性标识较好,其他词类的离散性标识不足。《现汉》等词典中,一些双音节词,只标识了名词、形容词、副词等词性,而疏漏了其实际上具有的动词性离散用法。如对“安心、耐烦、顺嘴”等词的处理都是这样,但这些词实际上是有离散用法的。如:
泮头乡是嘉禾县偏远的贫困乡,过去到这个乡工作的不少干部,安不下心,扎不下根。(尹振亮等《嘉禾泮头乡干群亲同“鱼水”》,《人民日报》20010515)
小顺儿拿着豆角还不肯放弃了看戏,瑞宣耐着烦说:“二叔去打听唱戏不唱!不是六号现在就唱戏!”(老舍《四世同堂》第一部《惶惑》二十九)
香菱猛省了,反不好意思,忙陪笑赔罪说:“一时说顺了嘴,奶奶别计较。”(《红楼梦》第八十回)
《汉语常用离合词用法词典》和《边听边记HSK离合词》把表示“心情安定”的形容词“安心”标识为离合词,处理得当,但对其他词的处理仍有问题。
词典对离散性标识不足的情况很多,无法一一列举,需要研究者依据大型语料库,对词典所收录的双音节词进行穷尽式梳理。
(二) 配例问题
离合词的配例,应该离式、合式并举,先合式后离式。但是,《现汉》的处理在体例上不统一。除了部分条目的举例符合这两条规则,还有不少条目存在缺陷。
1. 举例不够齐全
第一,只有合式例子,没有离式例子。如:
报价 报价单|出口商品应统一报价
“报”字头下的“报仇、报德、报恩、报废、报警、报幕、报税、报怨、报站”等条,也都是如此。
第二,只有离式例子,没有合式例子。如:
报账 报一笔账
挨边 上了大路,要挨着边儿走
第三,合式、离式都没有举例。如“报”字头下的“报案、报捷、报料、报丧、报时、报数、报喜”等。
2. 举例次序不统一
《现汉》对兼举合式例和离式例的条目,在两类例子的先后次序安排上不够统一。有的是先合式,后离式,有的是先离式,后合式。如:
存款 存款手续简便|到银行去存一笔款
充数 滥竽充数|要是人手实在不够,就由我去充个数吧。
打盹儿 午饭后打个盹儿|晚上没睡好,白天老是打盹儿。
出来 出得来|出不来|你出来,我跟你说句话。
3. 配例有讹误
误配用例的情况主要见于离式方面。《现汉》中“挨近”后的配例是“挨得很近”,但这是一般短语(“很”与“近”结合更紧密),而不是“挨近”的离散用法。“挨近”属于后补式离合词,其离散形式应该是“挨得近”或者“挨不近”。《现代汉语“离合词”用法词典》中也有这样的讹误,如“挨近”下的离式举例“你挨他近一点,行不行?”“离远点儿,别挨我那么近!”,都是一般短语。
配例讹误的情况还有把名词性的短语扩展误作为离合词的离散形式。《汉语常用离合词用法词典》这类失误较多,如(例中括号为本文所加,原词典没有):
保密 这将是我一生最难[保的密]。
拨款 地方政府[拨的款]不够用。
操心 父母们为孩子[操的心]太多了。
我们统计了一下,该词典中涉及91个离合词的共99个配例都误用了名词性的短语,配例讹误的条目占该词典条目总数的30%多。
离合词的聚合形式和离散形式在意义上一脉相承,不分立义项是正确的,但应分别举例,并用符号“|”或者“||”相隔。举例应该合式1个,离式1个或2个;肯定与否定形式并存的,可以对举2例,如“站得住|站不住”,肯定在前,否定在后。endprint
四、 加强相关理论的研究
对词典编纂中在离合词处理方面存在的种种问题,需要从两个方向来研究解决。笔者谨提出一些建议。
(一) 加强对离合词特点的研究
对离合词本身的研究,似可包括这样几个方面。
1. 离合词的界定
对离合词的界定不够明确,就会造成词典收录离合词或过度或不足的问题。编纂词典,首先遇到的是离合词的甄选问题。只有基于理论研究来甄别离合词,准确辨清离合词与离合现象,对条目收录、离散性标识等问题进行充分的定性和定量研究,才能系统解决词典编纂等实践应用性问题。
2. 离合词表的研制
离合词研究应该是理论性和实践性结合的。目前虽然有四部专门性词典和各版《现汉》,但词表有较大出入。有的不是离合词,也收录在内;而应该收录的离合词,又未收录。选词标准和举例等不尽一致。可见,研制規范统一、全面适用、广泛接受的“现代汉语离合词词表”很有必要。
3. 专门语料库的建设
没有真实、全面的语料作为基础,语言理论研究难免“只见树木,不见森林”。现有几部词典中,有些收词量大,但是凭语感造句,如《现汉》和《现代汉语“离合词”用法词典》;有的虽依靠真实语料,但是收词量较小并且收词注重对外汉语教学,不能反映离合词全貌,如《边听边记HSK离合词》《汉语常用离合词用法词典》《现代汉语离合词学习词典》。要对离合词有比较全面、系统的认识,大规模的真实语料必不可少。因此,需要建设专门的离合词语料库,广泛搜集它们的合式使用实例和离式使用实例。
(二) 优化词典编纂工艺
在词典编纂过程中,建议从下列几个方面优化编纂工艺。
1. 基于语料库考察离合词
利用语料库补充条目或义项、用法,纠正偏误,改变过去只凭个人语感而无基础语料的辞书编纂情况。胡明扬(2006)指出,词典编纂应该“不凭个人主观认定而从大规模的实际用例出发来编写释义和选择引例”。语料库对离合词研究和词典编纂具有重要意义。现在,词典中一直存在着离合词不能穷尽列举的现象,其中一个原因就是没有依据真实的语料来遴选、标识离合词。依据大规模的真实语料,可以发现许多在词典中作为非离合词的双音节词,实际上却能离散使用。
2. 注意演变性与沿袭性相结合
词汇发展变化较快,就需要时时注意新旧要素更替变化,并结合语料库等做好历时、共时的对比考察。一些双音节词从近代汉语沿用下来,如果不做历时、共时的对比,会使得一些离合词的离散形式被误判为修辞性“析词”,如前面所举的“咳嗽”就是其中一例。可见,只有从演变发展的角度出发,在充分考察从近代汉语到现代汉语的发展过程中离合词的隐显兴替情况之后,才能做出更准确的分析。
3. 注意叠置性与继承性相结合
“叠置性”是地理学术语,指空间重合的现象。这里借用其表示不同语言单位在某些方面的重合,包括构成成分叠置、词语意义叠置。如果说继承性是指侧重对离合词离式的发展演变进行研究,那么叠置性是指侧重对离合词合式范围的研究。
汉语以字组词的特点,使得双音节词在组词成分上具有叠置性,如“擦澡、冲澡、搓澡、泡澡、洗澡”等词都有表示“洗身体”意义的“澡”,在组词成分上具有叠置性。《现汉》第6版中,这些双音节词都标为离合词。那么,就要考虑到像“洗浴、淴浴”“冲澡、冲凉”等意义相近、结构相同、组词成分具有叠置性的合成词是否也具有离散性。
进一步而言,很多词在意义上也具有叠置性,如“顶事、抵事、管事、济事”等词,都有“管用、中用”的意思。词典编纂者如果注意到它们的意义叠置性,标注离散性时就不大会遗漏其中的一个或数个。然而,《现汉》第6版对词语的意义叠置性考虑不周,对“顶事、抵事、管事”都标识了离散性,唯独“济事”没有标识离散性。
4. 注意整体性与照应性相结合
词典应该做到整体统筹、体例统一、前后照应。非离合词条目虽然不直接涉及离合词的使用,但是释义、举例时涉及本词典中已标为离合词的词语时,也要符合离合词的理论与应用,做到体例统一,臻于完善。以“洗澡”为例,在《现汉》第5版中以下这些词的配例与离散形式有关:
轻快 洗完澡,身上轻快多了。
爽快 洗个澡,身上爽快多了。
歇息 洗过澡就上床歇息吧。
尽兴 这个澡洗得真尽兴。
然而,“这个澡洗得真尽兴”这个例子,按照我们的标准,不是离合词的离散用法而是一般短语。如果考虑整体性与照应性,可以不举这样容易与离合词的离散用法混同的例子,换成别的例子。
五、 结语
本文指出词典在处理离合词方面的一些问题,也尝试提出了相关问题的解决方式。除此之外,我们认为学界要关注离合词的性质界定、功能类型等理论研究及其对词典编纂、对外汉语教学的影响,探讨语言基础理论与语言应用实践的关系;探讨利用语料库弥补词典在收词或义项方面的遗漏,纠正使用偏误,改变过去只凭个人语感而无基础语料的辞书编纂和教学情况。以后离合词词典编纂研究的重点,要分析基于客观语料组织编写离合词学习词典的可行性与必要性。应借助来源广泛、类型多样、真实自然、动态新颖的语料,详尽列举离合词的离散形式和统计使用频率等,进行分析阐释,寻求离合词衍生孳乳的规律并运用到学习词典的编纂之中。在离合词语料库基础上,充分挖掘词典编纂、汉语教学等实践中的应用性问题,寻求新型离合词词典的编纂途径。
参考文献
1. 高永安.边听边记HSK离合词.北京: 北京语言大学出版社,2009.
2. 郭绍虞.汉语语法修辞新探.北京: 商务印书馆,1979.
3. 胡明扬.中国词典编纂史上一个划时代的里程碑.语言文字应用,2006(1).
4. 施茂枝.述宾复合词的语法特点.语言教学与研究,1999(1).
5. 王海峰,薛晶晶,王景璞.现代汉语离合词学习词典.北京: 北京大学出版社,2013.
6. 王楠.第5版《现汉》对离合词的处理分析.辞书研究,2006(3).
7. 杨庆蕙.现代汉语“离合词”用法词典.北京: 北京师范大学出版社,1995.
8. 赵金铭.能扩展的“动+名”格式的讨论.语言教学与研究,1984(2).
9. 中国社会科学院语言研究所词典编辑室.现代汉语词典(第1—第7版).北京: 商务印书馆: 1978、1983、1996、2002、2005、2012、2016.
10. 周上之.汉语常用离合词用法词典.北京: 北京语言大学出版社,2011.
(责任编辑 郎晶晶)endprint