谈对外汉语词典被释词的搭配原则
2015-04-29李禄兴
摘 要:在对外汉语词典编纂过程中,语料库的运用显得日益重要。一部好的词典应该充分利用语料库,注重体现被释词的常规搭配和高频搭配,注重常用搭配的分布和语法搭配的框架等。“名词+交流”和“交流+名词”的结构占了“交流”搭配的60%左右。因此,在对外汉语词典编纂中应该大幅增加这两类搭配的举例,并且描绘和提供常用高频搭配下的实际例句,以提高非母语学习者的语感,增强其学习效果。
关键词:对外汉语 词典 词语 搭配 语料库
一、被释词搭配的语料库原则
在语言研究中,语料库是一个由大量的真实语言信息组成,专供语言研究、分析和描述的语言资料库。当今我们谈及词典编纂的语料库时,一般都指电子语料库。这种语料库一般由大量不同来源的词语、句子、段落等组成,而这些材料又都是通过词语切分、属性标注等方式存入語料库的。研究者利用计算机可以从数百万、千万乃至上亿字的语料中调出某个词、短语或者句子的实例。所以,使用语料库可以快速针对某一个词汇搜索出海量的句子,这些句子涉及面广、内容真实、题材多样、表达自然,如能恰当使用,应该能满足对外汉语词典编纂对于例句的需求。语料库技术在对外汉语词典编写中的地位和作用越来越突出,可以说今天的词典编纂工作在某种程度上已经离不开语料库了。随着语料库规模的扩大、类别的增多以及功能的日益完善,可以为对外汉语词典编纂提供的素材和参考内容越来越丰富。很难想象如果词典编纂者还像过去那样靠主观语感、人为造句来编写词典,其科学性、实用性、适用性、准确性等如何得到保证。语料库技术的应用早在上世纪七八十年代已有相关研究,而利用语料库编纂对外汉语词典的研究则是近些年的事情。靳光瑾[1]、郑艳群和刘亚非[2]、郭曙伦[3]、季瑾[4]等都提出了语料库技术在对外汉语词典编写中的一些应用设计和设想,并在这方面进行了有益的探索。
一部词典包含三个最重要的构成因素,它们分别是被释词、释义与例句。其中被释词是一部词典的基础和核心,任何一部词典都要选定其收词范围、收词条目。也就是说,哪些词语可以作为被释词;释义则是一部词典的灵魂,兹古斯塔[5]认为“词义是词典编纂者所关注的中心问题”,但如何在词典中恰当地解释出或者体现出词义,则是考验词典编纂者学识、经验、技巧以及编写态度的重要方面;例句则是词典的“血肉”。Sidney I.Landau[6]说:“例证可以传达有关搭配、使用变体(正式程度、诙谐语体或庄重语体等)、内涵意义、语法(某一动词是否带间接宾语等),当然还有指称意义等各方面的大量信息。通常没有比采用例证更好的办法来揭示这些信息的了。”黄建华、陈楚祥[7]指出“例证不仅可以补充说明词的意义,使其具体化,而且可以说明它的用法,包括它的语法特点、搭配范围、修辞色彩等”。对于对外汉语词典来说,例句设置就更应该注意其科学性和实用性,要从学习者的角度着手,按照第二语言习得的基本规律,体现学习者的学习梯度。它不可能是随意的,也不可能是随机的。如何才能保证被释词的搭配不随意也不随机呢?语料库的原则是唯一的、根本的途径,是词典设例的一个重要原则,也是保证词典科学性的一个重要方法。一个好的语料库,能提供语言使用的有力证据,并能够提供更多关于词语意义和用法的可靠信息。靳光瑾[1]说:“语料库是真实语言文字的集合,基于语料库的辞书编纂更强调辞书内容、释义、例证的真实性,拉近辞书内容与用户的距离,使得辞书编纂更贴近用户的需要。另外,语料库可以提供情景、语用等丰富信息,以此为出发点可以构建基于情景语义的新模式的辞书。”应用语料库的方法,我们可以统计语料库中被释词的使用情况,按照实际语言环境中,被释词语法搭配关系频度的高低对它们进行排序,然后将结果作为配例的依据。
由于汉语是非形态或少形态的语言,所以词类问题以及词与词的搭配关系显得非常重要。一般语法书上或者教材里处理词汇的时候,只是指明该词为某类词,然后说明这类词的语法特征。例如:先指出“交流”为动词,然后举出[主+交流]、[交流+宾语]、[动+交流]、[交流+补]几种类型[9],每种类型下面举出若干短语例子,然而,一般对外汉语词典处理得还没有教材或者语法书详细。指出这些类型的特征一方面可以让学生掌握部分信息,另一方面还不是非常确切,或者离学生掌握该词还相差很远。因为框架内的词语是有选择性的,而不是泛泛的。以“主语+交流”的框架为例,什么样的主语,表人的还是表物的,施事还是受事,对主语的词性有无要求等条件,都会限制学生无法根据这样的框架造出正确的短语和句子。在语言组合式、运动式过程中,词与词的搭配是有条件的,也是有规律的,“可以说,词是一种磁性体,在运动中,只同相吸的词语搭配而同另一些词相排斥”[8]。“交流+宾语”的结构中,对宾语的要求是有定的,不是所有的名词都可以充当“交流”的宾语。留学生常常造出“我们交流了礼物”“交流一下位置”这样的误句。搭配关系既与词性有关,也与词义有关,如果不了解搭配的意义关系就会产生搭配不当的错误。由此可见,被释词搭配以语料库为基础,体现搭配的对象、频率、类型等对学生是大有裨益的。
二、“交流”搭配的词频原则
常规搭配指词语的搭配比例较高、很多人使用的规范用法,非常规搭配指临时借用或者误用、搭配比例较低的非规范性用法。由于语料库中收集的语料都是原始语料,基本没有进行规范化加工、纠错等,因此难免收录一些非常规搭配。对外汉语词典编纂在使用被释词的时候,应该注意避免这种非常规的搭配。我们基于北京大学中国语言学研究中心CLL语料库(4.77亿字)、北京语言大学《现代汉语研究语料库》(200万字精语料)、北京大学计算机语言学研究所《人民日报》语料库(2700万字)、现代汉语语料库(1亿字)等,对“交流”的搭配作了一个统计。
从上面的统计可以看出,常规搭配的数量占绝大多数,但仍有少量的非常规搭配。在非常规搭配中,“交流锐减”“交流下滑”等应为“交流量锐减”“交流量下滑”,“拓宽交流”显然是缺少了某个成分,如“拓宽交流渠道”等。在对外汉语词典编纂中,即使到了高级阶段,仍应该尽量去除这些非常规搭配而选用常规搭配,最大限度地保持汉语规范化的表述方式。
通过语料库不仅可以获知被释词的搭配对象,而且可以获知其搭配对象出现的频率。以往编写对外汉语词典的时候,编者通常根据语感来判断被释词语法搭配的常见度,但缺乏一定的科学验证方法。有时候为了照顾词语搭配的全面性,每个词语的搭配只出现一次,而没有体现其高频搭配的特征。高频搭配是留学生运用汉语的关键,教师讲解生词的时候往往让学生造句,而学生经常完全根据词义造出一些错误的句子。如果能够运用语料中50%以上的搭配规则和搭配对象,就能保证学生造出来的句子至少不会在搭配上出现错误。例如:
(1)*反而不同性格的人在一起,他们不但可以互相~不同的性格,更可以明白到之间的好处,更可以提高自身的素质。
(2)*在城市里,生活条件好,交通也比较方便,至于跟别人的~也相当丰富。
上面两个例句中,“交流”的搭配就出现了问题,“交流性格”“交流丰富”这样的搭配在语料库中没有出现,在汉语的句子中也就不能随意使用。为了让学生通过词典了解被释词的用法,词典例句在某种搭配上可以体现高频的特征。我们以李晓琪《汉语常用词用法词典》(P333)为例,来看“交流”在例句中的搭配:
(3)~学习体会/会上,大家~了经验/可以把多余的物资拿出来,互相~一下儿/会议还没有开始,代表们就~其各自的情况了。
例(3)中用到了三个述宾结构:“交流体会”“交流经验”“交流情况”,占75%,这符合高频搭配高频出现的原则。汉语学习者可以通过这样的动宾搭配很好地体会其所带宾语的特征。如果教师辅以合理的补充,告诉学生“交流”是动词,常常带宾语,根据这个特点学生就会通过其所学语法知识,转化成其他语法形式的正确搭配。例如:可以说“经验交流”“思想交流”“情况交流”等主谓结构的短语,也可以说“思想的交流”“经验的交流”“情况的交流”等定中结构的短语。如果搭配正确,很多语法格式也就会正确,再运用到句子中就会写出符合汉语语法的句子。
再以李忆民《现代汉语常用词用法词典》为例(P610),在“交流”词条下给出的例子则全部是“述宾搭配”。
(4)会上,代表们~了交通管理的经验。/他俩互相~着学习心得。/在一起工作三年了,他们从没~过思想。/我们虽然是同行,却难得在一起~~各自的研究成果。
根据上述图表的统计,“交流”带名词性宾语的使用频率最高,因此,上述例句搭配的都是名词,也完全符合高频搭配高频出现的特征。加上其重叠使用的“互相交流”“从没交流”“难得交流”等结构,覆盖了“交流”结构频率的50%左右。
有些词的搭配基本是固定的,或者某个被释词对应某个搭配词的比例高达90%以上,这时候就基本可以忽略其他搭配方式,而把90%的搭配规律充分体现在词典中。如“不争”在语料库中出现“不争的事实”的频率是94%,而“不争的道理”“不争的常识”加起来不超过6%。“不堪设想”与“后果”搭配比例也高达92%,所以例句中的搭配可以基本上以此类配为主。当然,“后果”的位置和功能可以有所不同,可以作主语、中心语等。
语料库为我们提供了充分的搭配語料,使我们可以穷尽式地分析某个词到底可以搭配多少词汇,从而全面掌握该词的搭配数量与搭配特点。对外汉语词典编纂者不必再搜肠刮肚地想某个词的用法,而完全可以根据语料库提供的数据进行筛选,其中一个重要原则是应体现常用搭配的丰富性和多样性。
高频搭配能保证被释词的常规用法,学习者当场或当堂造句是最实用和有效的手段。但是造句只是一种机械式的学习方法和学习手段,在实际语言应用中,会出现各种各样的场景和交际环境,当学习者一时找不到准确的词汇时,就可能会创造性地使用某个词语,从而造成搭配上的错误。所以在可能的情况下,对外汉语词典应该提供充足的搭配,以保障词典受众和使用者对被释词有较为全面的掌握和了解。仍以“交流”为例,看看《HSK汉语水平考试词典》(P326)中的例句。
(5)大家常常在一起~经验|两省决定定期~物资与人才。
对于有70多个搭配组合的“交流”来说,显然例(5)所提供的搭配范围是远远不够的,学习者很难通过这两个搭配举一反三,从而掌握该词较为全面的用法。相比而言,徐玉敏《当代汉语学习词典》的处理就要好很多。该词典(P442)在“交流”条下列举了除“释义句”外的6个句子,分别涉及到的搭配有“交流体会”“互相交流”“交流了一下儿”“交流研究成果”“交流思想”“政治、经济、文化交流”“希望交流”“进行交流”“正在交流”“交流看法”等10种用法,基本涵盖了交流的各种搭配,同时又体现了“高频搭配高频出现”的基本原则。通过查阅和通读这些句子,可以领会该词比较全面的用法,结合例句中的语境,学习者的习得效率就会大大提高。
体现常用搭配并不是说要把所有的搭配面面俱到地列举出来,毕竟词典受到规模、词汇量、篇幅等诸多因素的限制,不可能将每种搭配都体现得那么充分,若体现其70%~80%的搭配格式和搭配对象,则是比较合适的比例。此外,根据词典等级的不同,也可以有不同的取舍。
三、“交流”搭配的语法原则
被释词的搭配不仅体现在词语搭配上,广义的搭配还包括语法成分的搭配、语用成分的搭配等。词语搭配保证的是短语类型不会出现错误,而语法搭配则能保证句子符合语法,同时也意味着表达手段更加丰富。很多词典注重词语的搭配,列举了不少的短语类型,但学生还是出现各种类型的错误。因为短语仍然是备用的语言材料,就像一堆半成品的食材或者建筑材料,等待厨师或者建筑师去合理调配。仍以“交流”为例,其语法搭配包括是否带“了、着、过”等动态助词,是否可以“重叠”、是否可以带谓词性宾语、前后成分经常包含哪些等。如果结合词语搭配把语法搭配也体现出来,则会带给使用者更加高效的查读效果。当然,这种语法搭配不是靠说明性的文字,而是隐含在例句结构中的一种潜在构思。再以“害怕”为例,语料库中“害怕”的名词性宾语非常多,理论上说是很难穷尽的,某个人所害怕的东西、动物、现象等很难一一列举出来,但“害怕”不仅可以带名词性宾语,还可以带谓词性宾语和小句宾语。《新HSK5000词分级词典(一~三级)》(P252-253)中的例子如下。
(6)他害怕一个人在家/打雷的时候她很害怕。/我害怕考试,一考试就紧张/他做错了事,害怕被老师批评/他害怕极了,连看都不敢看/你越害怕困难,困难就越多。
例(6)中,被释词出现的语法功能搭配框架与语料库中的搭配是基本一致的,语法功能的搭配基本涵盖了被释词的日常用法(因该级别不涉及离合词问题,所以没有出现离合用法),对初级(预备级)水平的汉语学习者来说已经足够了。被释词的语法搭配也并不是越多越好,而应该体现其常用的原则。再以《HSK汉语水平考试词典》中的名词“盆”为例。
(7)盆景|盆栽|便盆|骨盆|火盆|脚盆|瓦盆|澡盆|聚宝盆|倾盆大雨|花盆里载着一棵五针松|倒一盆水,洗洗脸。
暂且不论作为语素构成的上面这些词语的语义留学生是否能够理解,其语料库统计中最常用的几个搭配并没有出现在词典中,例如“(洗)脸盆”“饭盆”,尽管这两个词可以看作短语,但至少应该体现在句子中。此外,“盆”作为名词时,其所使用的量词搭配在语料库中出现的频率也相当高。“一个盆、一个……盆”3种语料库中共出现了482次,而且也更生活化,对于词义的理解是非常有帮助的,而词典在这方面却没有体现。基于此,现在很多词典编纂者开始使用“语法搭配框架”进行编写,即在语料库和语法特征的基础上,进行对外汉语词典的编写,初稿写成以后再抽去搭配框架,让词典呈现出一种自然的状态。例如:
(8)交流:[动]互相把自己有的供给对方:[带宾语]他们~了学习汉语的经验︱~物资︱~技术︱~人才︱[重叠]~~思想感情‖[作谓语]双方的情况都在会上~了︱[带状语]经常~︱广泛~︱定期~‖[带补语]在教学方面,两校~过很多次︱~完︱~不了︱~一下儿‖[作定语]两地~的方式很多︱~的内容︱~的方面︱~的愿望‖[前面加动词]两国之间要进一步扩大~︱进行~︱开展~︱需要~[作主语]~比较频繁︱~增多了︱~太少了‖[作定种结构中心语]近几年两国加强了文化~︱城乡~︱学术~︱校际~。
这种搭配框架一方面来自被释词的语法特点,另一方面来自语料库中的语料收集。通過这种结合语料搭配框架的描写,尽量减少搭配遗漏,从而可以最大限度地体现被释词的功能和用法。
参考文献:
[1]靳光瑾.基于语料库的数字化辞书编纂平台研制与应用[A].对外汉语学习词典学国际研讨会论文集(一)[C].香港城市大学出版社,2005:146.
[2]郑艳群,刘亚非.语料库技术在HSK量词学习词典编纂中的应用[A].郑定欧,李禄兴,蔡永强.对外汉语学习词典学国际研讨会论文集(二)[C].北京:中国社会科学出版社,2006:363.
[3]郭曙纶.语料库技术在对外汉语学习词典编纂中的应用与实践[A].郑定欧,李禄兴,蔡永强.对外汉语学习词典学国际研讨会论文集(二)[C].北京:中国社会科学出版社,2006:353.
[4]季瑾.基于语料库的商务汉语学习词典的编写设想[J].语言教学与研究,2007,(5).
[5][捷]拉迪斯拉夫·兹古斯塔.词典学概论[M].北京:商务印书馆,1983:21.
[6][美]Sidney I. Landau.词典编纂的艺术与技巧[M].章宜华、夏立新译.北京:商务印书馆,2005:226.
[7]黄建华,陈楚祥.双语词典学导论[M].北京:商务印书馆,1997:76.
[8]张寿康,林杏光.现代汉语实词搭配词典(序言)[Z].北京:商务印书馆,1992:2.
(李禄兴 北京 中国人民大学文学院 100872)