试论我国现代编码型语文词典的编纂原则
2012-08-07杨金华
杨金华
(上海外国语大学国际文化交流学院 上海 200083)
一、编码与解码词典的界定
词典学界按照服务功能把词典分为积极型词典和消极型词典,近些年又出现了编码词典和解码词典的说法。其实,两种说法实质相同:一是对词典类型的重新定位,二是对词典凸显某种服务功能的总体评价。关于解码型和编码型词典的界定,钱厚生(2010)指出:“理解型词典又称解码型词典,主要阐释词义,帮助读者弄懂陌生词语,排除阅读障碍……应用型词典又称编码型词典,除了阐释词义,还要介绍词语用法,指导读者正确使用。”其实,这种说法并不很准确。编码词典不仅仅指应用型词典,还包括其他类型的词典。以英语词典为例,它们有的是学习型词典(如《朗曼当代英语词典》),有的是单语普通语文词典(如《柯林斯英语词典》),还有的是大型普通语文词典(如《新牛津英语词典》)以及国内外通用词典(如《剑桥国际英语词典》)(解海江等 2010)。由此可见,编码词典和解码词典不仅是词典的不同类型,更是词典编纂理念和服务意识发展进步的集中体现。
二、编码词典与解码词典的对比分析
编码词典和解码词典作为两种不同类型的词典,服从于不同的编纂宗旨,有着不同的解决问题的方式,最终达到不同的目的,两者在具体编纂细节和处理方法上都有着明显的差异。下文就几个主要方面做些对比分析。
1.编纂目的不同
解码词典主要是为了帮助读者弄懂陌生词语,排除阅读上的障碍。而编码词典不仅要帮助读者理解意义,还要帮助其解决语言应用上的问题,最终目标是指导应用。
2.释义范围不同
解码词典的词条一般包括词形、语音、词汇意义、词性标注以及例句等词语的基本语言信息,尽可能在这些方面给予明确的规定,以帮助人们理解陌生词语。编码词典不仅从静态的角度对词语的上述方面进行规范,而且力求通过增加各种相关信息达到对语言动态应用——词语应用每个主要环节的具体指导。
3.释义方式不同
解码词典主要采用简约的释义方式,以其简短精练之优势把主要的词汇意义讲清楚,帮助扫除阅读上的障碍。相关的隐含意味、色彩等信息读者可根据上下文自行品味和理解。编码词典基本不采用同义词释义法,而是详尽地解释说明词义,标明其进入语句的各种相关因素、搭配上的限制和要求等。
4.语法信息不同
早期的解码词典对词目的语法属性一般不做标注,现代解码词典中有的只对虚词做词性标注,有的对实词和虚词都进行标注。但除此以外对词目的语法结构不做描写。编码词典不仅标注词性,还会提供更多的语法搭配信息,并对一些隐性的规则和使用条件加以揭示。
5.例证不同
早期的解码词典很少配例证,现代解码词典大多在需要时配以例证,且多是短语例,目的之一是证明义项的存在,之二是帮助读者理解和掌握其基本用法。编码词典更注重例句的典型性,往往利用语料库在句型、功能、常用性、语义表达等方面提供合适的例句,充分展示词语在语言中最自然、最真实的一面,同时显示词语所在的上下文或语境、同现词语的情况、使用特点,等等。
6.词条信息不同
早期的解码词典信息主要由词形、语音、释义等构成,现代解码词典的词条信息有所增加,除了上述的几项信息外,还有例证、色彩、语域、相关用法的提示等,但在信息的匹配等方面尽量简约。编码词典或以括注的方式指出词目词对与其搭配的词语的要求、同义词、反义词、不同的表达方式、常用结构,或以专项信息的方式指出其具有的语体色彩、常用的语域等。在信息种类上,编码词典通常以丰富的语料为基础,向读者展示语言中词汇、语法、语义、语用、词源、文化、历史、习俗等各种信息,特别注重帮助读者全方位地把握词语的应用。
三、我国编码型语文词典的编纂原则
1.以读者为中心,以指导使用为己任
无论以哪一类群体作为服务对象,编码词典的定位始终不变:一切为读者服务,以指导使用为己任。这是编码词典编纂的基本宗旨、根本目标和首要原则。
虽然任何词典都是根据某类读者群体的特殊需要、为满足他们的需要编写的,但这并不等于以读者为中心。如“文革”期间我国市场还没有类义词词典,部分读者在表达时经常感到用词单调、贫乏,为没有同类的词语可供挑选、不能查到贴切而新颖的表达法而感到苦恼。市场根据需求出版的相关词典,只是基本满足了这部分读者群体的需求。至于词典能否真正为读者释疑解惑,能否从读者的角度考量释义和各种信息的给出,有效地为他们服务,就很难说了。
以读者为中心,把指导其正确使用作为基本任务,要求编码词典在词语的基本信息之外提供设计周密、布局合理、种类繁多、说明详尽的信息,突出全面指导读者使用的功能。下面我们结合一些具体问题来分析应如何从读者的实际需求出发,通过开发新项目或挖掘潜力来为读者服务。
(1)广泛收立词目,多维揭示其纵横关系,以充分展示词汇全貌
考虑到读者各种需求的可能性,编码词典应在特定范围内尽量广收词目。例如,编码型普通语文词典不仅应收录各类普通词汇,更要关注易被忽略的习语、短语、词缀、地域和社会变体、框式结构、缩略语、禁忌词语、专业词汇以及少有书面记载的口语词。此外,改革开放以来我国新词新义大量涌现,网络词语层出不穷,对此,词典也应酌情收录。而应用型或学习型词典,前者应注重常用和实用,后者则有特定的服务对象,两者在词汇层次、范围及难易度等方面则应另有所考虑和取舍。
按照认知语言学原理,一个语言单位在人的心理词库中并不是孤立的,它总因某种因素与其他单位发生联系并类聚成群。因此,词典可在对词目的各种用法进行梳理的基础上,全方位地展示词目的组合和聚合关系。这一方面能反映人的心理词库中词语之间的内在联系,另一方面对帮助读者理解和正确使用词语具有潜移默化的作用。如果仅从静态角度对词目进行解释,提供词性、释义、例句等孤立的信息,则无法揭示出词目的多维联系。这种以原子观主导的做法不适合编码词典,因为它不利于词语的摄入、记忆和学习,不利于词语间的联想和激活扩散,读者也很难全面了解并正确使用。因此,编码词典应酌情为一些词目(出现频率较高的、有特殊搭配的、用法复杂的,等等)提供一些动态信息,如派生词、同义/近义(前两者须指出其不同)/反义/类义词、习语、短语以及搭配关系,必要时还可加上口语短语框、辨析框及提示框等。不同类型的学习词典可酌情考虑以下的附加信息,例如:
看 动①使视线接触人或物。(例略)
同义:瞧(口语);望(向远处看);瞪(睁大眼睛用力看);瞟(斜着眼睛看);瞅(北方方言);视(语素)……
构词:看见(看到);看望(访问);观看(特意地看)……
辨析:看-看见:“看”着重在动作,“看见”着重在结果。
相关表达:看看;看得着;看不着;看了看……
短语:看上去;看起来;看得起;看不起……
成语:看风使舵;看菜吃饭……
视 语素①使视线接触人或物。(例略)
同义:看(中性)。
构词:视力(眼睛辨别物体形象的能力);视野(眼睛能看到的范围);近视(只看清近处的、看不清远处的物体);平视(眼睛平着向前看)……
成语:视而不见;熟视无睹…………
(2)提供周详完整的语法信息以帮助读者正确地组词造句
词语是句子的基本单位,也是表达、交流思想的基本要素,组词造句,表达思想需要按照一定的规则把词语组织起来。虽然词语作为静态单位有其入句的基本条件(词性)和规则(词在句中的功能),但仅靠这些基本条件难以保证造出正确的语句,因为它还受很多其他因素的影响。不妨来看以下词语的注释:
编码词典应尽量增加词目的个性信息,特别要根据读者对象的特殊性酌情增加句型以及其他相关的语法信息。例如,应适当补足词语进入语句的语法知识,如语序、组成语段的限制条件、动词的及物不及物、配价及其前后词语的搭配等,以备读者查检之需。如“很”是个使用频率很高的词,但使用中却有很多限制。不同的词典应酌情提供其使用规则,以免读者因相关信息的缺失而出现使用偏误。诸如下列信息可供选择:
很 副Ⅰ表示程度高。这工作很好︱他跑得很快。……注意:①形容词作谓语时,“很”有成句作用:这个苹果很甜︱那里的风景很漂亮。②单音节形容词前加“很”,凑成双音节:很多人︱书很重。③有些形容词不受“很”修饰:*很错/*很广大。④形容词的生动形式不受“很”修饰:*很火辣辣;*很雪白。⑤很+形容词修饰名词时要带“的”:很高的山︱很宽敞的房间。但“很多”修饰名词不带“的”:很多人︱很多动物。
Ⅱ用在动词或动词短语前,表示程度高:很应当︱很能干。注意:①有的助动词构成动词短语不受“很”修饰:*很要走︱*很可吃。②用在部分表示心理、评价、情绪的动词前:很高兴︱很愿意。③很多动词不受“很”修饰:*很唱︱*很喝︱*很游。④有些不受“很”修饰的动词带宾语后便可受“很”修饰:很有意思︱很说明问题。⑤“很”只修饰少数动趋式、动结式:很过意不去︱很对不住。⑥修饰少量动词+数量词:很有两下子︱很费了一番心血。
Ⅲ①用在一些“不……”前:很不好︱很不简单。(不能说“很不复杂;很不反对”)②“不很”程度减弱,与“很不”不同:不很舒服(有些不舒服)︱很不舒服(很难过)……(吕叔湘2000)
(3)提供详尽细致的语用信息以帮助读者正确使用词语
一个词语因在特定的交际环境中使用而带有一定的个性特征或标记:或在褒贬色彩、语域分布、使用频率、交际场合的正式程度、说话人的态度或评价等方面带有一定的特征;或在词源、文化、历史、习俗等方面带有明显的标记。这些在使用时须牢牢掌握的特征或标记在交际中往往容易被忽略。如“脓包”虽指“无能的人”,但还带有“粗俗,贬义”色彩。比较典型的还有亲属词语,有的可用于直接称呼(如爸、妈),有的则不能(如父母、小舅子、小姑子),有的带有地区差异(如姥姥、外婆),有的带有感情色彩(如老太太、老太婆),等等。此类语用信息,大部分汉语词典中通常不给出或给出得不多,即便是外向型学习词典也是如此。不妨将语用标注相对较多的《现代汉语学习词典》(1995,以下简称《学习》)与法国的《拉鲁斯法语词典·供外国人使用》(1978,以下简称《拉鲁斯》)的语用信息做一对比,以说明两者之间的差距。
表1 两部外向型学习词典的语用信息对比
编码词典不应让读者凭感觉自行体会和领悟,而应考虑如何使各类语用信息显性化,注重揭示词语的使用个性,并以读者最能接受的方式呈现出来。如普通语文词典可做如下说明[1]:
好端端(的) 形情况很好,很正常:看到个头长高了、人成熟了、又好端端回到自己身边的儿子,母亲怎不高兴呢?注意:多用于复句中,即前一小句说明情况正常,后一小句表示情况转向不好的一面:~的,怎么又生起气来了?︱她曾渴望有一个温暖的家,但一个好端端的家却被拆散了。
活见鬼 〈口〉表示对某些事情的发生感到无法理解或不可思议;多指不愉快的事,有感到奇怪的意味。具有贬义色彩(杨金华2008):如果你认为真的有人会相信你说的话,那真是活见鬼了。︱这里边要是没问题,那才是活见鬼!︱无论那是种什么样活见鬼的关系,都一定令人恶心得要命。
(4)提供丰富、地道、典型的例句以证明和补充词义、展示用法
例句虽然是为释义服务的,但其特殊功用却是其他部分无法替代的。词典中有了释义,仍无法使读者清楚地了解某词在具体语境或上下文中的用法和具体意思,特别是特定语境中词语所特有的意义。从这个意义上说,例句是释义的延伸和补充,是确切化了的释义。反之,释义也因有了例句而变得更完整、清晰和具体。然而,现行的汉语词典中例证方面还存在一些问题:如有的词典例句明显不足,语段例多于句子例,语境不自足;大部分外向型汉语学习词典用例在难度和用词数量方面不加控制,也没有充分利用语料库的资源对例证加以梳理、筛选和提炼。为了保证例句的有效性(常用句型、语义典型、语境自足等),编码词典通常应考虑哪些词、哪些义项应设例证,哪些不应设;如何选择恰当的例证,如何展示例证和体现词语的不同用法、功能、搭配、语域、变体及其关系的分布,哪种类型的例句最典型、最实用且最符合读者的接受能力;是否有同义表达,之间有什么差别;怎么排序;等等。这些方面的工作除了需要进行广泛调查和深入研究外,还要以相关领域的研究成果及语料库的统计频率做后盾。
2.利用现代语言学的研究成果
词典不是对语言使用现状的纯粹记录和描写,而是对这种使用状况的概括、归纳、提炼和展示。同时,词典又对人们的使用具有规范和导向作用。由于人们会希望以独特、新颖的方式表达思想,往往在日常交际中对语言原有规则、意义和用法有所创新和突破,使语言呈现出纷繁多样的动态的一面,并具有某种发展变化的潜在动向。一般说来,词典对同时代语言现象及其使用特点的反映具有一定的滞后性。但编码词典应在展现语言常态及规范的同时对语言的潜在动向予以较多的关注,充分利用并及时反映各相关领域的研究成果,注重时效性、准确性及理论依据,力求避免随意性、与语言理论相违背等问题。举例来说,我们在语句中经常看到“归功于/归咎于/无补于/有赖于/有损于”等“双音节动词 +于”之类的结构段,词典对这类结构段立目出条的普遍做法是把“于”剥离出去,由动词单独出条。但《规典》却对“有损 +于”加以定型,并作为一个动词词目出条。由于没有充分利用汉语本体研究成果,其立目的依据明显不足。
首先,汉语本体研究表明,由于“绝大多数附缀‘于’在后附过程中纷纷脱落”,“真正的‘V/A于’三音节词汇词几乎不可能形成”。(张谊生2010)其次,据我们观察,在多数的“V于”结构中,“于”具有羡余性质,它与前面的双音节动词黏附是非强制的,不具备与前面双音节动词构成一个词的条件。其三,在语言现实中,“于”与前面动词的分合有时取决于语用因素(如韵律的协调、表达的简洁),有时与使用者的偏好有关。例如,下面三个句子既可用“有损”,也可用“有损于”。
吸烟有损健康。(《现汉》)
有损于集体的事不干。(《规典》)
中方绝不做有损湄公河下游国家利益的事。(中新网2008-03-26)
由于词语立目具有系统性的特点,《规典》把“有损于”作为动词出条,似应同时考虑对如下一系列问题的处理:第一,是否也应让“无损”的义项①(不会造成损害:无损于其光辉的形象)分离出来,以“无损于”出条?第二,“归功于/归咎于/无补于/有赖于”等和部分“双音节形容词+于”是否应该立目?第三,“标志着 /意识到”(“动+助”或“动+补”)之类的结构段是否可整体出条?此外,“有损于”取代动词“有损”载入《规典》之后,“吸烟有损健康”这一说法的正确性是否会遭到质疑?
对相关现象的确定涉及语言学的一些基础理论和基本原则,也涉及汉语自身的理论研究。编码词典应充分利用并及时、准确反映这些方面的研究成果,以便更好地发挥规范和导向作用。
3.以语料库为编纂依据
语料库是应用计算机技术对大量自然语言材料进行处理、存储,以供自动检索、索引以及统计分析的大型语言资料库,通常为某个具体目标而建。西方发达国家在这方面比较成熟,相关的研究已有50多年的历史(王馥芳2004)。我国自20世纪80年代业已起步,开始建立英语语料库,随后又于2003年建立了英语口语语料库。90年代至今也相继建立了古代汉语、现代汉语、汉语口语、汉语书面语、汉语中介语等多种语料库。目前汉语语料库较多被用于汉语本体、汉外对比及外国人学习汉语偏误等方面的研究,但因多种原因似乎还未成为汉语各类语文词典编纂的主要支撑。
其实,语料库中相当多的语料对于教材编写和词典编纂是非常有用的,特别是经过加工处理的语料更是词典可资利用的有效材料。如编纂各种类型的语文词典都可利用语料库对所需词语及其用法进行全面的统计,提炼出新的词汇意义或转义,以及语用、语法、语体、修辞、搭配等特点,将其用于条目注释,清晰地揭示出词目的主要用法特点、所含意味、同现倾向、文化意义等,帮助读者准确把握词语用法。再如,编纂学习词典,特别是外向型初级汉语词典应注重降低词典的读者准入门槛,对释义用词和例句的难度和词汇量应有所控制,可利用语料库统计出常用且浅显易懂并有一定透明度的词语作为释义和例句用词;句型信息可利用语料库找出最典型、最常用、最基本的,并配上简单、实用的例句。外向型中级汉语词典则可将收词及释词范围适当扩大,例句的难度以及种类适度放宽,自然语料适量增加,说明适当加深,语用信息适量增加,还可加上句型替换、同义词辨析、正误提示、词汇联想扩展、同族逆序词等。总之,所有这些方面的信息都须建立在语料库的基础上,并有计划地进行,以确保不同层级的词典互相衔接,不同条目相互照应,不同信息环环相扣,以便为汉语学习者提供易查、易懂和易用的工具书。下面举例说明利用语料库对词目新义的提炼,其他恕不赘述。
先看一组例句:
一九五八年大跃进,我们头脑也热,在座的老同志恐怕头脑热的也不少。
今天,两次头脑一热,于是,做了两件“傻事儿”。
我看到货品那么便宜,一时头脑发热就下了1000元的货单。
对语料稍作分析便可发现,“热”的这一用法与其原有意义有联系。“热”原指物体内部分子不规则运动释放出的一种能量,由此引申出“加热、体温升高”等多个义项,又由“体温高”这种病态表现义产生了现在的比喻义:因情绪冲动、失去理智而无法正确地做出某些行为。其实这一用法并不是新近产生的,但大部分汉语词典都没有收录。
诸如此类的义项、基本用法、搭配及相关特征等都可通过对大量语料认真仔细的梳理得到。
改革开放以来汉语发展很快,特别是新词语、新义项以及新用法大量出现。我国语文词典理应紧跟社会发展,及时反映时代风貌,采用计算机技术对庞大的语料进行细致的分析处理,并据此对词语进行多维描写(王馥芳2004)。这比人工分析更为方便、快捷、准确、可靠,也更符合现代语文词典的发展趋势。
四、结 语
编码词典虽是语文词典中的一类,但却反映着当今世界语文词典优化内容配置、提升服务质量、贴近读者对象的新趋势,值得我国语文词典借鉴。上述原则不仅适用于应用型、学习型词典,普通语文词典也可从中汲取部分要素。同时,其先进的编纂理念、周到的服务功能也可为解码词典所借鉴,后者可根据自身的编纂目标和读者对象,增加相关信息,调整词条构成,以便更好地为读者服务。
附 注
[1]以下例句均出自北京大学语料库CCL。
1.吕叔湘.现代汉语八百词(增订本).北京:商务印书馆,2000.
2.钱厚生.双语词典设计理念探微.辞书研究,2010(4).
3.孙全洲.现代汉语学习词典.上海:上海外语教育出版社,1995.
4.王馥芳.当代语言学与词典创新.上海:上海辞书出版社,2004.
5.解海江等.词典编纂理念的二度转向.辞书研究,2010(6).
6.杨金华.关于对外汉语词典编纂的若干问题.∥中国辞书论集(第八辑).武汉:崇文书局,2010.
7.杨金华.留学生汉语习惯用语词典.上海:上海译文出版社,2008.
8.雍和明等.中国辞典史论.北京:中华书局,2006.
9.张谊生.从错配到脱落:附缀“于”的零形化后果与形容词、动词的及物化.中国语文,2010(2).
10.章宜华等.当代词典学.北京:商务印书馆,2007.
11.Dubois J.Dictionnaire du Larousse Français Langue Étrangère.Paris:Larousse,1978.