面向二语学习者的汉语易混淆词语词典和语料库建设
2015-05-11黄友
黄友
摘 要 文章主要探讨了如何编纂面向二语学习者的汉语易混淆词语词典。在“既帮助学习者辨别,又帮助其掌握辨别方法”的理念指导下,我们认为:1.应编纂针对不同母语学习者的汉语易混淆词语词典;2.词典收词以易混淆词语为对象;3.释义元语言应简明易懂;4.词典编排应突破传统程式,采用“先给例句,然后根据是否可替换来给出思考提示,最后描述区别”的编排程式;5.词典编纂应依托语料库。另外,还指出可建立带易混淆词语标注的面向二语学习者的汉语语料库和汉语中介语语料库。
关键词 二语学习 易混淆词语 词典 语料库
一、引 言
对外汉语教师普遍认为,词语辨析是教学中的难点。学生可能难以分清一些只有微妙差异且意思比较抽象的近义词,如“孤单/孤独/寂寞”“居然/竟/竟然”等的用法;也可能因母语的影响,误解或误用了在教师看来无需辨析的词对,如“祖国/故乡”“偏偏/故意”等;一些同译词也是相应母语学习者辨析的难点,如“本质/自然”是英语同译词,“事实/内容”是法语同译词,“正确/公平”是西语同译词,“赞同/满足”是阿语同译词。(郭志良 1988)
鉴于此,有学者提出使用“易混淆词语”(confusable words) 的概念,并指出“‘易混淆词语是站在中介语的立场、着眼于目的语理解和使用中的词语混淆现象并根据混淆的普遍程度归纳出来的词语类聚”。(张博 2005)
目前针对汉语词语辨析的词典主要是着眼于汉语语言系统内部的“同义词”或“近义词”词典,如:张志毅《简明同义词典》(1981),梅家驹、竺一鸣等《同义词词林》(1983),刘淑娥、佟慧君等《近义词辨析》(1983),刘叔新《现代汉语同义词词典》(1987),邓守信《汉英汉语近义词用法词典》(1994),林德金《凯氏现代英汉同义词近义词辞典》(1996),卢福波《对外汉语常用词语对比例释》(2000),马燕华、庄莹《汉语近义词词典》(2002),商务印书馆辞书研究中心《新华同义词词典》(2003),刘乃叔、敖桂华《近义词使用区别》(2003),杨寄洲、贾永芬《1700对近义词语用法对比》(2005)等。有两部针对英语易混淆词语研究的专著:孙湘生、龚艳霞的《英语易混词汇大全》(1991)和英国学者E. Carpenter编著的Confusable Words(2000)。(张博 2007)还有一部针对少数民族汉语学习的《现代汉语特殊同义词词典》(高莉琴 2000),所收的“特殊同义词”主要是“同音(近音)和换序同义词”,如“人才/文采”“收服/收伏”“侵入/入侵”“爱抚/抚爱”等,具有很强的实用性。然而,对二语学习者提出的众多易混淆词语的系统研究及专门词典编纂与语料库建设还很不够,可见,面向二语学习者的汉语易混淆词语词典和语料库建设是对外汉语教学实践中的一个重要课题。
二、词典编写理念
我们编写词典的理念是:“授人以鱼”的同时“授人以渔”。此类词典不仅应能帮助二语学习者辨析所列的易混淆词语,还能帮助他们掌握辨析的方法。
1.编纂针对不同母语学习者的汉语易混淆词语词典
有些易混淆词语是由于汉语系统内部原因产生的,有些则可能是因学生母语迁移产生的。后一种类型中有些可能具有语种的普遍性,有些则可能只针对个别语种。如日韩语的汉字与汉语汉字的混淆;又如引言部分所列举的同译词。这些同译词的混淆只在相应的语种中存在。鉴于此,应该编写针对不同母语的汉语易混淆词语词典,如《面向英语学习者的汉语易混淆词语词典》《面向日语学习者的汉语易混淆词语词典》等等。
2.易混淆词语的来源、类型及辨析维度
有些易混淆词语只是个别现象,另一些则具有一定的普遍性,词典收词范围应为后者。而针对某一母语又具有普遍性的易混淆词语如何得来呢?
(1)易混淆词语来源
张博(2007)指出:“易混淆词语存在于第二语言学习者目的语使用和理解两个层面,既表现为口头表达和写作中的词语混用,也表现为阅读和听辨中的词语误解。”结合张博的观点,我们可以归纳出易混淆词语的几个来源:1.中介语语料库中的词语偏误;2.学生考试、练习或交流时口头和书面表达中混用的词语;3.学生考试、练习或交流时阅读和听辨理解中的误解性词语偏误;4.汉语系统中音、形或义近似的词语;5.汉语与学生母语对比,尤其是同译词或近译词,有交叉关系的词;6.已有的汉语近义词、同义词词典中的部分条目;7.调查问卷;8.其他。
是不是所有的汉语近义词、同义词词典中的条目都需要纳入考虑呢?不然!因为有些近义词由于可以借助其母语翻译中介或其他手段加以区分,对于有些学习者而言,不算易混淆词语;而有些近义词较生僻,二语学习者学习的词语主要是词汇等级大纲中的词语,平时使用汉语主要是完成日常交际,那些书面性、文学性很强,或使用频度很低,或带方言古语意味的词语一般不会遇到,这些词语形成的易混淆词语对他们而言,一般可以忽略。如:“受伤/挂彩”“熟悉/熟稔”等。
(2)易混淆词语类型
根据影响学习者词语混用和误解的因素,可把汉语中介语易混淆词语分为以下几种:
A.汉语的音、形、义相同或相近诱发的易混淆词语
a.语音相同相近的词或词组。如:“权利/权力”“厉害/利害”等。
b.词形相同相近的词或词组。又可具体分为四种:
具有相同部件,如“话/语”“线/浅”等;
字形近似,如“千/干”“日前/目前”等;
异序,如“样式/式样”“兄弟/弟兄”等;
具有相同语素,如:“后来/以后/之后/然后”“鲜/新鲜”“有点儿/一点(儿)”等。
c.理性意义基本相同的词和词组。如“粗心/马虎”“诞辰/生日”“百分之/成”“两/俩/两个”等。
需要指出的是,有些词同时在音、形、义的两个或三个方面都易混淆,如“练/炼”“必须/必需”等。
B.因二语学习者母语负迁移形成的易混淆词语
a.同译词:见引言。
b.母语一词多义对应的汉语词。如:英语的live有两个常用义:(在某处)住,居住;(以某种方式)生活,过日子。学生学过“住”后,可能会误将汉语“住”与英语的live等同起来,表“生活”这一意义时也常用“住”,写出“我住的地方还留着封建的想法”这类句子。
c.母语汉字词与对应的汉语词。主要是日、韩等语言,如:日语“娘”表示“姑娘、女孩”的意思,汉语则是“妈妈”的意思,日本学生刚开始学习时可能混淆。
d.方言词与对应的普通话词。如,有客家方言背景的印尼学生在该用“吃”时,会误用“食”,造出“我们一般七点食早餐”这样的句子。(转自张博 2007)
(3)易混淆词语的辨析维度和方法
易混淆词语大多是近义词,有大量近义词辨析成果可供借鉴,可从语义、语法、语用三个大维度若干小维度进行研究。此外,词语的音、形以及跨文化视角等也应纳入考察。
有关易混淆词语的来源、类型与辨析维度和方法应在词典说明部分加以介绍,以便使用者系统地掌握辨析知识,再结合词典中具体的辨析,使他们更好地掌握辨析词语的方法,弥补词典收词的不足。
3.释义元语言简明易懂
既然词典是针对二语学习者,那么释义元语言(简单地说,就是解释词语所使用的词句)必须简明易懂,让词典使用者一看就懂,乐于使用,获得自信。为此,必须从用词范围、用词数量、专业术语和句式四个方面控制释义语言的难度。
释义用词范围应限定在初、中级词汇范围之内,并以初级词为主。用词数量应控制在3000个之内。1978年,Longman Dictionary of Contemporary English 仅用了2000个浅显易懂的核心单词诠释43500个词目,受到辞书界、语言界、教育界和翻译界人士的推崇。再以《现代汉语词典》第6版为例,词典中“干净”一词的释义是“没有尘土、杂质等”,且不说其准确性如何,“尘土”“杂质”本身比“干净”一词难,外国人查完“干净”,还要查“尘土”“杂质”的意思,会觉得麻烦、太难。
专业术语不能不用,但不能多用。可使用基本的、常用的专业术语,如“名词、动词、主语、谓语、陈述句、疑问句、单音节词、短语、褒义、贬义、书面语、口语”等。但比较专业的术语,如“语义、语用、句法、中心语、动补短语、偏正短语、自主动词、持续动词”等,尽量不用。另外,还可以在词典说明部分加上一个常用专业术语的汉语与其他语种的对照表。
句式方面,应尽量使用简单句、短句,不用或少用长句式、复杂句式。(赵新,刘若云 2005)如《现代汉语词典》第6版释“好奇”为“对自己所不了解的事物觉得新奇而感兴趣”。这样的解释就比较复杂,杂糅了“对……觉得……”“对……感兴趣”“所V的”“……而……”几个结构,这一释义可以改为“对自己不了解的事物,觉得很新奇,有兴趣”。例句也是释义的一部分,例句的选用也应遵循以上基本要求。此外,例句要规范、贴近实际生活、适量而有针对性(为对比分析服务)。传统词典从经典文学作品中选取例句的做法似不可取,我们主张从教材、学生创造的例子、日常会话、新闻语篇中选取例句,也可以由编纂者自编。如:《现代汉语词典》第6版中“悄悄”条有一条例证为“部队在深夜里悄悄地出了村”。这样的例句离学生的生活太远,可以换成“为了不吵醒妈妈,她悄悄地走了进来”“上课时,她悄悄和同学说话”。
4.词典编排方式的突破
(1)词对或词群的编排突破音节、词性等的限制
面向二语学习者的易混淆词语词典应突破传统近义词典只收词而不收短语、固定格式的限制。在编排词对或词群时,突破音节、词性等的限制,只要有可能造成混淆,就把它们编为一组。如:“既……又……/既……也……/又……又……/不但……而且……/不光……还……”等。
(2)突破以往词典的编排方式
以往词典的编排基本是:先给出词对;然后描述各自的意义;指出其同,给出例句;再分别描述其不同之处,给出例句。我们的编排方式则是:A.先借助语料库给出足够的典型而有效的例句;B.然后根据是否可以替换(a.能替换,替换后意思是否完全一致?差异在哪里?b.不能替换=差异)给出问题提示,引导学生在形成初步语感的基础上自己归纳异同;C.再用几条简洁的公式、图示、图片或说明给出参考答案,强调使用情境;D.给出一些常见偏误或练习题。
下面我们用一个例子来说明我们的编排设想:
夸张/夸大
(1)张悟本夸大了“食疗”的效用。
(2)黑客指责科学家“夸大”气候变化。
(3)Lady Gaga的衣着很夸张。
(4)一件衣服就3万元,他知道她没有夸大价格,但他觉得太夸张了!
(5)主持人幽默而又夸张的话把大家逗乐了。
根据以上例句,再利用语料库或网络,找出更多的例句,思考:“夸大”和“夸张”可以替换吗?两者的同与不同是什么?
以上例句一般不能互换。
“夸大”一般做动词,后面带宾语,另外的例子还有:夸大成绩/功效/优点等。
“夸张”一般做形容词,可以说“很/太/非常/十分/特别……夸张”,也可以说“夸张的话/打扮/表演”“夸张地说/表演/笑”等。
两个词都含有“夸”,“夸”的意思是夸奖,说得很好,很漂亮,实际可能不是真的这样。
“夸大”是贬义,知道事实不是这样,说话人说大话、言过其实;而“夸张”则有知道事实是这样,但是觉得有点不正常或不能相信,如例(3)、(4)。此外,“夸张”还是说话或写文章时,为了使话语更加生动,更有想象力,给人留下更深刻的印象,而采用的一种艺术手法,如例(5),再看下面夸张的艺术手法:
(6)他的嗓子像铜钟一样,十里地都能听见。
(7)这么巴掌大的地方,怎么住人哪?
(8)古代有个名叫夸父的人,为了追赶太阳而一路奔跑,他渴极了,喝完了黄河、渭河的水,还要继续追赶,最后渴死在路上,他遗留下的木杖,后来变成了一片树林,叫做邓林。
以上语句有什么特点?其中例(7)是夸大了还是缩小了?你还可以说一些类似的句子吗?第(8)是一个神话故事,你还知道其他相似的故事吗?
——夸张,可以往大和小两个方向夸张。如“一日不见如隔三秋”“白发三千丈”“疑是银河落九天”,以及“他瘦得像一只猴子”“鸡毛蒜皮的小事不要放在心上”“教室里安静得连针掉在地上都可以听得见”等。
电视电影、神话故事里常常用到夸张的手法,还有如《爱丽丝梦游仙境》《阿凡达》等。
这样的“夸张”表达法,可以让你说话、写文章更加生动精彩,以后多试试吧!
常见偏误或练习:
(9)不要(夸张*[1]/夸大)这个产品的功能。
(10)他知道数据是真实的,但还是觉得有点(夸张/夸大*)。
(11)她今天穿得很(夸张/夸大*)。
(12)他(夸张/夸大*)地大叫了一声。这是一部真正的学习词典,通过它,学生掌握的不仅是词语的异同,更是词语的辨析方式,词语所出现的典型语境,甚至词语所反映的文化。
三、语料库建设理念
词典编纂必须依托语料库。首先,例句需要从语料库中筛选;其次,学生利用词典来辨析易混淆词语之后,可能还没有真正内化成自己的语感,还需借助语料库,输入相关词语,得出若干例句,反复朗读体会其含义,验证给出的图示或说明是否准确,并最终内化为语感;再次,借助语料库,二语学习者便可通过词典编纂中介绍的方法去自己操作,包括词典中不可能穷尽的一些项目;此外,利用语料库,我们可以足量占有、穷尽分析语料,定量分析与定性分析相结合,提高释义的完备性、可靠性,促进释义的精确性、科学性;分析义频,筛选常用项目,淘汰不常用项目;运用搭配、语体等分析,揭示易混淆词语的区别性。遗憾的是,目前我们并没见到附有语料库网址的词典,更没有针对性的语料库或软件供用户查询、使用。
与面向二语学习者易混淆词语相关的语料库有两种:一是“面向二语学习者的语料库”,一是“汉语中介语语料库”。这些语料库根据学生母语和研究目的的不同,可以建成若干子库。目前针对语言研究的语料库确实不少,有汉语词频统计语料库、现代汉语语料库、中文五地区共时语料库等;但“面向二语学习者的语料库”和“汉语中介语语料库”则还在起步阶段,规模最大的是面向语言教学研究的汉语语料检索系统CCRL(为8亿多字次)。中国大陆已建成并可实际使用的“汉语中介语文本语料库”有5个:北京语言学院的汉语中介语语料库,南京师范大学的外国学生汉语中介语偏误信息语料库,中山大学的留学生中介语语料库,暨南大学华文学院的留学生汉语中介语语料库,北京语言大学的HSK动态作文语料库(1.1版);“汉语中介语口语语料库”只有一例,即北京语言大学的汉语学习者口语语料库,收入部分外国考生参加HSK口试的信息。目前我国汉语中介语语料库存在较多问题:如规模小,语料不全面,随意性强,检索不便,不能共享等。(张宝林 2010)
对于易混淆词语辨别而言,理想的自然语言语料库应该能够帮助二语学习者检索相关的易混淆词语(如标注了可替换词语,或对易混淆词语进行了标注,具有易混淆词语模糊检索功能),然后得出若干足够易理解并有用的例句。为了实现这一目标,我们认为语料库样本应主要取自日常会话和新闻语篇(有选择性的,对难词进行过干预的);要考虑词汇量的输出与复现,对于难以辨别的易混淆词语,不妨通过人工干预增加它们的复现;而理想的中介语语料库则应对词语偏误进行标注并能有效检索、系统分析。这些问题还有待深入研究。
四、结 语
本文主要探讨了如何编纂面向二语学习者的汉语易混淆词语词典及其语料库建设。当然,不管是词典编纂还是语料库建设都是一个系统工程,需要一代一代有志于此的专家学者共同努力。但语料库的建设应该先行,因为一旦能通过语料库获取需要的语例,二语学习者便可通过词典中介绍的方法去自己操作,包括辨析一些词典中不可能穷尽的易混淆词语。
附 注
[1]*表示句子不成立。
参考文献
1.高莉琴. 现代汉语特殊同义词词典.乌鲁木齐:新疆人民出版社,2000.
2.郭志良. 对外汉语教学中词义辨析的几个问题. 世界汉语教学,1988(1).
3.李绍林. 对外汉语教学词义辨析的对象和原则. 世界汉语教学,2010(3).
4.卢福波. 对外汉语常用词语对比例释.北京:北京语言文化大学出版社,2000.
5.马晖男,吴江宁,潘东华. 一种基于同义词词典的模糊查询扩展方法.大连理工大学学报,2007(3).
6.钱厚生. 语料库建设与词典编纂. 辞书研究,2002(1).
7.王永耀. 语料库介入的汉语语文词典释义途径.辞书研究,2010(1).
8.杨寄洲,贾永芬. 1700对近义词语用法对比. 北京:北京语言大学出版社,2005.
9.张宝林. 汉语中介语语料库建设的现状与对策.语言文字应用,2010(3).
10.张博. 对外汉语学习词典“同(近)义词”处理模式分析及建议.∥郑定欧主编. 对外汉语学习词典学国际研讨会论文集.香港:香港城市大学出版社,2005.
11.张博. 同义词、近义词、易混淆词语:从汉语到中介语的视角转移.世界汉语教学,2007(3).
12.赵新,刘若云. 编写《外国人实用近义词词典》的几个基本问题. 辞书研究,2005(4).
(上海大学国际交流学院 上海 200444)
(责任编辑 王慧敏)