APP下载

融媒时代外向型汉语学习词典编纂理念与实践

2022-04-26杨玉玲

关键词:用词辞书词典

杨玉玲

一、外向型汉语学习词典的现状及其融媒化的必要性、必然性

(一)外向型汉语学习词典的现状

作为辞书的古老国度,我国历史上有大量辞书可考,七大“强档辞书”既是“民族、国家集体记忆”,更是我国重视辞书事业的最好注脚①李宇明、王东海:《中国辞书历史发展的若干走势》,《鲁东大学学报(哲学社会科学版)》2020年第1期。。不过,我国虽可“称作辞书大国,但距离建成一个辞书强国还有很大的差距”②江蓝生:《为向辞书强国迈进而努力》,《辞书研究》2011年第6期。,尤其是外向型汉语学习词典既无法比肩内向型汉语词典,也难以和英语学习词典媲美,这与汉语“应用力”全球第二①数据来源于联合国《2005年世界主要语种、分布和应用力调查报告》。的排名实不匹配。

众所周知,英语六大学习词典不断推陈出新,获得了巨大成功。究其原因,除了英语是无可争议的强势语言之外,这些词典还做到了:由编者视角转向用户视角;收词多、规模大,极大满足了用户的查询需要;介质多样化,业已进入多模态立体化发展阶段,词典与用户、词典与媒体、词典与各类资源的交互极其频繁;严格控制释义用词数量,释义元词基本上控制在2000~3500之间,并配有插图帮助释义;配例丰富,搭配、用法全面;关注语用信息,使学习者能够学会使用,而不是只懂其义,凸显了学习词典的学习性。

汉语学习词典则相距甚远。虽然蓬勃的汉语教学事业使得汉语学习词典及其研究也得到一定的发展,先后有50余部汉语学习词典推出,但令人遗憾的是,95%左右的汉语学习者没有使用过中国出版的汉语学习词典②夏立新:《对外汉语学习词典的出版和使用者调查研究》,《出版科学》2009年第1期;章宜华、杜焕君:《留学生对汉语学习词典释义方法和表述形式的需求之探讨》,《华文教学与研究》2010年第3期;杨玉玲、杨艳艳:《汉语学习词典调查分析及编写设想》,《现代语文》2019年第2期。,而错误百出的PLECO却备受汉语学习者的喜爱③何珊、朱瑞平:《〈商务馆学汉语词典〉辨析栏的选词情况考察》,《云南师范大学学报(对外汉语教学与研究版)》2018年第2期。。这不能不令我们深思:为什么纸质汉语学习词典编者们煞费苦心的权威之作不被“青睐”,而错误百出的PLECO却独占鳌头?如何才能使汉语学习词典摆脱纸本词典“出版多应用少”而电子词典“应用广错误多”的尴尬处境?

(二)汉语词典融媒化的必要性和必然性

通过分析,我们发现汉语学习词典不被青睐的原因很多,归根结底是没有用户友好意识。例如,释义和配例用词过难,无元语言意识;配例不够丰富;学习性不够凸显,没有呈现词语的使用特点和语用条件;介质单一,纸质词典无法解决查询难的问题等。蔡永强也指出,“目前已出版的对外汉语学习词典之所以被冷落,恐怕在很大程度上是由查找困难造成的”。④蔡永强:《对外汉语学习词典编纂的用户友好原则》,《辞书研究》2011年第2期。而大量电子词典之所以受到喜爱,最主要的原因就是查询方便。然而,现有的电子词典多是单纯通过技术手段在网络中提取数据组建而成,并无汉语专业人员参与,内容错误较多,配例不分义项随意堆砌,而汉语二语学习者往往又对内容优劣缺乏判断能力,故出现上述错位问题。解决这一供需错位问题的根本出路在于发展汉语融媒词典,将融媒时代基本特点和优质词典内容有机结合,为真正面向二语学习者的优质词典插上技术的翅膀,实现汉语学习词典的“弯道超车”。

一语习得是在自然环境下进行的,而且自然环境是多模态的,正如胡壮麟、董佳所说“意义的构建和传递原本就是多模态的”。⑤胡壮麟、董佳:《意义的多模态构建——对一次PPT演示竞赛的语篇分析》,《外语电化教学》2006年第3期。根据传播学理论,接受信息时调动的感官越多,大脑中对事物的意象就越趋于真实,感官体验达到最大化时传播效用也最强⑥徐洁漪、席涛:《基于多模态感官理论的交互式数字艺术研究》,《工业设计》2018年第3期。。因此,“将多媒体和多模态引入词典能够降低用户的认知难度、提高其阅读兴趣和效率”,“可以更立体、更生动地阐释语义,并能进行人机交互,使词典从静态释义文本转化成动态语义情景”⑦章宜华:《融媒体英语学习词典的设计理念与编纂研究》,《外语电化教育》2021年第3期。。这样的词典应该是动态的、开放的、互动的,而纸质词典很难全面呈现多种模态,更无法实现各种媒体的有机融合,可见融媒词典并非将已有纸质词典直接电子化,而是必须在纸质词典权威释义的基础上大刀阔斧地重建。李宇明多次提倡研发汉语融媒词典,并指出“融媒体的关键是融”,“所谓‘融媒辞书’,本质就是跨界关联,是不同媒体的融合、编纂者与用户之间的融合、辞书与相关资源的融合”。⑧李宇明、王东海:《中国辞书历史发展的若干走势》,《鲁东大学学报(哲学社会科学版)》2020年第1期。

在科技加速发展的今天,汉语词典融媒化不仅必要,而且必然。汉语融媒词典是顺应互联网信息技术潮流而自我发展的必然,是适应用户获取信息新方式而自我改变的必然,更是辞书以知识服务参与建构社交化生活的必然。

二、融媒视角下的汉语学习词典宏观设计理念

传统辞书的编纂和研究多关注词典编纂本体,聚焦收词立目、释义的精准性,释义模式的科学性,例句的原则性等词典内部的微观设计,但在融媒时代的当下,囿于传统的词典本体研究显然无法满足融媒词典的需要。解海江、章黎平在对国外词典编纂理论进行详尽梳理的基础上,概括出词典编写理念的二度转向:先是从规定主义到描写主义的过渡;后由描写主义转向以读者为中心的实用主义,由体现编者意志变为以读者为中心,充分考虑学习者的需求。①解海江、章黎平:《词典编纂理念的二度转向》,《辞书研究》2010年第6期。张志毅、张庆云则对英法学习型词典及其基本编纂理念进行了系统梳理:把词作为集语义、语法、语用的统一体,突出语用,提示惯用法的二语习得理念;用最少的常用词进行释义的元语言理念;依托语料库进行收词、释义、举例的语料库理念;充分考虑语句自然性和完整性的语境理念;以读者为中心的读者本位理念。②张志毅、张庆云:《理论词典学》,商务印书馆2015年版,第3-14页。李宇明、王东海认为“融媒辞书改变了辞书的组织方式、表现方式和使用方式”,“由平面辞书向融媒辞书发展,也可以看作中国辞书史正在发生的第四大转变”。③李宇明、王东海:《中国辞书历史发展的若干走势》,《鲁东大学学报(哲学社会科学版)》2020年第1期。这一转变主要体现在以下几个方面:

第一,跳出词典编纂本体,放眼世界。融媒词典是词典文本和网络、AI技术、传播等有机融合的产物,所以融媒词典的研发必须关注词典和社会(世界经济发展,中外关系,汉语学习者的地域、年龄、职业特点以及人们的阅读、娱乐、生活方式等)、词典和技术(相关AI技术,如翻译、语音合成、图片取词技术等)、词典和用户的联系与互动(用户的个性需求、用户的参与意识和渠道等)、词典和其他相关学科(二语习得、教育学、心理学、信息传播学,甚至运营学等)的关系。

第二,跳出“大步慢走”,迎接“小步快跑”的编写、出版模式。传统词典编写、出版的模式是“编者视角的编写——出版社编辑——出版”,目前虽已告别“手抄+卡片”的编写方式,但“有相当一部分人还乐于用传统的书写和普通办公平台来处理词典文字”④章宜华:《论融媒体背景下辞书编纂与出版的创新》,《语言战略研究》2019年第6期。,这种速度显然无法适应融媒词典快速更新迭代的要求。更重要的是,这种模式的编写单位是“词典”,整部词典不彻底完成就不会接触用户,也就是说,直到词典最终达到编者和编辑自我满意的程度后,成品词典才会直接推到读者面前。此过程看似严谨,实则忽视了用户需求,无论读者喜欢“满汉全席”还是“私家小炒”,端上桌的都是读者没有见过“菜单”的“大餐”,谈不上用户意识,更谈不上私家定制。这种编者、编辑、出版方自认为的“严谨”和“大步”,实则是“忽视用户需求”的“慢走”。而融媒词典编写基于人机互助技术和语料库,利用专门的计算机辅助编写系统,不仅节省大量时间,而且便于格式体例的统一,方便技术生成和快速更新迭代,其编写单位不再是“词典”,而是“词条”,哪怕修改了一个词条也可以更新迭代。更重要的是用户需求在编写、修改过程中发挥着指挥棒的作用。因此,我们认为融媒词典的编写、出版模式应该如图1所示:

图1 融媒词典的编写、出版模式

融媒词典研发的整个过程都是在编者、发行者和用户的互动中实现词典优化的过程,而非编者、学者闭门修改的过程,这种看似不甚严谨的模式实则是符合时代特征的“小步快跑”。

第三,跳出编者视角,转向用户视角,体现用户友好性,凸显服务意识。章宜华指出:“当今词典编纂的目的不应再局限于用户的被动接受,而是要考虑在单位时间内尽可能地向用户提供‘足够’的动态词汇信息。”①章宜华:《融媒体英语学习词典的设计理念与编纂研究》,《外语电化教育》2021年第3期。这就要求我们在词典研发的整个过程中都要密切关注用户需求、兴趣和便利度,即用户友好性应体现在词典编写的每个环节,如收词立目足够全,满足用户学习和即时查询的双重需要;为了解决汉语检索难的问题,增加手写、拼音、英语、图片取词、图像、语音等查询方式;控制释义用词难度,选择适合二语学习者的释义模式;配例丰富、有语境;控制配例用词难度;配例排序体现从解码到编码;根据中介语语料库确定易混淆词词对;辨析方式不求面面俱到,但求符合二语者需要;设置常见偏误预警、自主练习和互动窗口;在充分听取用户使用体验及反馈基础上进行词典的修改完善;互动窗口问题并及时解决等。综上,融媒词典研发在关注词典内容的同时,必须要有服务意识,融媒词典实则是集“底层数据库、中层产品和顶层服务”于一体。

第四,跳出词典的查询功能,凸显学习功能,满足用户碎片化学习需要。这就要求学习词典由重解码转向解码、编码并重。钱厚生将解码型和编码型词典定义如下:“理解型词典又称解码型词典,主要阐释词义,帮助读者弄懂陌生词语,排除阅读障碍……应用型词典又称编码型词典,除了阐释词义,还要介绍词语用法,指导读者正确使用。”②钱厚生:《双语词典设计理念探微》,《辞书研究》2010年第4期。我们认为,学习型词典必须集解码和编码于一体,解码是编码的基础,解码是手段,编码才是终极目的。如上文所言,国内汉语学习词典不被“青睐”的原因很多,其中一个重要的因素就是没有很好地体现词典的学习性,而学习性的一个重要表现就是词典的编码功能。融媒词典既要满足用户阅读理解和查阅的需要,也要满足学习者语言产出的需要,因此需要提供各种适合积极使用所需的词语信息,如词汇搭配、易混淆词辨析、词语联想、用法说明、偏误预警、同族词汇、自主练习等,这些学习性特征是目前汉语学习词典特别需要关注的方向。

三、基于自主学习的融媒汉语词典微观设计及实践

上文谈到融媒词典的研发要跳出词典编纂本体研究的框架,但并非词典本体不重要,事实上“无论信息媒介和出版形式如何变化,词典文本的核心地位都不会变,变的是词典文本表征形式和编码方式”③章宜华:《论融媒体背景下辞书编纂与出版的创新》,《语言战略研究》2019年第6期。,一部优质融媒词典的灵魂和核心仍然是词典内容本身。对于汉语学习词典而言,已有成果为我们研发融媒词典奠定了一定的基础,但“基本上都是《新华字典》和《现代汉语词典》的删减本,没有真正从外国学生学习汉语的角度来考虑编写”④陆俭明:《商务馆学习词典·序》,鲁健冀、吕文华主编:《商务馆学习词典(双色版)》,商务印书馆2007版,第6页。。“真正具有原创性、创新性的并不多见,倒是不乏一些抄袭、变相抄袭的侵权之作,或是模仿、杂凑毫无新意的重复之作。”⑤江蓝生:《商务馆学习词典·序》,鲁健冀、吕文华主编:《商务馆学习词典(双色版)》,商务印书馆2007年版,第2页。所以要研发一款优质的融媒汉语学习词典,没有可以直接使用的文本内容,必须另起炉灶。下面我们将根据JUZI⑥该词典目前已完成10240个词目词的编撰,全典700万字左右,图片视频1万余幅,暂定名JUZI,目前已交商务印书馆技术生成中。研发过程从释义元语言、多模态释义、词汇控制理论下的配例、常用搭配的提取、易混淆词的辨析、自主练习的设计及语义关系网络的建构等不同微观角度探讨汉语学习词典如何走出困境。

(一)释义元语言下的多模态释义

“词典的核心问题是释义,这是国际辞书界的共识”⑦章宜华:《融媒体视角下多模态词典文本的设计构想》,《辞书研究》2021年第2期。,“一部词典的质量很大程度上取决于释义的质量”①胡明扬等:《词典学概论》,中国人民大学出版社1982年版,第122页。。判断释义质量优劣的标准除了是否精准之外,还应包括可理解性的高低,即用户是否“看得懂”。若词典呈现给用户的词语信息是不可理解的,那么无论释义多么精准,都形同虚设。已有汉语学习词典“在释义这个核心部分多仿效为具有中等以上文化水平的本族人编写的母语词典,所以既未能找到与外国读者的解读能力相适应的释义方法,又未能从外国人的需要出发提供足够的用法信息,以致几乎没有自己的特点”②杨金华:《突出“对外”特性的释义和用法说明——析〈商务馆学汉语词典〉的释词》,《辞书研究》2009年第6期。。对这种“内汉”释义问题学界业已提出质疑并进行了研究③阎德早:《汉外词典的编写与对外汉语教学》,《辞书研究》1995年第1期;夏立新:《〈商务馆学汉语词典〉释义存在的问题及改进意见》,《云南师范大学学报》(对外汉语教学与研究版)》2013年第1期。,也有学者对此提出了具体改进建议④李智初:《对外汉语学习型词典释义的优化》,《辞书研究》2012年第6期;翁晓玲:《基于元语言的对外汉语学习词典释义模式研究——以〈商务馆学汉语词典〉为例》,华东师范大学博士学位论文,2011年。,还有学者从宏观上提出了对策和出路,“简化释义的首要原则是不再简单拷贝《现汉》的释义,另辟蹊径;而另辟蹊径,不再以《现汉》为蓝本的重要举措就是在借鉴外向型英语学习词典编纂经验的基础上,研制出适用于外向型汉语学习词典编纂的释义用词词表”⑤蔡永强:《外向型汉语学习词典的释义用词》,《辞书研究》2018年第4期。,“界定与限制使用释义用词是解决释义问题的有效途径”⑥蔡永强:《从释义用词看中高级汉语学习词典的释义》,《国际汉语教学研究》2021年第1期。。这些质疑和对策都非常明确而中肯,对外向型汉语学习词典释义的改进具有重要的指导和借鉴意义,但至今尚无适用于外向型汉语学习词典的释义用词词表,更无真正践行释义元语言的外向型汉语学习词典。

即使在多模态词典中,文字释义在较长一段时间内仍然是释义的主要内容⑦章宜华:《融媒体视角下多模态词典文本的设计构想》,《辞书研究》2021年第2期。,所以提高释义可理解性的一个重要手段就是严格控制释义用词的数量。英语学习词典之所以获得巨大成功,重要因素之一就是严格控制释义用词数量。国外“在当代词典编纂实践中,使用定量词汇释义是一种主导趋势”⑧安华林:《现代汉语释义基元词研究》,中国社会科学出版社2005年版,第7页。,而汉语词典编写却很少考虑元语言问题,如《现代汉语词典》(第3版)收词6万余条,而所用释义性词语达3.6万多个⑨安华林、曲维光:《〈现代汉语词典〉释义性词语的统计与分级》,《语言文字应用》2004年第1期。。外向型汉语学习词典释义用词大多“尽量简明通俗”“尽量语言简约平易”“尽量使用本词典收录的词语”,“至于能‘尽量’到什么程度则存疑,因为没有一个具体的参照来说明‘尽量’的结果”⑩蔡永强:《外向型汉语学习词典的释义用词》,《辞书研究》2018年第4期。。下面两个定量统计可为此提供一个参照:杨玉玲等采取抽样的方法对《商务馆学汉语词典》的1500词目词和《当代汉语学习词典》(简称《当代》)的2000词目词释义用词进行了统计,结果显示,二者超纲词占比分别为16.38%和30.22%,释义文本难度平均分别为2.92/4和3.326/4,分别处于中等四级和高等五级。⑪杨玉玲、宋欢婕、陈丽姣:《基于元语言的外向型汉语学习词典编纂理念和实践》,《辞书研究》2021年第5期。对汉语二语学习者而言,这样的释义自然是不易懂的。汉语学习词典释义元词数量的底线到底在哪儿?为此我们遵循“把词典当成学生”“释义语言尽量低于被释词”的原则,完成10240个词目词的释义,在此基础上进行了释义元词的提取。初步结果令人鼓舞:整部词典释义元词3300个左右(释义尚在修改中,最终释义元词可能会有较小波动)。释义文本用词难度分布如图2所示。

图2 JUZI释义文本用词难度等级分布

这个数目符合我们日常使用的词汇量,也与英语学习词典的释义元词数量相仿,这一结果让我们对汉语学习词典释义元词的提取和研究更加充满信心,也让我们认识到汉语释义元语言研发这一基础工作不仅必要、迫切,而且可操作、可实现。当然,一部词典释义难易不仅体现在释义用词的总量多少和难易程度上,还体现在释义句法是否准确上,此不赘述,另文讨论。

释义元词有时会使释义精准性和简洁性受到影响,但其他模态元素的加入可以弥补这种不足。章宜华提出“多模态释义”的构想。①章宜华:《融媒体视角下多模态词典文本的设计构想》,《辞书研究》2021年第2期。在融媒时代,要提高释义的可理解性,不能单纯依靠文字释义,即使释义元词数量控制得很好,释义也会显得单薄、无趣,所以在融媒词典中还应充分利用图形、图像、符号、图表、语音、声音、视频等多媒体形式,使释义更加立体、生动、逼真,用以充分调动学习者的各种感官参与,使得词语意象更为全面精准,特别是一些中国特色文化词,如旗袍、琵琶、二胡、中国结、对联、粽子等,采用视觉、听觉模态与图像、视频等融合的方式能大幅提升词典释义和使用效果(如图3所示)。

图3 多模态释义

此外,还可以综合利用视觉、听觉等各种模态,借助整体和部分、类和种等关系图来凸显个体特征及其关系,逐渐丰富完善学习者心理词典的语义关系网络,使词与词之间逐渐建立起联系,即可以实现多项融通:鼠标点击某节点词可以发音,也直接链接到该词的释义信息,从任何一个节点词都可以点击出现整体图(如图4、图5、图6所示)。

图4 人体各部分名称

图5 各种厨具名称

图6 十二生肖图

这种融媒释义无疑会使二语学习者更容易完成识读和理解。虽然目前文字释义仍是释义的主要形式,但在融媒词典里其他模态已经不再是文字的附加成分,所有模态元素均可充当被释义词的意义表征。很可能在将来某一天,现在的图解词典会演化成以非文字模态为主的多模态词典,多模态技术将慢慢“削弱”文字释义的作用,成为释义的重要元素①章宜华:《融媒体视角下多模态词典文本的设计构想》,《辞书研究》2021年第2期。,加强多模态释义研究势在必行。另外,为了适应融媒词典查询终端的变化和多媒体的融合,词典的文本结构和释义内容也必须相应地发生变化。

通过搜索相关图片,我们发现此类图片多为英语学习者而设,针对汉语学习者的类似图片几乎没有,这从另一个侧面说明汉语学习词典要融媒化,需要做更多的基础性工作。

(二)基于可理解性输入的配例

“一部没有例句的词典只是一堆枯骨”,这句词典界名言很好地说明了词典配例之重要。成功的配例可补充说明词目词的意义,使其意义实例化、具体化。关于词典配例的作用和原则,学界多有研究②冯清高:《词典释例的作用及配例原则》,《广东民族学院学报》1993年第2期;付娜:《外向型汉语学习词典配例中搭配信息的呈现原则及实现条件》,《辞书研究》2010年第5期;蔡永强:《〈当代汉语学习词典〉配例分析》,《辞书研究》2008年第3期。,但对配例用词难度控制给予关注的学者却并不多,仅有刘川平、曾丹、杨玉玲等。刘川平指出汉语学习词典“用例内容和语言没有完全跳出面向国人的词典的路子,没有充分考虑读者对象的特殊需要”③刘川平:《对外汉语学习词典用例的一般原则》,《辞书研究》2006年第4期。。和释义一样,外向型学习词典配例用词难度也应控制,以用户看得懂为前提,否则配例就形同虚设,对此曾丹指出“例子中的词语应尽量控制在《新HSK大纲》的词汇范围之内,少用或不用超纲词汇”④曾丹:《论对外汉语多媒体学习词典的释义和用例原则》,《语文学刊》2015年第1期。,杨玉玲等也指出配例用词难度应不高于被释词的难度。⑤杨玉玲、宋欢婕、陈丽姣:《基于元语言的外向型汉语学习词典编纂理念和实践》,《辞书研究》2021年第5期。汉语学习词典配例用词到底如何?学界缺少定量研究。为了回答这个问题,我们抽取《当代》545个词目词和JUZI A字母段所有配例用词进行了定量统计。其配例用词难度等级分布如图7、图8所示。

图7 《当代》配例用词难度等级分布

图8 JUZI A字母段配例用词难度等级分布

可见无论是《当代》还是JUZI,配例用词难度控制均较理想,其中的超纲词多为专有名词,不影响二语学习者的理解。

除了配例用词应遵循元语言原则,对一部外向型学习词典而言,也应注意配例句法的使用。根据笔者词典编纂的实践经验,在外向型学习词典配例难度控制方面,无论是配例用词还是句法,我们认为都应遵循“≤i原则”,即配例语言难度应控制在不高于被释词的范围。如被释词是4级词语,原则上其配例用词和用句应“≤4级”。可见“≤i原则”需要分级别考查和控制。虽然配例难度控制比释义容易很多,但初级阶段被释词的配例稍不注意也会出现≥i的情况。如《当代》的配例:

爸爸(甲级) 爸爸,你偏心眼儿(超纲)。 他被爸爸批评了一顿。

办法(甲级) 土(乙级)办法 具体(乙级)办法 唯一(超纲)的办法。

粉碎(丙级)谣言(丙级)最好的办法是用事实(乙级)来说话。

显然,“被”字句、“批评、一顿、偏心眼儿、土、唯一、具体、粉碎、谣言、事实”等难度均高于被释词,都是不可被理解的,这实际上是可以避免的。

为了提高可理解性,除了释义多模态化,配例也可以多模态化。如拟声词“潺潺”的配例“流水潺潺”,如辅以图9小视频,利用声音、状态、颜色等多模态,效果比单纯用文字要好很多。

图9 视频释义

(三)基于语料库提取常用搭配和常见偏误预警

词的意义往往取决于其所赖以生存的语法结构。Firth提出“观其伴,知其义”,即“一个词的意义是由和它一起结伴出现的词语来体现的”①转引邢红兵:《词语搭配知识与二语词汇习得研究》,《语言文字应用》2013年第4期。,足见其对词语搭配的重视,张寿康更是直言词在语言运动中是一个磁性体,和哪些词可以相互吸引,产生搭配关系;同哪些词互相排斥,不能产生搭配关系,在教学中具有非常重要的意义。②张寿康:《谈汉语常用词的搭配》,《语言教学与研究》1988年第1期。林杏光曾说“在言语组装的整个链条上,词语搭配是重要的一环”③林杏光:《论词语搭配及其研究》,《语言教学与研究》1994年第4期。,张志公也认为“在任何语言里,词语搭配都是一个重要的问题,在汉语尤其突出”。④张志公:《张志公先生给全体编写人员的信》,张寿康、林杏光:《现代汉语实词搭配词典》,商务印书馆1992年版。可见词语搭配知识既是二语学习者目的语词汇知识的核心,也是难点所在。有研究认为从二语学习者汉语词汇习得情况来看,搭配上的问题是词语使用过程中最突出的问题⑤邢红兵:《词语搭配知识与二语词汇习得研究》,《语言文字应用》2013年第4期。。所以学习词典收录词语搭配信息对二语学习者而言极为重要。如在学习词典里列出“经验”的常用搭配,学习效果应大大优于单纯释义加配例:

经验:【n.】因为长期做某工作或者事情,从中得到的知识或者技能。

①V(有/没/总结/缺乏/介绍/积累/交流)+经验。如:很多人都找他看病,因为他很有经验。

②经验+(很/不)丰富/宝贵。

如:王老师教得特别好,她的经验非常丰富。

③工作/人生/生活/社会/政治/实战+经验。如:他的工作经验很丰富,你可以多问问他。

④丰富/先进/成功/宝贵/老(+的)+经验。如:感谢王先生跟我们分享他成功的经验。

在一系列调查中,二语学习者也表达了对学习词典中词语搭配信息的渴望。章宜华、杜焕君调查显示,72%的被调查者认为词典应提供语法和搭配信息。⑥章宜华、杜焕君:《留学生对汉语学习词典释义方法和表述形式的需求之探讨》,《华文教学与研究》2010年第3期。郝瑜鑫针对搭配信息需求所做的调查显示,60%的学生认为目前词典提供的搭配信息不足,不能满足其需要,尤其是中高级水平学生。⑦郝瑜鑫:《定量研究与汉语学习词典编纂理念的创新》,《云南师范大学学报(对外汉语教学与研究版)》2013年第5期。这就迫使我们去思考外向型汉语学习词典应提取哪些搭配信息、如何提取搭配信息、如何在词典中呈现搭配信息等问题。

随着语料库语言学的发展以及各种语料库的建设,人们开始利用语料库进行各领域语言研究,词语搭配便是语料库语言学一个较为活跃的领域,并越来越受到学者们的重视。通过大规模的语料统计,可以更准确地提炼出词语的搭配信息,找出高频搭配词。这些搭配词不仅能够辅助词语的释义,还可凸显词语的语法功能、语义韵,有助于易混淆词辨析等。邢红兵认为利用语料库对词语知识进行提取,可得到词语的使用频度、功能分布,搭配词以及频率、句法框架等信息。⑧邢红兵:《词语搭配知识与二语词汇习得研究》,《语言文字应用》2013年第4期。

如根据BCC语料库,“互相”的搭配如下:

3互相+5尊重2101/2帮助1803/4促进1684/3支持1578/3配合1259/1学习1238/5指责1071/6监督1041/3交流876/3联系680/6影响672/5制约670/3理解654/4了解625/0残杀585/3信任554/2关心489/6支援470/4交换470等双音节V①词语左上标数字为该词语在《国际中文教育中文水平等级标准》中的等级,右下标数字为在BCC语料库中这两个词的搭配频次。。

“好端端”的搭配如下:

◆ Sub+好端端的,怎么/竟然/为什么+已经发生的不正常的情况。如:

她好端端的,怎么哭起来了?

上周他们好端端的,这周竟然离婚了。

◆ 好端端的一+量+名,已经发生的不正常的情况。如:

好端端的一个姑娘就这么变傻了。

好端端的一个家就这么毁了。

关于汉语语料库的局限、如何基于语料库提取常用搭配等问题,需专文讨论,此不赘述。

对二语学习者而言,高频偏误预警在语言产出过程中也非常必要。如:

互相【adv.】A怎么对待B,B也用一样的行为对待A。

互相+V(学习/帮助/支持/理解/了解等双音节V)。

如:每个人都有自己的优点,我们要互相学习互相帮助。

*互相+单音节V。如:*他们互相爱了。

嫌【v.】因为某对象的某种缺点而不满意;不喜欢。

Sb+嫌+(O)不喜欢的原因。 如:我嫌那件衣服太贵就没买。

*Sb+嫌+O。 如:*我嫌食堂的饭。

不仅用简单的语言完成释义,列出其常用搭配及搭配条件,同时也给出高频偏误预警,这对二语学习者学习语言非常有指导意义。

(四)凸显学习性的易混淆词辨析

在用户需求调查中我们发现,67%的用户希望汉语学习词典提供易混淆词辨析。用户的这种需求也是学习功能的一种体现。在JUZI编纂过程中,我们基于HSK动态作文语料库和编者的教学经验,确定1800余对易混淆词,包括近形词如“尽管”和“不管”、近义词如“维护”和“保护”、同译词如“穿”和“戴”“经验”和“经历”等(如表1所示)。

表1 【辨析】彼此vs互相

“彼此”和“互相”都对应于英语的“each other”,二语学习者容易将二者混淆,为此在释义过程中除了基本释义外,还提供了二者的区别、常见偏误预警,从词义到用法和辨析,尽可能保证学习者积极、正确地使用和区分所学新词。

(五)基于自主学习的丰富练习

纸质词典由于受媒介的限制,不可能设置练习板块,而融媒词典则可轻松实现各种自主练习。比如在语音方面,不仅可以听,还可以由用户录自己的发音,和标准母语发音进行对比;在词形方面,不仅可以看动态笔顺,还可以自己在移动终端进行书写,如果出现书写错误,系统将会出现提醒;在词义方面,可以设置词形-词义、图片、用法等各种在线练习。随着汉语学习者低龄化现象的出现,融媒词典还可以设计一些符合低龄学习者的练习,如将“切西瓜”游戏和词汇学习结合的练习(如图10所示)。

图10 自主学习的丰富练习

如果出现错误,答案可自动跳转到词语释义等信息,用户与“教师”面对面,从而实现自主学习。

(六)基于联结主义构建语义关系网络

语义场理论认为一种语言的词汇在语义上是相互联系的,语言的词汇体系就是由这些彼此联系的语义所构成的一个整体,所以词汇在人们大脑中并不是孤立存在的,而是通过各种关系互相联系形成的一个包括语义、语法,甚至语用的网络。这是按照词语的组合和聚合关系建构起来的复杂而有序且可以无限延展的立体网络。纸质词典无法呈现这种关联,不利于学习者的认知联想。融媒词典可借助数据结构化和自动关联的优势,重构语词的自然关联,包括词语的组合关联和聚合关联等,鼠标指向任何一个词,即可显示该节点词的意义和用法信息。如我们以“家具”一词为节点,可关联出其下位词语,即各种家具,然后再由其构成语素“家”和“具”各自关联出一系列同素词,将语素教学法落到实处(如图11所示)。

图11 语义关系网络示例

为了清楚起见,这里只选择了一个节点词的一个关联角度,事实上在融媒词典的词汇网络里,每个词语的搭配词语(组合关系)也都会呈现出来。如“喜欢”一词的组合聚合关系如图12所示。

图12 “喜欢”一词的组合聚合关系

总之,可通过标注词汇元数据集,从聚合和组合两个维度用不同颜色、不同方向的箭头等构建多种词汇知识图谱,使词汇知识呈网络化、系统化、可视化,提高学生自主扩大词汇量的能力,提供新的词汇学习模式,以帮助学生建构心理词库的词汇关系网络。这种语义关系网络目前还有很多问题需深入研究。如同义词、反义词、同素词、主题词、上下位词、整体和部分词、搭配关系,到底应包括哪些关系?整个语义关系网络应该如何建构,是构建知识图谱还是认知图谱?词汇语义关系网络如何实现全面有效?目前仍需人机结合,是否能实现基于语料库或词典数据库完全自动化提取?如何呈现最有利于用户自主学习?

结语

融媒词典是汉语学习词典的一次机遇,也是巨大挑战。面对融媒时代,汉语学习词典可以说是百废待兴,不仅需要“重整山河”的雄心壮志,更需要“深耕细作”的行动落实,需要在坚持“内容为王、技术是翼,二者缺一不可”的认知下开展大量的定量和定性研究,这些崭新的研究课题蕴含着巨大的学术创新空间。要实现汉语学习词典的融媒化,无论是宏观理念还是微观内容设计都需巨大转变。如何总结国内外辞书研究和编纂经验,抓住机会,攀登融媒词典的制高点,推动中国由辞书大国向辞书强国迈进,提升中国文化软实力,是我们每一个辞书人面临的时代课题。

猜你喜欢

用词辞书词典
需注意的规范医学用词
强化诗词用词的时代性
CISHU YANJIU LEXICOGRAPHICAL STUDIES
大型辞书疑难字考释七则
苍凉又喧嚣:《我与地坛》中的用词
米沃什词典
评《现代汉语词典》(第6版)
写话妙计之用词准确
词典例证翻译标准探索
《胡言词典》(合集版)刊行