《新实用汉语课本》初级阶段教材词汇重现率研究
2017-07-06耿直
摘 要:本文在前人研究的基础上,对《新实用汉语课本》初级阶段教材的词汇重现率进行了统计,并与《实用汉语课本》进行了比较,对两部教材在词汇重现问题上的做法进行了分析。同时,本文进一步讨论了考察词汇重现率的方法问题,指出词汇的重现要同时兼顾频次要求以及分布技巧两个方面。最后,本文对教材编写中提高词汇重现的技巧给出了一些具体建议。
关键词:对外汉语教材 《新实用汉语课本》 词汇 词汇重现率
一、引言
在编写对外汉语教材时,保证词汇有一定的重现,有助于学生更好地学习,因此,词汇重现率是评估教材的一个重要量化标准。在这方面,康艳红、董明(2005)曾做过相关研究,他们对北语版《实用汉语课本》(刘珣,1981)教材初级本的词汇重现率情况进行了统计和对比,这是关于汉语教材词汇重现率的代表性研究。此后,又有一些关于教材重现率的研究,如吴国伟、刘宇熙(2016)。本文借鉴康艳红、董明《初级对外汉语教材的词汇重视率研究》(以下简称康文)的方法,对更新版的《新实用汉语课本》(刘珣,2002)前三册初级本进行词汇重现率的研究,借以观察新一代教材在词汇重现问题上的继承与发展,并进一步讨论教材编写在词汇重现问题上的处理方法。
二、词汇重现率的考察框架与程序
考察词汇重现率的核心问题是寻找能有效、准确、全面地体现一部教材中的全部词汇和部分核心词汇的重现程度高低以及重现方式优劣的指标。这样的指标至少有三个维度,首先是宏观上看教材里共有多少生词以及共出现了多少次,体现的指标便是平均词频。一般来说,平均词频越大越好。同时,为了避免一些词“被平均”的问题,需要在微观上看最多和最少重现的两类词。一般来说,“贫富不均”的词越少越好。另外,从重现的距离来看,一课之中重现多次不如多课均有重现。一般来说,重现有一定的距离,更加符合记忆的规律。
至于“重现有一定距离”应该是多大的距离,康文的标准是不宜大于5课,即该词首次出现之后,第二次出现距离首次出现不大于5课。这也是有道理的,一般来说,初级阶段教学上5课需要花一个月以上的时间,根据艾宾浩斯遗忘曲线,31天之后的记忆保留比率仅为21.1%。不过,笔者认为重现分布的计算不能简单化,比如某词的出现分布是在第1、7、8课。按照康文的标准,则是距离过大。但实际上第三次出现也是对第二次出现的重现,上述情况应该视为重现分布相对集中。因此,需要区分“重现分布的课之间有不超过5课的情况”与“任意课间距大于5课”两种类型。另外,康文计算五课內重现的词时把在同一课内重现的词也算在其中,我们也不采取这种同课的计算方式,因而需要专门考察“无论重现与否,仅出现在一课之中”的情况。本文在康文统计词汇重现率的方法基础上稍加修改,提出了考察词汇重现率的指标框架。
在程序上,我们首先把两套教材的课文(未包括注释、生词表、练习等补充部分)输入到计算机中,形成txt文本格式以便统计。对课文词汇重现率的统计主要利用了北京语言大学出版社出版的教材编写软件中文助教(ChineseTA)。
中文助教软件在刘颂浩(2005)对《乘风汉语》的词汇重现率统计中也曾使用。不过中文助教软件在切词上并不完美,宋海燕(2005)详细讨论了其切词的差异表现。一般来说,机器切词比人工切分的数量稍多,但相关误差未有统计学的显著差异。
三、《实用汉语课本》与《新实用汉语课本》的词汇重现率统计结果
(一)词汇使用的整体情况
我们统计了《新实用汉语课本》的词汇使用整体情况,并与康文统计的《实用汉语课本》指标进行了对比。相对于《实用》,《新实用》的平均词频下降了1.254(个),如表1所示。
康文称:“教材中10次以上的词语重现率原则上可以保证学生的习得。”从这前后两套教材的纵向比较上来说,在平均词频上,《新实用》这套新一代教材的词汇重现率没有达到前套教材的水平。造成这种词汇重现率下降的原因从表1数据分析上看主要是由于新教材大幅增加了词汇量而教材的篇幅却没有相应增加:《新实用》的总词种增加了64%,但是总词次只增加了45%。这从一个侧面反映了该学科最近二十年的发展中,学界对初级阶段教学的词汇量的定位有着不断扩大的趋势,但是在初级阶段固定的教学时间和初级本有限的篇幅容量内,词汇量的增加必然导致词频的减少。考虑到这个因素,我们可以说,《新实用》教材的词汇重现控制依然处于一个较高水平,在总词次增加的比率仅为总词种增加比率的70%的情况下,平均词频比高达87%。这也与笔者使用《新实用》的主观印象相符:该教材一个很突出的特点是语言点联系紧密,较好地体现了教材编者的意图,“每课一定要重现上一课的主要句型和语法点”,而语法的重现自然带来词汇的较高重现率。
(二)重现率为零的词汇
注:常用词是指词汇大纲里的甲、乙两级词汇。
可见《新实用》有多于三分之一(35.75%)的词汇仅出现一次,而《实用》重现率为零的词还不到四分之一。整体上看,《新实用》在词汇重现率为零的指标上控制得不如《实用》。不过,如果进一步观察常用词的重现率情况,则《新实用》控制得比《实用》要好。在零重现的常用词汇中,《实用》中有超过三分之二(67.05%)的是常用词,相比之下,《新实用》常用词的零重现比例下降得很大,仅有三分之一多(37.99%),这体现了新的教材在因词汇教学量增多而被迫减少平均词频的情况下,更加强了对核心词汇(常用词)重现的重视。形象地说,犹如发动机“排量”虽然下降,但是“效率”得到了优化,这反映了新一代教材的编写技术水平的提升。
(三)重现率最高的20个词及其相关情况
如表3所示,两部教材重现率最高的前20个词相似,两者共现16个词。这种相似有因可循。对照《现代汉语频率词典》的前20个最高频词,《实用》与其重合12个词,《新实用》与其重合10个词。可以说,教材里的高频词在很大程度上是对自然语言词频的体现。
另外,剔除20个重现率最高的极端词之后,《实用》与《新实用》的平均词频均下降至6.1左右,两部教材的平均词频变得接近一致。另一方面,前后两部教材的前20个词占教材总词频的百分比也是相对固定的,在31%~32%左右浮动。这个比率均高于自然语言的词频统计,依据《现代汉语频率词典》统计,自然语言的前20个词能覆盖语料的27.38%。这个数值的接近并不是一种简单的巧合,它可能反映了初级阶段汉语教材编写的一个普遍特征。就像自然语言的最高频前20个词固定覆蓋语料的27.38%一样,可以推断,初级阶段汉语教材语料最高频词汇覆盖率也有相对固定的一个常值,并会稍大于自然语言,这是因为初级阶段语言本身就有更为简单的特点:最常见的、简单易懂的词被多次运用。当然,这个推断还要更多教材统计结果和初级阶段的汉语语言习得以及发展研究结果的验证。
(四)重现率分布等级情况
注1:词次大于100包括词次是100,词次在50~100间包括词次为50但不包括100,以此类推。
注2:康文里最后的一个分级是1~5,因为词次是1即重现率为0,所以本文把这个等级细化为2~5和1。
由表4可知,在100以上、20~50、5~10这三个词次等级上,两部教材的差异比较大。如果按康文里说“教材中10次以上的词语重现率原则上可以保证学生的习得”,那么《实用》以及《新实用》里出现10次以上的词汇分别占总词种的18.56%和15.63%,两套教材出现10次以上的词汇比率都不高。另外,康文还引用了国外学者Saragi以及Nation&Meister研究的结论,认为“词频在6次以上,93%的受试都可以习得”,我们这里即使再把词频在5~10之间的词当作是词频比较高、可以被绝大部分学习者习得的词而算其累计频率,《实用》与《新实用》里这些高频词也仅占36.67%及30.94%,两部教材的高频词比率仍然不高。康文曾认为《实用》的高频词不够,“是一种缺陷”,从《新实用》的情况来看,这种缺陷似乎依然存在。
(五)重现的分布距离
注:“仅见于一篇课文”包括只在一篇课文内出现过一次的词和出现过一次以上,但还只是在一课内的词。
《实用汉语课本》中的“在5课内重现”数据来自康文中“在下一篇课文得到重现的词语”以及“在此后3~5课内得到重现的词语”的简单相加。
可见,两部教材都有超过四成以上的词仅见于一篇课文,特别是《新实用》中有超过一半的词仅见于一篇课文,重现分布的整体情况并不理想。从前文的统计中,我们知道《新实用》中有过重现的词共占其全部词汇的64.25%,假设在不同课间重现的词才是真正的重现的话,那么有一半的词汇是真正的重现。因此,从数据分析上来看,不得不说《实用》以及《新实用》教材在词汇重现的分布上都有很大改进的空间,特别是《新实用》重现距离超过5课的词汇比率更低。
综合以上三方面的统计数据,在现有的指标体系下,无论是在宏观的平均词频上,还是在微观重现率为极值的情况上以及词汇重现的分布距离上,《新实用汉语课本》教材的词汇重现情况相对于前一代的《实用汉语课本》都有一定变化,一方面是所有词的平均词频有所降低,但是核心常用词的词频有所增加,但是对词汇重现距离的控制不够理想。
四、讨论:教材如何增加词汇的重现率
前文统计了《新实用》的词汇重现情况,并与《实用》进行了比较。整体来看,两部教材的词汇重现情况都不理想。因此,教材编写需要更加重视词汇重现。
需要指出的是,教材的高词汇重现率,并非简单地只要编者注意并努力去做就能实现。刘颂浩(2006)甚至指出“这只是理论上的可能,在实践中是几乎不可能的”,因为“编者不能随意增加课文长度”“增加课文长度的另一方面是必然带来生词量的增加”。另一方面,“贫富不均本来就是词汇运用中的自然现象,如果要我们的教材自然流畅,就只能顺应这种现象”,由此,刘颂浩认为词汇重现率问题只是教材编写中的一个非原则性的问题。不过,教材编者也不能以此为原因放弃对词汇重现的重视。江新(2005)在论及教材里应该强调字词的复现率时,就认为“这在实践中虽然不易做到,但不能因为有困难,就不去尝试,甚至干脆放弃”,并认为教材中一些细节的处理,如人名选择上,选择包含高频常见字的人名和教材编写者对重现率问题的认识都有一定关系。
可见,教材增加词汇重现是一个非常精细的技巧。编者对教材编写对词汇重现率不应过度地强调,但也不能认为有自然词频规律在,语言教材就只需顺应自然语言词频的“大道”就行了,毕竟自然文本的创作目的与教学文本的设计目的不同。笔者认为在教材编写实践中(以初级教材的编写为例)对词汇重现率问题应该也有“三定”:一是定哪些词是重点词,这些重点词应该保证普遍被多次重现,如基础常用词就应当尽量不出现零重现的情况;二是定这些词的出现次数,比如说,这些词出现的次数尽量不低于3~6次,当然这个标准需要进一步研究;三是定这些词的重现方式,重现的方式有很多具体问题,比如重现间距离要适当:根据艾宾浩斯遗忘曲线揭示的遗忘是先快后慢的规律,教材中词汇各次重现的间隔不应太密集也不应太大,但也不是简单地均匀分布在各课中,而是应慢慢地拉开距离;又如课文和练习里词汇重现的配合问题,课文文本有长度和语句的自然协调等限制,而练习就比较灵活了,可以说练习部分是实现重现率的重要阵地;再如,这重现是深度重现还是一般重现,“深度重现是建立在对词汇的运用基础上的”(黄明毅,2006),而它对词汇的运用就要比词汇的单纯输入理解要经历更复杂深刻的加工过程。
另外,在教材编写过程中还要注意一些具体技巧。如在不同的上下文语境中重现还是在一个问答句作为共核成分重现,其重现的意义并不一样;听说读写译等不同角度和层次的词汇重现,其重现意义也不同;同时,重现方式也体现在课堂教学的具体操作上,如主干课与技能课之间词汇重现程度,教学环节上是不是安排有复习环节等等,这些诸多因素都影响着词汇的重现,进而影响着词汇学习效果。教材的编者虽然不能通过简单地延长课文的文本增加重现,但是可以为学生创造最大化的词汇重现和学习机会,使教材编写在与时俱进中更加精益求精,真正成为经得起指标检验和用户体验的精品。
(本研究受上海市哲学社会科学规划办青年项目“全球化背景下国际汉语教材编写的理论构建、现状调查及对策研究”[项目编号:2014EYY007]支持。)
参考文献:
[1]康艳红,董明.初级对外汉语教材的词汇重现率研究[J].语言文字应用,2005,(4):94-99.
[2]刘颂浩.现象和解释:词汇重现率及其他[J].暨南大学华文学院学报,2006,(1):1-8.
[3]刘颂浩.论生词率和重现率[A].刘颂浩主编.《乘风汉语》教学设计与研究[C].北京:世界图书出版公司,2005.
[4]刘珣.新实用汉语课本(1~3册)[M].北京:北京语言大学出版社,2002.
[5]刘珣.为新世纪编写的《新实用汉语课本》[J].暨南大学华文学院学报,2003,(2):1-5.
[6]宋海燕.《乘风汉语》词汇分析[A].刘颂浩主编.《乘风汉语》教学设计与研究[C].北京:世界图书出版公司,2005.
[7]柳燕梅.生词重现率对欧美学生汉语词汇学习的影响[J].语言教学与研究,2002,(5):59-63.
[8]江新.词的复现率和字的复现率对非汉字圈学生双字词学习的影响[J].世界汉语教学,2005,(4):31-38.
[9]黄明毅.复现与词汇习得[J].平顶山工学院学报,2006,(3):67-71.
[10]吴国伟,刘宇熙.《新实用汉语》第一册生词重现研究[J].现代语文(学术综合版),2016,(2):155-158.
(耿直 上海 复旦大学国际文化交流学院 200433)