APP下载

对外汉语文本可读性研究的回顾与展望

2015-12-24牛士伟

广东外语外贸大学学报 2015年6期
关键词:可读性读物语料

牛士伟

(天津外国语大学 国际交流与合作处,天津 300204)

一、前言

可读性,又称易读性或易懂性,是指文本易于阅读和理解的程度或性质 (李绍山,2000)。可读性研究最早起源于美国,后应用到国内的英语教学中来。近年来,对外汉语教学在世界各地蓬勃发展,同时,对外汉语的研究也进入了前所未有的发展阶段,越来越多的研究开始集中于对外汉语文本的可读性上来,张宁志 (2000:88)以29部常用对外汉语教材的语料为研究对象,第一次比较系统地采用量化方法来衡量教材的难易度,结果发现,句长和非常用词数是影响阅读难度的重要因素。之后相关研究都是在此基础上发展而来,因此,总结以往的研究成果,对外汉语文本可读性研究主要集中在三个方面:1.对外汉语文本可读性公式的研究;2.对外汉语教材的可读性研究;3.对外汉语读物的可读性研究。

二、对外汉语文本可读性研究的主要内容

(一)对外汉语文本可读性公式的研究

可读性研究的目的之一就是要得出衡量某种语言文本难易程度的可读性公式。可读性公式就是将所有影响阅读难度的、可以量化的因素 (尤其是文本因素)综合起来,制定成一个评价文本难易程度的公式 (王蕾,2005:8)。它“通常可以给出数字以评价阅读材料的难易度,并可以按其难易度的程度进行排序”,是一种“预测性的手段”(王蕾,2008)。英语可读性公式的研究较早,很多公式至今仍被广泛应用。此外,美国相关机构还制定出各种具有特殊目的的可读性公式,应用于保险条例、合同等文本的难度评价上。而在对外汉语研究领域中,尽管谢泽文(1994)就提出在新加坡华文教学领域中可以使用“可读性公式”来研究文本难度的建议,后经张宁志 (2000:88)对29部教材初步量化得出了一些影响文本可读性的因素,但直至王蕾 (2005:2)才针对初中级日韩留学生的记叙性汉语文本建立了第一个可读性公式。接着杨金余 (2008:27-28)以三部高级汉语精读教材为研究对象,得出了一个适用于挑选高级精读教材文本的语料难度的可读性公式。另外,郭望皓 (2009:53)采用主观评价与客观测量相结合的方法得出了一个基于计算机自动实现的、面向学习汉语留学生的汉语文本语料难度的可读性公式。最近,左虹、朱勇 (2014:263)同样采用主观评价和客观测量相结合的方法得出了针对中级欧美留学生的汉语文本语料难度的可读性公式。如表1所示,其中王蕾 (2005:2)、杨金余(2008:27-28)和左虹、朱勇 (2014:263)所得出的可读性公式针对性较强,除杨金余 (2008:27-28)的可读性公式没有进行拟合优度外,其他两个公式解释的总变异量基本一致 (80.3%Vs 79.5%),而郭望皓 (2009:53)的可读性公式针对性较差,且在计算过程中,为方便计算机自动化识别还省略了一些不易自动化的变量,但其可读性公式却能解释总变异量的90.6%。这些公式一方面对我们探讨影响文本可读性的因素有重要的理论意义,另一方面也为我们如何挑选难度适当的文本起到了重要的指导作用。

表1 对外汉语可读性公式研究一览表

(二)对外汉语教材的可读性研究

对外汉语教材评估的一个重要标准就是“科学性”,而这种“科学性”体现在教材的编写上就是内容的循序渐进(许迎春,2008),即教材应该按照语料的难易程度加以编排,能依照由浅入深、由易到难的过程。因此,我们要对影响教材可读性的各种因素都有比较明确的认识,制定出简明、实用和有效的可读性标准,并将其运用到教材语料的选择和编写中来,那么什么才是影响教材语料可读性的因素呢?不同研究有不同的结论:张宁志 (2000:88)认为句子数、平均句长和非常用词 (甲乙两级以外的词)是影响教材语料可读性的重要变量。杨金余 (2008:27)认为平均每百字丙级、丁级、超纲字数,平均每百字丙级、丁级、超纲词数,平均每百字固定词组数,平均句长和平均每百字丙级以上语法项目数是影响高级汉语精读教材语料可读性的重要变量。李燕、张英伟 (2010)对《博雅汉语—中级冲刺篇Ⅰ》的语料难度进行了定量分析,得出平均句长、每百字含非常用词数和语言的修辞手法偏多是影响教材语料可读性的重要变量。李娟 (2013:15)首次比较系统地提出了八个影响中级汉语精读教材语料难度的变量,它们是平均每百字丙级、丁级、超纲字数,每篇课文的生词量,平均每百字丙级、丁级、超纲词数,每册课本实词和虚词的数量,每百字平均固定词组 (包括固定格式)数,平均句长,平均每百字丙级 (含丙级)以上的语法项目数和篇长。综上所述,尽管不同研究有不同的结论,但大多数研究还是比较一致地认为词汇和句子是影响对外汉语教材语料可读性的重要因素。

(三)对外汉语读物的可读性研究

赵金铭强调,要注重泛读教材的编写,要保证书面语教学质量的提高,必须有大量的、适合各学习阶段的泛读教材 (郝俊茹,2013),因为“编写适于学生自主阅读的读物是实现学生自主学习的重要环节” (朱勇、宋海燕,2013:22)。在读物的可读性方面,不同研究也有不同的结论:储慧峰 (2011:48)以7套50本读物为研究对象,从选材、难易度和练习三方面考察读物的分级情况,在难易度方面,认为语料的长度、平均每百字句数和生词量与读物的语料难度密切相关。朱勇、邹沛辰 (2012)以《中文天天读》2A和《初级汉语阅读与写作教程Ⅱ》两本读物为研究对象,认为词汇难度 (甲、乙、丙、丁及超纲词比例)、句子长度 (每百字句子数和平均句长)、语篇 (篇长和平均每篇句子数)和语义块长度与读物的语料难度密切相关。黄林芳 (2013:46-48)以《汉语分级阅读》、《中文天天读》和《实用汉语分级阅读》3套读物为研究对象,从选材、词汇和难易度三方面考察读物的分级情况,在难易度方面,认为读物的选材 (内容)和词汇 (生词量、词汇等级和词汇重现率)与读物的语料难度密切相关,而篇长和体裁与读物的语料难度无关。综上所述,与影响教材语料难度的因素不同,影响读物语料难度的因素除词汇和句子外,很多研究还把篇长和选材等其他因素也考虑进来了。此外,由于读物是学习者在没有教师指导下的自主学习,它的首要目的是吸引读者的阅读兴趣,并使其从中获取一些信息,因此,读物较教材应更强调其可读性,除要控制其在语言层面上的难度,还应使其在文本的易辨认性方面如印刷品的形式上更方便读者阅读,更能吸引读者的眼球 (朱勇、宋海燕,2010:23)。

三、对外汉语可读性研究中存在的问题

(一)对外汉语可读性研究中缺乏对读者因素和环境因素的控制

总的来看,影响对外汉语文本可读性的因素可分为文本因素、读者因素和环境因素三大类,文本因素是指语言层面上的因素,如汉字、词汇、句子、语法及篇章等变量;读者因素又称主观因素,它包括读者的兴趣、爱好、阅读习惯、对不同文本内容的熟悉程度、本身具有的语言能力、认知水平及阅读动机等变量;环境因素主要指文本的物理属性和阅读环境,文本的物理属性是指文本的字体、字号、字间距、行宽和行高等,而文本的阅读环境是指阅读时光线的强度和方向、有无噪音、阅读时间是否受限等。因此,对外汉语文本可读性公式应该是通过量化并测定这三类因素来获得,但由于读者因素和环境因素是动态的,变化的,甚至是千差万别的,变量数量繁多且不易量化,因此,目前可读性公式的测定主要是在文本的语言层面上来探讨各种变量,在处理读者因素时,尽管有些研究已经考虑到了读者因素的影响,但在实际的研究过程中也仅限于考虑其宏观层面上的变量,如国别、汉字圈与否 (王蕾,2005:2;左虹、朱勇,2014:264),在处理环境因素时,目前尚未有文本的物理属性与可读性关系方面的研究,而且在阅读环境方面也仅限于阅读的时间受限与否 (郭望皓,2009:19)。因此,如何尽可能多地量化并测定读者因素和环境因素成为今后可读性研究的重要课题。

(二)同一语言层面上的变量不同,相同变量的统计方法不一,某些层面上的变量可以合并

目前,在对外汉语可读性公式研究中,几乎所有研究都是从字、词、句、语法和篇章等语言层面上来探讨可读性公式的变量,但不同研究选用的变量不同,主要有以下问题:

首先,同一语言层面上的变量不同。在什么才是该语言层面上代表性变量的问题上,不同研究有不同的结论:如在汉字层面上,王蕾 (2005:18)选取的是总字数、非重复字数、非重复字均笔画数和简单字数 (甲级);郭望皓(2009:15-16)选取的是汉字笔画数和字频;杨金余(2008:10)选取的是丙级、丁级和超纲字数;左虹、朱勇(2014:265)选取的是汉字笔画数、汉字部件数和甲级字数,同理,这种现象在其他语言层面上也屡见不鲜 (见表2)。

其次,相同变量的统计方法不一,如王蕾 (2005:18)和左虹、朱勇 (2014:265-266)都选取了虚词数作为词汇层面上的变量,但由于他们对虚词的定义不同,参照划分虚词的标准不一,因此,即使是相同语料的文本,其统计结果也肯定不同。

表2 对外汉语可读性公式研究变量选择一览表

再次,某些层面上的变量可以合并。根据变量表达和测量的内容,有些变量可以合并,如在汉字和词汇层面上,王蕾 (2005:20)选取的简单字数和简单词数与左虹、朱勇 (2014:265)选取的甲级字数和甲级词数概念相同,且统计方法一致,可以进行合并。王蕾 (2005:18)选取的总词数和杨金余 (2008:13)选取的固定词组数也是同一概念,因此也可以进行合并。另外,有些变量虽然测量的是两个不同的方面,但他们互为此消彼长,也可以进行合并,如在词汇层面上,王蕾 (2005:18)、左虹、朱勇(2014:265)选取的虚词数和郭望皓 (2009:17)选取的实词和虚词比这两个变量互为此消彼长的关系,因此也可以进行合并。

此外,有些研究的变量在归属上还有待商榷,王蕾(2005:18)将语法点难度归为句子层面上的变量,而郭望皓 (2009:31)将篇长也归为句子层面上的变量,这些都与其他研究的普遍认识不同。

最后,由于目前只有4篇可读性公式的文献,加之研究对象与目的各不相同,因此可读性公式的预测变量相对分散 (见表2),很难发现有规律性的东西。

(三)对外汉语可读性公式的研究缺乏统一的文本资料库

英语可读性公式的研究均以McCall&Crabbs(1925)从大量英语阅读材料中提出的一组测试课文为标准 (转引自郭望皓,2009),这类标准被认为是可读性研究的基石,而目前对外汉语还没有这类标准,陈阿林 (2000)通过对两种汉语阅读难度模型的处理,他认为应该有一组公认的汉语难度测试的标准文本集,而目前的情况是研究者根据事先选好的语料,在前人的基础上从不同的语言层面上选取支持自己论据的变量,然后通过线性回归的方法得出相应的可读性公式,但这样做的前提是我们研究的语料是已经标准化了的文本,我们是在此基础上探讨某一类可读性公式的变量,而现实是我们还没有形成统一的文本资料库,因此,目前我们的研究是在模糊的前提下探讨可读性公式的变量,加之读者和环境因素的影响,语言层面上变量选取的随意性较大,因此多种因素下也就不太可能得出比较精确的可读性公式,进而在语料难度的选择与控制上也就更加模糊。

(四)对外汉语教材和读物分级编写中存在的可读性问题

在教材和读物的编写过程中,无法避免地会遇到语料的分级问题。在语料难度的控制上,普遍存在的问题是由于没有可供教材和读物分级编写的大纲,不同编者依据的标准不同,这就造成不同编者对初级、中级和高级语料难度的理解不同,反映到教材和读物的编写上就会出现相同级别的教材或读物其语料难度却不相同。

此外,由于教材和读物的性质不同,因此在可读性问题上他们又各具特点:首先,在教材方面,杨子菁、严越(2006)发现生词方面存在的三个问题是:无法体现以丙级词汇为主的编写要求、生词各层级的分布比例不够合理以及超纲词的比例基本上超过了丁级词。李娟 (2013:31-32)认为汉字的等级和复现率,生词的等级和数量,超纲词以及语法项目的选择和编排是目前中级汉语精读教材语料难度存在的主要问题。刘弘、蒋内利 (2015)通过对近十年来对外汉语教材研究的特点与趋势分析发现,教材中的词汇编排问题是最受研究者关注的论题,相关论文数占到“教材微观研究”论文中的25%以上,因此,词汇问题是教材编写中的最大问题。其次,在读物方面,朱勇、宋海燕 (2010:27)从《中文天天读》的编写理念出发,认为语料难度涉及的因素非常复杂,而目前的研究还不充分,缺乏可读性公式的基础性研究,并且大纲的发布已过去十多年了,也有进一步修订的需要。储慧峰 (2011:12)发现读物的分级难度与其编者的编写说明并不一致。还有,即使是参照同样的分级标准,且编者的编写说明也完全一致,不同读物各自内的分级情况也相去甚远。黄林芳(2013:50-51)发现同词级的不同读物,其难度也不尽相同、词汇控制不合理 (每篇文章的生词量偏高、词汇等级比例不合理以及词汇重现率过低)、选材不合理等是当前读物编写面临的最大问题。

四、结论与展望

在语料库建设方面,一方面我们要通过实地调查、掌握大量第一手资料以及运用新的语言模型和数学方法找到标准化的文本资料库 (陈阿林,1999&2000;谷庆民,等,2004:36-37),这是进行可读性研究的重要前提;另一方面,杨金余 (2008:12-14)曾以HSK试卷 (高级)中的阅读理解为研究对象,以这种标准化了的语料为研究对象还属首例,这对我们探讨语料库起到了重要的指导作用。

在可读性公式的研究方面,如前所述,目前只有4篇可读性公式的研究,在没有语料库的前提下,读者和环境因素得不到控制,变量选择的主观性较大,因此得到的可读性公式也很不确定,将来的研究还是要以可读性公式作为基础性研究,期望早日发现能够代表各语言层面上的典型性变量;同时,我们也要尝试运用基于语料库的统计语言模型,将影响可读性公式的读者和环境因素一并考虑进来,这是进一步完善可读性公式研究的方向 (郭望皓,2009:4)。

最后,语料库的建设和可读性公式的研究最终目的还是为对外汉语教材和读物的编写提供理论依据和技术支持,因此,教材和读物的可读性研究也不可停滞不前,我们应在已有研究的基础上谨慎地探讨教材和读物的可读性因素,通过对可读性研究的各个方面相互比较、互相印证,形成合力,共同促进对外汉语可读性研究的发展。

陈阿林,张素.1999.中文阅读难度模型及易读性公式探索[J].计算机科学(11):42-44.

陈阿林.2000.神经网络汉语阅读难度量化计算模型及结果比较[J].重庆师范学院学报(2):30-33.

储慧峰.2011.对外汉语分级读物考察[D].上海:华东师范大学.

郭望皓.2009.对外汉语文本易读性公式研究[D].上海:上海交通大学.

谷庆民,马海霞,张月明.2004.关于高等院校教材可读性的定量研究[J].沧州师范专科学校学报(3):36-37.

黄林芳.2013.对外汉语分级读物考察[D].湖南:湖南师范大学.

郝俊茹.2013.中级汉语阅读教材调查分析[D].北京:北京大学.

刘弘,蒋内利.2015.近十年对外汉语教材研究特点与趋势分析[J].国际汉语教学研究(1):55-62.

李绍山.2000.易读性研究概述[J].解放军外国语学院学报(4):1-5.

李娟.2013.中级汉语精读教材语料难度的定量分析[D].吉林:吉林大学.

李燕,张英伟.2010.《博雅汉语》教材语料难度的定量分析——兼谈影响教材语言难度的因素和题材的选择[J].云南师范大学学报(对外汉语教学与研究版)(1):39-43.

王蕾.2005.初中级日韩留学生文本可读性公式初探[D].北京:北京语言大学.

王蕾.2008.可读性公式的内涵及研究范式——兼议对外汉语可读性公式的研究任务[J].语言教学与研究(6):46-53.

谢泽文.1994.阅读难度的测量[C].北京:北京语言学院.

许迎春.2008.对外汉语初级口语教材课文编写评析[J].语言教学研究(1):101-102.

杨金余.2008.高级汉语精读教材语言难度测定研究[D].北京:北京大学.

杨子菁,严越.2006.中级汉语精读教材中的词汇选取与处理情况分析[C].北京:人民教育出版社.

张宁志.2000.汉语教材语料难度的定量分析[J].世界汉语教学(3):83-88.

左虹,朱勇.2014.中级欧美留学生汉语文本可读性公式研究[J].世界汉语教学(2):263-276.

朱勇,宋海燕.2010.汉语读物编写的理念与实践[J].海外华文教育(4):22-29.

朱勇,邹沛辰.2012.《中文天天读》易读性研究[J].云南师范大学学报(对外汉语教学与研究版)(3):41-46.

猜你喜欢

可读性读物语料
工会干部案头读物推荐
工会干部案头 读物推荐
对外汉语分级读物的几个重要问题
基于语料调查的“连……都(也)……”出现的语义背景分析
纸质读物的困境与出路
华语电影作为真实语料在翻译教学中的应用
对增强吸引力可读性引导力的几点思考
浅谈对提高党报可读性的几点看法
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法