APP下载

汉语中介语偏误研究的回顾与展望

2021-01-12

华中学术 2021年2期
关键词:偏误语料语料库

祁 峰

(华东师范大学国际汉语文化学院/应用语言研究所,上海,200062)

一、引言

在上世纪60—70年代,国外学者提出了中介语理论,其中最具代表性的是语言学家塞林克(Selinker)在1972年发表的《中介语》一文。所谓中介语,是指在第二语言习得过程中,学习者通过一定的学习策略,在目的语输入的基础上所形成的既不同于第一语言又不同于目的语、随着学习的进展向目的语逐渐过渡的动态的语言系统[1]。也就是说,中介语不是固定不变的,而是一个不断变化的动态语言系统。中介语中存在一定的偏误,而且偏误具有反复性和顽固性等特点,但是中介语并非都是错误的,它有其正确的部分。中介语理论的提出,使第二语言研究从注重第一语言和第二语言的对比分析逐渐转向学习者的语言系统,并开始关注学习者的学习过程,即从传统的“以教为中心”向“以学为中心”进行转变,从而使第二语言教学发生了重要的理论导向的变革。

在中国,最早引进中介语理论的是鲁健骥,他在1984年第3期《语言教学与研究》发表的《中介语理论与外国人学习汉语的语音偏误分析》标志着我国汉语中介语理论研究的开端,之后越来越多的研究者开始关注汉语中介语问题。在这种研究背景下,留学生汉语中介语语料库的建设可谓是方兴未艾,其始于上世纪90年代。最早的语料库是北京语言学院(现北京语言大学)的“汉语中介语语料库系统”(储诚志、陈小荷主持,1995)[2],该语料库对104万多字的书面语料进行了字、词、句、篇等不同层次的加工与标记,填补了汉语中介语语料库研究方面的空白。学界使用较为广泛的语料库是“HSK动态作文语料库”(北京语言大学,2006),该语料库收集了1992—2005年HSK高等作文11569篇,共计424万字。目前规模最大的语料库是“全球汉语中介语语料库”(崔希亮主持,2012年立项),该语料库预计规模为5000万字,其中书面表达生语料2500万字,熟语料2000万字,合计4500万字;口头表达生语料500万字,其中熟语料200万字,生语料300万字,建设周期预计为8年[3]。其他比较有影响的语料库还有“汉语中介语偏误标注语料库”(中山大学)、“外国留学生汉语中介语偏误信息语料库”(南京师范大学)、“留学生汉语中介语纵向语料库”(南京大学)、“留学生汉语中介语语料库”(暨南大学)等,也有一些“国别化”的语料库,如“韩国留学生汉语中介语语料库”(鲁东大学)等,此外还有汉字语料库,如“汉语学习者汉字偏误数据资料库”(台湾师范大学)等。这些中介语语料库在汉语作为第二语言教学的相关研究中发挥了重要作用,研究者通过它们发现前人尚未发现的一些中介语现象,并将定性研究与定量研究相结合,使得研究结论具有较强的客观性和普遍性。

为此,本文拟对基于汉语中介语语料库的偏误研究成果进行简要的回顾,尤其是对汉语中介语偏误的研究内容和研究方法进行总结概括,并分析目前相关研究中存在的一些具体问题,在此基础上,指出汉语中介语偏误研究的发展趋势和若干拓展方向[4]。

二、汉语中介语偏误研究的现状分析

基于各类汉语中介语语料库,学界已经发表了不少研究成果。从研究对象来看,大多数集中在基于汉语中介语语料库的偏误研究或习得研究上,可见汉语中介语偏误研究已经成为中介语语料库应用研究的主流方向。根据搜集到的相关研究文献,这方面代表性的研究成果主要有[5]:

第一,专著方面:(1)《外国人学汉语语法偏误分析》(李大忠,北京语言大学出版社,1996),该书搜集了具有中等以上汉语水平外国学生的语法偏误实例,从中筛选出使用频率最高、学生最难自我修正而且在各国学习者中具有共性的偏误项目,按其所出现的语法点分为三十类,并对这些偏误实例进行描写和分析,力求揭示偏误成因,从而找到最有针对性的修正偏误的教学策略。(2)《外国人学汉语语法偏误研究》(周小兵、朱其智、邓小宁等,北京语言大学出版社,2007),该书以2000多条偏误语料为例,系统探讨如何分析、研究非母语者的语法偏误,并多角度探索偏误原因,揭示出不少有趣的语言心理现象。(3)《基于中介语语料库的汉语句法研究》(赵金铭等,北京大学出版社,2008),该书通过对大规模语料的调查、统计和分析,对留学生汉语语法的偏误与习得情况进行描写和分析,包括差比句、“得”字补语句、趋向补语、介词、否定副词、程度副词、量词等词类。(4)《基于中介语语料库的汉语词汇专题研究》(张博等,北京大学出版社,2008),该书基于北京语言大学“汉语中介语语料库”,对汉语中介语词汇和与此相关的汉语词汇问题及词汇教学问题进行了较为全面系统的探讨,包括易混淆词、多义词、同义词和反义词等。(5)《汉语中介语语法问题研究》(肖奚强等,商务印书馆,2008),该书利用“外国学生汉语中介语偏误信息语料库”,通过统计对比不同水平学生的正误用例、对比中介语和汉语母语者的使用情况,对部分句式和词类的习得状况进行定量研究,得出其习得难度与顺序,并提出教学分级和排序建议。

第二,期刊论文方面:鲁健骥(1994)对外国人语法偏误情况的分析[6],高立群(2001)对留学生规则字的偏误分析[7],杨德峰(2003)对英语母语学习者趋向补语习得顺序的分析[8],陈晨(2005)对英语国家中高级水平学生汉语篇章衔接手段的偏误分析[9],崔希亮(2005)对欧美学生汉语介词习得情况的分析[10],刘春梅(2007)对留学生单双音同义名词的偏误分析[11],周文华(2009)对外国学生兼语句习得情况的分析[12],黄自然、肖奚强(2012)对韩国学生“把”字句习得情况的分析[13],牟世荣(2013)对留学生“反而”使用情况的偏误分析[14],蔡淑美、施春宏(2014)对汉语二价名词习得情况的分析[15],戴媛媛(2014)对高级阶段非汉字文化圈学生作文正误字的对比分析[16],高玮(2014)对先行语中数量结构的偏误分析[17],曾常红(2014)对日韩留学生“是”类词语错位的偏误分析[18],郝瑜鑫(2015)对留学生汉语插入语系统习得情况的分析[19],邢志群(2016)对美国大学生汉语作文省略的偏误分析[20],马文津、施春宏(2016)对日本学生整句和零句的正确输出和偏误情况的分析[21],刘旭(2018)对泰国大学生汉语名词习得情况的分析[22],牛长伟、李君(2019)对留学生“什么”类代词的偏误分析[23]等。

第三,专题会议方面:(1)“汉语中介语语料库建设与应用国际学术研讨会”,该会议旨在共同探讨汉语中介语语料库的建设、开发与利用,加强海内外汉语国际教育研究专家、学者、教师之间的交流与合作,展示汉语中介语语料库建设与应用研究的最新成果。目前该会议已经召开了五届,主办单位有北京语言大学、南京师范大学、福建师范大学、扬州大学和南京大学等,并出版了前四届的会议论文选集,分别是:肖奚强、张旺熹主编的《首届汉语中介语语料库建设与应用国际学术讨论会论文选集》(世界图书出版公司,2011);崔希亮、张宝林主编的《第二届汉语中介语语料库建设与应用国际学术讨论会论文选集》(北京语言大学出版社,2013);林新年、肖奚强、张宝林主编的《第三届汉语中介语语料库建设与应用国际学术讨论会论文选集》(世界图书出版公司,2016);张亚军、肖奚强、张宝林、林新年主编的《第四届汉语中介语语料库建设与应用国际学术讨论会论文选集》(世界图书出版公司,2018)。(2)“语言学与华语二语教学学术研讨会”,该研讨会由华语二语教研学会(CSL Teaching and Research Society)主办,并于2018年出版了由胡晓清、李春普、吴伟平编著的论文集《语言学与华语二语教学:语言习得与语料库的建设与使用》[商务印书馆(香港)有限公司],这本论文集侧重对语言习得与语料库的建设和使用的讨论。

从上述的研究成果来看,基于中介语语料库的偏误研究成果众多,尤其是进入21世纪以来的二十年间,这些专著或论文大多是以外国留学生的偏误为切入点进行研究,进而分析偏误产生的原因,并提出相关的教学建议。下面我们从研究内容和研究方法这两方面来进行总结概括,具体如下:

第一,从研究内容来看,汉语中介语偏误研究主要包括以下四类:语音偏误、汉字偏误、词汇偏误和语法偏误,其中语法偏误又分为若干小类,即词类偏误、句子偏误和语篇偏误等。具体来说,语音偏误研究主要涉及声母、韵母和声调等;汉字偏误研究主要是对书写结果即书写偏误(包括错字、别字、漏字、多字、繁体字、异体字、拼音字以及无法识别的字)的研究,也有对书写过程即笔顺的研究;词汇偏误研究主要关注学习者因不能准确掌握词义而产生的偏误,包括构词偏误和用词偏误;语法偏误研究涉及的项目众多,这些项目有一个共同点,就是汉语语法项目相对于学生母语的差异性,也就是说,这些项目较难被学习者掌握,如孟国(2011)所指出的对外汉语十个语法难点,包括“把”字句、被动句、比较句、结果补语、趋向补语、能愿动词、语气词、量词、离合词、否定副词[24],因此这些语法项目受到研究者更多的关注。据童琴、徐婷(2018)统计,在中国知网1987年至2017年近30年来汉语偏误分析文献中,研究主题以词汇偏误居多,其次是语法、语音、语用、文字及其他,而且对偏误主题的关注点越来越深入,越来越细化,比如语音偏误研究细化到韵母感知偏误考察、擦音以及塞擦音的偏误研究,语法偏误细化到趋向补语“开”“上”“下”等某一个语言要点的偏误探讨,所涉及的范围逐渐缩小[25]。

第二,从研究方法来看,汉语中介语偏误研究主要采用基于语料库(corpus-based)的研究方法,这种研究方法认为对语料进行输入、标注和加工,这会给语料库带来附加的价值。其核心是对比研究,着眼点是中介语和目的语的差异性。可见,研究方法从内省式转向基于语料库的实证式。如前所述,汉语中介语语料库的建设处在一个蓬勃发展的时期,研究者所获得的中介语语料是外国学生的客观自然输出,而且这些语料有较大样本量作为支撑,因此研究结论具有较高的可信度,这应该是这种研究方法受到欢迎的主要原因。据毕晋、肖奚强、程仕仪(2017)介绍,基于语料研究法可以根据语料的来源分为三小类:第一小类是教师根据教学经验在教学中搜集的零散性语料,简称为“经验式语料”;第二小类是研究者在个案跟踪法中搜集的语料,简称为“跟踪式语料”;第三小类是大规模语料库中的语料,简称为“语料库语料”。在学习者语言特征研究领域,基于语料研究法占54.9%,而实验研究法占32.6%,可见研究者在此领域倾向于选择基于语料研究法[26]。一般认为,偏误研究是二语习得研究的开端。就汉语中介语偏误研究而言,研究者通常采用的研究范式是:先通过语料库检索和提取相应的语料,然后从偏误类型(包括“遗漏”“冗余”“替代”“错序”等)角度对这些语料进行细致描写和统计分析,进而分析偏误产生的原因(主要有“母语负迁移”“目的语知识负迁移”“学习策略和交际策略的影响”“学习环境的影响”等),最后在此基础上提出教学策略和教学建议[27]。由于偏误研究重视学习者出现的错误,因此这种研究范式具有较强的针对性和实用性,其主要目的还是研究汉语作为第二语言的学习过程,从而使汉语二语教学变得更有效率。

当然,尽管学界取得了不少汉语中介语偏误研究的成果,选题涉及中介语偏误研究的硕博士论文更是数不胜数,但是这方面的研究还存在一些问题,具体如下:

第一,从研究思路来看,绝大多数研究只是针对少量的汉语中介语语音、汉字、词汇或语法现象进行偏误分析,而忽略了汉语中介语正确表现形式的分析和研究。产生这一问题的原因主要在于大多数汉语中介语语料库只标注偏误现象,而没有标注语料中正确的语言表现形式。

第二,从研究内容来看,中介语偏误研究涉及的词汇、语法层面较多,而涉及的语音、汉字层面相对较少;在语法层面的偏误研究中,词类和句子的偏误研究成果较多,而语篇的偏误研究相对较少;在汉字层面的偏误研究中,又是以部件、偏旁为切入点的居多,而以笔画为切入点的较少。

第三,从研究范式来看,在以往的偏误研究中,有些偏误类型的统计是在未作推论统计的情况下对相关数据进行主观的显著性判断,而且这类偏误研究的论文形成了固定的研究范式,导致有些论文对偏误原因的分析停留在表面,提出的教学对策大同小异,缺乏针对性。也就是说,对偏误原因和教学策略的探讨大多数是主观性的思辨分析,并未经过实验或访谈等实践方法的检验与证明。

第四,从语料库建设与应用来看,分国别的汉语中介语偏误研究成果并不太多,这可能是因为没有可利用的大规模“国别化”的汉语中介语语料库;有些汉语中介语语料库虽然标注了学习者的国别,但也出现了“国别化”研究的不均衡现象。另外,基于作文这样的书面语语料库的研究比较多,但是基于口语语料库的研究相对较少,这应该跟口语语料库建设较少、建设难度较大有关。

三、汉语中介语偏误研究的发展趋势

从上文的现状分析可以看到,汉语中介语偏误研究在最近的二十年间取得了长足的进展,为汉语二语教学做出了重要的贡献,但是从相关的研究思路、研究内容和研究范式等角度来看,汉语中介语偏误研究似乎到了一个发展的瓶颈期,学界需要采用新的理论、视角和方法来推动汉语中介语偏误研究的持续发展。我们认为,汉语中介语偏误研究有以下若干拓展方向:

第一,留学生学习汉语所产生的偏误只是我们观察学习者中介语状态的一个窗口,真正意义上的汉语中介语研究,除了要进行偏误分析以外,还得观察、描写和解释留学生中介语中的正确部分,从而发现汉语中介语的系统规律。此外,基于中介语语料库的偏误统计分析比以往内省式的偏误考察更有系统性,但是只关注留学生的偏误对于汉语中介语系统的建构还是不够的,我们应该加强对不同语言项目系统(包括语音、汉字、词汇和语法等系统)的习得考察。因此,对一定数量的汉语中介语语料进行穷尽性的统计分析,并对汉语中介语进行全面描写与解释的系统性研究将是今后汉语中介语偏误研究的重要课题。

第二,中介语的发展不仅受学生母语因素的影响,而且也在一定程度上体现出语言共性(language universals)的特征。语言共性的研究目标,就是发现语言的共性和类型学意义上的普遍语言特征和标记性特征,并对语言习得的规律性做出预测,所以语言共性的研究体现了语言迁移研究的新趋势,使得相关研究成为近年来二语习得领域的一个热点[28]。为此,我们需要将汉语中介语偏误研究与语言类型学结合起来,因为语言类型学可以为汉语中介语研究提供理论支持、研究参项以及广阔的跨语言视角。据张赪(2016)介绍,类型学理论影响下的二语习得研究,其研究范式有二:一是印证类型学所揭示的跨语言蕴涵共性特征;二是以类型学研究框架为指导,对比分析母语和目的语的相关语言项目,讨论目的语该项目的习得特点和规律,这必然要涉及母语、目的语语法特征在二语习得中的作用[29]。其中,第二种研究范式是具体的、与二语教学实践关系更密切的研究,这方面将大有可为。近年来,已有一部分研究者从语言类型学的研究视角入手来探讨汉语中介语偏误或习得问题,如高顺全(2017)以“在……上”为例,对汉语框式介词习得偏误进行研究[30];又如郭风岚、刘辉(2017)对不同语言类型背景的中高级水平汉语学习者五种汉语结构成分出现的语序偏误情况进行考察[31]。

第三,前人的研究成果从“国别化”这一研究视角来看,多数研究成果不做“国别化”区分,有些研究成果虽然做了“国别化”区分,但是主要以英语为母语或韩语为母语的留学生为主。近年来,随着“一带一路”倡议的发展,大量来自“一带一路”沿线国家的留学生来到中国学习汉语,就我们接触到的留学生而言,主要是来自中亚、南亚、东南亚及中东欧等“一带一路”沿线国家。但是前人的研究缺少针对“一带一路”沿线国家留学生的汉语中介语语料库建设与应用,而鉴于“一带一路”倡议与汉语国际传播之间相辅相成的关系,以及国际中文教育中“国别化”和“本土化”的研究趋势,针对“一带一路”沿线国家留学生的中介语语料库建设与应用势在必行,所以我们需要建立较大规模的“一带一路”沿线国家留学生汉语中介语语料库,包括书面语语料库和口语语料库,并在此基础上,进行分区域、分国别的汉语学习者偏误和习得情况的考察,进而提出教学分级的具体建议。

四、结语

汉语中介语偏误研究始于上世纪80年代中期,进入21世纪以来,随着国内高校汉语中介语语料库建设力度的加强,基于中介语语料库的偏误研究涌现了众多的研究成果。本文具体梳理了以往的代表性研究成果,就相关的研究内容和研究方法进行简要的述评,并从该研究的广度和深度等方面指出汉语中介语偏误研究的若干拓展方向。

注释:

[1] 刘珣:《对外汉语教育学引论》,北京:北京语言大学出版社,2000年,第169~170页。

[2] 感谢美国加州大学戴维斯分校储诚志教授介绍“汉语中介语语料库系统”的相关情况。

[3] 据北京语言大学张宝林教授介绍,“全球汉语中介语语料库”目前已建成,熟语料超过了预定规模。

[4] 需要指出的是,本文所说的汉语中介语偏误研究主要是指基于汉语中介语语料库的偏误研究。学界也有基于问卷调查所得语料的偏误研究,如孟国主编的《对外汉语十个语法难点的偏误研究》(北京大学出版社,2011年),该书通过对留学生的问卷调查语料,对十个语法难点的偏误情况进行了具体的描写,并分析偏误产生的来源,最后提出相应的教学对策和建议。

[5] 限于篇幅,本文没有介绍硕博士论文方面的相关研究成果。

[6] 鲁健骥:《外国人学汉语的语法偏误分析》,《语言教学与研究》1994年第1期,第49~64页。

[7] 高立群:《外国留学生规则字偏误分析——基于中介语语料库的研究》,《语言教学与研究》2001年第5期,第55~62页。

[8] 杨德峰:《英语母语学习者趋向补语的习得顺序——基于汉语中介语语料库的研究》,《世界汉语教学》2003年第2期,第52~65页。

[9] 陈晨:《英语国家学生中高级汉语篇章衔接考察》,《汉语学习》2005年第1期,第66~72页。

[10] 崔希亮:《欧美学生汉语介词习得的特点及偏误分析》,《世界汉语教学》2005年第3期,第83~95页。

[11] 刘春梅:《留学生单双音同义名词偏误统计分析》,《语言教学与研究》2007年第3期,第36~42页。

[12] 周文华:《基于语料库的外国学生兼语句习得研究》,《语言教学与研究》2009年第3期,第40~47页。

[13] 黄自然、肖奚强:《基于中介语语料库的韩国学生“把”字句习得研究》,《汉语学习》2012年第1期,第71~79页。

[14] 牟世荣:《外国留学生“反而”使用情况考察及教学策略》,《汉语学习》2013年第1期,第96~102页。

[15] 蔡淑美、施春宏:《基于汉语中介语语料库的二价名词习得研究》,《语言文字应用》2014年第2期,第85~95页。

[16] 戴媛媛:《基于语料库统计的高级阶段非汉字文化圈学生作文正误字对比分析》,《世界汉语教学》2014年第3期,第411~421页。

[17] 高玮:《从语篇角度看先行语中数量结构的偏误及其成因》,《语言教学与研究》2014年第3期,第11~19页。

[18] 曾常红:《“是”类词语的错位偏误》,《汉语学习》2014年第5期,第97~104页。

[19] 郝瑜鑫:《外国学生汉语插入语系统习得研究》,《华文教学与研究》2015年第2期,第27~34+42页。

[20] 邢志群:《美国大学生汉语作文省略偏误研究》,《世界汉语教学》2016年第4期,第531~549页。

[21] 马文津、施春宏:《基于整句—零句表达系统的汉语中介语篇章现象考察——以日语母语者汉语语篇为例》,《世界汉语教学》2016年第4期,第513~530页。

[22] 刘旭:《泰国大学生汉语名词习得机制探析——以名词句法功能习得为中心》,《语言文字应用》2018年第3期,第114~123页。

[23] 牛长伟、李君:《汉语中介语“什么”类代词的偏误分析及教学对策》,《汉语学习》2019年第4期,第94~102页。

[24] 孟国:《对外汉语十个语法难点的偏误研究》,北京:北京大学出版社,2011年,第5~7页。

[25] 童琴、徐婷:《基于CNKI近三十年我国对外汉语偏误研究的文献计量分析》,《云南师范大学学报》(对外汉语教学与研究版)2018年第5期,第85页。

[26] 毕晋、肖奚强、程仕仪:《新世纪以来汉语作为第二语言习得研究成果分析——基于四份CSSCI中国语言学来源期刊文献的统计》,《语言与翻译》2017年第4期,第80页。

[27] 学界还有一种分析留学生汉语偏误案例的研究范式,如肖奚强、颜明、乔倓、周文华等著的《外国留学生汉语偏误案例分析》(世界图书出版公司,2015),该书基于在建的汉语中介语偏误信息语料库,对留学生所输出的七十多个语音、汉字、词汇、词类和句型句式方面的偏误案例进行较为细致的分析,进而提出相应的教学建议。

[28] 杨连瑞、常辉、尹洪山:《中介语发展的语言共性研究》,《外语研究》2011年第6期,第60页。

[29] 张赪:《二语语法习得研究的类型学方法探析》,《烟台大学学报》(哲学社会科学版)2016年第2期,第116页。

[30] 高顺全:《语序类型学视角下的汉语框式介词习得偏误研究——以“在……上”为例》,《海外华文教育》2017年第12期,第1626~1635页。

[31] 郭风岚、刘辉:《中高级水平学习者汉语语序偏误的类型学分析》,《汉语学习》2017年第2期,第98~105页。

猜你喜欢

偏误语料语料库
基于归一化点向互信息的低资源平行语料过滤方法*
平行语料库在翻译教学中的应用研究
《语料库翻译文体学》评介
初级对外汉语读写教学过程中偏误的成因及对策研究
偏误分析内涵探究及应用
濒危语言与汉语平行语料库动态构建技术研究
偏误分析的意义与局限
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入
英语教学中真实语料的运用