APP下载

近二十年汉语二语偏误分析硕士学位论文的计量分析*

2022-03-29李珺婷

关键词:偏误语料语料库

黄 伟, 李珺婷

(1.北京语言大学 汉语国际教育研究院/语言科学院计量语言学研究中心,北京 100083;

一、引 言

20世纪80年代,中介语理论被引入汉语作为第二语言教学与习得研究领域。到20世纪90年代中期,基于中介语理论的偏误分析成为研究热点(1)徐子亮.对外汉语学习理论研究二十年[J].世界汉语教学,2004,(4).,相关研究成果涵盖了语音、词汇、语法、语用等多个方面。(2)施家炜.国内汉语第二语言习得研究二十年[J].语言教学与研究,2006,(1).21世纪以来,汉语二语习得研究走过“理论引介与经验式研究期”“进入实证研究深水区,并将持续深入”(3)毕晋,肖奚强,程仕仪.新世纪以来汉语作为第二语言习得研究成果分析——基于四份CSSCI中国语言学来源期刊文献的统计[J].语言与翻译,2017,(4).,偏误分析仍是研究热点之一。

偏误分析持续二三十年的热潮对相关专业研究生学位论文选题产生了重要影响。国内二语汉语偏误分析研究中,“硕博论文是主力”。(4)童琴,徐婷.基于CNKI近三十年我国对外汉语偏误研究的文献计量分析[J].云南师范大学学报(对外汉语教学与研究版),2018,(5).与学术学位硕士相比,偏误分析更受专业学位研究生青睐。(5)刘弘,杨喆.汉语国际教育学术型硕士与专业型硕士学位论文选题之比较研究[J].海外华文教育,2013,(3).这里的专业学位主要是指汉语国际教育专业硕士。汉语国际教育专业硕士是汉语二语教学实践与研究阵营的重要组成部分,有效地“推动了汉语教学在世界范围内的快速发展”。(6)丁安琪.汉语国际教育硕士:专业发展十一年[J].国际汉语教育(中英文),2018,(4).统计分析2015~2016年4014篇该专业学位论文发现,偏误分析是该专业论文选题的重中之重。(7)周红.从学位论文选题看汉语国际教育专业硕士人才培养[J].国际汉语教育(中英文),2019,(2).针对5所高校的研究发现,偏误分析在该专业学位论文选题中所占比例仅次于教学方法与教学模式。(8)李宝贵,曹儒,李澍慧.辽宁省五所高校MTCSOL论文选题分析与建议[J].渤海大学学报(哲学社会科学版),2017,(1).统计分析16000余篇该专业学位论文数据发现,偏误分析是近十年来该专业学位论文最主要的研究热点。(9)黄伟,李珺婷.汉语国际教育专业硕士学位论文的文献计量分析[A].北京语言大学汉语国际教育研究院编·汉语应用语言学研究(第8辑)[C].北京:商务印书馆,2019:101~114.

偏误分析是发现二语学习者发生偏误规律的过程(10)鲁健骥.偏误分析与对外汉语教学[J].语言文字应用,1992,(1).,涉及不同学习者与不同语言知识或语言技能。分析规模庞大的偏误分析硕士论文涉及了哪些语言知识、语言技能与学习者对象,采用了什么方法,存在什么问题等,对于掌握汉语二语偏误分析研究现状,了解相关专业研究生学位论文选题,提升汉语二语偏误分析研究水平而言,都具有一定参考价值。

为了回答这些问题,需要对这一领域的研究主题进行分析。主题分析属于信息情报研究。信息情报工作能够为决策者、教学与研究人员的工作提供帮助,有利于了解全局、制定政策、选择研究课题。(11)崔希亮.对外汉语教学的基础研究与应用研究[A].对外汉语教学的全方位探索——对外汉语研究学术讨论会论文集[C].北京:商务印书馆,2005.文献计量学方法可用于描述、评价和预测科学技术的现状与发展趋势。(12)郑文晖.文献计量法与内容分析法的比较研究[J].情报杂志,2006,(5).目前,已有学者(13)童琴,徐婷.基于CNKI近三十年我国对外汉语偏误研究的文献计量分析[J].云南师范大学学报(对外汉语教学与研究版),2018,(5).对1987~2017年间国内的汉语二语偏误分析研究文献进行过统计分析。其数据来源既包括CNKI中的硕博学位论文,也包括期刊论文、会议论文与报纸文章,经人工清理后剩余有效文献7364篇。该研究发现,偏误分析研究数量呈螺旋式上升,语料来源从单一向多元化发展,研究热点为词汇偏误。而基于4本核心期刊的数据分析结果(14)毕晋,肖奚强,程仕仪.新世纪以来汉语作为第二语言习得研究成果分析——基于四份CSSCI中国语言学来源期刊文献的统计[J].语言与翻译,2017,(4).认为,偏误分析(与习得研究)侧重语法。另有研究指出了汉语二语偏误分析硕士论文存在的不足主要表现在创新性、语料来源丰富性、语料与研究对象的对应等方面。(15)田润润.汉硕学位论文“偏误研究”类选题分析——以黑龙江大学2009~2015级学生为例[D].黑龙江大学硕士学位论文,2017.然而,这些研究探讨的问题虽有相近之处,但数据基础与时间范围均不相同;且有的研究数据规模较小,样本代表性不强,因而所得结论有所不同,也尚未能较好地回答前文提出的问题。

为了进一步深入了解汉语二语偏误分析硕士学位论文究竟研究了什么、是如何开展研究的,本文收集整理了20年(2001~2020)的论文数据,采用文献计量学与知识图谱可视化方法与工具进行计量分析,拟回答的3个具体问题是:(1)汉语二语偏误分析硕士论文的研究主题是什么?(2)该类论文研究热点的演化路径(或发展趋势)有什么特点?(3)这些研究的语料来源情况如何?本文第二部分介绍研究方法与使用的数据,第三部分依次呈现3个问题的分析结果并展开讨论,第四部分总结主要发现、不足与有待进一步探讨的问题。

二、方法与数据

(一)研究方法

针对上文提出的前两个问题,采用文献计量学与知识图谱可视化方法进行研究。一方面,以文献信息中的知识单元为研究对象,采用统计方法考察文献的外部特征,从而描述、评价研究现状与发展趋势;另一方面,以文献集合形成的知识网络为对象,通过复杂网络方法探索学科领域的网络结构特点、绘制可视化图谱并进行分析。使用的文献计量研究工具是引文可视化分析软件CiteSpace与相似性可视化分析工具VOSviewer。这两个工具用于绘制关键词共现图谱与关键词时序图谱,探索偏误分析硕士论文的研究热点与演进过程。

对于第3个问题,由于语言研究的基本方法是收集真实语境中的语言材料,并将它们作为素材来解释语言现象,或者发现新的语言规律(16)卢伟.语料库在对外汉语教学中的应用[J].厦门大学学报(哲学社会科学版),1999,(4).,偏误分析必须使用中介语语料。中介语语料可分为自然语料和非自然语料。自然语料可以通过检索语料库得到,非自然语料可通过问卷调查或实验收集。(17)肖奚强.汉语中介语研究论略[J].语言文字应用,2011,(2).既可以从论文、对话中收集语料,也可以通过测试、问卷调查、访谈、课堂教学积累语料。(18)周小兵.汉语国际教育专业硕士毕业论文的研究设计与写作(上)[J].国际汉语教育,2017,(1).在分析收集到的学位论文数据、参考中介语研究方法的分类(19)肖奚强.汉语中介语研究论略[J].语言文字应用,2011,(2).并略做调整后,采取自动分类与人工校验相结合的方法,将收集到的学位论文按语料获取途径分为4类:检索已有的汉语中介语语料库,设计并实施问卷调查(及访谈),设计并开展实验,其他途径(包括在教学过程中收集到的作业和试卷、文献或教材中的语料、与学生交流或从社交平台中获得的语料等)。在此基础上统计分析不同类别的论文数量及随时间的变化情况。

(二)数据来源

本文分别从CNKI“中国优秀硕士学位论文全文数据库”(以下简称CNKI)与万方数据的“中国学位论文全文数据库”(以下简称“万方”)中检索汉语二语偏误分析硕士论文数据。这两个数据库收录的论文虽然有重合的部分,但是差异更大。组合使用两部分数据能够更全面地探讨本文提出的问题。在CNKI中将“学位授予年度”限制为2001~2020年,以“主题=(对外汉语+汉语国际教育+国际中文教育)*偏误分析”作为检索表达式进行高级检索(检索日期为2021年10月25日,下同),得到硕士学位论文数据3870条。在“万方”中将“发表时间”限制为2001~2020年,以“[主题:(对外汉语教学) 或主题:(汉语国际教育) 或主题:(国际中文教育)] 和主题:(偏误分析)”作为检索表达式进行专业检索,在检索结果中筛选出“授予学位”为“硕士”的数据共4529条。编写程序将这两部分数据合并、去重,共得到有效数据6699条。其中,CNKI独有数据2170条,“万方”独有数据2829条,二者共有数据1700条。经初步统计,这6699篇硕士学位论文来自全国144所高校。这些论文的发文量随时间变化的趋势如图1所示。其中的“对外汉语”相关论文数据是分别从CNKI中以检索表达式“主题=(对外汉语+汉语国际教育+国际中文教育)”进行高级检索和从“万方”中以检索表达式“主题:(对外汉语教学)或主题:(汉语国际教育) 或主题:(国际中文教育)”进行专业检索得到的。

从图1中可以看到,无论在CNKI还是在“万方”的数据库中,前10年(2001~2011)的偏误分析论文数量都不多,呈缓慢增长态势;后10年偏误分析论文数量维持在了一个比较高的水平。(20)2020年数量有明显下降,可能的原因,一是数据库收录滞后;二是受新冠肺炎疫情影响留学生毕业人数减少。偏误分析研究的材料是二语学习者的语言产出,研究规模自然受学习者数量影响。前10年偏误分析论文的增长速度比较缓慢。这一增长态势与“来华留学生数量增长曲线”(21)崔希亮.对外汉语教学与国际汉语教育的发展与展望[J].语言文字应用,2010,(2).基本一致。除了来华留学生,与偏误分析研究数量相关的因素还包括海外开展的汉语二语教学活动。2004年我国第一所孔子学院在韩国首尔正式成立,同年国家汉办派出第一批国际汉语教师志愿者。随着孔子学院数量增长,越来越多的在读研究生成为志愿者。他们在工作中收集学习者偏误语料进行分析研究具有便捷的条件,也与实际教学需求相契合。很多承担海外实习的志愿者与国内教学实践的学生在完成学业时将与教学相结合的偏误分析作为毕业论文选题。因此,从2007年起,偏误分析硕士论文数量开始增长。到了2010~2011年,此类论文数量上升到一个新台阶。与此同时,对外汉语相关论文的发文量增长更为明显。这与汉语国际教育专业学位硕士的培养规模增长密切相关。2007年3月底,国务院学位委员会颁布《汉语国际教育硕士专业学位设置方案》;同年5月底,国务院学位办批准首批24所高校开展汉语国际教育硕士专业学位的招生培养工作;2009年,另有39所高校成为该专业学位人才培养单位。(22)李向农,贾益民.对外汉语与汉语国际教育:专业与学科之辨[J].湖北大学学报(哲学社会科学版),2011,(4).截止到2021年10月,中国研究生招生信息网专业目录查询系统(23)https://yz.chsi.com.cn/zsml/zyfx_search.jsp.显示,该专业学位的培养单位至少有149个。该专业学制通常为2~3年,自2007年首批大规模招生算起,2009~2010年恰好是这批学生的毕业时间;而2011~2012年恰好是2009年扩招学生毕业时间。这些时间点恰好与偏误分析论文及对外汉语相关论文的增长阶段吻合,也与此前的研究结果(24)黄伟,李珺婷.汉语国际教育专业硕士学位论文的文献计量分析[A].北京语言大学汉语国际教育研究院编,汉语应用语言学研究(第8辑)[C].北京:商务印书馆,2019:101~114.一致。此外,偏误分析论文在全部对外汉语相关主题的学位论文中的占比,自2007~2008年起就维持在一个较稳定的水平。在CNKI中占比接近20%,在“万方”中的占比在20%~30%间波动。近20年总体占比分别为17.08%(CNKI)与27.42%(“万方”),年平均占比分别为15.96%与22.88%。绝对数量和相对占比数据说明,近20年“偏误分析”在对外汉语教学相关专业的硕士学位论文选题中一直备受青睐,是主要选题之一。

三、结果与讨论

(一)研究主题

论文的关键词是为了标引文献,从论文中选取出来用以表示全文主题内容信息的术语,能够帮助读者迅速抓住文章的信息焦点。我们统计分析了6699篇论文的6069个关键词词频(共计29447词次),过滤掉“对外汉语”“汉语教学”“对外汉语教学”“汉语国际教育”“偏误”与“偏误分析”等关键词后,前30个高频关键词如表1所示。这30个关键词的累积频率超过了1/4(26.17%)。

关键词词频能够反映文献集合聚焦主题的集中程度。观察表1可以发现,这些论文主要针对“留学生”在学习掌握“趋向补语”“能愿动词”“程度副词”“离合词”“句法结构”等各种语言要素与“语用功能”等语言技能过程中的“习得顺序”与“习得偏误”,分析“偏误类型”与“偏误原因”,探讨“教学模式”与“教学方法”,提出“教学策略”与“教学对策”,给出“教学建议”、优化“教学设计”。研究的学习者群体主要是“泰国学生”“韩国学生”“越南学生”与“日本学生”等。

表1 汉语二语偏误分析硕士论文的30个高频关键词

从高频关键词得出的上述对研究主题的描述还比较粗犷,但是它没能全面地反映这个领域的研究热点,特别是基于离散的词频数据难以发现关键词之间的联系。为此,我们绘制了关键词共现网络图谱(图2)。与此同时,上述关键词词频分析中,例如“韩国学生”与“韩国留学生”两个词条,在很大程度上代表的是同一类学习者。关键词标引不一致使得上述统计结果略显粗糙。在构建关键词共现网络的过程中,我们合并了同义关键词解决了此类问题。

图2呈现了汉语二语偏误分析硕士论文的高频关键词共现网络,由频次大于或等于10的202个关键词组成(隐藏了“对外汉语”“对外汉语教学”“汉语国际教育”“偏误”“偏误分析”“汉语”“现代汉语”等无助于发现研究主题特点的少量关键词)。图中节点代表关键词,节点大小代表关键词频次多少,节点间的连线代表两个关键词之间有共现关系(即在同一篇论文中出现)。节点颜色深浅代表了出现的年份,颜色越浅代表出现的平均时间距现在越近。这202个关键词约占全部关键词的3.33%,其累积频率达到55.52%,即超过半数。关键词的频次分布符合幂律,分布曲线的尾部是大量频次较低的罕见关键词。因此,累积频率超过半数的这202个关键词能够比较充分地反映这些论文的研究主题。结合图2与表1可以发现,这些论文的研究主题有以下5个方面的特点。

第一,从选题方向看,高频关键词(比如“教学策略”“教学建议”“教学设计”等)反映出这些研究与教学实践结合紧密。这与《汉语国际教育硕士专业学位论文撰写指导意见》中对论文写作的总体要求相符。该《意见》要求,“本专业论文应紧密结合汉语国际教育实践进行选题,须具有明确的汉语国际教育背景和应用价值,体现研究生综合运用科学理论、方法和技术解决实际问题的能力”。虽然本文考察的全部论文的作者不都是汉语国际教育专业硕士,但是占比达到45.77%。实际上,有2191篇论文的题录数据中缺少专业信息,如果仅统计专业信息完备的4508篇论文数据可以发现,汉语国际教育专业硕士论文共有3066篇,占比接近七成(68.01%)。对于汉语国际教育专业硕士而言,教学实践对学位论文选题与撰写均具有促进作用。(25)李宝贵,李慧.汉语国际教育硕士专业研究生海外顶岗实习的问题与对策[J].云南师范大学学报(对外汉语教学与研究版),2019,(3).这些论文分析二语者习得某项语言要素或技能过程中的偏误现象与规律,提出具有针对性的教学建议,是对教学活动的反思与总结,体现了选题紧密结合教育实践的特点。

第二,在研究内容方面,语音(声母、韵母、声调)、词汇(成语、惯用语、副词、介词、量词、语气词等)、语法(可能补语、结果补语、动词重叠、“把”字句、“被”字句、“是”字句、比较句等)、语用(篇章、写作、语篇衔接、语用功能)、汉字(书写)、标点符号与汉语拼音等语言要素或语言技能均有涉及。其中,趋向补语、能愿动词、程度副词、离合词等教学难点,以及在世界文字体系中具有显著特点的汉字,均备受关注。语法偏误研究数量最多,这与基于2015~2016年的学位论文的统计结果(26)周红.从学位论文选题看汉语国际教育专业硕士人才培养[J].国际汉语教育(中英文),2019,(2).一致。这些研究有效地推动着语言要素教学,但是相较于语音、词汇、语法等方面的语言知识,篇章与语用方面的研究尚不充分。30年前鲁健骥就已经指出了这一点(27)鲁健骥.偏误分析与对外汉语教学[J].语言文字应用,1992,(1).,但从本文的统计结果看,这个问题在硕士论文选题中没有得到充分重视。

第三,从研究对象看,根据分层级教学的现实情况主要开展了针对“初级”学习者的偏误研究,“中高级”的相对较少。这与基于期刊论文的研究结果不同。赵春利回顾20年的偏误分析研究发现,针对中级汉语水平学习者的研究多于针对初级水平。(28)赵春利.对外汉语偏误分析二十年研究回顾[J].云南师范大学学报(对外汉语教学与研究版),2005,(2).究其原因,主要是硕士学位论文的作者参与的教学实践活动大多数是面向初级学习者的,研究对象的选择受限于教学实践,以初级水平学习者为主。这些研究中,以泰国、越南、韩国、日本、俄罗斯、蒙古、印度尼西亚等邻近国家的学习者为研究对象的情况较多,针对欧美国家或地区的学习者研究较少。从对外汉语教学到汉语国际教育的发展过程中,国别化教学与研究已经形成一种趋势(29)李如龙.论汉语国际教育的国别化[J].语言教学与研究,2012,(5).,而研究涉及的国家或区域又与其汉语学习者数量密切相关。本文的统计结果说明,国别化研究已经成为偏误分析硕士论文的主要类型之一。这也在一定程度上说明,这些研究在“重视偏误分析,缺乏表现分析;注重个性分析,缺少共性分析”(30)张宝林.外国人汉语句式习得研究的方法论思考[J].华文教学与研究,2011,(2).方面较为突出。

第四,在研究方法上,主要采用“对比”分析方法分析汉语“中介语”的“偏误类型”“偏误原因”“习得顺序”等。偏误原因中只有“母语迁移”突显,这与研究方法密切相关:即对偏误现象的分析往往从学习者的母语与汉语的对比中寻找(如“汉英对比”“汉韩对比”等),几乎全部归因于“母语负迁移”。(31)张宝林.外国人汉语句式习得研究的方法论思考[J].华文教学与研究,2011,(2).篇章与语用方面的偏误现象有很多是文化差异原因造成的。但是由于此类研究较少,“文化差异”在图2中只是一个较小的节点,与其他节点的联系也不够广泛。学习者对目的语语言规则的过度泛化、自身的学习策略以及教学失误等偏误原因在现有研究中极少出现。张宝林指出,汉语二语习得研究中对偏误产生原因(以及偏误类型)的分析存在严重的“套路”化、“对号入座”现象,将“母语负迁移”视为解释各种语言偏误现象的“首要法宝”,“千篇一律”,缺乏具有针对性和个性化的研究(32)张宝林.汉语习得研究的两个问题[J].国际中文教育(中英文),2021,(3).。从本文的统计结果看,这种现象在硕士论文中尤其严重。

第五,“HSK动态作文语料库”“问卷调查”等节点及其在网络中的位置与作用表明了偏误分析论文的主要语料来源。其中,与“HSK动态作文语料库”节点相连接的、能够表明研究对象国别的主要是泰国、韩国和日本,而与“问卷调查”联系紧密的主要学习者来自韩国与俄罗斯。这是否能够在一定程度上说明,目前的汉语中介语语料库尚不能充分满足国别化研究需求呢?我们将在本节第三部分进一步讨论这个问题。

(二)演化路径

在得到研究主题的上述特征后,随之而来的一个问题是,20年来这些研究主题是如何发展变化的。随着时间的推移,科学文献在发表后,其内容会逐渐陈旧过时;而随着新文献的发表,新内容会层出不穷。这种推陈出新可以通过反映主题的关键词的频次变化表现出来。为了探究研究主题的变化情况,我们绘制了关键词时序图谱(图3)。在绘制过程中,将2001~2020年按每5年一个阶段划分为4个时段,每个时段选取前10%高频关键词(且不超过100个)。图中关键词节点所在的时区为其首次出现的时段,节点大小代表关键词在全部时区出现频次的多少,节点间的连线代表关键词间的共现关系。图3显示了频次大于等于30的部分高频关键词(过滤了“偏误”“对外汉语教学”等关键词)。由于关键词在共现网络时区图中的分布是按照首次出现的年份定位的,图中能够清楚地看出研究主题随时间推移的“增量”,但在描述各阶段研究主题的“存量”方面不够充分。为此,我们统计分析了各阶段的高频关键词(33)为了提高准确性和方便处理,这部分关键词频次分析没有采用关键词共现网络图谱中的数据,而是从原始数据中单独计算的,因此表2与图4中部分关键词不完全对应。,如表2所示。结合图3与表2可以看出,这些论文的研究主题的演进具有以下4个方面的特点。

第一,图3显示各阶段“涌现”出的研究主题在数量上非常不均衡。第一阶段研究主题较少,第二阶段出现了爆发式地增长,第三阶段急剧回落,第四阶段相对地几乎没有新研究主题出现。这说明前两个阶段的研究基本奠定了这些论文的主题范围,后10年没有太大变化。这与前文关于发文量的变化趋势形成了鲜明对比。前10年的发文量较少(706篇),不足后10年(5993篇)的1/8。但是这些相对较少的研究几乎涵盖了该领域的绝大部分主题。表2中大部分用星号标示的高频关键词在不同阶段重复出现,也说明了这一点。那么,后10年的这些研究真的是在重复前10年的研究吗?偏误分析研究具有相对成熟的经典研究范式(即描写偏误、总结规律、分析成因、提出对策(34)毕晋,肖奚强,程仕仪.新世纪以来汉语作为第二语言习得研究成果分析——基于四份CSSCI中国语言学来源期刊文献的统计[J].语言与翻译,2017,(4).)。为了深入探究这个问题,还需要从研究内容(与方法)、对象与目的等角度进一步分析研究主题的具体演进情况。

表2 偏误分析硕士论文的30个高频关键词(分阶段)

第二,从研究内容与方法看,这些论文在第一、第二阶段就已经较多地关注了语音、词汇、语义、语法、语用、汉字等方面的偏误现象。第一阶段主要研究介词、副词、比较句、趋向补语等。随着研究数量的增长,第二阶段的研究主题逐渐丰富起来,如量词、语气词、离合词、形容词、趋向补语、结果补语。这一阶段研究的语言现象也进一步精细化,“关注点越来越深入,越来越细小化,由整体到局部”。(35)童琴,徐婷.基于CNKI近三十年我国对外汉语偏误研究的文献计量分析[J].云南师范大学学报(对外汉语教学与研究版),2018,(5).例如关注到了量词中的名量词,副词中的程度副词、时间副词,动词中的能愿动词等。与此同时,语音(如声调)与汉字方面的偏误现象也更多地进入研究视野。研究主题的范围在这一阶段得到了充分的扩展。进入到第三阶段后,句式结构受到更多关注,语音与汉字方面的偏误分析也进一步加强。语音方面的研究多采用实验手段(详见下文)。这一阶段的汉字偏误研究较多地关注了“汉字书写”,这也需要记录与分析书写字迹的技术手段。“HSK动态作文语料库”等数据资源从这一阶段开始被大量使用。因此,虽然第三阶段在研究范围上没有太多变化,但开始在研究方法(主要是语料收集与分析手段)上有所突破。这与下文关于研究使用的数据来源的分析结果一致,基于实验、问卷与语料库的研究在第三、第四阶段逐渐增多。

第三,从研究对象看,第一阶段的研究数量不多,大多以泛化的“留学生”整体或“韩国留学生”“越南留学生”两个学习者群体作为研究对象;第二阶段开始,以越南、韩国、泰国、日本以及中亚等邻近国家与地区的学习者为主;第三、四阶段主要增加了蒙古、俄罗斯、印度尼西亚等国家的学习者。研究对象的变化体现了汉语二语学习者主要群体的变化,同时也说明国别化研究一直受重视,是汉语二语偏误分析硕士论文的主要研究类型之一。

第四,偏误分析研究的目的是寻找学习者的二语习得规律,从而帮助改进教学与学习。由此来看,第一阶段除了聚焦于“教学策略”“教学对策”,也关注了“学习策略”。第二阶段从“教学模式”“教学方法”等角度对“课堂教学”提出“教学建议”,第三阶段进而注重具体的“教学设计”。这一过程体现了研究目的逐步细化,针对性越来越强,将偏误分析与教学实践紧密联系起来,将研究成果尽可能地应用到教学中去。除此以外,“教材编写”几乎一直是重点讨论的话题之一,说明有很多研究注意到了将偏误现象与习得规律的研究发现应用于为教材编写服务。

(三)语料来源

在了解了研究主题及其演化路径后,另一个值得关注的问题是,这些研究是如何开展的。偏误分析是一种实证性研究,语料是描写中介语偏误现象的基础。如果语料不完整,那么在此基础上描写的中介语就不可靠。(36)孙德坤.中介语理论与汉语习得研究[J].语言文字应用,1993,(4).如前文所述,本文将这些研究的语料获取途径分为4类。按照Widdowson(37)Widdowson,H.G.On the limitation of linguistics applied[J].Applied Linguistics,2000,(1).的观点,通过问卷调查与开展实验得到的数据属于诱导性的“第二人称数据”,而检索语料库数据及部分其他类数据是相对客观的观察,称为“第三人称数据”。汉语二语偏误分析硕士论文极少使用靠内省产生的“第一人称数据”,主要使用第二人称数据与第三人称数据。图4是全部论文语料数据来源情况的统计结果。其中柱状图反映4种来源在各年度论文中的绝对数量,折线图表示四类数据的年度占比与变化。2007年以前的数据量较小,此后的数据能够更好地说明四类语料来源在这些论文中的使用及变化情况。

从图4可以看出,语料来源类型在全部研究中的分布不均衡。以实验获取语料数据的论文数量最少,这类研究通常是以实验手段开展的语音偏误研究。“其他”类语料虽然获取途径较多,但是可以收集到的语料数量有限,难以对汉语中介语中的某个具体问题进行较为全面的描写与研究。基于小规模调查数据的研究结论具有局限性(38)张宝林.汉语习得研究的两个问题[J].国际中文教育(中英文),2021,(3).,因此有逐渐减少的趋势。“问卷调查”类的数量与占比逐年缓慢上升,一直以来都是获得偏误语料数据的重要手段。使用中介语语料库获取数据的论文数量与占比在四类来源当中最高。随着语料库技术的成熟,汉语中介语语料库的建立在论文选题与语料收集方面产生了较大影响,不但为研究者探索汉语语言现象提供了更多语料资源,也极大地提高了汉语二语教学研究的水平。(39)崔希亮,张宝林.全球汉语学习者语料库建设方案[J].语言文字应用,2011,(2).使用中介语语料库的研究数量逐年增加,反映了该研究领域在语料收集与研究方法上的进步。

然而,我们发现大多数留学生撰写的论文更倾向于使用教学活动中积累的语料或问卷调查(合计占比56%),使用中介语语料库的约占1/3。一方面,这些留学生的论文往往聚焦于自己国家或母语的二语学习者群体的语言偏误问题。这说明现有的汉语中介语语料库还不能完全满足国别化的偏误研究需要;另一方面,留学生使用汉语中介语语料库比例不高是否能够说明,在中介语语料库的易用性与宣传推广方面,针对非汉语母语者是不是还有一些工作要做呢?这是一个有待考证的问题。

由于基于中介语语料库开展的研究最多,我们进一步分析了这些论文的数据,发现其中讨论语法相关问题的最多(1184篇),然后依次是词汇(646篇)、语篇(96篇)、语音(72篇)、标点符号(56篇)、汉字书写(46篇)等。这与基于CSSCI核心期刊论文数据的研究结果基本一致,即“偏误分析和习得研究侧重语法”“语法偏误分析占比57.1%”“汉字和词汇偏误分析最少”。(40)毕晋,肖奚强,程仕仪.新世纪以来汉语作为第二语言习得研究成果分析——基于四份CSSCI中国语言学来源期刊文献的统计[J].语言与翻译,2017,(4).本文仅统计基于中介语语料库的语法偏误分析研究占比也达到了45.65%,词汇偏误分析占比达到了9.64%,汉字偏误分析占比最少(不足0.7%)。由于口语语料库较少,借助中介语语料库开展语音偏误研究的论文非常少。这些研究中使用的主要有“北京语言大学中介语口语语料库”和“南京大学海外教育学院全球口语语料库”。当前语音偏误研究主要采用问卷调查(195篇)与语音实验(219篇)等方法获取数据。这说明公开、可靠、易用的汉语中介语语音语料库的缺失与汉语二语语音偏误研究需求之间的供需矛盾是客观存在的。

不仅如此,汉语中介语语料库建设方面的不足还体现在学习者母语背景的分布上。分析这些基于中介语语料库开展的研究涉及的对象国别(区域)与母语背景,可以发现,虽然这些研究已经涉及90多个国家(地区)、22种不同母语背景的汉语学习者,但是研究对象的分布极不均衡。其中韩国(578篇)、泰国(540篇)、越南(185篇)、蒙古(154篇)、日本(153篇)、俄罗斯(132篇)、美国(51篇)、柬埔寨(48篇)、马达加斯加(42篇)、菲律宾(39篇)、西班牙(33篇)等国家,中亚(72篇)、西亚(27篇)、非洲(12篇)、南亚(11篇)等地区,以及母语为英语(236篇)、俄语(38篇)、日语(26篇)、泰语(25篇)、阿拉伯语(21篇)、法语(21篇)的学习者是主要的研究对象。这与前文基于关键词分析研究主题的结果一致,即研究对象主要分布在我国周边国家和地区,针对欧美学习者的研究相对较少。这也印证了汉语二语习得研究中,“区分母语背景以及按照其他标准划分研究对象的差异性研究占多数”(41)毕晋,肖奚强,程仕仪.新世纪以来汉语作为第二语言习得研究成果分析——基于四份CSSCI中国语言学来源期刊文献的统计[J].语言与翻译,2017,(4).的看法。

四、结 语

偏误分析研究能够在二语学习者的语言产出中发现规律,进而提出具有针对性的教学建议与学习策略,帮助改进教学与学习,因此在二语习得领域备受重视,也是相关专业硕士论文选题的热点。本文尽可能地收集整理了较大规模的近20年汉语二语偏误分析硕士学位论文数据,采用文献计量学与知识图谱可视化方法,统计分析了21世纪以来此类论文在研究主题及其演化路径与研究使用的数据来源等方面的特点。研究发现,汉语二语偏误分析硕士论文大多紧密结合教学实践,能够比较全面地关注不同层面的偏误现象与不同国别或母语背景的初级汉语学习者群体。近20年来的研究在研究对象方面不断扩展,研究方法的科学性随着中介语语料库技术与实验分析手段的成熟与普及有所提升,在语言要素或语言技能方面逐渐深入和细化,但是在偏误类型与偏误原因的分析方面囿于成说、千篇一律,缺乏具体问题具体分析的科学性与合理性。

虽然本文尽可能地收集整理了不同来源的数据,但是由于部分高校的学位论文数据未公开,所得结论仍具有一定局限性。同时,由于学位论文数据库缺少引文数据,我们无法从引文空间探索这些研究的知识基础与知识流动,而只能将研究停留在上述结果的范围内。

在研究过程中,我们也发现了一些值得进一步探索的问题。一些学位论文在关键词的选择和使用方面不规范,有些关键词过于宽泛,起不到标引主题的作用;部分中介语语料库未公开共享;CNKI与“万方”的部分毕业论文数据不完整;学位论文研究使用的数据规模相差较大,特别是部分问卷调查与实验研究的样本量与抽样原则的科学性有待提高。这些问题均会影响科学研究的良性发展,值得进一步探讨。

猜你喜欢

偏误语料语料库
《语料库翻译文体学》评介
“一……就……”句式偏误研究
把课文的优美表达存进语料库
新HSK六级缩写常见偏误及对策
基于语料调查的“连……都(也)……”出现的语义背景分析
华语电影作为真实语料在翻译教学中的应用
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
介词框架“对……来说”的偏误分析