国内语料库外语教学研究二十年(2000—2020)
——基于CSSCI来源期刊的文献计量分析
2022-08-12张瑞娥韩名利
王 翊, 张瑞娥, 韩名利
(1. 安徽科技学院 外国语学院, 安徽 凤阳 233100; 2. 马来西亚理科大学 语言、文学与翻译学院, 槟城 11800)
在语言研究领域,无论是对语言结构的分析还是对其应用的考察都离不开相关语料的辅助与支撑。自20世纪初期Thorndike、陈鹤琴等学者遵循一定抽样方案对语料进行手动收集并以统计学方法对文本进行量化考察以来,历经近一个世纪的发展与演变,现今学界对语料的运用已经进入了大规模电子文本存储、海量语境信息集成、软件自动加工检索的“语料库3.0时代”[1]。语料库作为一种全新研究方法和范式已然广泛应用于语言学、社会语言学、翻译学、翻译批评、外语教学、词典编纂等各个研究领域。
较早出现的语料库语言教学研究案例是Tim Johns[2]所提出的“数据驱动学习法”(data driven learning),即利用语料库检索结果的索引行考察目标词汇的语义及语法结构共选情况,并尝试以此提高易混淆词和多义词的教学效果。随着语料库类型不断丰富,特别是专门用途语料库的发展,用于记录和描述语言学习者书面语、口语的学习者语料库得以建立,语料库在二语习得及外语教学中的作用不断显现。
国内学界自20世纪90年代起也开始尝试将语料库视角引入外语教学,根据方秀才[3]、徐秀玲[4]等学者考察,20世纪末的十多年间国内相关研究主要致力于介绍语料库语言学的理论概念、英美等国语料库建设及基于语料库的研究状况等,尚属“语料库引介”阶段。进入21世纪以来,国内学者对语料库外语教学的探究逐步深入并取得了长足进展。本文基于中国知网(CNKI)数据库,对2000—2020年CSSCI来源期刊涉及语料库外语教学研究的文献进行了梳理,绘制了科学知识图谱并进行可视化计量分析,以期厘清发展脉络、明晰研究现状、展望发展趋势,为该领域研究提供一定借鉴。
一、数据收集及研究方法
本文以中国知网(CNKI)为检索平台,选择“中国学术期刊数据库”(CAJD)中CSSCI期刊为文献来源,设置检索条件以“语料库”并含“教学”或“外语教学”或“自主学习”为主题,时间跨度为2000—2020年,经筛选剔除无关检索结果,共获得有效文献139篇,检索日期为2020年10月3日。
数据收集完成后使用CiteSpace 5.5.R2版本对文献进行了考察分析。CiteSpace是由Drexel大学陈超美博士团队与大连理工大学WISE实验室共同开发的科学文献分析工具,其设计理念遵循Karl Popper所提出的“三个世界”理论,旨在通过将“客观知识世界”的内容进行知识图谱可视化来帮助人的“精神世界”对“物质世界”进行认知了解[5]。具体做法是对施引文献集的内容信息如关键词、作者、发文机构等的出现频次、共现状况,以及施引文献集所引参考文献的出现频率、共被引状况等进行量化统计分析并以可视化形式展现。软件参数设置如下:Time Slicing(时间分区)为2000—2020年;Years Per Slice(时间切片)为1年;Term Souce(术语来源)全选;Links(连接算法)为Cosine;Top N(阈值)为50。
二、数据可视化分析
(一)文献总体分布
对某一研究领域的文献发文量进行历时统计分析能够在一定程度上考察该领域的发展特点及趋势[6]。依据2000—2020年CSSCI来源期刊关于语料库外语教学研究的载文情况生成期刊发文情况分布图,见图1。
图1 2000—2020年国内语料库外语教学研究文献总体分布(CSSCI来源)
据图1所示,2000—2020年语料库外语教学研究的发文分布总体呈现出由“低缓”到“增长”再至“稳定”的发展历程,累计发文139篇,年均6篇;2000—2003年发文量仅3篇,年均不足1篇,且2001年、2003年无文献发表,研究发展迟滞;2004年、2005年发文量陡增至6篇,2006年回落后开始稳步增长,2011年至峰值18篇;2012—2020年研究趋于平稳,年均发文7篇。此外,由于CSSCI文献发文量基数偏小,整体趋势呈现出一定的波动。
从研究范围来看,这139篇文献主要涉及英语教学(64篇,46.1%)、翻译教学(35篇,25.2%)、写作教学(18篇,12.9%)、词汇教学(14篇,10.1%)、语法教学(3篇,2.1%)、阅读教学(3篇,2.1%)等领域。从刊物来源来看,上述文献主要发表于《外语电化教学》《外语界》《中国教育学刊》《外语教学理论与实践》《外语学刊》《中国翻译》《上海翻译》《现代教育技术》等出版物。综合视之,21世纪这20年间,语料库外语教学研究开始进入国内学者视野并逐渐引起了学界的关注,呈现出较为良好的发展态势。
(二)作者及研究机构
研究者是推动学科发展与演变的内生力量,对期刊发文的研究机构及其主要作者的空间分布特点进行考察,有助于了解相关领域科研团队之间及作者之间的合作关系。Node Type(节点类型)选择“Institution”及“Author”,可视化结果见图2。
图2显示了研究机构的分布情况,其中Node(节点)以圆形符号加注文字进行标识,其出现频率与圆的直径及字体大小呈正相关;节点之间的连接线体现了研究机构之间的共现关系(即合作关系),连接线的粗细程度与共现频次呈正相关。据图2可以看出,国内语料库外语教学研究已经形成如北京外国语大学、上海交通大学、上海外国语大学、同济大学等一批较高水平的研究机构(Node=203),且各研究机构之间呈现出一定程度的合作关系;作者之间的合作关系则形成了若干有影响力的研究团队,如何安平团队、王克非团队、秦洪武团队等。然而从总体上看,研究机构及作者共现网络的密度不高(仅为0.0025),这表明相关领域研究的合作关系仍有较大提升空间。此外,部分研究团队单核心作者的现象比较明显,有待向双/多核心合作模式转变。图谱中节点大小排名前10的研究机构(将各二级学院及科研单位数据合并至某“大学”)及其主要作者信息见表1。
图2 2000—2020年国内语料库外语教学论文作者及研究机构图谱(CSSCI来源)
表1 语料库外语教学主要研究机构及作者
据表1可知,研究机构多集中于少数重点高校、知名外语类高校及师范院校(占总发文量的30.5%)。由发文量及研究起始时间可以看出,华南师范大学的何安平团队、北京外国语大学的王克非团队处于该研究领域的领军地位;何安平教授长期从事应用语言学研究,对语料库英语教学研究颇有建树,王克非教授则是最早将语料库翻译学引入国内学界的学者之一,是相关领域重要的奠基人。此外,表1信息表明核心作者的研究方向涉及语言学、翻译学、教学法、语言测试、社会学、心理学等众多学科门类及其下属多个子学科,这也从一个侧面反映出语料库外语教学相关研究的综合性、跨学科性特点。
(三)研究热点分析
某研究领域的热点信息一般可以通过对施引文献集关键词的出现频率进行考察来获取。作为对文献核心要点的总结凝练,关键词在知识网络中的反复出现是对研究领域热点的一种表征[7],其复现频率越高则表明该热点的受关注程度越高。Node Type(节点类型)选择“Keyword”,可视化结果见图3。
图3 2000—2020年国内语料库外语教学研究关键词共现图谱(CSSCI来源)
图3的节点由十字图形标识,图形及文字的大小与关键词出现的频次成正比,关键词之间的连线体现出共现状况;中介度的高低反映出关键词作为“媒介”节点的信息控制能力。从图3可以看出,语料库外语教学研究所涉广泛,以相关学科为理论视角(语言学、语料库语言学)与多种语料库类型相结合(英语语料库、双语平行语料库、学习者语料库、对应语料库等),关注教学的不同层面(教学改革、教学模式、课堂教学、自主学习等),涵盖众多教学内容(词汇、翻译、口译、口语、写作等)。其中具有较高频次和中介度的关键词节点见表2。
表2 高频/高中介度关键词分布状况
依据各关键词出现的年份,其分布状况大致可概括为三个阶段。
第一阶段(2000—2005年),核心有“语料库”“语料库语言学”“外语教学”“翻译教学”“平行语料库”等,该阶段研究主要表现为语料库语言学与教学研究结合路径的探索及语料库自主建设的尝试。潘璠、冯跃进[8]从频率统计、目标/母语差异分析入手,阐述了语料库语言学对外语教学中语言现象处理的启示,指出语料库技术为确立教学重点时对典型性和差异性的兼顾提供了可能。谢家成[9]在论证个人教学语料库建设必要性及可行性的基础上,从语料选择、分类、标注三个方面介绍了语料库建设的思路和步骤。王克非[10]以中国外语教育研究中心建设的通用汉英平行语料库为例,探讨了平行语料库为翻译教学提供词语/短语/常用结构以及一本多译对应样例的应用价值。
第二阶段(2006—2014年),核心关键词有“学习者语料库”“中介语”“二语习得”“ESP教学”等,该阶段研究的主要内容是基于学习者语料库探究二语习得过程中的问题及规律,突出特点为对比中介语分析方法(CIA)的采用。此外,语料库应用显现出小型化和专门用途的发展趋势。邓耀臣[11]将国内语料库二语习得研究归纳为辅助错误分析、中介语特征描写、语言发展形式研究及验证三个方面。肖忠华、戴光荣[12]通过运用CLECF 学习者语料库、FLOB书面英语语料库、BNC对话语料库、LCMC书面汉语语料库及CMCT汉语口语语料库进行多向交叉对比,对中国英语学习者的被动句式习得情况进行了诊断、分析和阐释。邢靖文[13]以外贸函电翻译教学为例,结合Firth功能语言学理论及Hymes交际能力概念,探讨了语料库应用于ESP教学的理据和现实需要。
第三阶段(2015—2020年),核心关键词有“教学模式”“翻转课堂”“混合式教学”“多模态”等,这5年来的研究多集中于探讨具体教学策略、模式、方法手段的创新和运用。熊兵[14]在重点讨论翻译教学平行语料库标注策略的基础上,从实施原则、内容编排、操作方式等方面探讨了基于语料库的翻译教学模式的构建及运作。刘剑[15]将多模态口译语料库应用于课前准备、现象讲解、基础能力训练及专项模拟训练等教学环节,并尝试以此构建新型口译教学模式。李广伟、戈玲玲[16]以自主建设的学术英语语料库教学平台为依托,以Bloom“教育目标分类法”及“任务教学法”为理论框架,构建了翻转课堂教学模式,效果检测结果显示,学生学术英语水平及自主学习能力得到了不同程度的提升。
(四)研究聚类分析
利用CiteSpace对文献关键词进行聚类分析可用于归结研究聚焦点,每一个聚类(cluster)可被视为一个内部联系较为紧密的独立研究领域[17],聚类处理后如图4所示。数据参数M=0.8273,S=0.5022,说明聚类效果良好。
图4 2000—2020年国内语料库外语教学研究关键词聚类图谱(CSSCI来源)
图4显示出“#0语料库”“#1翻译教学”“#2口语语料库”“#3 ESP”“#4大学英语”“#5口译教学”六个主要聚类。限于篇幅,这里选取其中两个聚类进行具体分析。
口语语料库聚类(包含10个关键词),主要关键词有“口语语料库”“中介语”“二语习得”“学习者语料库”等。时间线视图可以展现聚类的内部结构和历时演变进程,见图5。对口语语料库聚类的研究最早始于卫乃兴[18],他利用COLSEC语料库对外语教学中学生口语表达的词块特征、话语结构、话语模式展开了分析,进而考察其会话管理的语用/交际策略。2005—2013年的相关研究多探讨口语语料库应用于教学的作用意义[19]、建库思路及研究方法的介绍[20],与外语教学的结合点主要围绕词汇/短语等基本语言单位,如考查词汇用法功能[21]、套语语用能力[22]、词汇使用与二语习得[23]等。2015年以来,随着对语料价值发掘的深入,实证研究的范围得以拓展,涵盖了翻译对等[24]、性别语言立场标记语特征[25]、话语认知[26]、代词计量特征[27]、主题结构特征束[28]等不同视角。
图5 口语语料库聚类时间线视图
ESP聚类(包含6个关键词),主要关键词有“ESP”“语料库语言学”“词汇教学”,其时间线视图见图6。如图6所示,该聚类结构清晰——语料库语言学理论框架基于语料库/语料库驱动的ESP教学/自主学习研究的基础之上,发展历程经历了由理论探索向实证分析的转变。张济华、王蓓蕾、高钦[29]结合语料库语言学的研究方法和成果,探讨了大型分类语料库应用于ESP教学的必要性、可行性及具体实施方案。陈金诗[30]基于CLIPS语料库,采用语篇信息分析法设计了法律英语交互式阅读教学模式,并就其初步课堂实践进行了结果分析。李广伟、戈玲玲、蒋柿红[31]在建构主义理论指导下利用语料库在信息检索、资源提供等方面的技术优势,尝试构建模块化ESP课程体系。刘萍、刘座雄[32]基于自建的“农科学术英语语料库”对语料库辅助的学术英语词汇教学进行了有效性对比实验,结果显示,语料库方法的加入可以提高学习者词汇认知的准确性及词汇产出的多样性和覆盖率。
图6 ESP聚类时间线视图
(五)研究前沿
突现术语(burst terms)即研究文献标题、摘要、关键词中突然出现或频次激增的术语,相较于关键词分析以频次多少为判断依据,突现术语动态变化的特性能够在一定程度上反映学科研究的前沿领域和发展走向。运用CiteSpace对2000—2020年国内语料库外语教学研究文献进行突现词检测,统计结果见图7。
图7 2000—2020年国内语料库外语教学研究突现词统计
从时间分布来看,最早出现的突现词为“中介语”(起始于2005年,结束于2010年),此后间隔 2~3年“语料库语言学”“数据驱动学习”“语料库”“口译教学”等相继出现,这反映出该领域研究视野的不断拓展,最新突现词则为“翻译教学”(起始于2018年)。其中“语料库语言学”与“语料库”分别为相关研究的理论基础及研究工具,严格来说不能视作研究前沿,其余4个突现词则表征着国内教学研究的前沿领域,按照突现强度由高到低排列依次为“数据驱动学习”“口译教学”“中介语”“翻译教学”,这里选取前两者进行具体分析。
数据驱动学习是语料库应用于自主学习的主要方式,即利用语料库的相关检索手段,如索引行、词频统计、术语/关键词表等,为自主性、探究式学习提供技术支持。焦彬凯[33]将语料库技术与多媒体资源相结合,从多媒体语料库设计、学习平台建设、数据驱动自主学习流程等方面探讨了基于多媒体语料库的数据驱动学习模式及其具体实现路径。朱慧敏[34]基于建构主义及词汇语法理论阐述了数据驱动词汇教学的理论基础,并依据学习问题预设、语料筛选分类、总结归纳及练习设计的步骤展示了相关课堂应用。相较于传统书本示例的孤立性、封闭性,基于语料库的数据驱动学习模式以海量的语境信息为学生营造了更为真实、丰富的语言学习环境,能够更好地适用于实际场景语言交际能力的培养。
基于语料库的口译教学是近5年来兴起的研究方向,语料库特别是双/多语/多模态语料库的结构特点、运行方式及检索结果的数据呈现形式与口/笔译研究(也多用于词典编撰及机器翻译)有着天然的契合度,可为口译教学提供有效的技术辅助。刘剑[35]以国内首个口译教学多模态语料库(MCIS)为例,从课前准备、现象讲解、专项训练及实战演练等方面介绍了语料库在口译教学具体环节中的应用和相应教学模式的构建。邓军涛[36]从概念辨析、研究梳理、创建流程及使用评价等方面阐述了口译教学语料库的内涵和应用机制,并提出口译教学语料库的发展方向是多方共建及内容的多元化、语料深加工以实现多语境要素的有机结合,以及促进语料库与相应教学环境、平台的一体化。口译活动本身的性质和特点决定了口译课程的教学资源包含文字、音频、视频等多样化形式,语料库手段的加入有助于实现不同形式资源的有效整合,能够提供更加贴近真实口译现场的模拟教学环境,并具有更好的互动性和开放性。
三、成果及不足
(一)研究取得的成果
综合以上分析可以看出,国内语料库外语教学研究在21世纪前20年间大致经历了“低缓—增长—平稳”的发展历程,一批高水平的研究机构和科研团队得以建立,研究视角不断丰富,总体呈现出较为良好的发展态势,具体表现在:
“低缓期”(2000—2003年):研究文献较少且多从宏观角度(语料库、外语/英语教学)切入,多注重概念的引入和整体路径的探索。
“增长期”(2004—2011年):研究在多个层面铺展开来,理论基础得以阐发(语言学、语料库语言学),多种类型语料库得以运用(学习者、网络、英语、双语、平行语料库),研究对象多样化(词汇、翻译、口语、写作、语法教学、自主学习),内容具体化(词块、词义、搭配、语境、语义韵)。
“稳定期”(2012—2020年):语料库与外语教学结合的广度和深度得到了进一步拓展,口语/口译/教学型/影视语料库等一批专门用途语料库得以建立,语料的构成从以往的单一文本形式向集文字、图片、音频、视频为一体的多模态形式转变。
研究对象不再局限于EGP,商务/法律/医学/学术英语等ESP也受到了研究者的关注;项目式/任务式/支架式/分级式教学模式、数据驱动式学习模式、语言测试模式相继涌现并与教学实践和改革相结合。
(二)不足之处
国内语料库外语教学研究在理论和实践方面皆有较大进展且兼具广度和深度的延伸,然而该领域研究仍存在一些需要完善之处。
1. 理论基础有待充实
现有语料库外语教学研究大多以语言学、语料库语言学为理论视角,文献共引状况也表明这两者为相关研究的知识基础。然而随着语料库研究范式的不断发展及其应用于外语教学领域的深入,语料库翻译学、语料库批评译学等新兴学科理论也应作为该研究领域理论扩充的重要来源。
2. 研究力量不够均衡
现有研究成果多出自少数重点高校、专业外语及师范类高校,如上海交通大学、上海外国语大学、北京外国语大学、华南师范大学等,表明该研究领域受关注仍不够广泛。图谱也显示出研究机构之间的合作关系较为松散,研究合力的形成尚需时日。此外,研究团队的数量较少且团队单核心作者现象较为明显,双/多核心模式是未来团队建设的发展方向。
3. 研究范围较为局限
从教学活动的构成来看,现有研究多集中于对课堂教学进行探讨,对学生自主学习、语言测试等方面的考察甚少。从研究对象来看,现有研究多关注于大学英语、EGP的教学创新和改革,对专业英语教学、ESP教学、口译教学等的关注力度仍须加强。从研究内容来看,现有研究主要涉及词汇和翻译教学,口语、写作、语法、阅读、精读、英美文学等方面的教学研究在图谱上仅以零星分布形式出现。从语种来看,现有研究绝大部分为英语教学,对于非英语语种如日语、俄语、德语、法语等的研究非常之少,甚至并未涉及。由此可见,该领域的研究范围仍有待拓展。
4. 可操作性有待加强
文献分析表明,大多数语料库外语教学研究最终会落实到对教学模式的探讨上,这与语料库作为一种工具手段与外语教学的契合点有关。教学模式的构成可分为宏观、中观和微观三个层面,宏观上包括教学理论、思想、目标及评价体系;中观上包括教学理念、操作程序、辅助手段;微观上则包括具体教学策略、教学内容及活动[37]。现有研究多侧重于宏观层面的理论探讨及中观层面辅助手段的引入和操作程序的创新,然而鉴于语料库作为一种新型研究范式的地位得以确立,以及其技术工具用于教学实践所带来的教学环节间的衔接问题,相关研究也应考虑向微观层面延伸以增强其可行性。
5. 语料库建设仍须完善
语料库外语教学研究应以相应的语料库建设为基础,语料的选择、布局对将要开展的研究至关重要。从库容大小和语料涵盖范围来看,现有较成熟完备的语料库多为大型通用类语料库,较适用于EGP教学,而ESP、写作、翻译、口译等教学所需的专门用途语料库仍显缺乏且所涉学科领域分布不够均匀[38]。从语料呈现形式来看,以文字信息为主的单模态语料库占绝大多数,集文字、视觉、听觉信息为一体的多模态语料库尚不多见。此外,如何依据教学研究需求对语料进行有效的词性、句法、翻译信息、文化信息标注将是一项长期议题。
四、结语
本文运用CiteSpace可视化计量工具考察了近20年来(2000—2020年)CNKI数据库中CSSCI来源期刊语料库外语教学研究的载文情况。通过绘制科学知识图谱,从文献分布、作者及研究机构、研究热点、研究聚类、研究前沿等维度,对国内语料库外语教学研究的现状和发展脉络进行了梳理分析,并从理论基础、研究力量、研究范围、可操作性、语料库建设等方面对相关领域研究的未来发展提出了思考建议。对语言研究来说,语料库既是一种工具手段的创新,又是一种新型的研究范式,其应用于外语教学的优势主要体现在语料来源真实、内容丰富、数量庞大,能够较好地反映和解释语言实际使用过程中出现的典型特征和规律,从而为教学活动提供纪实性的辅助和参考[39]。作为语料库研究范式与外语教学的结合,现代信息技术在教学实践中不断应用,语料库外语教学研究在国内的发展历程不长,却极具发展潜力和现实意义,相信在各方学者的共同探讨推进下,该领域未来可期。