APP下载

2017国内语料库研究综述

2018-01-23张瑞华王乐乐

天津外国语大学学报 2018年6期
关键词:语料库外语学习者

张瑞华,王乐乐



2017国内语料库研究综述

张瑞华,王乐乐

(天津科技大学 外国语学院,天津 300222)

一、 引言

随着计算机技术的快速发展,语料库研究在经历长达25年的低谷后,得到了迅速的发展,尤其是在进入以信息技术为标志的21世纪后,语料库更是得到了越来越多的学者的关注及运用。基于语料库的研究把定性和定量研究方法结合起来,大大地增加了研究结果的客观性、真实性及全面性,克服了只注重定性研究这一传统研究方法的片面性和主观性。正如Johansson(2007:1)指出的,“通过语料库,我们可以观察先前没有意识到或仅仅隐约觉察到的语言模式”。笔者在中国知网以“语料库”为检索项,检索出2017年出版于国内核心及外语类期刊中的论文共101篇。下面将这些研究进行归纳、整理并加以评论,形成一个断代性的研究,可以更深入地呈现2017年间语料库研究的状况。

二、 2017年国内语料库研究

本文根据文章类型将检索出的期刊论文大致分为四类:评述类(11)、应用类(72)、研制开发类(13)与理论探讨类(5)。下面将对这四种类型的研究分别进行详细论述。

1 评述类

本文所讲的评述类文章主要体现在综述和书评两大类。2017年间,关于语料库的评述类文章共计11篇,其中,综述类的文章有7篇,大体可以分为四种类型:(1)语料库的概括性综述,许家金(2017)介绍了语料库历时性研究发展的大致情况,并对语料库的概念、哲学和学术源流作了详细的梳理,提出了目前语料库研究中存在的问题,同时表达了对语料库3.0时代的期待,是一篇值得研读的文章;(2)翻译类的研究综述;胡开宝与谢丽欣(2017)对译者风格的研究进行了论述,介绍了译者风格的基本概念,梳理了基于语料库进行译者风格研究所取得的成就及存在的问题,并就此提出了可行性的建议,为后续研究提供了指导性和参考性的帮助,有利于学者把握翻译研究的发展趋势和方向;(3)词汇和隐喻研究的综述,马蓉(2017)从语料库语言学、系统功能语言学与二语习得三个不同的视角分析了国内外长达45年的有关学术词汇的理论和实证研究,这一系统的梳理为今后学术词汇研究提供了多方面的借鉴,同时也为学术写作和学术教学提供了参考;柳超健与曹灵美(2017)对国外基于语料库进行隐喻研究取得的成就进行了描述,并提出了研究中存在的问题,为今后的研究提供了重要的启示;(4)语料库技术和建设的综述,刘剑(2017b)对国外的多模态语料库的创建现状以及相关学者利用其进行的学术研究进行了综述,指出国外多模态语料库的研究进展和不足同时存在,同时指出国内在多模态语料库建设及研究方面的缺陷以及未来所具备的巨大研究潜能;谭祥燕(2017)对国内外语料库的发展现状进行了综述,主要聚焦根据不同学科或文本进行创建的语料库的发展情况,指出这类语料库创建的重要性和必要性;葛晓华(2017)介绍了语料库检索工具Sketch Engine并对其主要功能和国内外有关该软件的研究进行了综述,指出其虽然不可避免地存在一些缺陷,但具有巨大的应用价值,其巨大潜能仍有待开发。

书评类研究有四篇:一是由Claudio和Federico主编的围绕多语语料库建设和多重复合分析议题展开的《语料库翻译研究的新方向》(,2015),该书汇集了多语语料库建设及其在翻译研究中应用的前瞻性成果,杨晓琳和李德超(2017)重点指出了书中提到的语料库设计及分析存在的创新点和问题,认为该著作体现了语料库翻译学研究的新方向,推动了翻译学科的建设和发展,值得研读;二是Svenja Adolphs 和 Ronald Carter两位学者合著的《口语语料库语言学:从单模态到多模态》(,2013),方清明(2017)认为,该书含有开拓性的多模态口译语料库研究,还提出了重要的有关口译语料库建设的建议,是一本值得研读的著作;三是由Geoff Barnbrook,Oliver Mason和Ramesh Krishnamurthy围绕搭配研究而合著的《搭配:应用与启示》(,2013),杨柳(2017)指出文中含有大量宝贵资源,对于有意深入了解新弗斯学派新颖观点的学者来说是一本必读之作;四是王峰和花萌(2017)对胡开宝编著的《基于语料库的莎士比亚戏剧汉译研究》进行了分析和评介,说明了语料库翻译学的跨学科性。

2017年间评述类研究涉及面较广,既有热点话题,如翻译风格研究、多模态语料库研究,又有经典话题,如搭配。这些评述有利于学界人士把握近来的语料库研究动态,并为未来的相关研究开拓视野,提供潜在的研究课题、研究理论和研究方法。

2 应用类

2017年间的语料库应用类研究文章共计72篇,主要分布于语言学、翻译、隐喻、话语分析及二语习得五个方面。

2.1 语言研究

纵观2017年间的语言类研究,语言学方面的研究可大致分为词汇、句法及语篇三个层面。其一,词汇层面的研究。相比其他研究,词汇层面的研究对象更加多样。(1)具体词汇或词类特征的研究。邵斌等(2017)以构式搭配分析法为指导,对英语强化词的搭配构式进行了考察,同时运用聚类分析法对不同类型或强度的强化词进行分析,加深了搭配构式和强化词研究的结合度,拓展了研究深度。余渭深和李中正(2017)和娄宝翠(2017)均对副词进行了研究,前者以从COCA语料库中提取的高频程度副词completely,absolutely,entirely及其相对应的中文对等词为研究对象,分析中英在搭配词、类连接、语义韵和语义趋向等方面的使用差异,研究发现两者并不完全对等;后者以国际期刊论文为参照对象,发现我国学习者英语学术论文中结果副词的使用整体上与其呈现出一致性,但也存在对某些副词的误用等问题。张金生和孙冬阳(2017)以语料库为基础,通过数据和实例的方式,揭示出空间介词“上”和on在总体意义方面的相同之处和区别。杨越森和卫乃兴(2017)探讨中国学习者在学术论文写作中动词模糊语的序列形式,及其对应的不同语篇功能和策略意义,为学术论文的写作提供了参考。廖正刚和杨忠(2017)利用语料库方法,以Berlin和Kay对人类颜色词认知结构的发现为参照,从认知语言学的角度对比分析《黄帝内经》中出现的颜色词及颜色词次范畴化的表现方式,这项研究集理论意义和实践意义于一身。王文斌和邬菊艳(2017)利用COCA语料库提取X-ee形式的词汇,从语义论元共指角度探讨这类派生词的实际用法及特征,用实例和数据打破人们对这类派生词以及X词基的不全面的认识,显示了将语料库与多种理论结合来分析实际语言案例的重要性与必要性。张继东和陈文(2017)利用语料库集中分析存现句中的存现动词,探讨存现动词和there存现结构之间的关系以及存现动词的变化对存现结构的影响。(2)词语搭配研究。李文中(2017)讨论了对搭配的界定以及搭配研究中存在的测量数据手段的问题与困难,同时指出了研究中国学习者语料库的搭配所具有的意义与作用,该研究进一步提高了搭配研究的力度及深度,有助于有关搭配的创新性研究。刘国兵和杜亚平(2017)及甄凤超(2017)均基于BNC语料库,以配价型式为依据,分别研究了动词appoint和consider的词汇意义与语法结构之间的同一性,前者探讨了appoint在不同句式中的结构,得出结构和搭配词之间存在联系的结论,而后者通过研究数据得知不同的配价型式可以用来区分词汇的不同意义,两项研究均有助于加深对语言本质的了解,对英语的词汇教学也起着重要作用。孙海燕(2017b)基于学习者语料库分析学习者在不同阶段对叙事类外壳名词reason和fact的使用和掌握情况,由此观察中国学习者对搭配构式的了解和运用,结果显示中国学习者受教育程度和对搭配构式的掌握呈正比,但是与本族语者相比,仍然存在不可避免的缺陷和不足,此项研究使教学者意识到外壳名词的重要性,有利于教师不断转变教学方式,提高教学质量。张萍等(2017)区别分析了中国学习者对英汉语中搭配的加工习得,发现对中英保持一致的搭配结构加工用时最短,加工用时的长短与学习者的母语对二语搭配习得的启动效应有关,对英语教学具有一定的参考价值。不同于上述语料的研究,李响(2017)创新性地将具有政治性的同体裁文本作为研究对象,发现虽然是相同体裁的政府工作报告,但在典型的搭配框架结构的使用上却有很大的差别,这一差别主要由文本主题导致,该研究推动了词语搭配研究的发展。(3)词块研究。这类研究主要体现为中国英语学习者词块输出能力的研究、学术语篇中词块使用对比研究及英汉作者期刊论文或议论文中的词块研究。吕颖(2017)以国外医学论文中的摘要为参考,深入分析国内医学论文摘要中程式语的使用特征,以期提高国内医学学者的论文质量,有效推动医学方面国际交流的深入开展。孙海燕(2017a)基于学习者语料库,探讨学习者在不同阶段对以way为节点词构成的三词词串在语义和语用功能上的使用特征以及学习者与本族语者在词串输出上存在的差异,结果显示学习者在词串的使用上仍需改进。高霞(2017)利用自建学术论文可比语料库,探讨中外学者在物理和语言学两个学科的学术论文中评价词语形式的使用特征及差别,重点论述了句法形式和其所具有的语篇行为之间的共选关系。李梦骁和刘永兵(2017)重点研究中外学者在应用语言学的期刊论文中的评价结果语步上词块使用的差异性,结果发现中国学者对该类型词块的运用能力和熟练度还有待提高。冯克明(2017)基于COCA探讨了英语中a(n)N1 of N2这一结构在语义、句法、语篇及认知功能上的作用及特征,该研究突破了运用认知语言学理论研究英汉表量结构的局限,使语料库成为研究该领域的一大创新点。李晶洁和卫乃兴(2017)提出了学术文本中的一种新的短语单位概念——功能句干,并探讨其界定标准、频数分布特征及提取方法。张磊和卫乃兴(2017)基于Beijing CARE学术文本可比语料库中西方和中国学者法律子库,对比分析了两组学者在使用三个评价型式时所呈现出的差异。对功能句干和局部语法的应用研究是近年来国内语料库研究的重要进展,学者们试图在专业语篇领域找寻突破口,拟建立专属于某一专业语篇的语言分析框架,并且成绩斐然。期待着这方面的进一步发展。

其二,句法层面的研究。较之词汇,句法是语言研究的一个重点和难点,2017年有关句法类的研究并没有词汇研究那么丰富,但仍然取得了一定的成就。房印杰(2017)基于构式语法理论,利用语料库对中国英语学习者和英语本族语者对关系代词的使用特征进行对比分析,该研究在扩大构式语法的研究范畴的同时,也为关系代词的习得提供了借鉴。雷蕾(2017)基于自建硕博论文语料库,运用10个测量句子复杂度的指标,对比分析了中国英语学习者和本族语者句子复杂度的差别,发现句子复杂度与学习者的写作经验有密切的关系。胡骏飞和陶红印(2017)基于语料库对不同语体语料中的“弄”字结构进行了详细的分析,结果显示该结构具有低度及物性的特点。陈中毅(2017)则以本科英语专业的学生所写的议论文中的wh-结构为研究对象,对由wh-结构组成的名词性从句和状语从句、感叹句等的使用特征进行详细的描述,发现总体上呈现出良好的发展趋势,但仍存在缺乏多样性的问题,该研究为议论文写作教学提供了有益的启示。杨玲(2017)基于COCA语料库,探讨英汉语义相同的状态变化动词在语义与句法层面上的不同用法以及特征,结果显示由于两者具有不同的核心语义及词根意义,因此,导致句法方面具有显著的差异,该研究推动了英汉跨语言层面的研究。

其三,语篇层面的研究。语篇层面的研究主要体现为对体裁、语体及语篇衔接的探讨。(1)对不同学科的学术论文中某一特定部分进行体裁的分析。刘辉(2017)通过自选20个常见学科的学术期刊论文建成语料库,进行语步和话目分布情况的分析不同学科对于论文方法部分体裁的选择具有差异性及独特性。曹忠芹(2017)利用语料库从宏观微观的角度探讨语言学与药学这两个学科的论文摘要的体裁区别。这两项研究均通过跨学科体裁对比研究,为论文写作质量的提高提供了有益的借鉴。(2)语体的研究。揭薇和金艳(2017)利用语料库方法研究描述中国英语学习者口语能力的描述语,通过分析描述语在词汇方面的特征,得出该语料的语体特征,为以后的语言量表的制定提供参考和建议,确保描述语的质量。郑剑委(2017)突破英语语料的局限,对陆港台三地的法律汉语的庄重性进行共时和历时的对比研究,分别得出三者在法律汉语方面的语言特征,该项研究使学者意识到类比语料库对语言研究的重要性,同样也是跨学科、跨领域研究的一个很好的范例。(3)语篇衔接的研究。郑丹(2017)通过自建的中外学术期刊论文语料库对比研究论文中转折关系的使用规律,发现中外学术期刊论文中不同类型的转折关系的使用情况具有很大的相似性。王晶晶和吕中舌(2017)利用自建语料库,以中国理工科博士生的学术英语论文为研究对象,探讨论文写作者对自我指称语的使用特征,发现理科博士生偏向使用较多的自我指称语。李治平和李丛(2017)对HSK作文语料中的语篇关联语进行了分析,结果显示考生对关联语的使用呈现两极分化的特征,说明学生对语篇关联语的习得欠佳,虽然该研究在一定程度上为教材编写等方面提供了参考,但未说明造成这一问题的原因及解决方法,有待后续研究的补充。

2.2 翻译研究

2017年的翻译研究主要包括以下几个方面:(1)译本中具体语言项目的翻译研究。袁淼叙(2017)基于小说《围城》原文本及其俄译本创建让步关系外译语料库,以语料库中的真实案例及提取的数据为依据,解释译者采取不同的方式翻译文中的让步关系的原因,揭示出译者的主观能动性。巩雪先和黄立波(2017)以及夏云和秦洪武(2017)对英汉译语的特殊结构进行了研究,前者对比分析了汉译文和原创汉语语料库中不同文本类型对于“人称代词+的”这一结构的使用情况,分析显示汉译文中该结构呈现出欧化趋势,并且不同文本类型的欧化趋势有所差异,但总体上欧化趋势的明显程度与文本的正式程度呈正比,后者基于历时类比语料库分析不同年代的汉译文和原创汉语语料中的“介词……方位词”结构特点,揭示出现代汉语中该结构容量有扩增的现象。陈水生(2017)利用COCA和CCL语料库对“微笑”及smile的句法构式进行检索分析,发现英汉在句法构式的使用倾向和主要动词性隐喻类型上存在差异,作者对《尤利西斯》两个译本中的“微笑”例句进行分析,揭示了不同程度的常规化倾向,该研究对语料库翻译学的发展作出了贡献。另外,管新潮和王金波(2017)利用语料库对历经百年的《资本论》四个汉译本中的“扬弃”进行了分析,指出时代政治语境和文本语境对该词汉译产生的影响,该研究突破了规定性翻译研究的局限,是对描写性翻译学的有力补充,同时也为《资本论》的新修订版本的编写提供了参考。(2)翻译共性研究。伍小君(2017)介绍了利用语料库证实翻译明晰化假说的方法后,从演绎逻辑的角度对这一假说进行了批驳性的反思,这一研究引发了学界对翻译共性的进一步思考和认识。(3)翻译风格研究。刘泽权和王梦瑶(2017)通过自建英汉平行语料库,分析《老人与海》五个译者的六个不同译本在词汇、句法方面的差异,并尝试从译者身份、翻译缘由等方面解释造成不同翻译风格的原因。(4)翻译策略及翻译实践研究。范敏(2017)指出了《论语》五个译本在翻译高频文化词时所采用的策略,为通过翻译实现中国文化的传播提供了有益的启示。周领顺和周怡珂(2017)研究了葛浩文十部莫言英译本中狗的翻译特点,指出葛浩文多数采取直译的方式,同时也指出了译者在译狗方面产生偏见的原因在于先入为主的态度,非常不利于中国文化的传播。董敏(2017b)利用《时间简史》英汉平行语料库,以语法型式为导向,分析译者在翻译高频外壳名词idea时,为实现其意义和形式对等所采取的翻译策略,此类研究为不同体裁的文本写作方面提供了参考和借鉴。超越词汇的句子层面的翻译研究有黄娴等(2017)对译本“使”字句的探讨。前者以莎士比亚戏剧的汉译本为研究对象,采用认知句法和翻译策略与方法,分析解释了译本中“使”字句的应用;后者利用语料库探讨了中英翻译中“使”字句的翻译特点,并借此提出有效翻译该句型的实质性建议与方法。王伟(2017)利用自建新闻英汉平行语料库,探讨进行英语长句翻译时在句子对应程度、文字对应比以及翻译方法上的特征,但由于语料来源于网络,个别语料存在不可避免的不准确性,所以该项研究的发现需要未来学者的进一步验证,并且期待更多的学者从不同的角度对此进行创新性的研究。单伟龙(2017)主要探讨葛浩文对《红高粱家族》和《变》这两部作品中习语的翻译情况,发现译者在处理歇后语等习语时所采取的翻译策略主要以异化和直译为主。詹菊红和蒋跃(2017)以鲁迅的十部小说为例,对比分析杨宪益和威廉·莱尔在译本中缩合现象的区别并提出了造成这一差异的原因,该研究发现杨译本的缩合率低于威廉译本,整体接近TEC水平。(5)翻译比较研究及其他研究。2017年有关翻译比较的研究相对较少,卢晶晶和倪传斌(2017)基于自建陆港台三地进口药品语料库,以翻译伦理为视角,对比分析药品名翻译之间的差异,以及三种不同的伦理模式倾向,该研究推动了药品名翻译的研究,是翻译领域深度扩大的表现,同时也是翻译学者对药品名进行翻译时选择规范模式的参考标准。唐义均和杨燚(2017)基于绍兴文理学院外国语学院创建的两个汉英双语语料库,比较大陆和香港法律文本在词块翻译上存在的区别,结果显示我国法律译本的质量并不理想,某些词块的翻译存在生硬的现象,这是由于译者未考虑到目标语的文化背景,导致外国人士对法律文本的理解存在障碍。黎昌抱和李菁(2017)利用语料库分析比较自译和他译文学作品时,译文在词汇、句法等方面会呈现出怎样的共性和区别,结果显示文学自译更能凸显文学作者的个性和主体性。

其他类研究主要涉及无法归纳到以上类别的研究,如王克非和秦洪武(2017)利用历时复合语料库对汉语语言的变化发展进行了详细的探讨,重点描述了翻译语言对汉语语言在词汇、词串等方面产生的深远影响以及带来的变化和革新,此项研究是首次将历时复合语料库应用于研究汉语语言变化发展的一次积极的尝试。另外,国内学者的研究领域不再局限于笔译层面,而是进一步拓展到口译领域。潘峰和李鑫(2017)基于语料库分析了汉英口译中不同性别的译者对插入语I think和I believe的使用差异,发现当它们表达不同的功能时,不同性别的译者对其使用倾向是不同的,这主要是因为不同的社会经验及性别差异带来的不同语言使用习惯等原因造成的,此项研究推动了口译研究的发展,同时也加深了学者对性别与翻译的联系的了解。

2.3 隐喻研究

胡春雨和徐玉婷(2017)利用自建的汉英媒体语料库探讨经济领域中的“隐喻”模式即经济隐喻,在概念隐喻理论和认知文化理论的指导下,揭示出汉英经济隐喻使用的特征及中西方文化对经济隐喻使用造成的差异。周惠和刘永兵(2017)分析了国内外学者学位论文摘要中的语法隐喻的使用情况及其语篇功能,研究发现中国学者并未能熟练运用语法隐喻,因此降低了论文摘要的客观性并增加了其他问题出现的概率,此项研究强调了熟练掌握语法隐喻的重要性,有助于改进有效实现语篇功能的表达方式,以此提高学位论文的写作质量。

政治语篇中的隐喻也颇受关注,有学者借助隐喻、转喻等形式来将话题提升到构建国家形象的高度。吕艳和戈玲玲(2017)对“中国梦”超文本语料进行了研究,主要探讨外宣网站中“中国梦”的多模态隐喻不同的表征方式和特征,这类研究丰富了对隐喻的研究,同时也是信息时代这一大背景下的创新性研究。陈香兰和禹杭(2017)借助中美并购报道的语料来分析中美两国对国家转喻的使用特征,以及对构建国家形象产生的作用。虽近年来隐喻研究实现了比较大的拓展,但仍存在巨大的进步空间和研究潜能。

2.4 二语习得研究

二语习得研究为中国英语学习者和教师教学提供了多方面(尤其是书面写作)有价值的参考和建议,对提高二语学习效率和质量有着巨大的辅助作用。这类研究主要围绕以下几个方面来进行:(1)词汇及搭配。朱海婷和Alexander Clark(2017)基于英语儿童语料库,利用分布格模型对语料库中100个高频词进行词性分类,研究证明了分布格模型重要的实用价值以及分布特征对词类研究的重要性。陆军(2017)以WECCL语料库中的高频搭配为研究对象,探讨学习者对隐形和显性搭配知识习得的差异,该项研究是一次跨领域的研究,对二语习得者具有一定的启示意义。贾光茂(2017)应用语料库对二语习得中的重点研究对象“动名搭配”进行了深入的研究,从认知语法视角出发,提取语料库中的实例,揭示并解释了中国英语学习者误用动名搭配的原因,该研究为英语教学中的动名搭配学习提供了参考。张辉和卞京(2017)探讨了中国英语学习者way构式的使用情况,通过对语料库的检索和分析,与之前学者对其进行违反范式下的ERP研究结果进行对比分析,揭示出中国英语学习者不能达到英语母语者水平的原因,这是一项二语习得机制和ERP技术相结合的研究。(2)句法。李辉和刘海涛(2017)基于自建汉语儿童三词句依存句法标注语料库,探讨语料的句法属性及儿童对具有不同依存结构三词句的习得情况,该研究使得语言习得研究更加多样化,但该研究主要以三词句为研究重点,更长句子的习得情况有待进一步研究。王文斌和赵朝永(2017)从英汉时空差异视角探讨了中国学习者产出英语“流水句”的现象,为英语教学提供了很好的借鉴。(3)语法。王丽和王楠(2017)基于语料库分析了中国英语学习者的学位论文和国际期刊论文在多个方面呈现出的口语化趋势,其中,前者呈现出更强的口语化倾向,且主要体现在博士论文上,该研究为中国学生的学位论文写作提供了良好的借鉴和参考。(4)多维分析框架。赵朝永和王文斌(2017)应用多维分析法对比分析了中国英语学习者和英语本族语者议论文中不同的语言特征,指出中国学习者所具有的语言特征在某种程度上与母语汉语保持一致性,而学习者对英语习得的情况和本族语者之间的差距则是因为汉英语言的时空特质,这对学习者议论文的写作具有重要的参考价值。

而有关学习者口语方面的研究也得到了一定的关注。孙杰和金琳(2017)利用TEM4口语语料库,分析了英语专业的学生交际策略的使用特征和差异情况,研究发现学习者对交际策略缺乏了解,且缺乏熟练运用交际策略的能力。高君和赵永青(2017)以英语本族语者表达异议使用的话语为参照,利用自建语料库,着重分析中国英语学习者在异议话语的使用方面的特征,深入挖掘其中存在的问题,以期提高中国英语学习者在口语交流中对异议话语的灵活运用能力,由于语料样本选取的局限性,该类研究有待进一步深入探讨。

2.5 话语分析研究

2017年的话语分析研究呈现多样化的趋势。唐青叶和史晓云(2017)基于语料库,研究globalization一词的时空变化,重点分析globalization的话语构建特点和人们对其的认知特征,通过评价词和搭配词的分析得出该词整体呈现出负面印象。陈建生和陈香君(2017)选取《卫报》中不同时段的新闻语篇作为语料对中国形象进行了历时性研究,发现西方媒体对中国的关注度不断增加,显示出了中国强国的形象。医药和医学话语也在逐步进入研究者的视野。钱毓芳和McEnery(2017)通过收录1986-2015年的16种英国全国性报纸中有关中药的文本建立中药语料库,在话语分析理论的指导下对文本进行了关键词分析,研究发现英国有关中药的报道整体呈上升趋势,同时表明报纸这一媒介在传输中药知识方面具有不可忽视的重要性。刘建鹏、赵俊海和杜惠芳(2017)利用Talkbank语料库,将社会中患有阿尔茨海默病的特殊团体与同龄健康团体的话语进行深层正式度的对比分析,功能词和实词的使用结果显示患者话语正式度较低,该研究丰富了国内医学话语的研究。另外,话语分析的研究已经延伸到了翻译语篇,甚至口译语篇。胡开宝和李鑫(2017)基于语料库,利用多领域、多样化的翻译文本研究分析中国形象问题,扩展了有关形象研究的范围,同时也体现了翻译对意识形态研究的重要性。潘峰和黑黟(2017)基于新闻发布会口译语料库,以人称代词we的搭配结构为例,分析汉英口译话语中政府形象构建问题,这是一项将口译、话语分析、搭配和形象构建有效结合的研究,充分体现了跨学科、跨领域研究的前沿性。

总之,2017年的应用类研究呈现出跨学科、跨领域、跨类别的特点,每个研究类别都不是孤零零地存在,它们互相贯通,互相影响,互相推动着深入发展。此类研究虽然研究层次、研究领域上还有待深化,但仍然填补了不少以前的研究空缺,同时又为今后的研究提出了许多潜在的研究课题,可能对语料库研究的发展起到深远的影响。

3 研制开发类

2017年间有关语料库研制开发类期刊论文共计13篇,主要论述专用英语、口译、汉语等语料库的创建问题,同时还涉及语料库相关技术工具的开发等问题。

3.1 语料库的创建

2017年有不少文章探讨汉语语料库的建设问题。周小兵等人(2017)探讨了国际汉语教材语料库的建设问题,论述了设计理念以及语料库在研究中的应用价值,同时指出了一些语料库创建中的问题并就此提出了建议,对日后学者创建语料库提供了参考,同时也为汉语教学研究提供了便利。颜明和肖奚强(2017)也提出了创建汉语中介语语料库时应注意的问题,其中,主要强调语料的代表性和全面性以及语料库应为不同领域的研究提供依据。权立宏(2017)论述了有关汉语口语语料库创建的基本程序及实用价值,指出了创建语料库需要得到改善的技术问题,比如分词。同样对汉语口语语料库创建问题进行探讨的还有谢楠和张笛(2017),不同的是这两位学者主要介绍儿童语言,该语料库的尝试性建设在一定程度上有效弥补了儿童语言研究方面的缺失,同时也使儿童语言得到了更多的关注。

胡春雨和谭金琳(2017)介绍了“国别贸易投资环境报告”平行语料库的设计理念,同时以“根据/据……”的翻译为例对其应用价值进行了介绍,有利于加强学者对商务翻译语言的研究,增加语料库翻译学的深度和广度,同时也有利于商务相关专业的学生加强对商务性话语和译语的理解和掌握,兼具语言学和教学的双重价值。蔡基刚(2017)以一篇有关元话语研究的期刊论文为例,分析了创建用于英汉学术语篇中元话语研究的平行语料库的必要性,为未来学术语篇的相关研究提供了参考。原伟(2017)以乌克兰事件的俄汉新闻为语料创建了俄汉可比语料库,文中指出国内可比语料库发展相对滞后,强调了该类语料库创建的重要性和必要性,并提出了它们的应用前景。有两篇文章探讨口译语料库的创建:刘剑(2017a)描述了口译教学中存在的误区及困难,以及多模态语料库的创建对口译多方面的教学具有的重要性,同时表达了对多模态语料库创建的展望;张威(2017)从理论和实践意义的视角,分析了口译语料库对口译等方面研究的重要意义,指出了创建过程中在语料采集、信息标注、口译主题等方面存在的问题,最后表达了对于口译语料库建设的期望。

3.2 语料库研究技术工具的开发

为确保术语及短语学相关研究数据提取的准确性及客观性,许汉成(2017)初步探索了军事术语提取的可能性,详细介绍了术语提取过程中的种种问题,同时展示出各种语言术语提取的可能性。卫乃兴等(2017))基于多种统计手段研制开发了一个大规模语料驱动的短语序列提取系统,为进行相关研究的学者在数据的提取上提供了便利,同时也为多个学科领域软件的开发研究提供了很好的借鉴。柳超健和王军(2017)基于自建语料库和BNC参考库,运用Wmatrix对语料进行语义标注,从而进行隐喻识别,对识别程序和工具的详细论述为基于语料库的隐喻研究提供了技术上的支持,同时也揭示了Wmatrix这一工具的功能和用途。王立非和刘霞(2017)创新性地构建了论文摘要语步结构自动识别模型,减少了人工劳力,提高了效率,为多领域的研究带来了不可忽视的实用价值。

4 理论探讨类

2017年间有关理论探讨类的研究共计五篇。甄凤超和李文中(2017),詹宏伟和朱永生(2017)分别论述了著名语言学家弗斯和韩礼德的一些重大的理论观点,指出这些观点对语料库语言学的发展产生了不容忽视的影响。董敏(2017a)、卫乃兴(2017)分别对局部语法的研究进行了梳理。董敏以评价子语言为例,以评价理论为基础,探讨了系统功能语法与局部语法之间的互补性,重点强调局部语法对系统功能语言学与语料库语言学相结合的研究以及实现共同发展的重要性。卫乃兴利用简短的篇幅对作为新兴研究领域的局部语法研究进行了综述,指出局部语法成功地实现了在计算机语言学到语料库语言学之间的转换,拥有良好的发展前景。陈功和梁茂成(2017)阐述了型式语法(pattern grammar),这是第一个语料库驱动的英语描写语法,产生于复杂的社会和理论背景,该理论为语言研究及词汇研究等均带来了全新的视角。这些理论性的研究都不同程度地推动了语料库语言学作为一种新的研究范式,一门具有理论支撑的新学科的发展。

三、结语

语料库研究近年来关于学术文本的研究呈现上升趋势,研究焦点主要集中在其语言模式方面,以期为学术写作提供可靠的建议和参考;在翻译方面,口译研究逐渐受到重视,这也是一个令人欣慰的新特点;话语研究方面,如医学、医药话语以及翻译话语的研究说明基于语料库的话语研究正在逐步发展壮大。但从上文可以看出本文检索出的语料库研究绝大多数属于应用类研究,也就是基于语料库的研究,语料库驱动的理论探索较少,且这些应用研究也大都集中在翻译、词汇等方面,句法、语篇、话语方面的研究相对薄弱。

语料库研究发展到目前为止硕果颇丰,但也面临一些具体问题。语言学内部各分支基于语料库的研究发展并不均衡,比如口译研究研究力度不够,目前国内这方面的发展正在跟上;基于语料库的语言对比研究也没有受到应有的重视;基于语料库的文学翻译研究不应过分依赖语料库的应用,容易使学者过分注重纯数据分析,而忽略了社会历史文化对翻译这项活动带来的影响,使具体项目的研究沦为与社会文化相脱节的纯数据分析,由此引发研究结果的片面性;基于语料库的翻译技术目前正蓬勃发展,但仍需加大开发双语库和技术工具的力度,才能适应新时代的发展潮流等等。本综述旨在帮助学者吸取前人的经验,挖掘潜在课题,以此创造更加丰硕的学术成果。语料库的研究之路还很漫长,学者们应努力突破传统研究的桎梏,打破学科间的界限,为语料库的研究开辟新的思路和路径,还应加强语料库资源的共享力度,由此节省人力资源,避免资源浪费,最大限度地实现语料库的应用价值。

[1] Johansson, S. 2007.[M]. Amsterdam: John Benjamins Publishing Company.

[2] 曹忠芹. 2017. 基于语料库的语言学和药学论文摘要的体裁分析[J]. 广东外语外贸大学学报, (4): 83-90.

[3] 蔡基刚. 2017. 英汉学术语篇元话语对比中的平行语料库建设问题研究[J]. 外语研究, (4): 1-4, 112.

[4] 陈功, 梁茂成. 2017. 型式语法的产生、特点及其应用价值[J]. 外语学刊, (1): 17-24.

[5] 陈建生, 陈香君. 2017. 西方媒体“眼”中的中国国家形象变化——基于语料库的研究[J]. 广东外语外贸大学学报, (5): 104-109.

[6] 陈水生. 2017. 基于语料库的英汉动词性隐喻的对比与翻译研究——以“微笑”构式及《尤利西斯》的相关译例为个案[J]. 上海翻译, (4): 75-79.

[7] 陈香兰, 禹杭. 2017. 媒体并购话语中国家转喻的意义和功能——基于语料库的研究[J]. 外语电化教学, (5): 40-45.

[8] 陈中毅. 2017. 中国英语专业本科生议论文写作中wh-结构的使用特征研究[J]. 天津外国语大学学报, (2): 46-53, 81.

[9] 董敏. 2017a. 局部语法与系统功能语法的互补性初探——以评价子语言为例[J]. 外语与外语教学, (2): 38-47, 147-148.

[10] 董敏. 2017b. 外壳名词及其翻译对等的语法型式分析[J]. 外语教学, (2): 86-90.

[11] 范敏. 2017. 基于语料库的《论语》五译本文化高频词翻译研究[J]. 外语教学, (6): 80-83.

[12] 方清明. 2017. 《口语语料库语言学:从单模态到多模态》介绍[J]. 当代语言学, (1): 142-145.

[13] 房印杰. 2017. 关系代词取舍的共现词分析——中国英语学习者和英语本族语者的对比研究[J]. 外语与外语教学, (3): 100-108, 149-150.

[14] 冯克明. 2017. 基于语料库的英语非表量a(n) N1of N2结构研究[J]. 外语电化教学, (3): 68-72, 79.

[15] 高君, 赵永青. 2017. 默认-框架礼貌视角下的中国英语学习者异议话语研究[J]. 外语教学与研究, (2): 267-280, 321.

[16] 高霞. 2017. 基于中外科学家学术论文可比语料库的评价词语形式研究 [J]. 外国语文, (4): 51-57.

[17] 葛晓华. 2017. Sketch Engine的核心功能和应用前景[J]. 外语电化教学, (4): 23-30.

[18] 巩雪先, 黄立波. 2017. 汉语译文中“人称代词+的”结构欧化用法考察——类比语料库视角[J]. 解放军外国语学院学报, (2): 1-8, 159.

[19] 管新潮, 王金波. 2017. 论《资本论》百年汉译进程中的时代政治语境与文本语境——以“扬弃”一词的历时演变为例[J]. 外语电化教学, (3): 43-51.

[20] 胡春雨, 谭金琳. 2017. 汉英平行语料库《国别贸易投资环境报告》设计与应用[J]. 广东外语外贸大学学报, (4): 75-82.

[21] 胡春雨, 徐玉婷. 2017. 基于汉英媒体语料库的“经济隐喻”对比研究[J]. 外语教学, (5): 38-43.

[22] 胡骏飞, 陶红印. 2017. 基于语料库的“弄”字句及物性研究[J]. 外语教学与研究, (1): 64-72, 160.

[23] 胡开宝, 李鑫. 2017. 基于语料库的翻译与中国形象研究:内涵与意义[J]. 外语研究, (4): 70-75, 112.

[24] 胡开宝, 谢丽欣. 2017. 基于语料库的译者风格研究:内涵与路径[J]. 中国翻译, (2): 12-18, 128.

[25] 黄娴, 张克亮, 陈晓扣. 2017. 基于大规模汉英平行语料库的“使”字句英译方法探讨[J]. 解放军外国语学院学报, (2): 9-17, 144, 159.

[26] 贾光茂. 2017. 中国英语学习者动名搭配错误的概念迁移分析[J]. 外语教学理论与实践, (1): 30-35, 66.

[27] 揭薇, 金艳. 2017. 口语能力描述语的语体分析:基于中国英语能力等级量表的研究[J]. 外语界, (2): 20-28.

[28] 雷蕾. 2017. 中国英语学习者学术写作句法复杂度研究[J]. 解放军外国语学院学报, (5): 1-10.

[29] 黎昌抱, 李菁. 2017. 基于语料库的文学自译语言特征考察[J]. 中国外语, (2): 86-95.

[30] 李辉, 刘海涛. 2017. 基于句法标注语料库的汉语儿童三词句习得研究[J]. 语言文字应用, (1): 107-116.

[31] 李晶洁, 卫乃兴. 2017. 学术英语文本中的功能句干研究:提取方法与频数分布[J]. 外语教学与研究, (2): 202-214, 320.

[32] 李梦骁, 刘永兵. 2017. 评价理论视域下中外学者期刊论文评论结果语步词块比较研究[J]. 外语与外语教学, (5): 73-80, 121, 149.

[33] 李文中. 2017. 搭配的界定、测量与中国学习者语料库搭配分析[J]. 外语教学, (2): 70-74.

[34] 李响. 2017. 相同体裁语篇的搭配框架研究——以《中国政府工作报告》和《美国国情咨文》为例[J]. 外语电化教学, (1): 70-77.

[35] 李治平, 李丛. 2017. HSK动态作文语料库语篇关联语使用情况统计分析[J]. 语言文字应用, (2): 102-109.

[36] 廖正刚, 杨忠. 2017.《黄帝内经》中颜色词的认知解析[J]. 外语教学, (3): 29-34.

[37] 刘国兵, 杜亚平. 2017. 语料库驱动视角下的英语动词配价结构研究——以APPOINT为例[J]. 天津外国语大学学报, (6): 1-7.

[38] 刘辉. 2017. 学术期刊论文方法部分体裁结构的比较研究[J]. 外语学刊, (4): 6-12.

[39] 刘建鹏, 赵俊海, 杜惠芳. 2017. 基于语料挖掘的阿尔茨海默症患者话语深层正式度研究[J]. 解放军外国语学院学报, (3): 36-44, 159-160.

[40] 刘剑. 2017a. 基于多模态语料库的口译教学模式研究[J]. 外语电化教学, (2): 9-14, 21.

[41] 刘剑. 2017b. 国外多模态语料库建设及相关研究述评[J]. 外语教学, (4): 40-45.

[42] 刘泽权, 王梦瑶. 2017. 量性结合的《老人与海》及其六译本风格对比考察[J]. 外语教学, (5): 73-79.

[43] 柳超健, 曹灵美. 2017. 国外基于语料库的隐喻研究:方法、问题与展望[J]. 外语教学理论与实践, (1): 36-40, 21.

[44] 柳超健, 王军. 2017. 基于语义标注工具 Wmatrix 的隐喻识别研究[J]. 外语电化教学, (2): 15-21.

[45] 娄宝翠. 2017. 学习者英语学术论文结果副词使用特征研究[J]. 解放军外国语学院学报, (3): 70-78, 160.

[46] 卢晶晶, 倪传斌. 2017. 翻译伦理视角下我国陆港台三地进口药品商品名翻译比较研究[J]. 外国语, (3): 86-94.

[47] 陆军. 2017. 二语隐性、显性搭配知识特征研究——一项语料库数据分析与心理语言实验的接口案例[J]. 解放军外国语学院学报, (3): 1-9, 112, 159.

[48] 吕艳, 戈玲玲. 2017. 外宣英文网站中多模态隐喻表征及语类特征研究——基于小型超文本语料库“中国梦”的个案研究[J]. 上海翻译, (2): 17-23.

[49] 吕颖. 2017. 语料库驱动的中外医学论文摘要程式语对比研究[J]. 外语电化教学, (1): 78-82.

[50] 马蓉. 2017. 学术词汇研究四十五年[J]. 现代外语, (3): 420-428, 439.

[51] 潘峰, 黑黟. 2017. 新闻发布会汉英口译中的政府形象构建——以人称代词we的搭配词为例[J]. 外语与外语教学, (5): 45-51, 72, 148.

[52] 潘峰, 李鑫. 2017. 记者招待会汉英口译中的性别差异:以插入语I think和I believe为例[J]. 外语学刊, (5): 37-42.

[53] 钱毓芳, Tony M. 2017. A Corpus-based Discourse Study of Chinese Medicine in UK National Newspapers [J]. 外语教学与研究, (1): 73-84.

[54] 权立宏. 2017. 小型汉语口语语料库建设探讨[J]. 广东外语外贸大学学报, (4): 69-74.

[55] 单伟龙. 2017. 基于语料库的葛浩文习语翻译研究——以《红高粱家族》和《变》为个案[J]. 外语电化教学, (1): 83-89.

[56] 邵斌, 王文斌, 黄丹青. 2017. 英语强化词的构式搭配分析及其可视化研究[J]. 外语教学与研究, (3): 379-391, 480.

[57] 孙海燕. 2017a. 基于语料库的非词语化与词串的语用功能研究[J]. 外语电化教学, (2): 71-76.

[58] 孙海燕. 2017b. 学习者叙实类外壳名词的搭配构式发展特征[J]. 外语与外语教学, (2): 81-89, 149.

[59] 孙杰, 金琳. 2017. 基于TEM4口试语料库的交际策略研究[J]. 外语研究, (4): 63-69.

[60] 谭祥燕. 2017. 专业领域语料库现状与文本采样分类[J]. 中国科技翻译, (3): 26-29, 64.

[61] 唐青叶, 史晓云. 2017. 基于语料库的globalization时空演变及其话语建构[J]. 天津外国语大学学报, (6): 22-29.

[62] 唐义均, 杨燚. 2017. 从词块理论看中国法律文本英译的质量——基于法律双语语料库的研究[J]. 中国科技翻译, (3): 41-44.

[63] 王峰, 花萌. 2017. 语料库翻译学的跨学科研究——评《基于语料库的莎士比亚戏剧汉译研究》[J]. 外语研究, (5): 110-111.

[64] 王晶晶, 吕中舌. 2017. 理工科博士生学术英语写作中的作者自我指称语研究[J]. 外语界, (2): 89-96.

[65] 王克非, 秦洪武. 2017. 基于历时复合语料库的翻译与现代汉语变化考察[J]. 外语教学与研究, (1): 37-50, 159.

[66] 王丽, 王楠. 2017. 二语学习者学位论文中的口语化倾向[J]. 现代外语, (2): 275-286, 293.

[67] 王立非, 刘霞. 2017. 英语学术论文摘要语步结构自动识别模型的构建[J]. 外语电化教学, (2): 45-50, 64.

[68] 王伟. 2017. 基于语料库的新闻英语长句翻译研究[J]. 解放军外国语学院学报, (2): 18-23, 50.

[69] 王文斌, 邬菊艳. 2017. 从语义论元共指原则视角考察英语X-ee派生词[J]. 外语与外语教学, (1): 33-41, 146.

[70] 王文斌, 赵朝永. 2017. 中国学习者产出英语“流水句”现象剖析:英汉时空差异视角[J]. 外语界, (1): 30-37, 71.

[71] 卫乃兴, 李峰, 李晶洁. 2017. 语料库短语序列提取系统的设计与开发[J]. 外语电化教学, (4): 9-16.

[72] 卫乃兴. 2017. 基于语料库的局部语法研究:背景、方法与特征[J]. 外国语, (1): 10-12.

[73] 伍小君. 2017. 演绎逻辑与翻译明晰化假说[J]. 外语电化教学, (5): 82-86.

[74] 夏云, 秦洪武. 2017. 翻译与现代汉语结构容量的变化——以“介词……方位词”结构为例[J]. 外国语, (6): 77-85.

[75] 谢楠, 张笛. 2017. 汉语儿童多模态口语语料库建设研究[J]. 外语电化教学, (5): 53-60.

[76] 许汉成. 2017. 基于语料库的军事术语抽取方法初探[J]. 外语研究, (5): 43-46, 60.

[77] 许家金. 2017. 语料库研究学术源流考[J]. 外语教学与研究, (1): 51-63, 159.

[78] 颜明, 肖奚强. 2017. 论汉语中介语语料库建设的基本问题[J]. 语言文字应用, (1): 136-144.

[79] 杨玲. 2017. 基于语料库的英汉状态变化动词语义—句法界面比较研究[J]. 外国语, (3): 52-60.

[80] 杨柳. 2017. 《搭配:应用与启示》介评[J]. 外语教学与研究, (3): 474-478.

[81] 杨晓琳, 李德超. 2017. 翻译研究语料库设计、标注及分析中的创新与问题——《基于语料库的翻译研究新动向》评介[J]. 外国语, (2): 106-110.

[82] 杨越森, 卫乃兴. 2017. 中国学者英语论文动词模糊语序列及意义研究[J]. 解放军外国语学院学报, (2): 51-59.

[83] 余渭深, 李中正. 2017. 基于语料库的中英文最高程度副词的扩展意义研究[J]. 外语教学, (5): 32-37.

[84] 袁淼叙. 2017. 外译保真或改变的原因——基于语料库的让步关系研究[J]. 外语学刊, (4): 19-23.

[85] 原伟. 2017. 俄汉新闻可比语料库的构建、评估及应用展望[J]. 解放军外国语学院学报, (6): 113-120.

[86] 詹宏伟, 朱永生. 2017. 韩礼德与语料库研究[J]. 外语学刊, (4): 1-5.

[87] 詹菊红, 蒋跃. 2017. 汉英文学翻译中的缩合现象研究——以鲁迅小说为例[J]. 外语研究, (5): 75-82.

[88] 张辉, 卞京. 2017. 二语构式加工的神经认知机制研究——中国英语学习者对英语way构式加工的个案研究[J]. 外国语, (4): 64-72.

[89] 张继东, 陈文. 2017. “There存现构式”的语言特征研究——以存现动词为切入点[J]. 解放军外国语学院学报, (1): 53-60, 107, 160.

[90] 张金生, 孙冬阳. 2017. 汉英空间介词“上”和“on”的认知语义对比——一项基于语料库的研究[J]. 解放军外国语学院学报, (3): 45-53.

[91] 张磊, 卫乃兴. 2017. 中外法律学者学术论文评价局部语法型式对比研究[J]. 解放军外国语学院学报, (3): 10-18, 159.

[92] 张萍等. 2017. 英语搭配加工中汉语母语知识的启动效应研究[J]. 外语与外语教学, (1): 60-72, 147-148.

[93] 张威. 2017. 中国口译学习者语料库建设与研究:理论与实践的若干思考[J]. 中国翻译, (1): 53-60.

[94] 赵朝永, 王文斌. 2017. 中国英语学习者语域变异多维分析:英汉时空特质差异视角[J]. 外语电化教学, (4): 71-78.

[95] 甄凤超, 李文中. 2017. 弗斯的意义理论与语料库语言学[J]. 外国语, (4): 15-24.

[96] 甄凤超. 2017. 配价型式与意义的整合——语料库驱动的研究途径[J]. 外语学刊, (4): 13-18.

[97] 郑丹. 2017. 基于英汉学术期刊论文语料库的转折关系对比研究[J]. 外语学刊, (2): 55-60.

[98] 郑剑委. 2017. 法律汉语“庄重性”语体实现路径对比分析——基于法律汉语变体复合类比语料库的研究[J]. 广东外语外贸大学学报, (1): 78-86.

[99] 周惠, 刘永兵. 2017. 英语学位论文摘要中语法隐喻的使用与语篇功能研究[J]. 现代外语, (4): 484-494, 583-584.

[100] 周领顺, 周怡珂. 2017. 葛浩文译“狗”——基于葛浩文翻译语料库的考察[J]. 外语教学, (6): 74-79.

[101] 周小兵等. 2017. 国际汉语教材语料库的建设与应用[J]. 语言文字应用, (1): 125-135.

[102] 朱海婷, C. Alexander 2017. 基于分布格模型的英语词类习得研究[J]. 外语教学与研究, (1): 111-123, 161.

教育部人文社科规划基金项目“话语分析视角下西方媒体话语中的中国概念研究”(17YJA740068)

张瑞华,教授,博士,研究方向:语料库语言学、话语分析 王乐乐,硕士生,研究方向:语料库语言学、语料库翻译学

2018-08-27;

2018-10-22;

2018-11-10

猜你喜欢

语料库外语学习者
你是哪种类型的学习者
《语料库翻译文体学》评介
十二星座是什么类型的学习者
外语教育:“高大上”+“接地气”
把课文的优美表达存进语料库
汉语学习自主学习者特征初探
大山教你学外语
大山教你学外语
基于JAVAEE的维吾尔中介语语料库开发与实现
论远程学习者的归属感及其培养