体育类平行语料库的创建及应用前景探析
2017-11-27宋年春王雪敏
宋年春,王雪敏
(1.曲阜师范大学体育科学学院,山东 曲阜 273165; 2.曲阜师范大学外国语学院,山东 曲阜 273165)
体育类平行语料库的创建及应用前景探析
宋年春1,王雪敏2
(1.曲阜师范大学体育科学学院,山东 曲阜 273165; 2.曲阜师范大学外国语学院,山东 曲阜 273165)
采用文献资料法、专家访谈法、逻辑分析法,从体育需求的角度对当前体育汉英双语之间存在的空缺进行分析。结合“互联网+”和“大数据时代”的普及,对体育平行语料库的构建及前景进行探究,得出:1)体育类平行语料库可以全方位地促进体育行业英语教育的发展以及科研的深入;2)体育平行语料库还可以为体育行业提供高质高效的辅助翻译;3)体育语料库还有利于推动语言服务的发展。
体育类平行语料库;体育英语教育;翻译;语言发展
随着语料库语言学的创立,以语料库为基础的研究越来越得到重视。语料库是指“根据语言研究的目的,有计划、有针对性地收集并用电子形式保存的自然语言材料”[1]。
就语料库的研究目的而言,语料库主要包括2大分类:通用语料库以及专门用途语料库。通用语料库如英国国家语料库(简称BNC)和CCL现代汉语语料库等,主要用来反映各类语言的变体,用于一般性语言的研究。专门用途语料库则是就某个特定领域的语言变体的反映,如专门用途医学英语语料库、专门用途军事英语语料库等。
当前,我国体育系统英语教育发展不够完善,体育系统英语类教材及科研相对比较薄弱,不利于解决体育类语言服务人才培养的问题。建立体育类平行语料库可以全方位地促进体育行业英语教育的发展以及科研的深入,还可以为体育行业提供高质量、高效率的辅助翻译,不但有利于翻译效率的提高,而且有利于推动语言服务的发展。
1 体育类平行语料库的发展与现状
目前,语料库已经广泛应用于教学、翻译、语言研究等多个领域。英国国家语料库是目前可以免费使用的最大语料库,英语全称是British National Corpus(简称BNC)。
90年代末到20世纪初,语料库的创建及应用开始发展。在国内,汉语通用语料库是我国最大的语料库,涉及人文与社会科学类、自然科学类和综合类3大类。
我国体育系统英语教育发展并不完善,体育类英汉双语资料比较少,行业计算机翻译研究更是凤毛麟角。在计算机辅助翻译普及的大数据时代,翻译模式愈加多样化:由传统的纸质文本向超文本转变,静态模式向动态模式转变,个人翻译模式向团队翻译模式转变。
创建专门用途的术语库和语料库不但有利于翻译效率的提高,而且有利于推动语言服务的发展。创建体育类平行语料库还有利于解决体育类语言服务人才的培养问题。
此外,有关体育系统英语方面的教材资料数量并不多,而且种类比较单一,不符合当前的实际应用;有些教材内容安排不妥当,结构较为繁琐,查用不方便,可用性不强。
截至目前,国内外还没有专门服务于体育系统的平行语料库。只有在一些语料库的子库中,能零星地发现有关于体育的英汉/汉英双语语料,而且有的只是少量名词和短语,缺失很多与体育相关的内容,如:许多与体育相关的比赛规则术语、章程用语、中华民族传统体育术语等[2]。
体育类平行语料库的空白不利于体育系统英语语言学的发展和课题研究以及体育类语言服务人才的培养。陈建生等提出建立体育英语语料库已经成为体育英语学科建设的基础工程[3]。那彩霞认为语料库建设在体育英语笔译教学中发挥着重大作用[4]。由此可见,创建体育类平行语料库非常必要。
2 体育类平行语料库的创建
创建体育类平行语料库与创建通用语料库有许多相似之处。但是作为专门用途的语料库,体育类平行语料库也有其特殊之处。体育类平行语料库的创建要既能节约成本,又能充分应用于体育英语教学、体育论文写作、体育方面翻译研究、相关的双语词典编撰及体育英语教材的编写。
2.1 语料库创建的原则体育类平行语料库的创建要全面反映体育英语语言的事实。就形式而言,既要包括书面语语料库又要包括口语语料库。
在语料选取方面,要强调各类语料间的平行性和抽样的随机性。同时,语料的选取也要有一定的代表性。
体育类平行语料库应该全面科学地反映出体育领域用语全貌,包括球类运动语、田径运动语、户外运动语、射击运动语、体操运动语、水上运动语、棋牌运动语、体育赛事报道、体育学术论文、体育规则、体育赛制、体育知识介绍等。
体育类平行语料库的创建旨在满足体育类语言服务人才的培养、体育类英语专业科研及体育英语发展的需求。
2.2 语料收集语料的收集与筛选是创建体育类平行语料库的一大重点与难点,选取的语料要具有一定的代表性并且语料涵盖范围要广,这样才能为体育英汉/汉英双语者提供较为规范的、标准的、统一的和全面的双语服务,满足体育类双语教学、中外交流、高效翻译的需要,与此同时,也为体育类双语语言研究提供充足的语料来源。
因此,本研究将选取来自体育系统专业各个领域的中英对照语料,在分类方面,首先分为2大语料库:书面语语料库和口语语料库。
由于考虑到搜集语料的难易程度和成本高低,书面语语料库将会占据很大的比例。随着科技的发展,如网络查询、下载以及激光扫描等书面语语料的搜集相对来说比较容易,成本较低。相反,口语语料则需要录音、转写,而这对技术上和时间上的要求都比较高,因此,口语语料库会占一小部分的比例。
由于每项体育运动之间存在异同点,可以根据技能能力决定性因素将能力相似的运动项目作为一个整体来划分,类似于我国著名体育学者田麦久老师所提出的项群训练理论,初步分类设想如下:
1)速度力量型:速滑、短跑、投掷、举重;
2)耐力型:竞走、游泳、滑冰、长跑;
3)表现难美型:体操、花样游泳、冰上芭蕾;
4)技能准确型:射击、射箭;
5)隔网对抗型:乒乓球、排球、网球;
6)同场对抗型:篮球、足球、橄榄球、冰球、曲棍球;
7)格斗对抗型:击剑、柔道、摔跤、拳击;
8)综合型:现代五项、现代冬季2项。
2.3 语料的加工处理语料的收集与加工需要专门的制作流程,将采用机助人校的加工方式,采取最流行的语料加工软件,提高质量:
1)将收集的语料利用文本加工处理工具(ABBYY Fine Reader/Editplus/EditPadPro等)进行识别校对,除去多余的空格、改正错别的汉字和单词以及标点符号等,保证文本的正确性;
2)将语料转化为txt格式;
3)依据王克非的研究对语料进行赋码,加注篇头,即给语料标注篇名、作者、文本、领域、语体、时代、出版信息、文本字数等。
只有经过这样一系列地加工处理与标注,才能转化为实现语料库用途的语料[5]。
2.4 语料入库及调试语料的收集与入库需要投入大量的时间与人力。入库的主要难点在于语料的标注与输入。为了以后使用方便快捷,在入库之前需将收集来的语料分类标注,然后输入数据库。为确保准确性,需要对输入的内容进行校对,以确保格式、内容等无误。输入时,需要实现英汉语语料的句级对齐。入库完毕后,将语料库平台投入使用,根据使用效果进行改善,希望该语料库的创建能够满足语言研究、体育教学、翻译以及教材编撰的多个目的。
3 体育类平行语料库创建的意义
创建体育类平行语料库不仅可以促进体育系统英语的语言研究、翻译研究和教学研究,而且可以为体育行业、体育有关的企业提供高质量、高效率的翻译。
3.1 教育意义专门用途体育平行语料库的创建能够为数据驱动式教学(Data-driven learning)提供丰富多样且真实有效的语料。这些体育类双语语料不仅可以提高体育英语教学的效率和效果,而且还可以为体育生自学英语提供丰富的资源。双语语料库能够为学生们提供原文和相对应的译文,学生们可以通过自主学习,提高相应的专业英语水平。大量的例句不仅可以帮助学生们提高词汇量,还可以帮助他们找到更准确、更地道、更合适的英语表达。
此外,体育类平行语料库的创建有利于体育英语教师队伍的培养。大多数英语教师的语言教学能力高,但他们缺乏相应的专业知识。为使英语教师具备体育专业知识,需要对其进行相关专业的培训。体育类平行语料库的创建能够提高体育英语教师开展相关专业培训的效率,从而促进体育英语教学。
由于体育类平行语料库的语料均来自某一领域的实际话语,通过对专门用途体育语料的分析,可以得出某一领域的高频词及相应的搭配信息,使体育英语教材的编撰具有真实性和实用性。这样可以在短时间内掌握最有价值、使用频率最高的专业术语表达,从而提高体育生的专业文献阅读能力、文献翻译能力以及文献写作能力,有利于国际化体育人才的培养。
3.2 科研意义陈建生等认为目前语料库语言学中发展较为成熟的词频统计、搭配、类联接和语义韵等研究方法为专门用途英语的研究提供了从词汇到语篇,从语篇到文体,从语言理论到语言教学的全方位、多层次的研究途径[3]。
近年来,随着语料分析软件技术的不断发展,如MonoConc,可以从对体育英语语料进行文体、体裁、语义韵、词汇、语篇等方面进行全面分析,从而找出体育英语作为专门用途英语的特点。
此外,基于语料库对体育系统英语的的语言表达特征以及翻译规律进行分析,摆脱以往研究的主观性和片面性,使语言研究基于数据,结果更加客观,更加具有说服力,也使对体育系统英语的语言特征有更加深化和具体的认识。
3.3 翻译实践意义近年来,我国体育事业发展迅速,对体育服务的需求也随之增加,为了更好地促进国际间体育事业的交流,大量的与体育相关的资料需要翻译;在计算机辅助翻译盛行的大数据年代,翻译已呈现多元化发展,此时仅仅依靠传统的人工翻译无法满足市场发展的要求,而创建专门用途的术语库和语料库不但有利于翻译效率的提高,而且有利于推动语言服务的发展[6]。
随着体育类平行语料库的不断改进与完善,借助于语料库的翻译加上计算机辅助翻译能大大提高翻译效率以及翻译的准确性。此外,体育平行语料库的创建,可以为体育方面的翻译者提供一个平台,通过比较原文和译文所呈现的语言特征找出特定的翻译规律,促进我国体育英语事业的发展。
4 平行语料库的前景探析
目前,我国专业平行语料库十分稀少,体育类平行语料库更是少之又少。体育类平行语料库在体育科研方面、体育教学、语言对比研究等方面有较强的应用价值。
4.1 平行语料库在科研中的应用语料库的建立解决了众多学者们因体育术语翻译不统一、不规范带来的困扰,无论是在翻译论文摘要,还是在研究国文论文时,必定都会遇到很多专业性词汇,而平行语料库的建立以及针对这一问题配套开发的检索翻译平台,可以方便科研工作者对体育术语及常用词汇进行全面检索,大大提高了工作者的翻译和写作效率。体育类平行语料库与传统词典相比,在进行翻译写作时,展现出更专业、更准确、更权威等特点。
4.2 平行语料库在教学中的应用在体育教学过程中,作为一名体育专业的英语教师,除了具备最基本的英语理论知识外,更要具备丰富的体育专业知识,做到一般英语与专业英语兼容,能够灵活地解读课堂中常用的体育知识,以免在课堂中遭遇尴尬局面。
体育平行语料库的建立能够提供丰富的英汉、汉英实例对照,使用起来方便、快捷,既能够满足教师的课堂教学,也能够帮助学生的课外自主学习。学生在学习时,通过总结常用词汇和习惯性搭配词语,进行汉英、英汉双语学习,总结归纳经验,有助于提高学习效率。
另外,解决跨越专业术语的障碍,进入自由探讨专业内容的新阶段,这种学以致用的体验有助于提升学习者参与课程的兴趣。
5 结 语
当前,我国的体育事业发展迅速,国家也出台相关政策,体现出对体育事业的高度重视。体育类平行语料库的创建促进了体育系统英语教学的发展,有利于探索切实可行的教学方法和相关教材的编撰,为体育双语学习者、翻译者提供了标准化、专业化的双语语料,使使用者在短时间内掌握最恰当的语言表达,使体育专业方面的术语翻译趋于一致,有利于体育类国际化人才的培养,体育类平行语料库的创建还有利于开拓体育系统英语语言研究新空间,使该领域的研究居于领先地位。创建专门用途的术语库和语料库不但有利于翻译效率的提高,而且有利于推动语言服务的发展,解决体育类语言服务人才的培养问题。
[1] 王利娜.专门用途英语语料库建设的现状及对策[J].海外英语,2012(5):121-122,127.
[2] 王瑞芳.体育汉英双语语料库创建研究[J].体育文化导刊,2015(12):202-205.
[3] 陈建生,谭青松.语料库.专门用途英语与体育英语语料库建设[J].广州体育学院学报,2009,29(3):111-115.
[4] 那彩霞.论语料库建设在体育英语笔译教学中的应用[J].科技信息, 2012(32):618.
[5] 王克非.双语对应语料库:研制与应用[M].北京:外语教学与研究出版社,2004.
[6] 杨惠中.语料库语言学导论[M].上海:上海教育出版社,2002.
Research on the Establishment and Application Prospect of Sports Parallel Corpus
SONG Nian-chun1, WANG Xue-min2
(1.School of Physical Education and Sports Science, Qufu Normal University,Qufu 273165,Shandong China;2.School of Foreigh Languages, Qufu Normal University,Qufu 273165,Shandong China)
This paper analyzes the vacancies existing between Chinese and English bilinguals from the perspective of sports needs by means of literature, expert interview and logic analysis. Combined with the popularity of "Internet +" and "Big Data Age", the paper discusses the construction and prospect of parallel corpus, and draws the following conclusions: 1) Sports parallel corpus can promote the development of English education in sports industry and the deepening of scientif i c research. 2) Sports parallel corpus can also provide high quality and eff i cient auxiliary translation for the sports industry. 3) Finally, the sports corpus is also conducive to the development of language services.
sports parallel corpus; sports english education; translate; language development
G807
A
1004 - 7662(2017)02- 0050- 04
2017-01-03
宋年春,硕士研究生,研究方向:体育人文社会学。