基于口译教学的语料库建设初探
2013-04-10靳松
靳 松
(西北民族大学外国语学院 甘肃 兰州 730030)
一、国内外口译语料库建设现状
国外口译语料库的开发起步于20世纪末,现已建成几个较为成熟的语料库。其中最有特色的语料库有两个:一是日本名古屋大学设计研发的目前世界上规模最大的英语、日语双语同传语料库,该语料库采编的口译录音材料为182小时转写;二是意大利博洛尼亚大学研究人员开发的欧洲议会口译语料库,该语料库是一个包含英语、意大利语、西班牙语的多语平行语料库,库容量约为18万字。
国内口译研究起步虽晚(20世纪70年代),但发展速度较快,各类专著、译著、研究课题及相关论文如雨后春笋,异彩纷呈。尽管口译研究成绩斐然,但是口译语料库的研究与建设到2007年后才初现端倪。目前已进入研究和应用阶段的口译语料库是由上海交通大学研究开发的以国内外新闻发布会口译活动为对象的汉英会议口译语料库,容量约为54万字,该语料库的语料也来自职业译员的口译实践。另外还有文秋芳教授等人创建的50万字规模的中国大学生英汉、汉英口译语料库,该语料库为了真实反映口译学习者口译状况,选取的研究对象为高等院校英语专业汉族学生。
随着口译语料库的开发与建设,基于语料库的口译研究也相继展开,包括对口译文本、口译操作方式、口译策略等问题进行的初步量化描述与分析。目前,基于语料库的大多数口译研究主要遵循“建设语料库,研究语料库”的原则,即依托现有的口译语料库,通过数据统计和分析,对具体问题进行量化描述。
二、基于语料库口译教学的特点
“语料库是应用计算机技术对海量自然语言材料进行处理(包括预处理、语法自动附码、自动句法分析、语义分析等)、存储,以供自动检索(retrieva1)、索引(concordance)以及统计分析的大型资料库”(李文中,1999:51)。英语语料库作为口译教学的辅助工具,可以提供大量真实的语言材料、丰富的词汇和语境,而其可独立操作性可以充分调动学生学习口译的积极性。口译教学中语料库的运用对口译教学有着巨大的价值,表现在:1.呈现了大量真实的语言材料;2.提供了丰富的词汇及语境;3.可以独立操作,从而鼓励学生主动思考;4.“语料库方法注重运用而非能力,重描述(description)而非普遍语法(universals),重量化分析(quantitative analysis) 而非定性分析(qualitative analysis)”(李文中,1999:52)。教师和学生能够得到更加具有统计意义的数据,客观审视语言的实际运用而不拘泥于书面的文本,这一点对口译实际操作更具指导意义。由于语料库中语料的内容和形式多样,教师可根据各种口译语料内容、形式开展不同的口译教学与实践,这种口译课堂的教学内容与形式更加多样,效果更加明显。而且语料库中的教学语料难度各异、语速及口音多样,教师可在不同的教学阶段为学生安排相应的训练内容,并让学生体会、适应真实的口译现场,这样的口译课堂显得更加合理,有利于对学生的培养。对于教师来说,口译教学语料库的资料多样性、大规模性、检索便利性等特点能有效帮助口译教师增加训练材料,丰富训练内容,节约训练时间。
三、口译教学语料库的建设环节
建设基于口译教学的实际情景的口译语料库,不仅可以在很大程度上克服口译教学在材料、环境等方面“非真实性”的缺陷,使口译学员更多地获得“身临其境”的感受,还可以尝试新的教学形式与策略,活跃教学气氛,提高教学效果。与其他类型语料库不同,口译教学语料库注重材料的现场性和实时性、提取的便利性、语料存储的多媒体性。主要包括以下几个方面:
1.口译教学语料的收集
口译教学语料库的语料主要来自于利用多媒体设备对口译课堂中学生口译训练的录音以及各类会议、会谈、访谈、演讲等需要进行口译的现场。收集内容涵盖源语发言、目标语口译以及文稿、会议日程等材料,材料以录音或录像和文字的形式呈现出来。
2.语料的整理
与其他语料库不同,口译教学语料库的初始语料多为音频或视频,需要对原始语料进行录音转写,使口译教学语料库的主体语料应至少具备音频和文字两种形式以便学生和教师使用。
3.语料的标注
口译教学语料库需要根据口译材料的主题、场合、源语语体、难易程度、语速、时长、来源进行细致的分类。(l)“副语言”标注。“副语言”信息是口译语料标注的一项关键内容,应该充分借鉴口语语料库对口语信息标注的成功经验,探索适合口译特点的“副语言”标注策略。(2)超语言信息标注。除基本的词性标注外,口译语料的超语言标记不仅应该包括译者信息、时间、地点、口译活动组织者等信息,还应考虑包括反映口译交际特色的其他信息,如源语发布形式(自由发言、提纲式发言、带稿诵读等)、场景(会议口译、社区口译等)、工作形式(同传、交传等)、口译听众性质(知识背景、目的、外语水平等)、技术设备(传统会场形式、远程口译、如电视、电话、网络)等。
4.技术处理
技术处理是口译教学语料库建立过程中最为复杂的环节,这一环节的处理需要与相关技术人员的有效配合,对各种语料进行多媒体格式处理、噪音处理、相关软件配备,双语语料的平行对齐处理,检索工具的开发等程序。当前,数码式录音、录像设备日益普及,不仅可以保证原始口译语料的采集质量,也非常有利于语料的后期校对、时间标记、对齐等工作。同时,语料自动标注技术也对口译转写材料的标注加工有较大的应用价值 (参见王克非等,2004:21-22)。此外,自然语言工程领域内的语音识别技术也取得了一定突破,有利于口译语料的自动转换工作。(参见倪崇嘉等,2009)
四、口译语料库建设的特殊困难
口译语料库的建设面临诸多困难。口译语料必须由口语转写为文字形式,而这只能通过人工来进行;而且,实际口译活动中,如商务口译、法庭口译和会议口译等,口译内容转瞬即逝,而且常常涉及机密和隐私,不便于公开,这些都增加了口译语料建设的难度,具体表现在以下几点:
1.语料采集与转写。首先,口译活动的时间、场所以及人员配合程度(口译员、会场主办者等)等因素依然在很大程度上限制着语料收集的顺利进行。其次,作为一种特殊的口头语料,口译语料涉及源语口语与译语口语两种语料,语料的采集、转写工作更加复杂、艰辛,面临着口语语料采集工作的“双重困难”。(参见杨惠中,2002:57;kedney,2000:80-82)
2.口译语料标注的特殊性。除对语料进行文本结构和词性标注等一般性加工处理外,口译活动的特殊性也给口译语料的标注带来了特殊的困难与挑战。(1)语料时间切分。在口译活动中,发言人与译员的语言表达往往存在一定的时间间隔,这种间隔能较直接地反映出主题熟悉程度、译员认知素质等问题。此外,通过考察原文与译文在语言形式与语义两方面的对应情况,可有助于确定口译信息的转换单位,同时也能为客观分析口译中的“脱离源语语言外壳”现象(巴黎的释意派Déverbalisation)提供实证材料。而要实现以上目标,就须对原文和译文语料进行精确的时间切分与标注,并根据具体要求进行不同层次的对齐。目前的录音设备虽然能对原始语料进行较为精确的标定,但原文与译文的起始时间差异以及具体对应单位的时间关系,仍需人工确定,很大程度上影响了时间切分的精确性。(2)“副语言”信息标注。如前所述,停顿、支吾语、语音拖长等“副语言”现象在口译活动中具有重大的意义,但当前的语料标注工具还不能对这些“副语言”现象进行自动标注,仍需进行人工辨别,仅此一项工作就大大增加了口译语料库建设的难度。
3.源语与译语的对应层次。口译实践的特点(特别是同传)要求口译员在短时间内完成源语核心信息的有效传递,促成交际双方的交流与沟通。因此,“字字对译”或“逐句对应”并非口译实践的常态,“信息对等”、“功能等效”才是评价口译质量的首选因素(刘和平,2002)。因此,口译语料库不应进行“字对应”,也难以实现在笔译语料库中的“句对应”(参见王克非,2004)。同时,要想实现口译语料库的“信息对应”,须首先解决口译信息单位的划定标准、量化指标等关键问题,而上述问题迄今尚未形成定论。(参见勒代雷,2001:15一16.蔡小红,2003)
五、结语
基于语料库的口译教学能够适应当代学生的习惯,注重他们的个人需求,刺激他们的学习兴趣,有效帮助他们进行口译训练。将语料库语言学与口译活动进行有机结合,创建具有教学与研究多重用途的口译语料库,不仅符合翻译学科发展的大方向,更应该成为语料库建设与应用性研究的一个新课题,受到更多的关注与支持。而且,口译语料库的开发与建设,不仅对提高口译研究质量、促进口译教学改革、完善机器口译研究与应用有重大意义,也必然对丰富语料库类型、扩大语料库应用研究范围、深化语料库研究层次起到积极的促进作用。
[1]Bendazzoli,C.,Sandrelli,A.,&Russo,M.Disfluencies in Simultaneous Interpreting:A corpus-based analysis[A].In Kruger,A.,Wallmach,K.&J.Munday(eds.) Corpus-Based Translation Studies:Research and Applications[C].London&New York:Continuum Continuum International Publishing Group,2011.
[2]叶亮.面向教学的口译语料库建设:理论与实践[J].外语界,2009(2)
[3]北京大学计算语言学研究所.北京大学汉英双语语料库标记规范[J].北京:JournalofChineseLanguageandComputing,2003.
[4]陈振东.口译课程培养模式探索[J],中国翻译,2008(4).
[5]李文中,语料库、学习者语料库与外语教学[J],外语界,l999(1).
[6]王立非,张岩.基于语料库的大学生英语议论文中的语块使用模式研究[J].外语电化教学,2006(8).
[7]胡开宝.语料库翻译学概论[M].上海:上海交通大学出版社,2011.
[8]李婧,李德超.基于语料库的口译研究:回顾与展望[J].中国外语,2010(5).
[9]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.
[10]张威.口译语料库的开发与建设:理论与实践的若干问题[J].中国翻译,2009(3).
[11]张威.近十年来口译语料库研究现状及发展趋势[J].浙江大学学报,2012(3).