APP下载

多模态建筑双语平行语料库的创建及其应用

2020-09-16张聪颖高金岭

安阳师范学院学报 2020年4期
关键词:语料语料库检索

张聪颖,高金岭

(山东建筑大学 外国语学院,山东 济南 251010)

一、研究背景

在国家“一带一路”倡议的指引下和“双一流”建设的推动下,如何能培养出具有国际交流能力和国际竞争力的人才是外语教学改革面临的突出任务,而“此类人才的培养则有赖于专门用途英语(ESP)教学的有效开展”(蔡基刚 2019)。[1](P8)刘润清(1996)[2](P2)、章振邦(2003)[3](P2)、秦秀白(2003)[4](P80)指出大学外语教学处于转型期,ESP教学是未来高校英语教育的主流。蔡基刚(2010)[5](P20)对比了外语通识教育(ELE)和ESP,从世界公共英语教学的趋势和我国外语教学的现状论证了大学英语教学的发展方向是ESP教学,ESP教学是大学英语教学改革的关键。在“一带一路”倡议的推动下,我国建筑业处于转型发展期。一方面,大中型建筑企业逐渐走出国门,与“一带一路”主题有关的合同额从2018年开始加速增长。2030年中国企业有望获得1.36万亿的海外建筑合同,2016~2030年间的复合年增长率为19%。另一方面,新的装配式建筑从其他发达国家逐渐引入,因此,急需大量高质量的具有国际视野的建筑人才,这就为建筑类高校和综合类高校的建筑专业的人才培养提出了新的目标和挑战。作为建筑专业与英语教育相结合的建筑英语课程能否满足新形势下对建筑人才的需求,作为ESP重要分支的建筑英语在大学英语教学改革中将如何发展,成为重要的研究问题。

为了更好地了解建筑英语的教学现状和学生的满意度,本次研究采取调查问卷、访谈的形式,对山东省内建筑专业在校本科生进行大规模调查,同时为了展示建筑英语对学生本科毕业后从事学术研究和工作的影响,本次调查还选取了一些研究生和已经就业的学生。本次调查共发放问卷300份,回收295份,其中有效问卷295份。参加本次问卷调查的学生70%以上已达到大学英语四级或以上水平。调查结果显示,73.5%的被访者认为建筑英语的课程开设对他们的继续深造和就业很重要,但只有17.8%的学生对现行的建筑英语课程满意,这说明建筑英语课程的开设无法满足学生的需求。教材方面,67.4%的学生认为现行教材过于陈旧,无法反映行业最新的研究成果,且很多学生反映他们所使用的教材未附词汇表和相应的练习,对于建筑专业词汇的学习十分不利。教学手段上,72.8%的学生反映他们的老师在课堂上所使用的是单调的纯翻译或阅读与翻译相结合的教学方法,且基本都是以教师为中心,学生的学习积极性普遍不高。此外,高校建筑英语都是开设在大三上学期或者下学期,课时32学时,占2个学分,学生普遍反映课时太少,对于专业英语水平的提升很有限。

通过调查分析,不难得出结论,现行的建筑英语课程远远无法满足学生继续深造和就业的需求。主要体现在教材过于陈旧,没有相应的专业词汇表,对于建筑专业词汇的学习犹如大海捞针;教学手段落后,依然是传统的阅读翻译法,无法以学生为中心,学生的积极性和主动性很难发挥。

目前ESP教学备受重视,成为未来大学英语发展方向,与此同时,建筑企业走出去需要大批复合型的建筑国际人才,在这种形势下,作为ESP分支的建筑英语的地位显得尤为重要。而现有的建筑英语课程由于种种原因无法满足需求,这种矛盾日益突出,严重阻碍了人才培养。面对建筑英语的教学窘境和ESP发展的新形势,英语教师必须采用新的教学模式来改变现状,因此,建筑英语教学模式的改革已经箭在弦上。教学模式应以“现代信息技术,特别是网络技术为支撑,使英语的教与学可以在一定程度上不受时间和地点的限制,朝着个性化和自主学习的方向发展”[6](P197),而以语料库为驱动的教学则顺应了这一要求。

二、语料库驱动下的建筑英语教学模式

无论从 ESP 研究方法还是从语料库语言学未来发展方向来看,语料库技术和 ESP 研究的交叉融合将持续成为这两大领域的学术热点[7](P153)[8](P7)。

ESP教学的核心应该是“学什么”,教学内容的选择是ESP教学的重中之重。Bojovic认为ESP教学材料必须具有真实性、时效性和专业性[9](P3),Lorenzo强调ESP教学内容应首要选择来自具体语境的语言学习材料,而不是关注语法或语言结构[10]。从以上观点可以总结出,ESP课程除了强调学习者需求外,在教学内容上更强调英语与特定学科的衔接,即突出教学内容的真实性,这就决定了 ESP的教学内容不能拘泥于教材,要选择与特定学科相关的真实的学习材料。根据前面的调查发现,山东省内的本科建筑英语教学,基本都是以教材为唯一的教学材料,现行的教材不仅所选文章陈旧,而且选材局限性大,对于建筑合同、标书都没有涉及,实用性差,完全不能达到ESP对于教学内容的要求,而作为大规模电子文本集合的语料库则显示出其独特的优势。语料库语言材料真实、量大、内容丰富,能反映最鲜活的语言使用,对语言的使用范式也极具解释力。因此基于语料库的“数据驱动学习”(Data-Driven Learning,简称DDL)可以为ESP教师和学生提供大量丰富、真实的语言材料。

DDL为ESP学习提供了新方法。DDL是一种新的基于语料库的外语学习方法,它的基本原理是指引学生利用海量的语料库数据观察、概括和归纳语言使用现象,自我发现语法规则、意义表达及语用特征,这是一种以学生为中心的发现式学习[11](P116)。Tim(1991) 和Chris(1990)是DDL的先行者,主张实际教学中必须给学生提供真实的语言材料,鼓励学生积极主动地从真实语料中去发现语言事实。[12](P4)[13](P6)DDL摒弃了传统的3P(present-practice-produce)教学流程,实现“observe-hypothesize-experiment”的发现式学习流程[14](P256)。据前面调查所知,目前建筑英语课堂教学方法还是采取教师主导下的翻译法和阅读—翻译法,这种落后的教学手段很难满足学生在目前日新月异的信息技术浪潮中的学习需求,学生普遍反映课堂形式单调、乏味。而DDL模式下的发现式学习使学生成为课堂的主体,通过自己对语料库进行检索、发现,提升学生对专业词汇的认知水平;不仅如此,课堂还可以延伸到课下,达到课上课下的有机融合,使学习形式更加多元、有趣,改变了传统建筑英语教学以教师为主体而无法调动学生积极性的难题。

因此,DDL模式的应用,不仅能为教学活动提供大量丰富、真实的语言材料,而且必将引发教学中学习者的学习方式、评价方式等方面的革命性变化。这是对以教师和教科书为中心的自上而下式传统外语教学模式的挑战,同时也为有效地解决目前ESP教学中的各种问题提供了一个崭新的思路。

国内学者在近年来开始尝试借助语料库辅助ESP教学。张济华(2009)提出通过建立和运用大型专业分类语料库,帮助学生和教师突破专业词汇的瓶颈。[15](P20)高书娜(2016)将语料库融入汽车专业英语教学[16](P168);张济华等(2009)尝试将语料库用于ESP词汇教学[15](P20);孙艳(2016)借助语料库工具,建立“基于语料库的银行英语词汇教学模式”[17](P84),帮助学生正确使用银行实务英语词汇,提高文本阅读速度和语篇分析能力。施称等(2015)探讨了医学英语语料库在ESP课程改革中的应用[18](P129);王珏(2015)把自建美术类平行语料库运用于ESP教学[19](P61)。可以看出,近年来,语料库驱动下的ESP教学模式受到广泛关注,已经被应用到ESP教学中,并取得了良好的成绩。

但是,将DDL应用到建筑英语教学的成果很少。国外高校利用建筑专门语料库驱动教学的案例主要有三个,分别为芬兰、英国和日本学者研制,研究者将介绍本国建筑的英文文本建成建筑文本语料库,以供学习建筑英语课程的不同程度的学习者使用。[20](P110)三个建筑英语语料库规模都不大,而且都是单语文本语料库。国内方面,迄今为止,尚未有专门的建筑英语语料库出现,DDL用于建筑英语的教学模式也只是一种设想,无法应用到实际教学中。

三、多模态语料库及其创建

国内学者对基于文本语料的传统语料库在英语教学中的应用,已经取得了丰硕的研究成果,但在信息技术高度发展的今天,外语教学已进入多媒体时代,传统的文本语料库已无法满足外语教学的需要。于是,多模态语料库应运而生。多模态语料库是指包含经过转写、处理与标注的语言文本及与文本紧密关联的音视频数据库,目的在于采用实证的方法系统地研究语言符号与非语言符号之间的相互作用[21](P38)。内涵上超出了 Biber 等人对语料库的定义——“口语或书面语文本的大规模集合”,是“经过标注的不同交际渠道协同的数据集合”。[22](P80)多模态语料库将文本语料和图片、音视频有机地结合,打破了单纯依靠文本理解语言的模式,解决了以往英语学习中只能了解文字信息,无法深入直观了解概念和术语的问题,多模态语料库的诸多优势,使之成为语料库语言学的新秀,被称之为“语料库4.0”。[23](P123)

在国外,2008年12月欧洲7国共同合作建成的SACODEYL(system for the assisted compilation and open distribution of European youth language)多模态教学语料库,是全球首个将DDL付诸实践的多语种的多模态语料库,不仅提供了多种语料库工具和灵活多样的检索形式,还可进行文本和多模态视频间的自由切换。

在国内,由于技术限制和人力、物力的制约,多模态语料库的建设遭遇了很多困难和挑战。虽然建成了一些多模态语料库,但规模较小,而且基本都是单语语料库,多模态双语平行语料库更加罕见[24](P56),多模态语料库在外语教学方面的使用则更为有限。根据梁燕玲(2016)对多模态语料库在外语教学研究和应用方面的统计数据,多模态语料库外语教学研究文献只有11篇,其中关于理论探讨的文献4篇,7篇为实证研究[25](P114)。这说明国内多模态语料库外语教学研究刚刚起步,理论研究不足,还需要在不断发展的实证研究中补充理论。

在建筑类文献和文件中,图片是极其重要的表达形式,通过大量形态图和平面图的展示,使阅读者对概念形成直观认识是非常重要的。而以往的语料库都是纯文本形式,由于技术所限,无法将图片添加到语料库中,图片和文本是分离的,很多建筑概念和属性不能完整传递,使学习和研究的效果大打折扣。多模态双语平行语料库成功地解决了这一难题,检索时不仅能看到建筑术语的英汉表达方式,而且能借助对应的图片深化了解和认识,使文本和图片合而为一,便于学习者随时比对。因此,多模态语料库在多元语境中反映语言在语义和语用等方面的全貌,学生能更直接地体验语言使用的多模态语境,对于建筑英语的学习大有裨益。

但是由于多模态语料库相对于传统文本语料库而言,创建难度更大,因此国内尚未出现建筑英语多模态语料库。山东建筑大学外国语学院从2015年起开始创建多模态建筑英语双语平行语料库,目前规模达到1500万句对,并以每周10万句对的速度扩容。该语料库不仅有精确匹配的英汉双语文本,而且包含大量图片、音频与视频,可以进行多模态识别、检索与翻译。该语料库已经在2019年4月通过了科技查新,证明本语料库为国内外唯一的国际建筑工程多模态双语平行语料库。2019年7月获得了国家专利(专利号CN110046261A),开辟了多模态语料库的新领域,为建筑英语的教学和科研提供了支撑。

在创建过程中,首先将已经整理的语料进行数据的清洗和去重,做成以段落为主的句对方式,以符合计算机辅助翻译软件和机器翻译引擎的算法,达到能够广泛应用的目的。然后对建筑类语料进行系统的标注和识别处理,以便在机辅翻译软件进行语料对比识别时能够准确识别出要查询的术语是建筑类。最后,将建筑工程类音频、视频和文字语料等多种信息集成,通过多模态方式加工、检索和统计,进行语料处理,并且进行多模态检索。

该语料库的特征和优势主要体现在如下几个方面。

1.语料来源可靠

为保证语料的权威性,团队要求所有搜集的语料均来源于以下几个方面:国家级出版社正式出版的建筑类英汉双语著作;政府公文报告、会议公报等;官方认证材料,包括合同文本以及建筑工程类音频、视频材料等等。语料主要涉及的领域包括绿色建筑、建筑理论、建筑标书、建筑合同、建筑材料、城市规划等。

2. 语料切分科学

语料的加工制作过程中,在保证语句意思完整的情况下,做到最精细的切分。保证每个平行句对在 Word中都不超过四行。因此在机器对齐之后,需要人工进行降噪切分处理,这样就确保了在计算机辅助翻译过程中的精确匹配。示例见表1。

表1 机器切分后的语料展示

3.语料库持续扩容

语料库的不断扩容保证了语料的更新。语料扩容的作用在于:一是确保语料的平稳延续,使得后续的关联项目能够正常使用更新后的记忆库;二是确保为术语的统一提供更多语料参照;三是及时区分翻译过程中所参照语料的来源;四是为术语提取工作准备更可靠的资源。

4. 采用多模态模式

利用现代影像技术采集多模态建筑工程类信息,并对其进行“有的放矢”地挖掘、构建。根据研究对象和研究需要设计合理的数据挖掘方案(即标注方案),在标注软件上建立不同的标注层,从不同的视角和层面对语料进行标注。对转写内容、音频和视频进行同步呈现,同时支持多种形式的结果输出。

在建的多模态建筑英语双语平行语料库可以为教学提供真实的语境,语料库的持续扩容解决了传统教材难以经常更新、学生无法接触到最新文献的难题;双语的精确匹配和实时检索方便学生学习专业术语的英汉表达方式;多模态技术的应用使图像和文本有机结合,便于学习者更直观深入地了解建筑概念(示例见图1)。因此,多模态建筑英语双语平行语料库的创建和在教学中的应用是进行建筑英语教学改革的有效途径。

图1 多模态语料库展示

四、多模态双语语料库应用于教学

1.语料库技术培训

根据学生的计算机水平制定出合理的培训方案。首先让学生了解我们建设的建筑英语多模态英汉平行语料库和其对于建筑英语学习的优势。然后在机房向学生展示如何利用索引软件进行检索,包括文字检索和图片检索。

2.教师制作微文本,引导学生发现式学习

对学生进行初步的培训后,教师根据教学重点提前加工相关检索行,制成微文本并带入课堂。这里所说的“微文本”,也称“微型文本”,是指通过检索工具从语料库中得到的、包含若干个索引行的文本[26](P9)。上课时,教师根据教学材料所涉及的建筑英语词汇和短语加以讲授,并展示微文本,也可当堂引导学生动手检索语料库,发现这些词汇的意义和用法。

3. 小组课外发现式学习及课内成果展示

将学生分成5人一组的学习小组,每组从建筑英语多模态语料库选取3-5篇建筑英语材料,进行自主学习,随时将自己感兴趣的生词、新词、词组、句型加以检索,并对搜索结果进行记录,在小组中讨论、切磋。学期末各组以团队合作形式进行发现式学习成果展示竞赛。由小组成员集思广益,将自己平时所关注并检索的高频建筑英语词汇加以总结并在课堂上作成果展示,要求每组用10分钟时间最大程度地体现语料库检索的收获,形式不限,解释并归纳高频词汇的意义、用法等。展示后留出3分钟提问时间,小组成员回答其他同学或老师提出的问题。这种“搜索—发现”式的学习方法对激发学生的兴趣大有裨益。学生首先提出问题,接着在语料库中进行索引并对索引行进行观察、分析,然后提取相关语例,最后解决问题。当学生能够熟练使用语料库来提取信息和验证他们的直觉假设时,语料库就成为学生手中强大的工具。

4. 开发手机小程序,实时学习

多模态语料库应用于教学,如果只能利用机房电脑和学生个人电脑,则会造成很大的局限性。因此,开发出和多模态建筑英语语料库相匹配的手机小程序,实现图片和英汉双语同步连接,使学生只需要对看到的建筑物或建筑物的某个部分进行扫描,就能出现对应的英汉双语术语以及解释,能够满足学生随时随地学习建筑英语的需求。示例见图2。

图2 多模态建筑英语小程序

上图是美国金门大桥的图片,学生通过我们开发的手机小程序在对金门大桥和桥两侧的弧形吊带以及索塔进行扫描后,就会看到关于金门大桥的中英文解释,以及对于弧形吊带和索塔的英语翻译。

传统的教学模式下,教师是课堂的主导者,教材是教师唯一依靠的教学材料,内容上无法适应不断更新的知识体系,课堂活动单一,很难调动学生的积极性。在DDL的教学模式下,教师利用建设的多模态建筑英语语料库,摆脱了教材无法经常更新的困境,学生可以随时调取最新、最希望了解的语料。与此同时,充分发挥学生的主体性,将课内微文本引导、小组课外发现式学习及课内成果展示相结合,使学习不再局限于课堂上,让学习形式更加多元、有趣。不仅如此,还可以利用班级学习群,实现学生之间、师生之间的课外在线互动。开发的手机小程序能使学生在欣赏建筑图片时,通过扫描功能了解该建筑及其重要部分的中英文表达和它的建筑特色,将课堂延伸到课下,实现课内引导式教学和课外发现式学习的有机融合,从而真正实现以学生为主体的教学模式,学生由被动接受转变为主动探索,能够充分激发学生的学习兴趣,挖掘其内在的学习潜力,锻炼其自主学习能力。

五、结论

在大学英语教学改革的重要阶段,如何解决从ELE过渡到ESP的诸多问题,使ESP教学能紧跟时代发展,满足学生未来发展的需求,是外语工作者必须思考的问题。与传统的文本语料库相比,多模态建筑英语平行语料库更真实地反映了建筑文献的全貌,为英语教学提供了丰富而真实的教学材料,解决了ESP教学中“学什么”的问题。与此同时,在信息化高度发展的今天,以多模态语料库为驱动的建筑英语教学,打破了传统的学生被动接受的单一教学模式,构建了学生自我发现、自我探索、自我归纳的学习过程,有助于培养学生的观察能力、概括能力和自主学习的能力,实现了ESP教学方法的大变革。

未来,我们将会把多模态建筑英语平行语料库应用到更广阔的建筑英语教学领域,如应用于多模态教材设计、专业教师培训、多媒体课件开发、教学大纲设置、教学评价、教材评估、试题库设计等领域。以语料库为驱动设计出各类教学任务,引导学习者进行甄别、选择、分类、分析、综合,从而不断提升和改善学习者的知识与能力,使之成为既具有精深的专业知识,又能阅读专业英文文献,可以用英文有效地表达自己的看法、阐述自己的研究,无障碍地和国际同行交流的高端复合型人才。

猜你喜欢

语料语料库检索
基于语料库的清末民初日源外来词汉化研究
面向低资源神经机器翻译的回译方法
《语料库翻译文体学》评介
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
濒危语言与汉语平行语料库动态构建技术研究
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入
英语教学中真实语料的运用