APP下载

专用型学习者语料库建设与应用

2019-03-15窦文娜陈品

语文学刊 2019年1期
关键词:二语语料库学术

○ 窦文娜 陈品

(北京建筑大学 文法学院,北京 102616)

语料库指的是电子文本集,立足于大量的真实语料,对其通过概率统计的方法得出结论,进而推广到整个语言或是语言变体。随着科学技术水平的高速发展,语料库更加广泛地应用到现代外语教学当中,逐步成为外语教师日常教学中一个强有力的教学手段。但是随着学生学习需求和教师教学需求的多样化,现有的大型语料库虽能为外语教学和研究提供可靠的研究方法,但其针对性、实用性不强。鉴于此,各种针对特殊用途语料库的建设研究也孕育而生。近些年,中国建筑英语也逐渐重视对专业语料库的建立,从多维度提出了建筑工程英语语料库的构建标准与应用[1]113-114[2]428-432[3]253-255。但是以往研究只关注对本族语者语料进行研究,忽略了在中国语境下,绝大多数学生将英语作为外语的二语学术写作这一现象。因此,有必要建立该领域学习者语料库。笔者以非英语专业研究生为落脚点,聚焦学生撰写的英文专业学术论文,研究建设建筑与土木工程英语小型学习者语料库,为提升研究生二语学术写作能力、研究生英语教学、专业用途英语教材编写提供帮助,进而提高建筑与土木相关行业在国际学术研究领域中的话语权。

一、学习者语料库设计目的

建筑与土木工程英语小型学习者语料库建设的主要目的是服务于教学。在中国高等院校,大多数研究生培养目标中都将英语作为研一的必修课程。从教师层面,担任一线教学任务的主体教师是英语教师,与本科时的教学目标的不同。研究生阶段的英语教学要求教师在授课过程中将英语与学生所学的专业相结合,培养学生英语应用的综合能力。这样才能更好地服务学生,满足学生在研究生学习期间撰写与发表英文科技论文的诉求。从学生层面,用英文撰写学术论文的能力不仅是学生作为顺利毕业的必要条件,更加体现研究生培养过程中的国际化水平。

(一)助力英语课堂模式改革

随着国家“一带一路”倡议的推进与实施,中国建筑与土木工程在国际相关行业有着举足轻重的地位。从“中国制造”到“中国创造”,国家逐步在工程领域有了飞跃式的发展。在此过程中,国际化工程人才是企业发展的根本,是国家发展的根基。反观国际化工程人才的培养,最先要在高等教育方面进行相应的改革,以适应时代的需要。在高等教育改革中,英语教学改革首当其冲。有研究显示:英语教学如果只是让学生埋头苦练语言基础, 不以服务学生的专业为主要目的,在这种情况下教出来的学生不会用英语从事自己所学的专业当中,更不能在自己的所研究的专业领域内展现具有国际交流的能力和较强的国际竞争力[4]56-60。由此可见,英语教师在助力培养国际化人才培养的过程中担任重要角色。一线任课教师有必要改变传统的教学模式,从“单一语言教学模式”到“融合专业语言应用教学模式”进行转变。

(二)丰富英语课堂实践

“结合专业语言应用教学”强调关注学生的专业领域,尤其是在研究生阶段。从科技论文写作的视角,教师不仅应具备扎实的语言基本功,还要熟悉学生专业领域的国际学术论文写作的基本规律和要求。 除此之外,最重要的是教师要充分了解学生在学术写作方面存在的问题。这样教师才能在研究生日常教学中有针对性地解决学生的实际问题,从而培养学生二语学术写作的能力,实现有效教学。就专业领域的国际学术论文写作基本特征而言,教师可以借助语料库,进行深入研究。在中国建筑英语方面,很多研究者提出了不同的建筑工程英语语料库的构建标准与应用,吴明海通过收集建筑类出版社出版的图书以及土木工程相关专业的论文、电子书籍等材料建立了建筑工程英语小型语料库[2]428-432。刘佳通过扫描建筑工程类报纸、期刊等材料对数据进行收集,进而提出建工工程类英语语料库构建的标准[1]113-114。这些研究都为英语教师在教授建筑工程类英语时,了解掌握该行业的国际论文写作,提供了有力的教学素材。

(三)有效培养学习者二语学术写作能力

国内多数相关研究只关注对本族语者语料进行研究,忽略了二语学习者在写作过程中呈现的特点。为了了解和研究学生在二语学术写作方面所存在的问题,有必要建立建筑与土木工程英语小型学习者语料库。首先,相比大型语料库而言,小型语料库更加针对二语学术写作教学的开展,贴近学生的个性化需求,同时为学生课下自主性学习提供了有力的平台。其次,与建筑与土木工程本族语语料库形成对比,可以让教师更好地了解在建筑与土木工程领域学生二语学术写作现状与问题,通过应用语料库,从而更加有效地指导教学。

二、学习者语料库的建立

(一)文本采集与转换

本研究选取的语料来源于北京某市属高校建筑与土木工程专业研究生。在系统学习学术英语写作课程一个学期后,以期末论文考核的形式用英文撰写建筑与土木工程专业领域的学术论文,共计120篇。其中建筑工程类论文59篇,土木工程类论文61篇,所撰写的英文论文格式符合期刊发表的标准。

由于学生上交的英文论文格式主要有两种Word和PDF,为了统一格式,便于在语料库中进行信息标注和检索,笔者将所收集的文本进行转换。Word格式的论文另存为记事本文本格式(.txt),使用ANSI编码保存文本文件。PDF格式的论文通过Solid PDF Tools v9转换成纯文本格式(.txt)。所有的语料保存在一个移动硬盘上,用于后续语料的承载和更新。

(二)抽样及先导分析

在正式收录文本之前,通过简单随机抽样,先抽取少量文本进行分析,主要检查以下问题:文本大小、文本问题、标点符号问题等[5]28。图1是学生提交的英文论文,仔细观察后可以发现,文本中第三行的第四个词cast-in-past中间有两个连字符,应该删除,从而形成独立的三个单词。这样处理后,在后续的统计计算中,可以成功检索出cast和in或是past三个单词,否则在后续检索时就会出现问题,甚至整个检索系统就会崩溃。

图1 文本先导分析样例

(三)文本整理与清洁

学生在用英语撰写论文的时候,可能会出现的问题,大致可以分为三类[5]28:第一,文字符号类问题,比如在中文编辑的状态下,输入英文字母和数字,这使得所输入的英文字母和数字占有两个标准的字符,呈现“全角”状态,这就需要研究者将其进行修改,确保所有的英文字母和数字处在“半角”状态下进行输入。第二,格式类问题,指的是在段落的首尾,或是一行的首尾存在半角或是全角空格,跳格(Tab字符)或者是滥用软回车。第三,标点符号类问题,指的是在“全角”状态下或是中文模式状态下,输入的标点符号。

以上这些问题如果得不到及时的处理,都会导致在后续的文本标注和检索出现错误,统计出来的数据不真实。由于人工纠正错误费时费力,可以借助现有的软件对原始文本进行整理和清洁。本研究采用“文本整理器”5.0绿色版软件对原始收集的数据进行批量整理,见图2。

图2 文本整体前样例

如图2所示,文本整理前,在段首有跳格,第一行的T 是“全角”,前三行行尾有多余回车,第二行R后面的标点符号是“全角”,第三行后面的标点符号是“全角”。通过“文本整理器”,将原文本中的所有字母和符号修改成“半角”格式,同时去除段首的跳格,整理结果见图3。

(四)文本加工

文本加工包括元信息标注、分词和词性赋码,这三个步骤是文本处理的核心步骤,为基于该语料库的后续研究提供相应的数据支持。

1.元信息标注。元信息就是文本自身的信息,也是本文附加的说明。笔者对120篇英文论文进行文献信息说明,包括作者、时间、标题、专业等。

2.分词。如图4所示,第一行“逗号”和“it”之间没有空格,语料库分析工具就会将“system,it”视为一个词。第三行“句号”和“at”也是同样错误,诸如此类的错误在图4中有多次。如果不进行分词处理,在后续检索过程中,将无法检索出相应的单词,甚至造成自动标注的失败。因此,笔者运用梁茂成设计的英语自动分词程序“Tokenizer”对文本进行分词处理,处理后的结果如图5所示。

图4 未分词文本

图5 自动分词后文本

3.词性赋码。词性赋码指的是可以利用现有的计算机技术,对文本中所有的词进行词性标注的过程。词性赋码后的文本可以便于研究者对文本中词汇使用特征或是语法结构进行更为深入的研究。笔者利用德国斯图加特大学计算机语言学研究所Helmut Schmid设计研发的TreeTagger,对文本进行词性自动赋码。根据程序设计者所提供的研究报告,使用该赋码器对英文文献进行赋码,准确率高达97%。

三、学习者语料库在外语教学中的应用

Granger 指出,学习者语料库的建立是为研究学习者语言特征和使用提供客观真实的语言数据,基于这些数据, 研究者可以进行语言学相关理论研究和语言教学研究。[6]本语料库的建立的主要目的是服务教学,为英语教师日常教学和科研提供有力辅助工具。与此同时,在有效提高学生二语学术写作能力的同时,让学生成为学习的主体,培养学生自主学习的能力,从而有效地改善学习效果。

(一)协助教师有效实施教学

教师可通过该语料库研究二语学习者在建筑与土木工程领域的学术写作特征,分析学生写作过程中出现的问题。尤其在词汇、句式和语法层面。建筑与土木工程英语小型学习者语料库可帮助教师更加清晰地梳理学生在以上方面的使用特征。这些研究直接反作用于教学,教师更加明确语言学习者的学习需求,有针对地组织教学,明确教学目的的同时,提高教学效率。教师不但可以研究局部学习组群整体的语言特征,而且能够观察分析独立的学习者个体的语言发展,从而建立一种更科学、更客观的全新教学信息反馈模式[7]72-77。

(二)助力教师提升科研能力

运用语料库语言学研究方法,教师可根据该语料库中所呈现的二语学术写作的特征或是问题,深挖素材,分析二语学术写作特征表象背后的成因,寻找能解决学生在写作过程出现问题的有效方法。从理论探讨到应用实践,教师可以将科研的成果应用到教学中去,或是通过教学实践活动,佐证理论的建立。以该语料库为研究基础,教学助力科研,科研反哺教学,让教师在二语学术写作的科研和教学方面得到双提升,从而更好地服务学生。

(三)协助学生提升自主学习能力

Nesselhauf 在研究中指出,基于语料库的学习对于解决学习者在学习过程中遇到的实际问题和困难非常有用,尤其是有助于学生在课堂上学习过但是还没有完全掌握的语言知识。鉴于上课时间的有限性,学生可以在课下自主时间,合理的运用建筑与土木工程英语小型学习者语料库。可以让相关专业的学生通过对比学习者语料库和本族语者语料库,观察分析数据,发现问题,形成改进的策略,从而让学生成功真正的学习中心。同时,在学习者语料库的帮助下,他们可以通过辨别和解释自己语言输出中的语言错误,从而达到掌握正确的语言知识的目的[8]104。从被动接受来自教师的问题反馈,转变成主动发现问题解决问题,为培养和提高学生学习的自主性提供了有力的平台。

(四)锻炼学生批判性思维能力

中国的学生英语学习往往注重词汇、语法以及阅读这些最基本的语言能力要求,但忽视了英语学习中的中西方文化差异、语言习惯和思维方式[9]140-142。尤其是在研究生阶段,这些能力的培养与锻炼显得尤为重要。所以学生应该在日常英语学习中,摆正学习的态度,明确学习的目标,在提升语言基本技能的基础上,更加注重锻炼高层次语言技能。蔡基刚指出:很少带着批判性思维去阅读,久而久之,造成了批判性思维能力差的后果,反映在学术写作中,就是创造性思维少[4]56-60。充分利用建筑与土木工程小型语料库,学生以批判的眼光和视角审视自己的学术论文,找寻其中的优点与缺点,培养学生在二语学术写作上的创造力,进而提升学生的科研能力。

本研究通过自建建筑与土木工程英语小型学习者语料库,详尽阐述了建库的目的和语料库文本的处理过程。以服务教学的视角,从教师和学生两个方面,分别论述了学习者语料库在外语教学过程中的应用,为建筑与土木相关专业学生的二语学术写作能力的提升提供有力的辅助工具。该语料库随着学生的个性化需求以及教师的教学改革,还需要继续充实和完善。首先,今后的研究可以细分不同的专业方向,便于对比发现不同专业方向学习者二语学术写作特征,结合定量研究方法,进行科学的系统性研究。其次,教师作为教学的主要行动者,可以根据自己的实际教学情况,在共时和历时两个维度建立小型的个性化语料库,从而发挥语料库的长效机制。最后,发展建筑与土木工程专业平行语料库,丰富现有的数据资源,为更加深入的研究提供数据支持。

猜你喜欢

二语语料库学术
中国大学EFL班级的二语自我分型特征分析
二语习得理论对初中英语课外阅读教学的实践探索
学术是公器,不是公地
《语料库翻译文体学》评介
如何理解“Curator”:一个由翻译引发的学术思考
对学术造假重拳出击
《神经语言学和心理语言学视角下的二语习得》述评
基于JAVAEE的维吾尔中介语语料库开发与实现
基于汉语方位词特点的二语教学策略——以“左”“右”为例
语篇元功能的语料库支撑范式介入