大学英语教材语料库平台的建设研究
2020-04-04陈蕾
陈 蕾
(安徽信息工程学院 通识教育与外国语学院,安徽 芜湖 241000)
词汇是语言的根基,始终贯穿于语言学习的整个过程。大量词汇认知是培养语言技能的基础,并直接决定着学习者的语言运用能力。在外语能力评测体系建设的推进下,大学英语教学和考试开始更加强调学习者英语语言的实际运用能力。因此,作为影响英语学习效率的最重要因素,词汇学习显得尤其重要。英语教材是学生学习阶段词汇的主要来源,在英语教学中具有重要地位。然而,对教材词汇的记忆和运用一直以来都是英语学习的“绊脚石”,“记不住”生词或记住了却“不会用”,直接影响了英语学习的积极性。主要原因是:传统的大学英语教学主要以脱离语境的单词表传授词汇规则,忽视了真实的语言环境。因此,如何实现让学习者通过丰富真实的语境完成自主发现式的语言知识构建,是中国英语教学的重要目标。而语料库能够反映真实语境中的语义和语用等语言面貌。利用语料库手段辅助词汇学习,有利于提升学习者的语言综合应用能力和自主学习能力。
一、国内语料库研究现状
国内英语语料库的研究起步于20 世纪80 年代初,并且在早期阶段就间接地应用于指导英语教学。一直到90 年代中期,国内语料库研究主要围绕专门用途英语,如上海交通大学科技英语语料库和广州石油英语语料库,对专门用途语言教学产生了重要影响[1]62-68+88-89。90 年代中后期,国内学者开始转向学习者语料库的建设并基于语料库开展中介语研究,其中,中国学习者英语语料库[2]1-2影响最大。截至2006 年底,分别有5 个和14 个学习者英语口语语料库和书面语语料库建成或在建,为英语教学提供了有益指导[3]5-8。与此同时,语料库及其方法开始直接应用于英语教学,建成的语料库类型也更加丰富,新增了教材语料库。2000 年华南师范大学外国语言文化学院建设了英语教育教学语料库, 分 成EFL Corpora、English Corpora、Chinese Corpora 三大板块[4]44-49。EFL Corpora 板块包括三大子语料库:BOOK(教材语料库)、CLASS (课堂教学实况语料库)及 LEARNER (学习者语料库)。而BOOK 教材语料库则由国外教材语料库和国内教材语料库两个子库组成。其中,国内教材语料库涵盖了国内小学至大学阶段的200 多册通识英语教材。这是国内首次基于英语教材建设的语料库,对语言教学和测试有极大的指导作用。但是,该语料库规模过于庞大,并且受访问权限限制,可及性很低,难以在实际课堂教学和课后学习中使用[5]119-120。于是,出于教学需求,学者们开始纷纷自建基于教材的语料库。2003 年前后,广州中医药大学的薛学彦[6]60-64收集了国内大学英语教材中的930 篇阅读文章,建立了COLEN 语料库,但主要用于个人课堂教学使用。外语教学与研究出版社出版的《新视野大学英语》(第二版和第三版)配有规模200 万词的教材语料库。然而,该语料库仅对登录网络平台的教师开放权限,受益面仍然很局限。可见,目前语料库研制和使用仍然无法真正让英语学习者受益。此外,学习者和普通英语教师在使用语料库时也会遇到障碍:缺乏或不熟悉配套的语料库软件应用知识,导致无法有效地利用语料库进行自主学习或辅助课堂教学。因此,若能对语料库进行“加工”,利用网络平台,简化语料检索过程,语料库的使用率将大大增加。
二、构建教材语料库的意义
根据情境认知理论,语言学习需要情境。只有基于大量的真实语境才能促进语言的认知与学习。因此,大学英语教材语料库及其平台的建设对于英语学习和教学有着重要的实际意义。
(一)语料库平台有助于提升自主学习能力
语料库平台有助于实现高效词汇学习,提升英语学习者的自主学习能力。词汇的意义是在声音或文字材料语境中的音形义结合的意义[7]67-68,也就是说,词汇的知识包含了词义和使用语境。因此,词汇的学习应当在有意义的语境中进行。传统的大学英语教学正是忽略了这一点。而教材语料库的检索功能,可展示语料库中包含核心词的所有语句,直观地呈现核心词的使用语境,能够帮助学习者加深词汇认识的深度,提升识读能力。同时,学习者可以对语料库中的批量信息进行观察,归纳总结语言的相似特点,进行发现式语言知识构建,进而提升自主学习的能力。
(二)教学语料库可提升教学者的课堂效果
英语教学者可借助教材语料库辅助英语课堂词汇教学,提升课堂效果。Michael Lewis 指出,语言是由语法化的词汇组成,而不是词汇化的语法组成。目前,很多英语教学都以规范性语法教学为主,以语法规则贯穿词汇教学,词汇只是嵌入在语法结构中。这种教学方式忽视了动态发展语言中的词汇使用,可能会导致学生对词汇运用的片面理解,如不了解词汇的使用频率,常见搭配。而语料库却可以展示出核心词的频率和搭配,为词汇教学提供依据。此外,语料库中收录的主流大学英语教材的课文,是最佳的语篇分析素材和写作范本,也是阅读技能分析和操练的素材。教学者在涉及词汇讲解的内容时,可以随时选取基于教材的语言实例,将词汇教学置于真实语境,进行语言的描述性教学。
(三)免费开放语料库平台实现了语料共享
将语料库资源上传至网络平台,对所有网络用户免费开放,实现了语料库的使用意义。目前国内已建成的语料库因其规模、内容难度、开放权限等方面的原因,并不适用于一般的英语学习者和教师日常课堂教学使用。而免费开放的语料库平台,既共享了语料,又简化了工具使用,可谓真正地惠及了普通师生,他们可针对不同需求选取语料辅助学习和教学。同时,教师也可基于教材语料库开展相关教学研究、编写教材讲义、设计测试练习等。
三、基于SSM 框架的CETC 语料库平台建设
大学英语教材语料库平台的建设由教师和学生团队共同完成,主要涉及两个阶段:语料库的创建和平台的搭建。具体流程见图1:
图1 语料库平台建设流程
(一)构建语料库
1.语料采集。语料来源于外语界两大主流出版社(上海外语教育出版社、外语教学与研究出版社)的6 套大学英语纸质教材:全新版大学英语(第二版)综合教程、新目标大学英语系列教材综合教程、全新版大学进阶英语综合教程、新视野大学英语(第二版)读写教程、新世纪大学英语系列教程(第二版)综合教程、新视野大学英语(第三版)读写教程。通过扫描识别、键盘录入、网络下载等方式进行语料采集,共获得348 篇文章,形成348 个独立文档,以出版社、教材名称、册、单元、AB 篇等关键词对文档进行整理分类。
2.语料处理。对采集获取的348 篇文章进行文本清洁。采取对照纸质教材进行人工校对,去除和纠正符号、格式、文字等方面的问题,充分确保语料质量。最终获得60 万词的生语料。该语料库主要服务于平台建设以及大学英语学习者的自主学习,所以暂不对语料进行词性和语法等方面的赋码。
3.语料存储。清洁之后的文本,统一以TXT和EXCEL 格式分存。TXT 格式文本以文件夹和文件为单位,使用英文字母或数字进行统一而有规则的命名,形成生语料库并存储入盘。EXCEL 格式文本用于平台搭建,批量存储于后台数据库。
(二)搭建CEC 平台
为保证检索速度和准确度,CETC 平台的建设采用J2EE 技术、SSM 框架(Spring + SpringMVC + MyBatis)结合MySQL 数据库的模式,可提供强扩展性功能的网络检索服务,如图2 所示。该平台基于Windows 操作系统、ECS 服务器、MySQL 数据库以及Java 编程语言。其中, Windows 系统的图形界面对用户很友好,可直观、高效地进行多任务的操作;ECS 服务器操作便捷、高效,配置灵活,适用于轻量级平台的部署;MySQL 数据库安装便捷,查询速度快,灵活度高,有利于实现轻量级平台的开发;利用Java 编程语言实现前后台交互,根据用户检索需求,将后台数据调入前端进行显示,并依赖可重用且跨平台的组件,如JavaBean,来执行更复杂的应用程序请求。以上技术框架可以创建高效、扩展性强的网页,并将网页发布至服务器,用户通过公网实现随时随地的平台访问。
图2 基于SSM 框架的平台技术路线
CETC 平台的用户可以使用针对性的检索功能来满足具体的需求,检索界面如图3 所示。其核心功能是智能检索,包含语境核心词、例句、搭配,即时展现检索关键词的使用语境,实现高效的自主词汇学习。另外,检索可设置筛选条件,利于精准化检索,满足不同水平学习者的需求。教师也可以最大限度地利用语料库平台检索语言材料,丰富自己的课堂教学,实现跨教材和跨学年的系统词汇教学。同时,针对高级用户需求,CETC 平台还嵌入了语料分析工具,可实现词性赋码、搭配分析、自动断句等功能。此外,平台还设有辅助语言学习的小功能,如单词翻译、美文推送、每日一句等。CETC 语料库平台还支持移动终端访问,随时随地助力英语学习和教学,检索界面如图4 所示。
图3 CETC 语料库平台功能页面
图4 CETC 语料库移动端界面
结 语
语料库方法是一种语言学习和教学的新型思路。在大学英语教材语料库CETC 及其平台建设过程中,教师团队和学生团队共同致力于CETC 平台的开发,深刻地感受到了这项工作的重要意义。语料库平台的建成,顺应了信息化的时代潮流,融合了语料库方法,有助于学习者较为全面地理解英语词汇及相关语言现象,提高自主学习的能力。除了核心的语料检索功能,平台上其它辅助英语学习的工具和模块也能激发学习者的学习兴趣。此外,该语料库平台基于一个动态的语料库,除了目前已有的6 套教材,后期还会加入更多的大学英语教学文本内容,并考虑加入大学英语四、六级真题文本,满足不同水平的英语学习需求,以期为英语学习和教学提供更大便利。