语料库驱动的药学英语词汇教学
2021-10-16战忠亮
肇 彤,战忠亮
(沈阳药科大学 文体学院,辽宁 沈阳 110016)
1 研究背景
药学专业的学习者在进行学术写作和阅读的过程中,会遇到语法和词汇等语言困难。而词汇方面的困难体现在词汇量的缺乏和词语的误用等等。传统的词汇教学模式对于药学专业的学习者并不适用,其原因主要有如下几点:第一,学习者自主学习能力强,对于以教师为主的传统词汇学习模式缺乏兴趣和热情;第二,忽略语境的单词机械背诵导致大量词汇误用;第三,有限的课本材料无法提供大量的语料,词汇复现率低。第四,不同学科的学习者对词汇的需求不尽相同,固定的词汇表设定或者词汇学习计划无法满足所有学习者的要求。
语料库的出现,为解决上述问题提供了新的途径。何安平指出“词汇教学是语料库资源和研究手段应用于外语教学实践最早和成果最多的一个领域”[1]。学者们尝试探究语料库在各个学科的词汇教学中的作用,其中包括中医词汇教学[2]、法律词汇教学[3]、物流词汇教学[4]等。
本文基于建构主义学习理念和数据驱动学习理论,尝试以微管蛋白研究方向为例自建小型语料库和专业技术词表,以此探讨语料库驱动的药学词汇教学的实践路径。
2 理论基础
2.1 建构主义学习理念
建构主义认为,学习并不是一个被动接受知识的过程,而是一个意义构建的过程,是一个以学习者为中心的活动。整个学习过程体现了学生的主动性:主动探索知识、主动发现知识和主动构建知识体系。教师和外界环境的作用是帮助和促进意义构建。何安平认为卓有成效的语言学习实际上是一个探索语言的过程[1]。语料库驱动的词汇学习模式,恰恰符合建构主义的学习理念。语料库提供大量真实且有序的语料供学习者进行观察和分析语境,进而帮助学习者探索语言,从而完成语言学习的意义构建。
2.2 数据驱动学习方法
与传统的演绎式的教学方法不同,数据驱动学习(data-driven learning)是归纳式的。学习者通过语料库观察大量真实的语言材料,对其进行恰当的筛选和分析,从而归纳出语言特征及语用特征等。甄凤超归纳了数据驱动的外语学习的四个特征:学生为中心;真实语言为输入;探索和发现的学习过程;归纳式学习[5]。数据驱动学习作为一种新兴的教学方法,以其独特的优势在外语教育中发挥着越来越重要的作用。
3 自建语料库和专业技术词表
3.1 创建微管蛋白研究方向英语论文语料库
本研究以微管蛋白研究课题为例,搜集了191篇相关研究论文,建成了语料库,包括749,197个形符,18,595个类符。所有研究论文取自2010年1月至2018年1月的《Journal of Medicinal Chemistry》和《European Journal of Medicinal Chemistry》两种期刊,论文第一作者均为英语本族语研究者。
为了使语料符合语料库基本规范,依照梁茂成等[6]提出的文本整理方法,清理了不合规范的符号与格式等,并采用UTF-8编码;为了达到样本的标准化,我们去除了论文中一些不被计算机软件识别的,或者不影响词汇分析结果的图表、附录、引文等。
3.2 创建专业技术词表
首先,我们使用计算机软件AntWordProfile,借助相关词形还原表(lemma),把词汇还原成了词族,比如am, is, are, was, were都还原为be;indicate, indicating, indicated还原为indicate。依此方法,得到词目总计17,467个。
然后,我们综合了前人创建词表的经验,选用GSL(通用词表)和AWL(通用学术词表)作为停用词表。同时,确定了词汇筛选的两个指标:频数(FREQ)和跨度(RANGE)。Coxhead[7]创建通用学术词表的时候,基于350万词的语料库,设定了最小频数为100,相当于每百万词的语料库,所选词汇至少出现大约28.5次。Wang[8]创建医学学术词表的时候,也选用了同样的标准。参照以上标准,考虑到微管蛋白语料库的库容约为75万词,我们将入选专业技术词表的词汇频数设定为≥22次。跨度指标指一个词目出现过的文章数目。跨度指标的引入,避免了词表中包含只在极少数文章中频繁出现的,而在大部分文章中从未出现的词。我们把跨度最小值定为文章数量的5%,既≥10。
在此基础上,我们人工排除了缩略词以及个别非英文字符,按频数排序,创建了专业技术词表,包含词cytotoxicity, vitro, cytotoxic, phenyl, ligand, methoxy, methyl, apoptosis, spectrum, anticancer,substitution, incubate, 和solvent。族895个,其中的前40个词为cell, tubulin, cancer, analogue, colchicines,microtubule, concentration, inhibitor, assay, drug, polymerization, potent, active, tumor, protein, antiproliferative,potency, acid, molecule, dock, moiety, synthesis, synthesize, resistant, substituent, molecular, biological。
4 语料库驱动的词汇教学
4.1 专业词汇意义的总结和归纳
学习者可以利用本词表总结归纳反应学科特色的专业词汇。比如学科特有的名词,包括常用概念(如cell, tubulin, cancer, analogue等)、基本性能(如cytotoxicity, solubility, selectivity等)和动作过程(如polymerization, concentration, incubation, proliferation等);学科特有的动词(如dock,incubate,purity,filter等);以及表示常见性质特点的形容词(如potent, novel, resistant等)。
4.2 词源和词缀教学
英语单词构成有其规律,掌握了构词规律,才可以快速准确的记忆单词。英语单词的意义主要是由组成单词的词根体现出来的,通过词缀来改变单词的意义和词性。掌握这些词根和词缀,对词汇量的提升和词义的理解有很大帮助。但是对于学习者来说,这些词根和词缀的学习难度较高,很难记忆。所以教师应该有效的利用自建语料库及专业技术词表,检索出高频专业词汇的构词成分,结合构词法知识,加深学生对词根和词缀的记忆。比如,cytotoxic是由前缀cyto-(细胞),词根tox(毒),和形容词后缀-ic构成的;polymerization是由词根polymer(聚合),动词后缀-ize,和名词后缀-tion构成的。
4.3 词汇搭配教学
学习者词汇的误用,很多情况是由搭配不当造成的。利用自建语料库可以充分了解一个单词的正确搭配情况。教师或者学习者可以借助AntConc的检索功能,通过索引行找到相关词汇的使用语境,从而了解目标词语的正确搭配,如图1所示;也可以通过搜索词汇的共现词,来了解其正确搭配,如图2所示。
Fig. 1 Concordance of the key word图 1 语境查询
Fig. 2 Clusters of the key word图 2 共现词查询
5 结语
本研究通过建立微管蛋白研究.方向英语语料库和专业技术词表,探讨了语料库驱动的药学英语词汇教学的实践路径,从一定程度上解决了药学专业学习者词汇缺乏和词汇误用等问题。本研究方法可以推广到药学专业其他学科的词汇教学研究,旨在为语料库驱动的药学英语词汇教学提供参考。