APP下载

语料库数据驱动学习模式下的高校英语词汇教学探究

2023-03-14邱清伟聂晶晶杨廷君

华章 2023年8期
关键词:数据驱动高校英语词汇教学

邱清伟 聂晶晶 杨廷君

[摘 要]近年来,语料库语言学不仅改善了语言学的理论基础,也丰富了语言学的应用范围,使得语言学的学习更加有效率、更加灵活。通过图式理论、词块基础理论以及单词句法基础理论的研究,可以更好地理解如何利用语料库指导英语词汇的使用。这些理论知识可以帮助学生更好地掌握词频、搭配、语义,以及辨别等方面的知识。

[关键词]语料库;数据驱动;高校英语;词汇教学

随着现代信息技术的飞速进步,传统的大学英语词汇学习面临着前所未有的挑战。20世纪90年代,许多学者都尝试把语料库的知识和方法融入学习,例如Tim Johns的“数据驱动学习方法”(Data-driven Learning,简称“DDL”),这种方法利用大量的语料库数据,帮助学生更好地理解和掌握所学知识,从而更高效地学习和掌握所学知识。DDL是一种数据驱动学习方法,通过收集海量的数据并将数据按照不同主题、不同方向、不同目标组织起来,帮助学生进行自主学习,以便更好地掌握所学知识。

一、语料库与数据驱动学习模式

(一)语料库的概念及分类

语料库(corpus)也被称作“语言数据库”,是储藏着丰富文本的宝藏,汇集了众多文本,如书写文本、口头文本等。按照它的采集原则及方式,corpus可以被划分为:第一,异质语料库,指没有特定语料收集原则,广泛地进行各种语料的收集并原样储存的库。第二,同质语料库,指储存的语料均为同类的库。第三,系统语料库,指为了保证语料的平衡性,按照一定的比例收集语料,客观存储语言事实的库。第四,专用语料库,则指针对特殊的需求进行收录的语料库。

(二)数据驱动学习模式的提出及特点

数据驱动學习方法是一个新的方法,建立在20世纪90年代初的数据库语境之上,学生可以根据自己的想法,使用数据分析来学习英文。这种方法的核心思想是:在学生自有想法的基础上,借助数据分析来实现对所学内容的理解与深化。同时,学生能够通过对这些数据的自主理解、分析,逐渐总结出该语言的使用规律,从而能够更好地解决在学习中存在的问题[1]。

二、数据驱动学习的理论依据

(一)建构主义教学观

建构主义的理念强调通过让学生主动参与到课程的讨论和互动当中,帮助他们更好地理解和掌握所需的知识。通过这种理念人们不难认识到,单靠教师的讲授和指导可能无法帮助学生更好地理解和掌握所需的知识。因此,建构主义的理念鼓励学生通过主动参与和互动来发展他们的独立思考和创新能力。随着科技的发展,如何实现有效的教育,已经成为当今社会发展的关键。因此,建立完善的英语语料库,不仅能够帮助教师更好地了解学生的学习情况,还能够有效地指出学生学习中的薄弱环节,使他们掌握知识时更加有的放矢,发挥潜能时更加如鱼得水,最终将以学生为中心的教育理念贯彻到底。

(二)自主学习理论

自主学习理论强调学生应该主动探究和掌握知识,通过数据驱动模式,学生可以从语料库中搜索相关词条,并在语言环境中自主学习,掌握单词的搭配和用法,从而在所学知识的帮助下更好地进行交流。

(三)词汇语法理论

在现代语言学中,语法与词汇是两个非常重要的领域。语法作为语言的核心结构,它的存在决定了使用的每个单词的含义。Sinclair指出,“slot-and-filler”的模型未能全面反映出语言的真正含义,而“前计算机时代”的理论更多地停留在表面,缺乏深度探究。因此,将一个词纳入一个语法结构中,需要其兼具一定的词性和特定的语法含义,还需要其他因素的相互配合。词汇与语法的重要程度旗鼓相当,因此在创造有效的句子结构时首先应该考虑二者的统一。然而,根据词汇语法学的观念,学生可能会将单独的字母看作是创造句子结构的关键因素。Sinclair建立了一个用来表示单个单词之间复杂关系的模板,并将这种复杂的关系诉诸为三个层次:第一层,即单个单词之间的搭配(collocation),一般情况下,这种搭配的位置在单个单词的4个字之间;第二层,即单个单词之间的语法连接,一般情况下,这种连接的位置在单个单词的两个字之间;第三层联结则涉及语义偏好(Semantic Preference),即一个单词和其他单词之间的相似性,这种偏好可以反映出该单词的语义

特点[2]。

(四)词块理论的理据

Lewis的观点表明,语言的发展主要依靠对真实语句的掌握。因此,早在1993年,他的词块中心教学法概念就已得到普遍重视,并且被越来越多的人采纳。而Wray则将语言模型称为语言块,而后语言块则成为一种常见的、被广泛应用的语言模型。这些语言模型在学生的大脑里进行整合,因此它们能够被快速地理解并加以应用。随后,Nattinger和Delarrico在他们的研究中发现英语交流并非只依靠一个简单的语言模型,而是依靠一系列语言模型来进行。而该领域最新的研究发现,拥有良好的语言技巧的学生可以利用更多的句子来进行语言的综合运用,其中最直观的效果可以通过这些学生的英语写作体现出来。

三、数据驱动学习模式下的高校英语词汇教学应用

(一)词汇搭配学习

对于广大英语学习者来说,学习词汇的重要性不言而喻,它不仅影响着句子的形式,还影响着句子意思的表达。为了让学生能够更好地表达自己的想法,在教学中教师能够使用DDL教学模式,从BNC语料库中查找特定的搭配,帮助学生理解和掌握更多该门语言的使用技巧。“problem”一词是“solve the problem”的一个重要组成部分,当从BNC的语料库中提取“problem”的信息,经过筛选,被提取出了568条索引行,其中“problem”最常见的动词搭配分别是:tackle、unlock、remove和conquest。经过仔细对比研究,学生发现索引行上的词语是日常使用的同时,也意识到在使用这些日常用词的时候存在着某些不足。

上述例子中提及的搭配是一种语言技巧,可以帮助学生更好地理解文本中的词语,并以更有效的方式将它们组合在一起。这种技巧使得词语之间那种绝非偶然的关联性变得更加紧密。要熟练掌握这种语言技巧,就得从词组之间的相似性、相互期望和吸引力、搭配成分的类似性等词语搭配的形式特征说起并加以研究,因为这些都是词语搭配研究的重要方面[3]。

通过语料库可以更加有效地指导学生使用常见的词组进行学习。例如,教师可以引导学生研究“absolutely”与BNC语料库中其他常见的形容词之间的搭配情况,并找出它们之间存在的共同点:指明特定事物某种程度上的特征,例如“sure”和“certain”;指对某个事物特征的判断,以及其他一些有助于描述人、事、物的术语等。

通过对“get+adj”结构中“get”的研究,发现“get”是“系动词”中常见的词汇。因此,教师可以利用语料库来客观地评估学生“get”的使用情况。通过这种方式,學生可以更准确地进行句子意思的表达,搭配词是学生最常用的,但也有少量搭配词就显得不那么地道,比如“get answer、get feelings、get the entertainment”等。综上所述,“get”广泛使用的常见意为“得到、获取”,并且被认为是“万能动词”中的一个重要动词,在不同的语境中能发挥各种作用。

(二)语义韵的学习

根据Sinclair的研究,许多词汇都会出现在某种特殊的文化背景中,而随着他的研究推进,这种被称作“语义韵”的文化背景,将含义和目的的功能性灵活地组合在一起,使得选定的词汇都会形成某种特殊的音乐节奏。DDL学习模式能够帮助学生理解词汇的含义,包括积极、消极和中立的含义;能够帮助学生准确地理解文章的情感,从而更好地运用英文来表述思想。相比之下,传统的教学方式往往会忽视这一点。通过对BNC语料库的研究,可以发现如“commit”作为一个负面的动词,与其相关的宾语通常也具有负面的含义,比如“crime”或“suicide”。因此,学生便可以更好地理解“commit”的含义,并且在不同情况下正确地运用它。

由此可见,语义韵的研究对于理解语言来说至关重要,通常被划分为正面、负面和中立三类。其中,负面的语义韵通常表现出一种显著的负面情绪,这种情绪所产生的影响会牵连到句子的字面意思的表达及句子的内在意义的呈现;当使用积极的语言时,通常会出现一种良好的语义韵,这种语义韵通常会由一些带有积极意味的词汇来完成;使用中性的语言时,则会出现一种相对较为混乱的语义韵。这么说来,语义韵通俗而言就是指语言在不同语境下的表达能力。通常将这些表达能力归纳为两种:一是通过数据分析来探索语义韵的本质,如语义、语调等。二是通过数据驱动来分析语义韵的形成机制,如语义分析、语义分析的组成、语义分析的变化趋势等。在阅读文章时,学生则可以利用相关语义韵的索引行来理解文章中的关键字。例如,如果用“rather”来表示一个动物,那么它的索引行中的关键字可以帮助学生更好地理解这个动物的含义。这些关键字可以帮助学生更好地理解文章的字面意思及其内在含义[4]。

(三)利用语料库进行词频统计分析

如今,我国的汉字数目庞大,但并非所有的汉字都需要精通。教师应该重点关注那些对学生生活中日常表达更为重要的、更具实际意义的汉字。唯有这样,学生才能够更好地理解并应对日常生活。使用语料库的词频统计技术,能够更准确地把握各个层次的词汇。例如,根据Francis和Kucera的研究,拥有一百多万个词的Brown语料库中,出现次数最多的单词涵盖大多数常见的英汉翻译。例如,出现次数最多的前1000个单词能够涵盖64%常见的英汉翻译;出现次数最多的前2000个单词能够涵盖80%常见的英汉翻译;出现次数最多的前3000个单词能够涵盖71%常见的英汉翻译;出现次数最多的前4000个单词能够涵盖79%常见的英汉翻译;出现次数最多的前5000个单词能够涵盖87%常见的英汉翻译。显然,2000个最常使用的单词是整个句子层面的重要组成部分,它们的使用率达到80%。因此,教师必须耗费更多的时间和精力来讲解这些重要的句子。

(四)利用语料库进行词语辨析教学

通过语料库语言学方法,学生能够更好地研究同义词在不同语境中的频率分布,并统计它们与关键词的相似性。此外,还可以观察索引行中出现的同义词搭配,以揭示它们之间的语义关系和语义韵律。由于拥有庞大的语料库,可以收集到大量的有价值的证据,这些证据为学生提供了丰富的同义词的用法和语境,帮助学生更好地理解同义词之间的细微差别,并且能够客观、全面地对它们进行描述。

1.词频分布差异

研究表明,同义词之间的使用频率和语域分布存在显著差异,这种差异不仅体现在定性上,还体现在定量上,从而可以更好地理解和掌握它们之间的关系,以便更好地应用到实际情境中。

根据BNC语料库的宏观分布情况,发现“utterly”和“absolutely”在不同语体中的应用频度存在显著差异:“absolutely”在各语体中的应用频度均大于“utterly”,其应用频次在小说中最大。这表明,在做出决策时,“utterly”和“absolutely”的应用频度是最重要的,因此,建议学生在做出决策时,要特别关注“utterly”和“absolutely”,以便能够得出最佳的结论。

2.搭配差异

利用对比技术,学生能够更好地识别不同的单词。首先,要收集并比较每个单词的搭配;其次,使用数学方法和统计学方法,评估它们的重要性。如此就能够推断出每个单词的典型搭配情况。

学生在学习过程中,通过语感不能找到的词语搭配,能够使用数据驱动中定量分析的方式快速解决这一问题,并且也有助于帮助学生快速地纠正词汇搭配错误问题,让学生能够从上至下地进行归纳学习,有助于提高学生的自主学习

能力[5]。

结束语

综上所述,在高校英语词汇教学实践中引入语料库数据驱动学习模式,能够帮助学生更好地掌握英语词汇并提高词汇的应用能力,但同时也要注意在引入语料库数据驱动学习模式的过程中要遵循相关理论依据,重点从词汇搭配、语义学习、词频统计分析以及词语辨析等四个方面着手,通过语料库数据驱动学习模式的优势来提高教学质量。

参考文献

[1]王家义.基于语料库的英语词汇教学:理据与应用[J].外语学刊,2012(4):127-130.

[2]骆雁雁.基于语块理论的大学英语词汇教学模式研究[J].外语学刊,2009(6):168-170.

[3]章柏成,韦汉.英语词汇教学的呈现方式研究[J].外语与外语教学,2004(4):24-27.

[4]谷小娟.认知语言学对英语词汇教学的几点启示[J].天津外国语学院学报,2002(2):41-44.

[5]李莉文,任长惠.大学英语词汇习得及对教学的启示[J].外语与外语教学,2001(6):40-41+57.

作者简介:邱清伟(1987— ),男,汉族,福建泉州人,泉州信息工程学院,讲师,本科。

研究方向:英语教学方法。

聂晶晶(1983— ),女,汉族,晋江人,讲师,泉州信息工程学院,本科。

研究方向:英语教学改革。

指导老师:杨廷君(1965— ),男,汉族,重庆渝北人,宁波大学,副教授,硕士。

研究方向:语料库语言学、应用语言学、文献计量分析。

猜你喜欢

数据驱动高校英语词汇教学
基于网络与数据智能化的数码印花产品设计定制模式研究
数据驱动理念在大学英语课程中的应用
高校英语语境教学的现状及对策探究
大数据背景下的警务模式创新研究
基于就业导向的高校英语创新教学研究
基于语言学理论指导下的高校英语教学探讨
高中英语词汇教学的现状与改进策略
小英语词汇教学问题及解决方法
记初中英语词汇教学的一次归类、整合改革及反思
建构主义视角下高校英语教学活动的探索与分析