基于语料库的英语专业学生口语输出中的错误分析
2014-12-07韩冰梅丛晶晶付勇齐宫健宇
韩冰梅 丛晶晶 付勇齐 宫健宇
(沈阳师范大学外国语学院,辽宁沈阳 110034)
基于语料库的英语专业学生口语输出中的错误分析
韩冰梅 丛晶晶 付勇齐 宫健宇
(沈阳师范大学外国语学院,辽宁沈阳 110034)
本文结合桂诗春提出的中国学习者英语失误分析认知模型和中国学生口笔语语料库错误分类方法,对自建的“辽宁省英语专业学生口语语料库”中的语言错误进行量化分析,总结出英语专业学生口语表达中存在的错误,并重点分析高频错误出现的原因,旨在帮助提高学生的口语表达能力和水平。
错误分析 口语语料库 英语专业
1 引言
众所周知,错误分析(error analysis)在评估学生外语表达水平中扮演着重要角色。传统意义上的错误分析在20世纪70年代非常流行,但由于其在解释学生外语学习问题方面存在局限性,这一方法在二语习得研究中的运用在80年代步入低潮。(Selinker,L..Rediscovering Interlanguage.London:Longman.1994)90年代初期,随着国际学习者语料库的建立,错误分析再次被人们重视起来。研究者借助于计算机的帮助,对语料库的文本进行错误标注、词性赋码等处理,对学习者的外语表达进行量化分析。这样便很大程度上避免了传统意义上的错误分析存在的局限性。
2 错误分析方法
自错误分析这一研究方法被应用于分析学习者外语表达水平的研究中以来,各种错误分析方法层出不穷,为语料库研究提供了丰富的途径。
五维错误标注系统,是在总结先前研究方法的基础上,设计出的多维错误标注系统。(杨达复.学生语料库:错误标注与多维度分析.中国的语言学研究与应用(P155-174).上海外语教育出版社)此错误分析方法的设计遵循“控制错误代码数量、提供最大错误信息”的原则,将错误分为五维进行标注:域(rang)、阶(level)、类(class)、型(type)、因(cause)。此种错误标注系统的优势在于条理清晰,错误的覆盖面较全,为评估学习者外语表达水平提供了详细的依据。
中国学习者英语失误分析认知模型,是根据CLEC(Chinese learner English Corpus)对中国学习者英语失误分析提出的一个认知模型。模型提出将失误分为三个层面:在单词层面的词汇感知错误(如拼写),在词际层面上的词汇语法失误(如替代),在句子层面上的句法失误(如句子片段和结构缺陷)。(桂诗春.以语料库为基础的中国学习者英语失误分析的认知模型.Modern Foreign Language(Quarterly)第27卷第2期.2004,5)
中国学生口笔语语料库错误标注,主要包括时态错误、第三人称单数错误和单复数错误等。因WECCL1.0中有些错误难以判断其正确形式,所以研究者只对十分明显的错误进行了标注,对无法判断的错误进行保留原貌处理。
本研究结合中国学习者英语失误分析认知模型和中国学生口笔语语料库错误分类方法,将自建的“辽宁省英语专业学生口语语料库”中的语言错误进行量化分析,旨在揭示辽宁省英语专业学生口语表达中存在的高频错误,为教师教学和学生学习提供数据参考,使教学和学习更具针对性。
3 语料收集、错误标注以及错误代码处理
3.1 语料收集
话题多样性是口语语料库建设的重要原则之一,因此我们选择的口语测试话题涉及政治、经济、文化、体育、环境、生活、旅游、教育、科技等九个不同领域,话题覆盖面比较广泛。口语测试采用两位学生以自由讨论的方式对话题发表看法,或以辩论的方式阐述各自的观点。口语语料库建设最关键也是最耗时耗力的工作是语料的转写与标注,为此我们忠实的转写考生的录音,对用词、句式、短语等保持原样,进行多人多次校对,并应用CLAW S4对全部语料进行赋码,以便为后续研究提供更多更可靠的依据。
3.2 错误标注
在对语料进行错误标注的原则方面,本研究依据的原则是:错误即违反标准英语语法的任何语言表达错误。依据此原则,我们将错误共分为三类:单词层面,词汇语法层面以及句法层面,共21种错误。单词层面包括:动词(v)、副词(d)、名词(n)、代词(p)、形容词(j)、冠词(t)、介词(r)、连词(c)等实义词和结构词的使用错误。词汇语法层面包括:构词(s)、时态(t)、语态(pp)、主谓一致(i)、名词的数(m)、词类混淆(u)、替代(e)、冗余(g)等错误。句法层面包括:句子片段(f)、结构缺陷(l)、句法迁移(a)语义模糊(su)、语序错误(si)等错误。我们只对占总错误百分比大于等于2℅的错误进行详细剖析。
4 各层面错误数据分析及总结
4.1 词汇层面错误分析(表1)
从上表中可以看出,在辽宁省英语专业学生口语语料库1669个错误中有41.6%(出现695次)属于单词层面错误,远高于词汇语法层面及句法层面错误。在词类错误中,实词使用的错误(特别是动词、名词和形容词)在比例上要比结构词所占比例要高。在结构词的错误中,冠词的错误比例为22.9%,明显高于其它词类。
学生口语错误在词类方面所呈现的不同比例说明在英语学习中,学生的实词使用知识相对薄弱。从分析结果可知,这不仅是英语初学者的难题,对于英语专业学生也应在学习中给予足够的重视。英语实词用法多并复杂,且多数为多义词,这在无形中增加了实词在用法上的复杂度,也就增加了出现错误的几率。因此,学生在英语学习过程中应注重对实词的积累和词义的全面了解。
在结构词中,冠词的高频错误使用也应该引起我们足够的重视。定冠词the是英语中最常使用的冠词,也是中国学生在使用中错误频率最高的冠词。(杨达复,学生语料库:错误标注与多维度分析,中国的语言学研究与应用(上海外语教育出版社)这一现象揭示出中国英语学习者的另一学习难点。一方面,定冠词the的用法多,规则较为复杂,对于外语学习者来说掌握具有一定难度。另一方面,汉语中并没有对应的词及用法,这也为学生学习使用带来一定困扰。此外,介词的错误率为15.4%,也是使用过程中较为容易出错的一种词类。介词的错用主要是体现在词组中,由于介词词组数量较多,从而较易在使用中因记忆原因而产生错误。
学生在口语表达中连词的使用也是必不可少的,在词汇层面中的错误中这类错误占5.8%。这类错误的产生是学生对词意及句意理解上的错误。而占词汇层面错误14%的代词错误则是由于指代不清或错误指代,固定搭配中的错误使用等原因造成的。
表1
表2
表3
4.2 词汇语法层面错误分析(表2)
研究结果显示,语料中词汇语法层面的语言表达错误总计490个,包括8种:构词(s)、时态(t)、语态(pp)、主谓一致(i)、名词的数(m)、词类混淆(u)、替代(e)、冗余(g)。
如上图所示,名词单复数使用错误占词汇语法层面错误总数的25.5%,所占比例最大,与其他错误比,也占有较大比重。这多由于学生基础知识不牢固,英语中有许多不可数名词,和单复数同形的词,许多学生辨别不出,例如:I will give you some advics*.在一些环境中因心理因素造成紧张、压力等,也会导致第二语言输出错误。对此,学生应在学习过程中扎实基础,并在生活中积极运用语言,锻炼提高心理素质等。“主谓一致(pi)”和“冗余(pg)”次之,分别占本类错误的18.4%和17.8%,占总错误的5.4%和5.2%。导致这两种错误的原因不仅仅是学生的知识有缺陷,母语的负迁移也是总要原因之一。在汉语中动词不会因为主语单复数的变化而变化,这很容易导致学生忽略英语表达时要主谓一致这一点。再者,许多符合汉语的表达习惯的搭配例如:“因为……所以”“尽管……但是”,在英语中有不同的表达,而受母语影响经常会发现以下表达:“Although I like the car very much,but *I can’t afford it.”学生想表达“尽管……但是”这一搭配,但英语中although 不能与but连用。其中“构词(ps)”错误仅发现2处,所占比例最小,分别占本类错误的0.41%和占总错误的0.1%。虽然这该类错误所占比例较小,但也启示我们,在学习过程中要正确用词,不能主观造词。
4.3 句法层面错误分析(表3)
由上图可以看出,结构缺陷(sl)、句子片段(sf)、语义模糊(su)、句法迁移(sa)和语序错误(si)。它们占此类错误的比例分别为38.6%、24.2%、19.2%、15.5%和2.5%。
由此数据,我们不难看出句法层面的错误中,结构方面的错误占较大的比例,结构缺陷、句子片段和句法迁移都属于此。
有研究表明,讲话者在说话时主要把注意力集中在语义的加工上,他们努力使语义符合逻辑和连贯,但是却犯了句法错误。这说明激活的语义模块可使语义合乎逻辑,同时也可促使句法模块的加工或阻碍句法模块的活动。这也正是结构方面的错误占较大比例的原因。
首先,我们来着重分析一下结构缺陷错误。结构缺陷(structural deficiency)主要指一个句子中语法结构的错误,主要包括:improper splitting,pattern shifting and confusing structure。我们从团队自建的“辽宁省英语专业学生口语语料库”中选取若干例子来以此说明。例如,一位同学在谈论自己的假期生活时提到过此句话:During I spent my holidays in Beijing ten years ago.很显然,此句话存在一定的句法错误。究其本源,属于结构缺陷中的improper splitting,这在很大程度上是该同学过于注重汉语语义的结果。再如,Can you exist in society without money?这属于结构缺陷的第二种类型pattern shifting。这句话带有明显的汉语色彩,也是同学们在口语中常用到的句子之一。与此同时,第三种类型出现的频率也是很高的。例如People are homeless,no food to eat, unwearing and no water to drink,even full of illness.同学们在表达时过度注重意义的表达,只用一个相同的谓语来引出多个宾语,造成了confusing structure。
句子片段指不完整的句子。从语言学上说,一个句子通常应该具有完整的意思,完整的成分,完整的语法单位等等。而句子片段即是在此些方面不完整。例如,As they do more exercises and think deeply.此句话中只有从句,而没有主句,是明显的句法错误。
句法迁移指受到母语的负影响,导致目标语出现一定的错误。例如,They should try their best obey the strict moral standard.此句话在汉语中很常见,却不符合英语的表达习惯。很大程度上,这是过于注重意义表达引起的。语义模糊指在口语表达中意义存在不清晰的情形。例如He saw a man with glasses.这类句法错误可以通过进一步的相关解释来向听者表达清晰。语序错误占此类错误的比例较少,但也在一定程度上存在,指的是句子成分的顺序出现差错。由于此类错误只需在表达时稍加注意即可,在此不再赘述。
5 结语
通过对辽宁省英语专业学生口语语料库语料的研究,表明单词层面错误所占比例最多,其次是词汇语法层面错误 ,句法层面错误所占比例相对最少。造成错误的原因是受母语负迁移影响较为严重,导致英语表达依照汉语的语言逻辑顺序,造成言不达意的错误。
[1]Selinker,L.Rediscovering Interlanguage.London:Longman.1994.
[2]杨达复.学生语料库:错误标注与多维度分析.中国的语言学研究与应用.上海外语教育出版社,2010,10.P155-174.
[3]桂诗春.以语料库为基础的中国学习者英语失误分析的认知模型.Modern Foreign Language(Quarterly),2004,5.第27卷,第2期.
本课题为2013年辽宁省大创项目,项目编号:201310166沈师025”。