不同语言水平英语学习者对语块使用特征研究
——以独立学院英语专业学生为例
2021-06-03黄琼
黄琼
(广州大学华软软件学院,广东广州 510990)
近年来,二语习得领域对语块的研究越来越感兴趣。语料库研究表明,语言不仅由单个词组成,而且由大量固定或半固定的词组合和词串组成,在自然语言使用中占很大比例。Erman 和Warren(2000)通过对英语口语和书面语篇的分析,计算出各种类型的交际能力占英语口语课程的58.6%,书面语篇的52.3%。鉴于该研究的范围,语块将主要用于书面语。
目前,国外学者Cowie(1998)从语块能力和语言能力的角度对语块能力和语言能力进行了研究,强调了获得“语言能力”的重要性。国内学者从语块能力和语言能力的角度对语块进行了研究[1]。Wiktorson(2003)发现大多数公式化语块倾向非正式和口语化。国内学者研究语块的目的是为了发现公式化序列的使用功能。国外学者从词汇短语使用的纵向研究角度来研究语块。丁言仁通过分析参与者一年多的8 篇论文和一篇论文,对学术写作中词汇短语的习得进行了纵向个案研究[2]。研究发现[3],通过语块的输入,提高了语言流畅水平,获得了使用短语的信心,总体上有助于学术写作。
大多数关于语块重要性的研究表明,语块与外语学习具有正相关性。通过查阅相关文献,可以发现国内外的研究大多集中在语块使用能力与英语口语和书面语之间的关系,以及对语块教学方法的实证研究。
笔者发现,目前国内对独立学院英语专业学生在写作中使用语块特征的研究很少。该研究致力于解决以下研究问题: 独立学院英语专业学生写作中词块的一般特征是什么? 高水平组和低水平组在词块的使用上有什么不同?
1 研究设计
该研究收集由广州大学华软软件学院161 名英语系大一新生所写作文。所有学生都参加了第一年的两次期末考试。第一次期末考试是在2017年1月,第二次是在2017年7月。按照测试要求,他们需要在20 min 内独立完成一篇英文议论文。
1.1 数据收集
该文所使用的数据全部来自自建的学生作文语料库,包括期末考试写作部分的161 篇作文的语言数据。第一次字符数为16 520,第二次字符数为22 522。所有来自样本写作的语块都是手工识别和分类的。在论文转化为Word 之前,每一篇文章都会由作者添加〈tag〉,以便于查找相关材料。为了保证样本中所有可能的语块都能被识别,在总结Michael Lewis(1993)、Ketko(2000)、Nattinger 和De Carrico(2000)分类的基础上,将语块分为五类。
同时,以大学英语四级考试(CET-4)写作成绩为基础的数据表明,161 篇作文的得分范围在106~195 分之间,最高的是195,最低的是106。经计算,中位数为150 分,分数在150 分以上的文章被归类为高水平组,而低于150 分的则被归入低水平组。为了方便统计,将161 名新生分为低水平组(100~150分)和高水平组(150~200 分)。从低水平组参与者的写作中随机抽取30 篇文章样本,从高水平组参与者的写作中随机抽取30 篇样本文章。
1.2 数据分析
首先,该研究将收集的161 篇作文扫描成电子版,建立了一个小型的自建语料库。文中语法错误不会被纠正,在不考虑分数的情况下,随机抽取样本60 篇。其次,进行了基于语料库的数据分析。使用语料库工具AntConc 对使用最频繁的20 个语块进行统计,找出新生写作中最受欢迎的诘块,并展示LCs的频率和多样性。为了生成一个细化语块列表,在“AntConc” 中设置的长度和频率阈值的关键标准是发生2 次或2 次以上的2 个字或更多lc[4]。
此外,该研究基于He(2015)对MichaelLewis(1993)、Ketk's(2000)、Nattinger 和De Carrico(2000)的分类总结,并将语块分为五类。
(1)习俗语语块(CLC),在数据的文本类型中频繁出现的一系列单词或术语。
(2)多元词语块(Poly words,简称PWLC)是词的一个小的延伸,它是连续的,不允许在不间断的词序列中变化,因此它的功能类似于单个词项。
(3)短语架构语块(Phrasal constraint,PCLC)是一种短到中长的语块,由句法/语义特征组成,允许词汇和短语类别的变化。
(4)句子构建语块(IULC),通常指为整个句子提供框架的词汇短语。它分为3 个子类型:句首、句子框架、篇章。
2 数据分析与讨论
2.1 整体特征
表1 描述了高水平组通常比低水平组多使用102 个语块。如表1 所示,高水平组一般比低水平组多使用42 个语块。总的来说,虽然在第二次写作中,低水平组在某些类别上比高水平组取得了更多的进步,但总体而言,高水平组比低水平组使用了更多的语块。因此,这些结果也(Dong & Ke, 2011)证明了高水平群体比低水平群体使用语块更为丰富。此外,高水平组的学习者获得和产生语块的意识更强。
表1 高水平组与低水平组语块分类统计
通过深入研究发现,存在差异最大的是作文一中CLC 和作文二中SBLC。高水平组比低水平组分别多使用44 个CLC 和34 个SBLC。例如,Zhang(2010)基于语料库的研究发现,SBLC 对英语母语者的写作和口语语料库最为有利。很明显,高水平学习者对词汇化句法的掌握较好,这归因于句子和语篇的复杂性。高水平组在使用SBLC 时,作文结构和风格上表现出更突出。
然而,作文一中存在差异最小的是PCLC,因为高分组只多使用了2 个PCLC。而在写作二中,存在差异最小的是IULC,高分组最多使用了4 个IULC。但是对比两篇文章,PWLC 的使用存在很大的变化,两组都使用了更多的PWLC,而低水平组比高水平组多使用了6 个PWLC。Zhang(2004)发现外语学习者,尤其是初、中级学习者,更倾向于使用PWLC[5]。作为写作中频繁使用的语块类别。此外,Yang(2015)解释说,不仅是中国学生,美国大学生也同样会重复使用来自写作方向的词汇短语。事实上,这意味着语块习得遇到了困难。然而,考虑到深层次的原因,学习者缺乏有效的语言输入,缺乏支持主题的证据或观点,批判性思维有待提升。
在PWLC,PCLC,这两类语块中,高水平组使用的比低级别组少。Yang(2014)指出,初级学习者喜欢重复使用相同的语块,尤其是在写作测试中,因为这有助于他们构建和收集整个语篇,这可以解释为低水平组比高水平组更重视内容的质量和信号词的连贯性。
2.2 写作中词块使用差异
通过对从语料取样分析发现,在使用最频繁的20 类语块中,CLC 在高水平组和低水平组都占了11个。高水平组使用了“being punctual, keep punctual,with the development of, the preciousness of time, the importance of time, fast pace of, make good (full) use of, take advantage of, relax oneself, leave a good impression on, solve problem”,而低水平组使用了“being punctual, keep punctual, with the development of,the preciousness of time, the importance of time, make good use of, spare no effort, because of, the fast place of, enjoy oneself”.几乎有一半的词汇短语(CLC)是从题目中完全复制,而另一些词汇短语在保留关键字的前提下只做了细微的变化。可以看出,学生在写作指导中受到词丛的强烈影响。以上表明,学习者缺乏与写作相关的语块存储,他们倾向于受写作指令所限制,而很难用不同的替换表达方式[6]。
另外,两组都使用了IULC “ as time went/goes by”。高水平组在5 篇作文中写作5 次,低水平组在4 篇文章中写作4 次。可反映出,日常教学中对这类谚语的强化结果。值得注意的是,低水平组在前20名中应用了4 个PWLC,比高水平组多了2 个。即使是高水平组的PCLC 也不在前20 名,而在低水平组。所有这些都表明,低水平小组更强调段落的连贯性。
高水平组与低水平组在SBLC 的使用上有显著差异。在前20 个常用语块中,高水平组有6 个最常用的SBLC: “It is adj. (for sb.) to do/that X, If X(you); X will/would (be/do); sb. think (realize/mean)that X; first (ly), second (ly); not only...but also...; it’s adv. V-ed to sb. that...”。此外,词汇化词干It is +adj. (for sb.) to do/that X, (如: It is important for us to keep punctual.) 高级组在形容词前面加上一个副词really (例如: It is really important for us to keep punctual under whatever circumstances.)另外,高分组在使用SBLC 方面有更多的变化,虽然频率不算在前20 位。
在低水平组的文章中,使用的前四个SBLC 与高水平组相同:It is adj. (for sb.) to do/that X; If X(you),X will/would (be/do); sb. think (realize/mean)that X; first(ly), second(ly)。一般来说,低水平组倾向于人使用基本结构It is+adj.(for sb)to do/that X,句子结构逻辑简单,变化小,形容词前副词少。
3 结语
该研究基于自建小型语料库,通过比较中高级学习者,探讨中国英语学习者的语块使用偏好与独特性。研究发现:(1)通过对英语专业学生高水平组和低水平组作文中连词使用的对比研究表明,高水平组学生在习得、使用和产生连词方面更为熟练。并且,高分组普遍使用语块的频率越来越高。(2)在语块类型的使用上,高水平组的SBLC 水平显著提高,这表现在他们的句子结构更好,SBLC 丰富多样,句子逻辑更具本土性。(3)高水平组比低水平组使用更少的PWLC 和PCLC,因为高级别组更重视想法、意见和证据,而低水平组则更多地依赖于语篇中的信号词,目的是为了获得分数,并使用PWLC 和PCLC作为促进剂来保持整个语篇的连贯性。此外,两组学生都过度使用了语块,虽然语块是写作过程中的典型和公认的结构,但他们在写作实践中过于自信,导致滥用。
该研究同时也证明了以往关于中国英语学习者使用语块的研究结果。基于这些发现,寻找更合适、更有效的方法来提高学习者的输出能力,缩小语言习得与语言使用、学习者英语和母语者英语之间的差距,具有一定的启发意义。