APP下载

基于自建语料库的英语写作词汇深度知识发展特征研究

2019-07-31何微微

唐山师范学院学报 2019年4期
关键词:句法语料语料库

何微微

(昭通学院 外国语学院,云南 昭通 657000)

一、研究背景

词汇深度知识研究始于20 世纪90年代中后期。Anderson 和Freebody 将词汇深度定义为词汇的充分并深度理解[1];Read 认为词汇深度是学习者词汇知识了解的质量,即在多大程度上了解并掌握该词[2];Qian 指出词汇深度为学习者对词汇多方面知识的了解,即学习者对词汇的掌握程度[3]。研究学者充分肯定词汇深度知识是除词汇量外的词汇知识总和,因涉及面广,难以在一次测试中完全覆盖,只能以各自研究目的、操作性地评估学习者词汇深度知识的掌握情况。

国外二语产出性词汇深度知识研究多以选择目标词汇进行测试的方式如Schmitt 和Meara 等)来评估学习者产出性词汇联想和词缀的发展[4],这种方法无法摆脱目标词选词不足、脱离语境等问题;因而部分研究者转向从写作文本评估产出性词汇深度发展,研究词汇在文本中的实际用法:如Lenko-Szymanska 以波兰的英语专业二年级和四年级学生的写作文本语料评估词形、词汇—语法、使用和语义四方面的发展情况,表明词汇深度知识随着英语水平的提高而进步,学习者在派生词、搭配和固定词组方面掌握较差[5]。国内基于二语写作文本评估学习者产出性词汇深度知识发展情况研究中,比较有代表性的是谭晓晨横切面探究英语专业学习者在拼写知识、形态-句法知识和语义知识的发展情况,指出词汇深度知识随着英语水平的增长呈现出非同步发展的趋势[6,p52]。Lenko-Szymanska[5]和谭晓晨[6,p53]以定时写作文本为研究语料,将前人研究中较少涉及的拼写、语义等知识包含在内、较为全面地评估学习者在英语写作中的词汇深度知识情况,但研究结论不一致,有待进一步验证;此外,Lenko-Szymanska[5]和谭晓晨[6,p53]研究语料文本均为横切面研究,缺乏对大学生四年的历时语料进行的跟踪研究。鉴于此,本研究基于自建语料库的同题定时写作文本,采用纵贯研究方法,考察一组中国西部地区英语专业学生4年中的英语写作词汇深度知识发展变化情况,试图探究其写作词汇深度知识习得的规律性及存在的问题。

二、研究设计

(一)词汇深度界定

本研究基于Nation 提出的词汇知识理论框架——完全掌握和了解一个词应包括词形(form)、位置(position)、功能(function)和词义(meaning)[7],借鉴谭晓晨词汇深度知识分类[6,p53],将词汇深度操作性界定为由拼写知识(生造词、增音、减音)、语法—句法知识(一致、动词、数、冗余、省略、句式、冠词等)和语义知识(搭配、词义和固定词组)构成。

(二)语料来源与收集

研究语料来源于中国西部地区某省属普通高校英语专业30 名学生的写作。学生年龄为18~23 岁,其中男生4 名,女生26 名。写作主题统一为2012年英语专业八级考试题目Comment on College Students' Attitude towards Phones Calls and Text Messaging,文体要求为议论文,课堂45分钟内完成,不能查阅词典和参考其它资料,要求英语书写清晰,词数不少于150 词。

2014年9月,收集完成学生一年级的作文,2015年9月、2016年9月和2017年9月分别完成学生二、三、四年级的作文,历时4年收集了学生在同一写作要求下完成的120 篇有效作文,词数分别为6 369 词,8 384 词,8 601 词,7 011词,语料总量为30 365 个形符。

(三)语料标注

根据词汇深度的操作定义观察并人工标注生语料,拼写、语法—句法和语义知识三大类范畴的具体错误类型及标注见表1。标注完成后,为确保无误,邀请外籍专家共同检查、核对。

表1 词汇深度涵盖类别及标注

运用AntConc 软件统计出错误频率,按照标准化频率公式统计出每1 000 词的相对频率:

标准化频率(每千词)=观察频数÷总体频数×1 000

其中,观察频数即检索词项实际出现的次数;总体频数即语料库的大小或总形符数[8]。

以上步骤所得数据使用SPSS 13.0 和语料库卡方检验器进行统计分析。

三、结果与讨论

(一)拼写知识

表2 显示,拼写知识中减音类别错误最多、增音错误相对较少。为考察拼写知识的发展情况,采用对应分析法进行比较,发现该组受试在1~4年级中拼写知识发展没有呈现出具有统计意义的显著性差异(X2=1.093,p=0.982>0.05)。这一研究结果与谭晓晨不一致[6,p53],一定程度上反映出拼写知识的发展与研究对象自身的英语水平相关:谭晓晨研究的是全国重点高校英语专业学生[6,p53],本研究对象为西部地区学生,英语水平方面存在一定差异。

表2 拼写错误相对频率

为具体探究拼写错误各类型,增音、减音、生造词类别分别进行卡方检测,统计结果表明仅减音类别呈现显著差异(X22~3年级=16.09,p=0.000;X23~4年级=12.05,p=0.000)。如表2 所示,减音(57.67%)也是拼写错误最多的类型。观察检索行,发现32.3%的减音拼写与不发音字母相关,如People aremor (more)isolated from each other.39.2%与非重读元音相关,如

Our society has become more and moreconvenent(convenient) and colorful.

这与何安平[9]、王雪文和孙蓝[10]、谭晓晨[6,p55]等研究结果基本一致,再次证明语音表征在拼写习得过程中起着重要作用:不发音因素导致形素位置缺失,非重读元音导致对应形素模糊。

分析增音错误(18.92%)发现,增音多发生在单词拼写中部,如proud→pround这与Tesdell、Laufer 等研究结果基本一致[11,12],说明单词的头尾在学习者心理词库中的语音标识较强。进一步检索语料发现,高达58.31%的增音与非重读元音有关,如technology→techonology,children→chirldren;19.34%的错误与不发音字母有关,如from→frome,work→worke;双写辅音字母相对较少,仅占5.34%。该结果也证实Mitton 指出的造成语音拼写的主要误区为非重读元音、不发音字母和双写辅音字母[13]。

检索生造词拼写错误(23.41%),发现62.52%为纯拼写错误,如competate、expercially;15.77%为曲折或派生词错误,如radialion;10.22%为词性转换错误,如needest。分析造成生造词错误的原因主要有目标词汇空白,过度概括、使用规则。

(二)语法—句法知识

表3 为语法-句法错误相对频率表。

表3 语法-句法错误相对频率

纵向观察表3 可以看出,学习者在一年级时,语法—句法知识错误较多,此后,呈下降趋势,但四年级时,知识错误出现大幅反弹。因此,学习者语法—句法知识发展的关键期在2~3年级,也说明语言技能的学习经过一段时间后,可能会进步缓慢、停滞甚至产生退步[14]。采取对应分析法考察语法—句法知识的发展情况,结果显示在1~4年级中没有出现显著性差异(X2=8.228,p=0.994)。这说明,语法—句法知识没有随着语言水平的提高而增长,反映出了语言学习过程中的非线性和复杂性特点。

从表3 还可看出,在1~3年级阶段“一致”“动词”“省略”“句式”“冠词”子类别中的相对错误频率呈现递减趋势。卡方检验结果显示各类型错误都存在显著性差异,这说明语法—句法知识发展的不平衡性[6,p54]。

从表3 可以看出,动词错误是学习者普遍存在的难点。结合西部地区学生英语水平实际,对自建语料库中的动词错误详细归类[15]、标注并统计频率:动词及物性[gs, vb1],固定句式动词误用[gs, vb2],主谓一致[gs, vb3],动词时态[gs,vb4],语态[gs, vb5],情态[gs, vb6],虚拟语气[gs,vb7],定式[gs, vb8],不定式[gs, vb9],动词缺失[gs, vb10]。结果见图1。

从图1 看出,动词及物性是困扰学习者最突出的问题,如I agree[gs,vb1]it ….(vi.误用为vt.);…to link between[gs, vb1]friends …(vt.误用vi.);…asked my parents[gs, vb1]get help(宾补误用)[16]。

图1 动词失误频数统计图

动词时态也是动词习得难点。检索自建语料库各类时态误用情况,发现一般现在时的误用远超过其它时态,其次是一般过去时,第三为现在完成时;检索同时发现学习者没有使用过去将来进行时、将来完成进行时态等复杂时态。这一结果可以用Ellis 提出的“回避策略”进行解释,即在定时写作条件下,学习者迫于时间或心理压力,倾向于有意回避使用不熟悉的时态[17]。

(三)语义知识

表4 显示出学习者1~4年级语义知识的发展同样呈现出非线性发展趋势。对应分析结果显示各阶段语义知识的发展没有显著性差异(X2=1.775, p=0.94)。对各类语义错误进行卡方检验,发现固定词组是唯一没有显著差异的语义类别。观察表4 得知,固定词组错误相对频率不高,是受试相对掌握较好的语义范畴。语料库检索发现,学习者在介词词组(22.38%)和动词词组(30.21%)出错较为频繁,如:To the contrary[se, ph]…;…pay more attention on[se, ph]…。

表4 语义知识错误相对频率

词义类项中近义词错误约占65.34%。近义词指词义中的某一义项的基本意义相似或相近,但在词义类联接选择上并不能随意替换。检索发现,形容词近义词是学习者的一大难点,学习者没有掌握近义词之间的细微差别,母语思维很大程度上影响着词义类联接,例如strange people、recent news、fraud teams、a big influence。

搭配(52%)是学习者普遍存在的困难,语料库卡方检验(X21~2年级=14.85,p=0.000;X22~3年级=41.30,p=0.000;X23~4年级=44.75,p=0.000)表明受试在1~4年级中搭配错误频率在语料库中存在显著性差异。索引检索分析,动词—名词搭配错误约占59.18%,该研究结果与谭晓晨[6,p55]、李玲[18]等一致,说明动词—名词搭配是中国英语学习者的普遍困难。

选取do,get,have,make 四个高频及物动词为搜索词,在自建语料库中检索其名词搭配情况,发现母语思维很大程度上影响学习者目的语搭配。英语动词do,get,have 与中国学习者母语表达较为一致,学习者掌握较好,如do things(做事情),do exercise(做练习),get information(得到信息),get a conclusion(得出结论),have different views/attitudes(有不同观点/态度),have trouble(有困难)。动词make 常用搭配是make use of,make a contribution,但是受到母语思维负迁移影响,学习者表达“做梦”为make a dream(应为dream a dream),“挣钱”为make money(应为earn money)。

此外,研究者还发现,学习者倾向于使用简单动词词汇进行写作语言表达,该研究结果与Laufer[19]、谭晓晨[6,p55]等基本一致,说明在整个英语专业学习阶段,学习者复杂的语义知识网络未能有效建立起来,自由产出动词及搭配仅限于日常词汇。

四、结语

本研究发现,词汇深度知识中的拼写知识、语法—句法知识和语义知识的发展都呈现出非线性、复杂性的特点。语音表征在拼写习得过程中起着重要作用,非重读元音、不发音字母是造成学习者语音拼写的主要困难。语法—句法知识受到母语迁移影响大,特别是在二语学习的初级、中级阶段,我国英语学习者主要任务是识别、记忆单词或词组,并能够恰当组词成句。学习者会借助已掌握的母语语言的词汇、句式实现目的语词汇和句式表达,这使得学习者缺乏足够的英语词性、句法意识。教师应有意识地进行中英两种语言的比较,积极挖掘汉语、英语的共同结构,特别是动词教学为重点和难点,培养学习者词性意识。语义知识方面,学习者依然处于以母语词条为中介阶段。因此,强化真实、语境化的语言输入,削弱母语的影响是语义学习的重点。

猜你喜欢

句法语料语料库
基于归一化点向互信息的低资源平行语料过滤方法*
述谓结构与英语句法配置
平行语料库在翻译教学中的应用研究
《语料库翻译文体学》评介
濒危语言与汉语平行语料库动态构建技术研究
句法二题
诗词联句句法梳理
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入
信息结构与句法异位