独立学院非英语专业高低水平学生写作错误研究
——基于小型语料库的数据分析
2014-01-09张晓燕
张晓燕
( 集美大学 诚毅学院 外语教学部,福建 厦门 361021 )
独立学院非英语专业高低水平学生写作错误研究
——基于小型语料库的数据分析
张晓燕
( 集美大学 诚毅学院 外语教学部,福建 厦门 361021 )
利用自建小型语料库,运用语料库分析软件,对独立学院非英语专业高低水平学生写作错误进行初步的调查、统计和对比分析,概括出了此类学习者内部不同水平学习者在写作方面的一些特点,找出高低水平学生的常犯写作错误,分析写作质量与错误类型的相关性,发现最能显著区别写作水平的是句子表达因素,并提出相应的教学建议。
独立学院; 基于语料库; 错误标记; 错误分析
一、引言
语料库语言学是近 40年来在国外快速成长起来的跨领域学科,现已经成为现代语言学的一个重要分支。国际上较有影响力的英语语料库有 BROWN、LOBBNC、ICLE、LOCNESS等,国内 CLEC、SWECCL等中国学习者语料库也颇具规模和研究价值,这些语料库的建立为相关研究专家提供了一手的研究数据。因此,国内近年来基于语料库的二语习得研究成果不断问世,在中国期刊网截至2014年2月以“基于语料库”为全文搜索结果显示,相关研究论文已达17622篇,而以“二语习得”为关键词在搜索结果中显示找到 273 篇相关文章。这些研究或从某个词看词汇习得的负迁移问题(何淑琴,2010;刘春阳,2006),或对学习者使用的某个常见虚词的语义习得(闫丽莉,2003;张碧琼,2012; 张萍,2007),或研究高职非英语专业学生英语词汇能力(王振,2012),或对比语料库文本和本族语在某个语言表达上的差距(孙静,2007),然而鲜少基于语料库研究独立学院非英语专业学生写作错误的研究。
独立学院学生的综合能力相比其他本科院校而言相对薄弱。因此,其英语教学必然会碰到更多的困难和挑战。本文尝试基于语料库的分析方法来探索独立学院非英语专业不同水平的书面英语错误,自建微型语料库,通过一些必要的对比分析,显示该学习群体的写作错误概况,为英语教育者了解“三本”学生二语学习过程的困难及采取相应的教学策略提供一些有益的参考。
二、研究设计
本研究以集美大学诚毅学院非英语专业大二年级学生为研究对象,采用定量和定性两种研究方法,对其限时半小时完成的150篇作文的错误进行分析,旨在回答如下几个问题:
第一,独立学院非英语专业不同水平学生写作能力如何?常犯的写作错误有哪些?该群体碰到的最大的困难是什么?
第二,错误类型间是否有相关性?有的话,哪些错误具有较强的相关性?
第三,有否某种错误能显著区别高低水平?
第四,有没有相应的教学建议?
研究过程即对错误的分析参照高远的五个步骤:采样,识别,描写,解释和评价(2002)。
(一)采样与识别
查看集美大学诚毅学院非英语专业大二年级学生的基本情况,发现这些学生来自31个省份。要求在半小时内完成题目是“On Volunteering”的文章,字数不少于 120。笔者根据分数,取高中低三组各50份,为了比较高低水平作文,仅选取高水平(HL)和低水平(LL)两组作为对比组建成一个微型语料库。并请工作至少 5年以上的英语教师评改作文,找出写作错误。
在本研究中错误标记类型采用桂诗春、杨惠中(2003)在 CLEC中的错误分类方法,即把语言错误分为词形、动词词组、名词词组、形容词词组、代词、介词词组、副词、连词、词汇、搭配和句法(fm,vp,np,aj,pr,pp,ad,cj,wd,cc,sn)共11类错误,61种类型。
(二)研究工具
研究采用定量定性研究相结合的方式。文中数据处理采用AntConc3.3.5w,利用索引条检索出相应的错误类型数量,所用数据分析软件为SPSS12.0.1,用来分析11种错误类型和作文分数的相关性。Excel2000 则用来转换标准频数。
三、数据分析与统计
(一)概况
根据 AntConc3.3.5w, 高水平作文子语料库中,总词符7188,字符数32777,句子数480。每篇文章平均长度为143.8个字符。平均句长为15词符。低水平作文子语料库中,总词符 5222,字符数268917,句子数407。每篇文章平均长度为104.4个字符。平均句长为12.8词符。从平均句长看,高水平学生比低水平学生会写更长的句子。
(二)句子复杂性
本研究进一步分析两组样本中的句子复杂性。粗略浏览统计数据,发现学习者在句子结构呈现上还是较为简单,在此,笔者从学习者常用的定语从句和状语从句入手,检索以“which,whom,whose”为关系代词的定语从句和以“because,if,when”引导的状语从句,粗略地估计两组学习者的句子复杂程度,具体情况如表1所示。
表1 句子的复杂程度对比
数据显示,在定语从句使用上,高水平学习者比低水平学习者用得频繁,而在状语从句的使用上,低水平学习者比高水平学习者用得频繁,即高水平学习者对于两种复杂句类型都有使用,尤其善于使用“which,whom,whose”来表达较复杂的关系,而低水平学习者显然定语从句还不能运用自如,仅用“because,if,when”来表达原因、条件、时间。此外,笔者还发现简单句句数占了句子总数的79%,也就是说两组学习者多使用简单句,还不太熟悉一些如以“whose”引导的复杂句。只是相比低水平组,高水平组会写更长的简单句,而且一个主语常跟随两个或更多的动词做谓语。而低水平组的同学对于简单句衔接凌乱,无逻辑。如:
例1 We know,volunteer is free,they do they can do to serve for others and get no pay.
例2 As we know,the students of university is a member of society.
例 3 People do this job have many things.
此外简单句常见典型错误还体现在主谓语的不一致,如:
例4 As we know,the students of university is a member of society.
例5 The govenment give people do this job everytime.
另外很多简单句表达结构不完整,再如:
例 6 Not only china but also all the countries.More and more on volunteering.
例7 As we know,the work of volunteer can help society.More piece and happiness.
例 8 Especially,As a student.We should to do more than others.
(三)词汇衔接手段的使用
尽管语料中没有接续词使用错误类型,本研究在此从一些常用词汇衔接手段的出现频率来比较不同学习者对篇章知识的掌握程度。在此考察五类词汇衔接手段,即:递进,信号词包括“also, likewise,furthermore,moreover,what is more(what’s more),in addition,besides,for example,for instance”;转折,常用信号词包括“though,although,but,yet,however,nevertheless,on the contrary,in spite of,despite,otherwise”;次序,信号词包括“first,second,third,then,next,after,before,last,finally”;因果:“since,because,so,thus,therefore,as a result,consequently,accordingly”;总结,被考察的词和词组包括:“in brief,in a word,in short,in conclusion,all in all”。表2显示上述五种接续词的分布情况。
从AntConc3.3.5w搜索出,在高水平组中,表递进的词语衔接手段使用频率最高,主要使用的接续词依次是“and,also,for example,such as,what’s more,besides,in addition,furthermore,moreover”;而在低水平组,表因果的词语衔接手段使用频率最高,主要使用的接续词依次是“and,also,for example,such as,in addition,besides,moreover”,两组中使用频率最高的是“and”,其次是“also”,第三是“for example”和“such as”,两组学习者都较少用“likewise,furthermore,for instance”来进一步分析观点。
表2 接续词频数
(四)错误分析
利用AntConc3.3.5w,根据错误代码搜索出相关的检索条,统计相关数量。为方便比较,再对原始数据进行处理转换成标准频数,转换公式为:(错误数/总字符数)*20,0000,则显示了每20,0000 词出现的错误率,如表3所示。
表3 错误类型频数(每200000 词)
表3转换成图1,更直观地显示两组不同水平的学习者在11种错误类型中出现的频数上的差异。
如图1所示,LL的曲线都在HL之上,并且两条都具有相同的趋势,即两组样本在各个错误类型中的比重一样。也就是,不管分数高低,两组学习者的犯错误类型分布比例是一样的。拼写、动词短语、用词和句子错误在两组中具有较高的频率,且低水平组频率是高水平组的两倍。其中用词错误具有最高频率达3468。
图1 错误类型分析
(五)相关性
表4报告了11种独立变量(fm,vp,np,pr,aj,ad,pp,cj,wd,cc,sn)和学习者写作分数之间的相关性。当 p<0.01,通过皮尔森分析,分数和写作错误呈正相关。特别是句子错误和分数呈最大相关( 457.0-=r ),即句子错误最能影响作文质量,动词短语错误其次( 453.0-=r ),词形(fm)第三( 329.0-=r );词汇(wd)第四( 313.0-=r );代词错误(pr)虽也与分数呈正相关,但r值最低,为 267.0- 。结果表明,若其他条件一样,学习者上述五种错误犯得越多,写作质量越低。而在 11种错误中动词短语(vp)与词语搭配不当(cc)和句子(sn)呈正相关,r值分别达0.317 和0.318;词汇(wd)和句子(sn)呈正相关,r达0.358。也就是词语搭配不当和句子犯错越多,动词短语犯错也越多,此规律也适用于动词短语和句子错误与其他两者的关系。
表4 11种错误类型的相关性①
(六)总结
利用自建小型语料库,运用语料库分析软件,对独立学院非英语专业高低水平学生写作错误进行初步的调查、统计和分析,概括出了此类学习者内部不同水平学习者在写作方面的一些特点:第一,不管作文质量如何,两组学习者的犯错误类型分布比例是一样的。高低水平学生的成绩与词形、词汇的使用、动词搭配和句子错误类型的错误数量具有很强的相关性。第二,词汇错误是所有错误中所犯数量最多的,两组对象中,学生书面语错误带有基础性,拼写错误尤为突出,这说明学习者基本功不扎实,尤其是低水平组学习者。第三,词汇的使用错误和句子错误相关性最为显著,r值达0.358,也反映了学习者词汇运用能力较弱的现象。第四,对高低水平组学生而言,最显著区别还在句子出错程度上。换言之,句子表达最影响学生的整体写作水平。
四、启示
上述研究结果为本群体学习者的英语教学研究和英语学习提供如下启示:
(一)以语料库为基础的数据驱动性英语学习可以成为英语教与学的一种有益补充。对学习者的写作进行系统研究始终不能单靠有限的少量的中间语材料,一方面,本群体研究人员自建特殊群体的微型学习者语料库,为定性和定量相结合的二语研究提高了较好的方式,还可以通过英语语料库、中国学习者语料库进行中间语的系统对比分析(CIA),研究母语负迁移对二语习得过程的影响。此外还可以专门利用大型语料库来研究词汇的搭配结构,借鉴 Renouf 和 Sinclair(1991)提倡的以短语结构为纲的英语教学,而后再扩建到句子层面。另一方面,学习者可以从网络上获取大量可读文本作为语料资源,通过对比学习真实语料,夯实语言的准确性和地道性,来提高二语习得。
(二)作文质量的好坏不是仅看出错数量,或是否用高级的词汇和复杂的句式,而是看能否准确地表达思想。总体而言,独立学院非英语专业高低水平学习者对语言的使用还非常不精准,应继续扩充词汇,积累语言,对高水平学习者,教师应鼓励学习者多借鉴本族语者表达思想和意义的语言形式,写出更好的文章。对低水平学习者,则应重视其语言的基础积累、词汇的准确拼写、扎实的语法知识和整句的写作意识。
上述研究只是对本学习者群体的书面表达做的试验性探索,还存在不足和局限性,要更全面了解其特点和发展规律,需要今后再扩充语料库,结合应用语言学的其他方法理论做出更进一步的研究。
[1] Renouf, A. & J. Sinclair.Collocational frameworks in English. In J. Svartvik ( ed.). English Corpus Linguistics.Singapore:Longman,1991.
[2] 高远.对比分析与错误分析[M].北京:北京航空航天大学出版社,2002.
[3] 桂世春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003.
[4] 何淑琴.从concern看词汇习得中的负迁移问题——一项基于语料库的分析[J].外语研究,2010,(6):63-69.
[5] 刘春阳,杨雨时.中国英语学习者词汇误用分析——一项基于中国学习者英语语料库的调查研究[J].东北大学学报,2006,8(4):301-304.
[6] 孙静,赵雪爱.基于语料库的中国学生和本族语使用者对于存现句使用的研究[J].西北工业大学学报,2007,27(4):56-60.
[7] 王振.基于语料库的高职非英语专业学生英语词汇能力调查[J].开封大学学报,2012,26(3):75-77.
[8] 闫丽莉.中国学生英语冠词习得初探——一项基于中国学习者英语语料库的研究[J].外语教学与研究,2003,35(3):201-214.
[9] 张萍,周敏.“Besides”:基于语料库的对比研究[J].国外外语教学.2007,2:46-53.
A Mini-corpus-based Study on English Writing Errors by Non-English Major Students with High and Low Levels in an Independent College
ZHANG Xiaoyan
( Foreign Teaching Department, Chenyi School of Jimei University, Xiamen, Fujian 361021, China )
The paper establishes a mini-corpus of English writing errors by non-English major students with high and low levels in Independent College in order to investigate, statistically analyze and compare the particular groups of English learners and find out the most frequently committing errors in writings, the correlation between the 11 categories of errors and the types of errors that most significantly distinguishes between the HL and LL students.Finally the causes were found out and the corresponding pedagogical implications were proposed.
independent colleges, corpus-based analysis, error-marks, error analysis
(责任编辑 王小聪)
(责任校对 鲁娜娜)
声 明
本刊已许可中国学术期刊(光盘版)电子杂志社在中国知网及其系列数据库产品中,以数字化方式复制、汇编、发行、信息网络传播本刊全文。该社著作权使用费与本刊稿酬一并支付。作者向本刊提交文章发表的行为即视为同意我刊上述声明。
G648.7
A
1673-9639 (2014) 05-0174-06
2014-06-24
本文系福建省中青年教育科研项目“基于微型语料库的独立学院非英语专业学生写作错误研究”(JBS14427)的成果。
张晓燕(1982-),女,福建厦门人,讲师,研究方向:应用语言学。