汉语母语和二语书面表现的对比分析
——以小学高年级中国学生和大学高年级越南学生的同题汉语作文为例
2012-03-25曹贤文邓素娟
曹贤文,邓素娟
(1.2.南京大学海外教育学院,江苏,南京 210093)
汉语母语和二语书面表现的对比分析
——以小学高年级中国学生和大学高年级越南学生的同题汉语作文为例
曹贤文1,邓素娟2
(1.2.南京大学海外教育学院,江苏,南京 210093)
汉语习得;书面语言表现;流利性;准确性;复杂性;多样性
本研究以小学高年级中国学生和大学高年级越南学生的同题汉语作文为例,从流利性、准确性、复杂性和多样性四个维度,对上述两组被试的书面语言表现进行了测量。统计结果显示,中国学生组的流利性和准确性各项指标均高于越南学生组,尤其在流利性及词汇与句法准确性方面,两组之间存在统计意义上的显著差异;在复杂性方面,两组被试的汉字和词语复杂性测量数据差别不明显,但越南学生组在以T单位长度为指标的句法复杂性方面显著高于中国学生组;在多样性方面,越南学生组的各项指标均高于中国学生组,不过两组之间只在词语多样性方面存在显著差异。这些发现揭示了汉语母语和二语书面表现的不同发展特点。
1.研究背景
语言表现(performance)是由乔姆斯基提出的与语言能力(competence)相对应的概念,指的是“操本族语者说出的具体语言”(克里斯特尔,2004:262),或者“人对语言的实际运用”(Richards等2000:338),有的学者把它译为“语言运用”(克里斯特尔,2004:262)或“语言表达”(王建勤,2009:7)。因此,语言表现分析(performance analysis)也叫语言运用分析(刘珣,2000:203)或者语言表达分析,即对学习者运用语言的具体表现进行分析。在语言习得研究中,语言表现分析是研究学习者语言及其发展过程的重要方法。
汉语母语习得研究和汉语二语习得研究在各自的领域分别对母语学习者与二语学习者的语言表现开展了相当系统且深入的研究,然而迄今为止,笔者尚未发现对这两类语言表现进行实证对比调查分析的成果,特别是在完成同一任务时,汉语母语学习者与二语学习者各自语言表现如何,以及可以采取哪些量化指标来测量这两个群组的语言表现,目前这方面的研究仍是空白。根据语言产出形式的不同,语言表现可以分为口头语言表现和书面语言表现,本研究打算考察同处于学校课堂教学环境下的汉语母语和二语书面语言表现,探讨如何对其进行综合的测量,并对两组被试的书面表现结果进行对比分析。
2.研究方法
2.1 研究目的
本研究选取汉语书面表达学习时间基本相同的两个实验组——小学高年级中国学生组与大学高年级(包括研究生)越南学生组作为实验对象,考察这两个组别在完成同一任务——同题汉语作文时,其汉语书面表现的异同。
Skehan(1998)、Wolfe-Quintero等(1998)、Ellis&Barkhuizen(2005)、Ellis(2008)、Housen&Kuiken(2009)等都认为,测量学习者完成任务时的语言表现通常包括三个维度:复杂性(complexity)、准确性(accuracy)和流利性(fluency),简称为“三性分析”(CAF)。用“三性分析”来测量学习者语言发展的成熟度已是学界共识,不过学者们仍在不断探讨如何完善“三性分析”的测量方法。例如,Skehan(2009)认为应该把对词汇的测量补充进“三性分析”,文秋芳和胡健(2010)则在“三性分析”之上,又增加了一项多样性,与复杂性、准确性和流利性一起作为“四性分析”。在传统的“三性分析”中,语言发展的多样性测量通常归入复杂性一类,不过从测量的全面性和精细性考虑,笔者赞同把多样性从复杂性中分离出来专门作为一项指标。因此,本研究将从复杂性、准确性、流利性和多样性四个维度,从汉字、词汇和句法三个层面来考察中国学生组与越南学生组完成同题作文时的书面表现。具体测量指标参见下文。
2.2 研究对象
越南学生组共35人,其中17人在南京大学、南京师范大学和南京农业大学学习,18人在河内军事外语大学学习;15人为研究生,20人为大学本科4年级学生;16人男性,19人女性。本科学生都是汉语言专业,研究生都是跟中国研究相关的专业。他们学习汉语的平均时间为4.4年。由于他们学习汉语是听说读写一起推进的,因此其学习汉语书面表达的平均时间也是4.4年。
中国学生组共41人,为南京市汉口路小学5年级二班和四班全体学生。其中男性20人,女性21人。本实验在5年级上学期实施,一般来说,中国学生从小学一年级开始正式学习书面表达,因此,中国学生组跟越南学生组学习汉语书面表达的时间大体相同。
2.3 实验设计
虽然两个实验组具有相似的汉语书面表达学习和发展时间,不过在年龄、认知和文化背景等方面却存在一定的差别,为了让所有的被试都有话可说,我们选取了一个人类共有的、老少咸宜的最基本社会情感话题——母子/母女关系作为写作的题目。作文题目由一张暗示性的图片(见下图)给出,直观易懂并有利于发挥被试的想象力。由于两组被试的母语背景不同,图片上的说明文字采用两组被试都熟悉的非常简单的第三语言——英语进行说明。
具体的施测题目如下:
题目:请仔细看图,发挥你的想象力,写出图意。
时间:45分钟
注意事项:
(1)根据画面内容,发挥想象力,题目自拟。
(2)文章的表达形式:记叙、议论和说明。
(3)题目前空4格,开头空两格,标点符号独立占格。
(4)如果有不会写的字,可暂用拼音代替。
图1:引自Jason Love的漫画网站
2.4 数据收集
越南学生的语料收集分为两个部分:第一部分2010年11月下旬由南京学习汉语和中国研究的大学高年级越南留学生(包括研究生)完成。第二部分语料2010年12月初由在越南河内军事外语大学学习汉语的18名四年级学生完成。参加实验的越南学生共有35人,回收答卷35份,其中5份答卷回答不全,作为无效答卷排除,实际有30份答卷进入了统计分析。
中国学生的语料收集分别于2010年12月15日和23日在课堂上集中完成,共有41人参加实验,回收答卷41份,其中有6份答卷回答不全或者夹杂了一些英文,被作为无效答卷排除,共获得有效答卷35份。为了与越南学生组的实验人数保持一致,我们随机选取了其中的30份进入统计分析。
2.5 测量指标和统计工具
我们参考Carroll(1979)、Wolfe-Quintero等(1998)和Ellis&Barkhuizen(2005)等总结的已有研究中采用过的有效测量指标,并针对汉语的特点,确定本研究的测量指标如下:
1)流利性测量指标:每分钟汉字数和词语数;
2)准确性包括句法准确性、词语准确性和汉字准确性,测量指标分别为:
A.句法和词语准确性方面:平均每一百词里有多少个词语和语法错误;
B.汉字准确性方面:平均每一百字里出现多少个汉字错误(包括错字、别字和用拼音代替的字)①重复出现的错误都按照出现的次数累计。;
3)复杂性包括句法复杂性、词语复杂性和汉字复杂性,测量指标分别为:
A.句法复杂性:平均句长(MLU)和T单位(T-Unit)长度②早在20世纪30年代美国心理语言学家D.McCarthy就提出了平均句长(MLU)的概念,作为测量儿童语言成熟度的尺度,得到了广泛的运用。不过,Hunt(1965)在研究中小学生书面语法结构时,认为平均句长这一指标不够客观,因为McCarthy并没有设定一个明确判断“句子”的标准,而由于学生对标点的不充分使用,他们对句子的判断并不可靠。随后,Hunt提出一个更具操作性的句法单位——“T单位”(Minimal Terminable Unit)用来测量儿童母语写作的语言发展。十多年后,Larsen-Freeman&Strom(1977)开始把它引入二语发展的测量,此后“T单位”测量法逐渐在二语习得研究中得到广泛应用。Wolfe-Quintero et.(1998:70)和Foster et.(2000)等对二语习得领域的相关实证研究所作的统计结果表明,T单位是第二语言发展指数研究(developmental index studies)最常用的测量因子,T单位长度是测量学习者语言复杂性的最主要指标之一。本研究将同时使用平均句长和T单位长度来测量复杂性。我们根据Hunt(1965)对T单位的定义和汉语自身的特点,把T单位界定为:单句和带有关联连词或关联副词的复句。对于不含任何关联性成分的流水句,如,一些并列复句和承接复句等,每个分句都被视为一个T单位。;
B.词语复杂性:高级水平词例(token)数与总词例数之比、高级水平的词型(type)数与总词型数之比③本研究根据《汉语水平词汇和汉字等级大纲》(2011)甲乙丙丁四级的划分,把丙级词、丁级词和超纲词作为高级水平词汇,汉字的划分与此相同。;
C.汉字复杂性:高级水平汉字字例数与总字例数之比、高级水平字型数与总字型数之比;
4)多样性包括汉字多样性、词语多样性和句法多样性,测量指标分别为:
A.汉字多样性:字型数与字例数之比;
B.词语多样性:词型数与词例数之比;
C.句法多样性:由于汉语全部句式的分类和统计方面目前还存在一些难以解决的困难,本文采取一项折中方案,通过抽取“是”字句、“有”字句、“把”字句和“被”字句这四种特殊句式的用例来分析其内部的多样性分布。
本研究收集的原始语料是写在方格纸上的手写材料,为了分析上的方便,笔者把这些材料都转写为电子文档,并根据上述测量指标进行标注,然后进行统计。字数、词数、字频和词频等先采用Dimsum软件进行初步的切分和统计,在此基础上,再进行人工检查、重新划分和统计。句子、句式及所有字、词、句错误的辨识和标注全部由两位作者人工完成并交叉核对。
3.统计结果
3.1 流利性统计结果(表1)
3.2 准确性统计结果(表2)
3.3 复杂性统计结果(表3~5)
3.4 多样性统计结果
3.4.1 汉字和词语多样性(表6)
①q只计算汉字总数,不包括标点符号。
表2:准确性统计结果
表3:汉字复杂性统计结果
表4:词语复杂性统计结果
表5:句法复杂性统计结果
表6:汉字和词语多样性
3.4.2 四种特殊句式的使用
详见表7~10。
4.分析和讨论
为了检查两组被试的汉语书面表现在流利性、准确性、复杂性和多样性指标方面是否存在显著差异,我们使用SPSS软件采用独立样本t检验的方法,对上述数据进行了统计分析,其结果如下:
4.1 流利性统计结果分析
从统计结果来看,中国学生组的字产出流利性和词产出流利性分别为8.8字/分钟和6.3词/分钟,越南学生组的字产出流利性和词产出流利性分别为8.1字/分钟和5.6词/分钟。独立样本T
检验结果显示,在字产出和词产出流利性两项指标方面,两组之间存在统计意义上的显著差异,中国学生组的流利性显著高于越南学生组,见表11。
表7:使用9类“是”字句①的情况
表8:使用7类“有”字句②的情况
表9:使用6类“把”字句③的情况
表10:使用四类“被”字句①的情况
表11:两组被试书面语言表现测量结果的独立样本T检验
4.2 准确性统计结果分析
从统计结果来看,在汉字错误总数方面,越南学生组“每100字汉字错误数”为1.8,中国学生组为1.6,越南学生组的汉字错误率比中国学生组略高;而在词汇和语法错误总数方面,越南学生组每100词词汇和语法错误数为5.5,中国学生组为2.1,越南学生组的词汇和语法错误率是中国学生组的2.6倍。独立样本T检验结果显示,在汉字错误率方面两组之间差异不明显,而在词汇和语法错误率方面,两组之间则存在统计意义上的显著差异,中国学生组的词汇和语法准确性显著高于越南学生组。
4.3 复杂性统计结果分析
从统计结果来看,在汉字复杂性指标方面,越南学生组的高级水平汉字字例数与总字例数之比、高级水平字型数与总字型数之比分别为29.2%和43.5%,中国学生组这两项数据分别为30.2%和41.6%;在词语复杂性指标方面,越南学生组的高级水平词例数与总词例数之比、高级水平的词型数与总词型数之比分别为24.4%和37.8%,中国学生组这两项数据分别为23.9%和37.0%。独立样本T检验结果显示,两组被试在汉字和词语复杂性上差异不显著。在句法复杂性方面,以平均句长来测量,中国学生组平均每句22.5字,越南学生组平均每句23.4字;但以T单位长度来测量,中国学生组的T单位平均长度为12.9字,越南学生组的T单位平均长度为18.4。独立样本T检验结果显示,两组在平均句长上的差距不显著,而在T单位平均长度上则存在统计意义上的显著差异。
4.4 多样性统计结果分析
从统计结果来看,汉字多样性的测量指标——字型数与总字数之比,中国学生组和越南学生组分别为0.091和0.095;词语多样性的测量指标——词型数与总词数之比,中国学生组与越南学生组分别为0.190和0.214。独立样本T检验结果显示,在前一项数据上,两组之间的差异不显著,而在后一项数据上,越南学生组显著高于中国学生组。在四种特殊句式的使用方面,越南学生组“是”字句和“有”字句的使用频率明显高于中国学生组,而“把”字句和“被”字句的用例数则少于中国学生组。不过从每一种句式内部句型的使用分布来看,越南学生组总体上稍微多样和均衡一些,显示出越南学生组的句法多样性略高于中国学生组。
4.5 统计结果总结
通过上述测量、统计和分析,中国学生组和越南学生组在完成汉语同题作文任务时的书面语言表现测量结果总结如下:中国学生组的流利性和准确性各项指标均高于越南学生组,尤其在流利性及词汇与句法准确性方面,两组之间存在统计意义上的显著差异;在复杂性方面,两组被试的汉字和词语复杂性测量数据差别不明显,但越南学生组在以T单位长度为指标的句法复杂性方面显著高于中国学生组;在多样性方面,越南学生组的各项指标均高于中国学生组,不过两组之间只在词语多样性方面存在显著差异。
上述结果表明,尽管中国学生和越南学生的汉语书面语学习时间大体相当,但在完成同题作文的实验任务中,其书面表现的各项测量数据却显示了较大的差异,从中可以发现汉语母语和二语书面表达能力发展的不同规律和特点。中国学生组的流利性指标均显著高于越南学生组,显示出作为母语学习者相对于二语学习者的优势。这种母语优势也反映在准确性的指标方面,特别是词汇和语法准确性的测量数据,越南学生组与中国学生组存在统计意义上的显著差异。这说明尽管经过多年的汉语学习,但与汉语母语者相比,高年级越南学生的汉语书面表达在使用准确度方面仍存在较大的发展空间,不过由于越南学生具有一定的汉字背景,在汉字准确性上跟中国学生组的差异并不显著。
在汉字和词语复杂性指标上,两组被试的书面表现测量数据大致相同,不过,在平均句长和T单位长度两项句法复杂性指标上,越南学生组均高于中国学生组,特别是T单位长度的测量数据,两组间存在统计意义上的显著差异。我们对比两组语料分析其中的原因,发现越南学生使用的外显句法结构和关联成分明显多于中国学生,而中国学生使用外显句法标记较少的流水句更多,使得后者的T单位总数明显高于前者。越南学生的汉语书面表达倾向于使用较多的显性复杂句法成分,一方面可能是受到汉语二语教学的影响,比较重视显性句法结构的学习和运用;另一方面越南学生都是成人,大脑中已经形成了比较复杂和多样的概念系统,这不但会影响语言表达的复杂性,也会对语言表达的多样性产生影响。本试验中的多样性测量数据显示,越南学生组的各项指标均高于中国学生组,特别是在词语多样性方面两组之间存在显著差异,这显示出在书面表达方面,成人的二语学习相对于儿童母语学习的优势,成人在学习二语时,大脑中已有的丰富的概念系统会对第二语言表达的多样性,尤其是词语表达多样性的发展产生积极的迁移作用。
戴维·克里斯特尔(编)2004《现代语言学词典》,沈家煊译,商务印书馆。
国家汉语水平考试委员会办公室考试中心2001《汉语水平词汇与汉字等级大纲》(修订本),经济科学出版社。
刘珣2000《对外汉语教育学引论》,北京语言文化大学出版社。
刘月华潘文娱故韡2001《实用现代汉语语法》,商务印书馆。
邵敬敏(主编)2007《现代汉语通论》(第二版),上海教育出版社。
王建勤(主编)2009《第二语言习得研究》,商务印书馆。
文秋芳胡健2010《中国大学生英语口语能力发展的规律与特点》,外语教学与研究出版社。
Carroll,J.1979《儿童语言的发展》,曾越麟译,《语言学动态》第4期。
Ellis,R.2008The Study of Second Language Acquisition(2nd Edition).Oxford University Press.
Ellis,R.&G.Barkhuizen2005Analysing Learner Language.Oxford University Press.
Foster,P.,A.Tonkyn,&G.Wigglesworth2000Measuring spoken language:A unit for all reasons.Applied Linguistics,21(3).
Housen,A.&F.Kuiken2009Complexity,accuracy and fluency in second language acquisition,Applied Linguistics 30(4).
Hunt,K.1965Grammatical Structures Written at Three Grade Levels(NCTE Research Report No.3).Urbana,IL:The National Council of Teachers of English.
Larsen-Freeman,D.&V.Strom.1977.The construction of a second language acquisition index of development,Language Learning 27(1).
Richards,J.,J.Platt&H.Platt2000Longman Dictionary of Language Teaching&Applied Linguistics(《应用语言学辞典》),管燕红译,外语教学研究出版社。
Skehan,P.1998.A Cognitive Approach to Language Learning.上海外语教育出版社。
———2009Modeling second language performance:Integrating complexity,accuracy,fluency,and lexis.Applied Linguistics 30(4).
Wolfe-Quintero,K.,S.Inagaki&H.Kim1998Second Language Development in Writing:Measures of fluency,accuracy,and complexity.National Foreign Language Resource Center,University of Hawai'i.
The Contrastive Analysis of the Writing Performance in Chinese as L1 and L2:Based on the Chinese Compositions on the Same Topic among Chinese Senior Elementary Students and Vietnam Senior University Students
Cao Xianwen1,Deng Sujuan2
(1.2.Institute for International Student,Nanjing University,Jiangsu,Nanjing 210093,China)
Chinese acquisition,writing performance,fluency,accuracy,complexity,diversity
This study measures the fluency,accuracy,complexity and diversity of language performance in the task of writing a Chinese composition on the same topic by Chinese students in elementary school in high grade and senior Vietnamese students in university.The statistical findings are as follows:While the fluency and accuracy indexes of the Chinese students’composition are above those of the Vietnamese students,the complexity and diversity indexes of the Vietnamese students’composition are above the Chinese students’.These findings reveal different features in the development of Chinese as a First Language(L1)and Chinese as a Second Language(L2).
H195.3
A
1674-8174(2012)02-0039-08
【责任编辑 宗世海】
2011-09-01
曹贤文,男,安徽安庆人,南京大学海外教育学院副教授,博士,主要从事对外汉语教学研究。邓素娟,越南留学生,南京大学海外教育学院汉语国际教育专业硕士研究生。