第二语言习得顺序研究工具<br/>——蕴含量表评介*

第二语言习得顺序研究工具
——蕴含量表评介*

2014-08-03吴继峰王亚琼

云南师范大学学报(对外汉语教学与研究版) 2014年1期

吴继峰，王亚琼

(北京师范大学文学院；2.北京师范大学汉语文化学院，北京 100875)

蕴含量表(implicational scale)是社会语言学和第二语言习得研究的有力工具，在国外社会语言学和二语习得研究领域中发挥着重要作用，如Pienemann & Håkansson(2007)[1]、Jansen(2008)[2]、Newman(2010)[3]等学者的研究都使用了蕴含量表。但是在汉语作为第二语言习得领域，对蕴含量表这种工具的来源、作用、使用方法和注意事项进行专门介绍和说明的研究还很少，对这个工具研究的不足导致使用过程中出现了一些错误，如矩阵的建立、分界线的确定、边缘值以及各项指标系数的计算都存在问题。为了使蕴含量表在第二语言习得研究中发挥更大的作用，本文综合了蕴含量表的主要研究成果，对如何使用蕴含量表做详尽的介绍和说明。

一、蕴含量表的起源

量表主要包括三种类型：一维的(unidimensional)、多维的(multidimensional)和蕴含的(implicational)。最早使用量表(scale)技术的是社会学家和人类学家。(Hatch & Farhady，1982[4][p.176])蕴含量表通常指的是格特曼量表图示法(Guttman Scalogram)，社会语言学家和第二语言研究者利用它来研究语言表现的变异(variation)，即结合单个学习者在不同时间点的语言样本数据来观察其习得语言结构的发展情况，或者是结合个案研究数据来展示在第二语言学习者群体中的相似类型。蕴含量表建立在这样一种观念之上：在学习者语言中，一种语言形式的出现，是以一种或多种其他的语言形式的出现为前提的，与此对应，习得一种语言形式，也是以先习得一种或多种语言形式为前提的，亦即这些语言形式(或者习得阶段)之间存在蕴含关系。(Ellis,2008)[5][p.965]

蕴含量表第一次引入语言研究是1968年，David DeCamp用它来分析牙买加克里奥耳语连续统(Jamaican Creole continuum)，后来被广泛应用到社会语言变异和变化研究、语言直觉(linguistic intuitions)理解研究和第二语言习得研究(Rickford,2002)。[6][p.144]由于蕴含量表能较为完整、系统地反映第二语言学习者习得语言结构的顺序，所以深受第二语言习得研究者的重视，并一直发挥着重要的作用。

二、蕴含量表在二语习得顺序研究中的应用情况

蕴含量表在国外第二语言习得研究领域主要是用来考察或者构拟学习者在习得二语语音项目、语法项目时的顺序。Politzer(1976)[7]利用蕴含量表考察了来自旧金山湾双语学校的学生对于英语和法语的5个语法对比规则的掌握情况；Andersen(1978)[8]用蕴含量表来研究波多黎各大学说西班牙语的学生习得13个英语语法词素的情况；Trudgill(1986)[9]利用蕴含量表构拟居住在挪威的瑞典人习得挪威语代词的顺序；Pienemann和Mackey(1993)[10]利用蕴含量表来描绘不同语言背景的儿童学习者习得各种英语结构的情况；Nagy等(1996)[11]利用蕴含量表来阐明英语母语者在习得蒙特利尔法语的过程中删除/l/的习得顺序；Pienemann(1998)[12]利用蕴含量表构拟出16个从波兰和越南移民到澳大利亚的成年人习得12个英语语法结构的情况；Bayley(1999)[13]通过观察墨西哥裔儿童叙述故事中使用(动词)体的种类，利用蕴含量表构拟了过去时和未完成时的使用情况。(Rickford，2002[6][p.155])此外，相关的研究还有Pienemann & Håkansson(2007)[1]、Jansen(2008)[2]等。

由于蕴含量表可以比较完整地展示习得的顺序，描写数据具有一定的客观性和体系性，并能够揭示一定的习得规律，所以在20世纪90年代末被引入到汉语作为二语习得研究领域，如施家炜(1998)[14]利用蕴含量表和准确率等方法对留学生习得22类现代汉语单句句式的顺序进行了研究。

施家炜(2006)[15]整理了1987-2004年汉语作为二语习得顺序的研究成果，本文在其基础上，整理了2005-2012年大部分涉及习得顺序的研究成果，以观察蕴含量表在汉语作为二语习得顺序的应用情况。

表1 汉语作为二语习得顺序研究成果(部分)

时间研究的汉语语言项目语言样本来源研究方法确定习得顺序的方法研究者2006疑问代词不同句法位的习得顺序不同母语背景的96名留学生(作业分析)+3名留学生(个案跟踪)语料库研究+作业分析+个案跟踪使用频次排序法、使用频率排序法丁雪欢[24]2007汉语依据类介词结构的习得顺序欧美学生语料库研究+作文分析+问卷调查正确率排序法、Q_P_SCORE算法胡媛媛[25]2008汉语比较句的习得顺序韩国留学生问卷测试蕴含量表朱云凤[26]2009多义副词“就”的习得顺序不分母语背景的外国留学生作文分析使用率排序法黄露阳[27]2009兼语句的习得顺序不分母语背景的外国留学生语料库研究正确率排序法、偏误率排序法周文华[28]201011类有标转折复句的习得顺序印尼留学生作业分析+问卷调查使用率排序法、正确率排序法李佳[29]2011汉语关系从句的习得顺序英美留学生实验研究正确率排序法、蕴含量表王亚琼[30]2011现代汉语介词的习得顺序不分母语背景的留学生语料库研究使用率排序法、正确率排序法周文华[31]2011多义副词“还”的语法化顺序和习得顺序不分母语背景的学过1-2年汉语的来华留学生作文分析使用率排序法、偏误率排序法高顺全[32]2011汉语单项定语的习得顺序泰国留学生语料库研究+作文分析使用率排序法、正确率排序法杨骐冰,齐春红[33]2011对象类介词的习得顺序不分母语背景的留学生语料库研究+问卷测试蕴含量表、正确率排序法李佳佳[34]2012汉语介词短语语序的习得顺序韩国留学生问卷测试蕴含量表、正确率排序法[韩]尹有贞[35]2012“把”字句的习得顺序韩国学生语料库研究正确率排序法、蕴含量表黄自然、肖奚强[36]2012汉语能愿动词的习得顺序美国留学生书面语料分析+测试、问卷调查使用率排序法、正确率排序法、蕴含量表沙茜[37]

从表1可以看出，在2010年之前，在汉语作为二语习得顺序研究中，确定习得顺序的方法主要是使用率排序法和正确率排序法，较少使用蕴含量表，仅施家炜(1998)[14]、林勇明(2000)[19]、朱云凤(2008)[26]等使用。当然，不是说在习得顺序研究中习得顺序的确定一定要使用蕴含量表，而是从以上研究中可以看出蕴含量表的应用价值并没有完全发挥出来。“习得顺序的排列是依据正确率直接排序还是采用蕴含量表，则可以参考研究中样本的数量。因为两种方法从根本上来说所依据的都是正确使用情况，但蕴含量表的作用之一就是减少个体差异对分析结果的影响。从统计学的角度来说，当样本的选择具有代表性且数量足够时，所得到的分析结果应该能够代表所在群体的特征。”(冯丽萍、孙红娟，2010[38][p.13])所以，当个体差异较大、样本数量不够大时，采用蕴含量表具有一定作用。2011-2012年研究者在习得顺序研究中使用蕴含量表的意识增强，但是在使用的技术上还需要改进和提高。为提高研究的科学性和可信度，有必要对蕴含量表的使用方法进行说明，以便其在汉语作为二语习得顺序研究中发挥更大的作用，下面介绍蕴含量表的具体使用方法。

三、蕴含量表的使用方法

Brown(2004)[39]对比分析了美国9本经典的应用语言学的量化和统计研究教材，在这9本教材中，仅有两本教材详细介绍了蕴含量表的使用方法，即Hatch和Farhady(1982)[4]的“Research design and statistics for applied linguistics”,Hatch和Lazaraton(1991)[40]的“The research manual: design and statistics for applied linguistics”。本文主要参考Hatch等学者1982和1991年的这两本教材来说明蕴含量表的使用方法。

根据Hatch和Farhady(1982)[4]、Hatch和Lazaraton(1991)[40]，建立蕴含量表需要6步。我们结合图1来说明如何建立蕴含量表。

图1 蕴含量表例图

(一)转换数据

首先要将正确率或使用率，或者其他量化的测量结果数据转化为0和1两个分类数据，0表示未习得，1表示已习得。确定一个数值，例如90%(也可以是其他数值)，低于这个数值的都转化为0，达到和高于这个数值的都转化为1。

(二)建立矩阵

矩阵通常有两个变量，如图1的两个变量是学习者(S)和问题(Q)。将收集到的原始数据转化为(0，1)，并对矩阵进行排序：

1.计算每个问题“1”的数量总和，然后将这些总和按照由小到大的顺序从左向右排列。例如图1，我们调查了7个问题，计算每个问题“1”的总和，*Q1-Q7也可以代表语言中某项目的小类，如“把”字句的7个小类，每个小类都可以测试若干题目，然后计算每个小类题目“1”的总和。Q1-Q7的“1”的数量总和分别为6、2、3、6、9、6、3，那么就在表的上部，根据“1”的数量总和按照由小到大的顺序从左向右依次排开，如果出现数量总和相等的情况，如图1中的Q3和Q7，以及Q1、Q4和Q6，可以暂定一种方案(如按照序号排列)继续进行下面的步骤，完成所有步骤后可以根据步骤(六)中的系数进行调整，最终选择各个系数表现最佳的排列方法。按照这个原则，图1中的Q1-Q7的排序为：Q2、Q3、Q7、Q1、Q4、Q6、Q5,并用双向箭头在两端标明“难”、“易”。

2.计算每个学习者获得“1”的数量总和。总数最多的学习者处于最上层，以下依次递减。例如图1中，学习者S1、S2、S3、S4、S5、S6、S7、S8、S9各自“1”的总和是7、5、7、3、5、2、3、2、1，然后根据“1”的数量总和按照由大到小的顺序从上到下依次排开，如果出现数量总和相同的学习者时(如S1和S3，S2和S5，S4和S7，S6和S8)，也同排列Q1-Q7时一样，按照系数表现最佳的原则进行调整。

需要说明的是，在Q和S的排列过程中，可能需要进行数次尝试和调整，最直接的技巧是尽量使“1”位于蕴含量表的右上部分，使“0”位于左下部分，但最可靠的验证还是通过步骤(六)中的系数来确定蕴含量表的有效性。

(三)划出分界线

当数据列入矩阵以后，下一步就是划出分界线，将具有相同正确数量的学生分为一组(尽管他们正确的项目有可能不同)，从下到上依次划分。

S9有1个“1”，从右往左数1列，在第一列和第二列之间画一条竖线；

S6和S8有2个“1”，从右往左数两列，在第二列和第三列之间画一条竖线；

S4和S7都有3个“1”，从右往左数三列，在第三列和第四列之间画一条竖线；

S2和S5都有5个“1”，从右往左数五列，在第五列和第六列之间画一条竖线；

S1和S3都有7个“1”，从右往左数七列，在第七列和第八列之间画一条竖线；

然后用横线将这些竖线依次连接起来，一段横线表示一个习得阶段。

(四)找出偏误

蕴含量表的理想模型是折线左下侧区域的项目都应当为0，而折线右上侧区域的项目都应当为1。偏误是指违反理想模型的那些条目，即我们认为学习者应该习得的项目实际上学习者未习得，而我们认为学习者不可能习得的项目实际上却习得了。例如在图1中，我们认为S6不会习得Q1，但是实际上习得了；我们认为S7应当习得了Q6，但是实际上却没有习得。在图1中，从左到右每列的偏误个数分为别0、1、1、2、0、2、0，总计6个。

(五)确定“边缘值”(marginal)

注意最下面一行的数值，这些数值被称为“边缘值”，每组第一个数值代表的是这一列0的总数，第二个数值代表这一列1的总数。例如最左边第一列最下面的一组数值是“72”，第一个数字“7”是这一列0的总数，“2”是这一列1的总数，将每列总数中最大的数目(不管是0的还是1的数量)加起来得到一个“最大边缘值”(7+6+6+6+6+6+9=46),这个数值将在后面的计算中用到。

创建好蕴含量表并不代表就能说明存在等级差异，要进行统计程序的检验，检验创建的蕴含量表是否有效。要检验蕴含量表是否有效，需要以下几个数据：再生系数(Coefficient of Reproducibility)、最小边缘再生系数(Minimum Marginal Reproducibility)和再生提高百分比(Percent Improvement in Reproducibility)，这些数据会决定最后的关键数字“可测量性系数”(Coefficient of Scalability)。

下面介绍各项指标系数的计算方法。

(六)计算蕴含量表的各项指标系数

1.计算再生系数(Coefficient of Reproducibility)

再生系数告诉我们有多大把握可以根据矩阵中学生的位置或排列预测学生的表现，这个系数越接近1，预测的把握越大。根据统计知识，再生系数的值应超过0.90。公式为：

Crep=1-错误的数量/学生的数量×题目的数量

我们以图1为例，其中错误的数量是6(图1中，Errors=0+1+1+2+0+2+0=6)，学生数量是9，问题数量是7，所以Crep=1-6/9×7=0.9048

2.计算最小边缘再生系数(Minimum Marginal Reproducibility)

最小边缘再生系数告诉我们如果不考虑矩阵中的偏误，我们可以在多大程度上预测学生的表现。这个数值应小于第一步的再生系数。

MMrep=最大边缘值/学生的数量×题目的数量

“最大边缘值”我们已经在前面计算过了，是46；所以MMrep=46/9×7=0.7302

3.计算再生提高百分比(Percent Improvement in Reproducibility)

%improvement= Crep-MMrep=0.9048-0.7302=0.1746

4.计算可测量性系数(Coefficient of Scalability)

可测量系数表明蕴含量表所建立的等级分级是真实有效的，在研究中使用蕴含量表需要报告这个数值。根据统计知识，可测量性系数必须超过0.60才能宣布具有可测量性。

Cscal=%improvement/1-MMrep=0.1746/1-0.7302=0.6471

综合以上，排好顺序的Q5-Q6-Q4-Q1-Q7-Q3-Q2就代表了习得Q的顺序，具有同段横线的项目(Q1和Q7，Q3和Q2)处于相同的习得阶段。

图1的蕴含量表是有效的(Cscal=0.6471﹥0.6)，而且可预测性较高(Crep=0.9048﹥0.9)。我们使用蕴含量表确定的习得顺序为：

Q5﹥Q6﹥Q4﹥Q1﹥Q7﹥Q3﹥Q2*“A﹥B”在习得顺序中表示A先于B习得。

习得过程分为5个阶段：

Q5 / Q6 / Q4 / Q1、Q7 / Q3、Q2

四、使用蕴含量表时需要注意的问题

蕴含量表在第二语言习得研究中具有重要的应用价值，但是在使用中有3点需要注意(Hatch & Farhady 1982[4]，Hatch & Lazaraton 1991[40])。

(一)习得标准的判定

蕴含量表中的数据只有0和1，本质上是一种分类数据，由数值型数据(例如准确率、使用率)转化而成。这种二分法掩盖了学习者习得程度上的差别，把学习者的语言状态只分为“习得/未习得”两类。在具体操作上，首先需要确定一个数值，作为判断习得或者未习得的标准，这个数值以上和以下将分属于“习得”和“未习得”两个类别，分别计为1和0。这里存在两个问题，一是以多大的数值作为判断习得和未习得的标准，二是这个数值附近的数值如何解释。例如：假如我们把习得标准定为正确率达到80%，正确率80%及以上的记为1,80%以下的记为0，那么首先我们需要说明选择80%的原因。实际上采用不同的标准可能会产生不同的习得顺序结论。此外还要思考是否正确率80%的习得者就比正确率79%的习得者习得状况要好得多？这一点值得研究者在今后的研究中考虑并做出说明。

(二)关于缺失数据

为了更好地考察语言项目的习得顺序，我们一般倾向于收集自然条件下产生的语料，但是部分学习者可能不会使用研究者期望的语言项目，一部分研究者认为一个要考察的语言项目需要达到一定数量，才能计算其在强制性语境中的正确率百分比，进而使用蕴含量表。这个最低样本数量是多少，需要在研究中明确说明。达不到这个数量的样本，就必须计为缺失数据。例如考查“把”字句的使用时，我们首先需要规定并说明“把”字句出现5次以上(也可以是3次、6次、10次或其它)，才可以计算“把”字句使用的正确率，此外还要说明使用次数低于5次，算作缺失数据的情况是如何处理的。

(三)注意习得规律和蕴含量表之间的关系

与任何测量研究工具一样，蕴含量表也有其局限性，只能在一定程度上反映语言的习得过程。习得过程中一些复杂状况会影响蕴含量表的效度，例如习得过程的“U”型模式就很难通过蕴含量表体现出来。

蕴含量表尽管存在着不足，但是在社会语言学和二语习得研究中是一个很有价值的研究工具，希望今后汉语作为第二语言的习得研究能更准确、规范地运用蕴含量表，使其发挥更大作用。

(笔者就蕴含量表问题曾向美国斯坦福大学John R.Rickford教授、美国明尼苏达大学Anne Lazaraton副教授请教，在此向两位教授表示诚挚的谢意。另外，本文在立意和修改过程中得到冯丽萍教授和徐彩华教授的悉心指导，同样表示真挚的感谢！论文错漏之处，一概由笔者负责。)

【参考文献】

[1] Pinemann,M.,& Håkansson,G.Response article Full transfer vs.developmentally moderated transfer:A reply to Bohnacker[J].Second Language Research,2007，23.

[2] Jansen,L.Acquisition of German Word Order in Tutored Learners:A Cross-Sectional Study in a Wider Theoretical Context[J].Language Learning,2008，58.

[3] Newman,M.Focusing,implicational scaling,and the dialect status of New York Latino English[J].Journal of Sociolinguistics,2010，14.

[4] Hatch,E.& Farhady,H.Research Design and Statistics for Applied Linguistics[M].Rowley,Mass.Newbury House,1982.

[5] Ellis,R.The Study of Second Language Acquisition(2ndedition)[M].Oxford:Oxford University Press,2008.

[6] Rickford,J.R.Implicational Scale[C].In:J.K.Chambers,Peter Trudgill and Natalie Schilling-Estes.The Handbook of Language Variation and Change[M].Blackwell Publishing,2002.

[7] Politzer,Robert L.The implicational relation paradigm in language acquisition[C].In:Alphonse Juilland(ed.),Linguistic Studies Offered to Joseph Greenberg.Saratoga,CA[M]:Anma Libri,1976.

[8] Andersen,Roger W.An implicational model for second language research[J].Language Learning,1978，28.

[9] Trudgill,Peter.Dialects in Contact[M].Oxford:Basil Blackwell,1986.

[10]Pienemann,Manfred and A.Mackey.An empirical study of children’s ESL development and rapid profile[C].In:P.McKay(ed.),ESL Development:Language and Literacy in Schools,vol.2.Commonwealth of Australia and National Languages and Literacy Institute of Australia[M],1993.

[11]Nagy,Naomi,Christine Moisset, and Gillian Sankoff.On the acquisition of variable phonology in L2[M].University of Pennsylvania Working Papers in Linguistics，1996，3.

[12]Pienemann,Manfred.Language Processing and Second Language Development: Processability Theory[M].Amsterdam and Philadelphia:John Benjamins,1998.

[13]Bayley,Robert.The primacy of aspect hypothesis revisited:Evidence from language shift[J].Southwest Journal of Linguistics，1999，18.

[14]施家炜.外国留学生22类现代汉语句式的习得顺序研究[J].世界汉语教学,1998,(4).

[15]施家炜.国内汉语第二语言习得研究二十年[J].语言教学与研究,2006,(1).

[16]田士琪，梅立崇，韩红.从第二语言习得规律看教学方法的改进[J].世界汉语教学,1987,(2).

[17]钱旭菁.日本留学生汉语趋向补语的习得顺序[J].世界汉语教学,1997,(1).

[18]刘谦功.外国留学生汉语让步复句习得研究及教学新思路[D].北京语言文化大学硕士学位论文,2000.

[19]林勇明.泰国学生汉语定语顺序的偏误分析及其习得顺序[D]，北京语言文化大学硕士学位论文,2000.

[20]林载浩.韩国学生习得“把”字句情况的考察及偏误分析[D].北京语言文化大学硕士学位论文,2001.

[21]李晓琪.母语为英语者习得“再”、“又”的考察[J].世界汉语教学,2002,(2).

[22]杨德峰.英语母语学习者趋向补语的习得顺序——基于汉语中介语语料库的研究[J].世界汉语教学,2003,(2).

[23]杨德峰.朝鲜语母语学习者趋向补语的习得顺序——基于中介语语料库的研究[J].暨南大学华文学院学报,2003,(4).