“动机调控的词汇学习模型”的适用性及其效度研究∗<br/>——多群组结构方程模型方法

“动机调控的词汇学习模型”的适用性及其效度研究∗
——多群组结构方程模型方法

2018-01-11马蓉秦晓晴

外语学刊 2017年1期

马蓉秦晓晴

（曲阜师范大学，曲阜273165；华中师范大学，武汉430079）

1 引言

词汇习得一直被认为是一个复杂的心理认知过程（Jiang 2000），“词汇习得的途径丰富而多元”（任杨何高大2014）。尽管二语习得领域不断探讨词汇习得的过程，但仍未得出一个较为公认的词汇习得理论（Tseng，Schmitt 2008）。为了探索可以涵盖词汇习得过程中所有复杂特征且自成体系的词汇习得理论，Tseng和Schmit（2008）尝试通过引入情感变量，并基于实证数据构建一个动机调控的二语词汇习得模型。这一模型将动机融入词汇学习的行动前、行动中和行动后3个阶段（Dörnyei 2005：107），涉及初始评价、自我调控、参与程度、策略掌握、词汇知识和事后评价6大潜在变量，旨在从动机的动态视角解释词汇习得的全过程。该模型一经提出，就在学界引起较多关注，学者们纷纷对各自国家的二语学习者进行验证（Mizumoto，Takeuchi 2012； Yeᶊilbursa， Bilican 2013），但结果各异，主要体现在因子结构（测量模型）不一。目前，这一词汇习得理论模型在我国应用语言学界尚未引起足够重视。本文旨在验证中国语境下“动机调控的词汇学习模型”（Tseng，Schmitt 2008）的适应性和有效性，为系统深入研究二语词汇习得理论提供必要的实证支持，也为我国学生二语词汇的教与学提供理论参考。

2 研究背景

“动机调控的词汇学习模型”的理论背景可以追溯到语言学习策略研究。许多学者指出，尽管语言学习策略研究已成果颇丰，仍存在很多不足：策略的定义不甚清晰；类型不够连贯和系统、测量工具的信效度也不够高（Dörnyei 2005；Tseng et al.2006）。尤其是词汇学习策略研究，除上述问题外，还表现为多数研究只从单一维度孤立地探讨词汇策略习得过程（Rose 2012）。鉴于动机长期以来被认为是语言学习成败的决定性因素之一（Dörnyei， Csizér 2002； Gardner 1985： 39），Dörnyei（2005：218）尝试在词汇学习策略研究中引入二语动机自我系统中的自我调控概念，并与Tseng合作进行实证研究，初步构建出自我调控的词汇学习策略模型（Tseng et al.2006）。两年之后，Tseng和Schmitt（2008）又基于动机调控的行动前、中和后3个阶段，从完成词汇学习任务的启动、保持和反思3个方面扩充动机元素，提出一个更具系统性的“动机调控的词汇学习模型”。

该模型的理论价值引起很多学者的关注。Gao（2007）认为自我动机调控模型与策略使用模型可以兼容，自我动机调控关注初始的启动力，而学习策略研究关注这些启动力的结果。Rose（2012）指出将动机系统纳入词汇学习策略研究，可以更加全面地探索词汇学习的全过程，推进学习策略研究。另外，近年来的负动机研究表明“有效学习策略缺乏”是导致动机衰退的重要因素（周慈波王文斌2012），而 “动机调控的词汇学习模型”可以同时激活动机和学习策略这两个主要影响二语习得的可控因素，因此极具理论意义。

该模型由动机系统和词汇学习两个部分6个潜在变量组成，分别是：词汇学习经验的初始评价（IAVLE）、词汇学习的自我调控能力（SRCvoc）、词汇学习策略的参与程度（SVLI）、词汇学习策略的掌握（MVLT）、词汇知识（VOCkno）和词汇学习策略有效性的事后评价（PAVLT）。Tseng和Schmitt（2008）以259名中国大陆和台湾的多学科的大学新生为受试，获得该模型。模型论证动机在词汇学习中的重要作用，并表明二语词汇学习是一个向前发展且不断循环的过程。

另一些学者通过实证研究验证该模型。Mizumoto和Takeuchi（2012）针对不同学科各个年级的日本大学生先后进行两次研究，受试共1，357人，不过调查内容只聚焦模型中“词汇学习的自我调控能力”。验证性因子分析发现，模型中只包含情感、元认知和环境3个控制策略因子，而任务和兴趣两个控制策略因子由于负荷较低未能保留。 Yeᶊilbursa和Bilican （2013）研究102名土耳其高中生，但也只聚焦模型中的“词汇学习的自我调控能力”。结果显示环境控制策略因子未能进入模型，其他因子得以保留。然而，这些验证未能全面探讨该模型的适用性和有效性。

“动机调控的词汇学习模型”（Tseng，Schmitt 2008）尚存以下不足。首先，最好的模型应当同时具备内在效度和外在效度（黄芳铭2004：16）。该模型是由一组样本所得，因而只具备内在效度，模型无法推论到其他样本，因此缺乏外在效度。目前，学界采用多群组建模，发展竞争模型，目的是选择一个可以接受且能应用到其他观察数据上的稳定模型，同时，多个不同群组的模型如果没有显著性差异，说明该模型具有普适性（吴明隆2009：373）。因此，该模型的外在效度和推估合理性有待验证。其次，该模型整体拟合度的两项指标值与标准值0.9相比稍微偏低（GFI＝0.87；AGFI＝0.83），这说明理论模型与观察数据的拟合度还有待提高。再次，该模型依据的观察数据来自问卷调查，但该问卷量表的等级设计不规范，即每个部分的等级不一致，前后共出现3种等级（5个等级、6个等级和7个等级），同一量表前后采用不同的等级会降低问卷的信度。

综上所述，“动机调控的词汇学习模型”在效度和拟合度方面还有待验证和修正。由此，本文拟以不同学习阶段的群体为受试，采用规范的问卷设计，运用多群组结构方程模型方法验证该模型的适用性和有效性，具体探讨以下问题：

（2）如果对模型进行修正，修正后的模型是否同时具有内在效度和外在效度？

3 研究方法

3.1 受试

本研究的主要目的是构建跨群组模型，因此选定高中生和本科生两个跨度较大的学习群体。为提高研究结果的正确概率，本研究采用GPower软件对所需样本量进行事前检验，即将统计方法设为卡方检验拟合度，效应量设为中等水平，显著性水平定为0.05，统计检验力（power）定为0.8时，得出需要样本量143。据此，本研究的两组受试群体样本均在143以上，共计294人。他们来自国内一所省属重点中学和一所部属重点大学的8个自然班，具体信息见表1：

表1 受试者基本情况

3.2 调查工具

本研究采纳Tseng和 Schmitt（2008）的词汇学习问卷和词汇测试卷，但对量表的等级进行修改，将原量表中3种不同的等级改为相同等级。为避免学生给出模棱两可的答案，量表全部采用6个等级（1＝完全不同意／从不这样做；2＝不同意／不这样做；3＝基本不同意／基本不这样做；4＝基本同意／基本这样做；5＝同意／这样做；6＝完全同意／总是这样做）。为保证所有受试均能理解问卷题项，我们将原始的英文问卷译为汉语，并请同行专家审译，以确保汉语问卷准确传达原始问卷的意义。该问卷主体部分由5个维度（潜在变量）组成，共44个题项，主要调查词汇学习的动机策略发展。测试卷用以测评词汇知识的掌握，包括词汇量和词汇深度两个维度。

3.3 数据收集与分析

在正式施测前，我们进行了182人的试测，调整一些题项的表述，并检验问卷的信度和效度。正式的数据收集均在英语课堂上进行，问卷和测试的答题时间为20分钟。所有数据的分析由SPSS20.0和AMOS21.0软件完成。我们首先对录入SPSS的数据进行清理和必要的转换，缺省值采用均值插值方法替代，反向题也重新编码调整为正向题。然后对问卷进行整体信度分析，高中生和本科生样本的 Alpha值分别达到.943和.921，说明问卷题项具有较高的内在一致性。最后我们使用AMOS结构方程模型软件建模并采用多群组分析方法验证模型的效度。

4 结果与讨论

4.1 测量模型的适用性

问卷主体部分的KMO值检测分别为.871（高中生）和.789（本科生），达到因子分析对数据的要求。对两个群体的验证性因子分析检验发现，除潜在变量“词汇学习策略的事后评价”的因子分析结果与Tseng和Schmitt（2008）的研究结果一致外，其余4个潜在变量的因子结构（观测指标）均不一致。这说明Tseng和Schmitt（2008）的测量模型不适用于本研究受试的高中生和大学生英语学习群体。一个原因可能是两项研究的样本数量不尽相同，另一个原因可能是样本的类型有所差异。为修正测量模型，我们进行二次因子分析，两组受试群体的5个潜在变量均获得12个因子，因子负荷分别在.46和.49以上，且潜在变量的信度系数分别在.797和.714以上。

4.2 结构模型的适用性

为验证以上因子数据是否符合结构方程模型分析的条件，我们对包括词汇量和词汇深度的14个观测变量进行描述统计（见表2）。结果显示，高中生和本科生在6个潜在变量上的倾向基本一致。这为构建两组样本的跨群组模型奠定良好的基础。从数据的正态分布检测看，除本科生“自我提高”的峰度值（1.01）和高中生“词汇量”的峰度值（1.69），其它数值均为正态分布（数值在－1和1之间），达到参数检验（结构方程模型）的条件。

表2 观测变量描述统计

由于个别因子的数据属于非正态分布，我们采用一般化最小平方法（generalized least square）分别对高中生和本科生验证结构模型。结果显示，各潜在变量之间的连结关系呈循环模式，与Tseng和Schmitt（2008）构建的“动机调控的词汇学习模型”基本一致，说明本研究修正的模型潜在变量间的因果关系成立，同时也表明该结构模型适用于本研究的高中生和本科生两组受试群体。

4.3 整体模型的内在效度

为评估两个群组的整体模型质量，我们又进行模型的效度检验（见图1和图2）。结果显示，两个模型均可收敛，且p值均高于.05，接受虚无假设，说明模型与数据可以拟合。各项拟合度指标均达到标准范围，即RMSEA值均小于.50，GFI值和AGFI值均高于.90，这表明基于本研究受试的结构方程模型具有各自群体的内在效度。

在参与联合国维和行动时，要有所为有所不为，在量力而行的基础上做到内外兼顾。面对新形势新挑战，中国应进行有自己特点的维和行动，在履行联合国赋予的国际义务和常任理事国的责任方面，体现出愿担当、敢担当和能担当的大国形象；同时，参与维和行动应当保持有理有节，坚定我们自己对于维和事业的客观态度和正确立场，在符合国家外交政策和国家利益的原则下，为维护国际社会的和平与稳定，做出负责任大国应有的贡献。

图1 高中生动机调控的词汇学习模型

图2 本科生动机调控的词汇学习模型

从结构模型的路径系数可以看出潜在变量间的直接影响程度，例如，高中生模型（图1）中“词汇学习有效性的事后评价”对“词汇学习经验的初步评价”的影响系数为.92，说明“词汇学习有效性的事后评价”每增加1个单位，“词汇学习经验的初步评价”也就升高.92个单位。我们还发现两个模型的路径系数稍有不同。

高中生模型的数据显示（图1），以下路径（“词汇学习经验的初步评价”“词汇学习的自我调控能力”；“词汇学习的自我调控能力”“词汇学习策略的参与程度”；“词汇学习策略的参与程度”“词汇学习策略的掌握”；“词汇学习有效性的事后评价”“词汇学习经验的初步评价”）的系数均达到显著影响，且p值小于.001，这一结果与Tseng和Schmitt（2008）的研究结果一致。但是“词汇知识”对“词汇学习有效性的事后评价”的影响系数（－.15）和“词汇学习策略的掌握”对“词汇知识”的影响系数（.04）没有达到显著影响，这说明对于本研究受试的高中生，词汇知识对词汇学习策略的事后评价以及词汇学习策略的掌握对词汇知识都没有预测力。这一结果与Tseng和Schmitt（2008）的研究结果不一致，可能存在两个原因，一是样本的类型和数量不同；二是词汇测试可能对本研究受试的高中生来说信效度有限，因为词汇深度的测试均值（2.29）低于中间分值（3.0），说明题目难度较大。

本科生模型的数据显示（图2），除“词汇学习策略的掌握”对“词汇知识”的路径系数（.22）没有达到显著性水平，其它路径系数均达到显著影响（p＜.05）。这一结果较为接近 Tseng和 Schmitt（2008）的研究结果，但词汇学习策略的掌握对词汇知识还是缺乏预测力，说明Tseng和Schmitt（2008）的词汇测试对于本研究受试的本科生也可能存在题量和题型等方面的信效度问题。

从测量模型的路径系数可以看出各观测变量对潜在变量的解释程度，例如，高中生的模型中“自我效能”和“学习焦虑”对潜在变量“词汇学习经验的初步评价”的解释力分别为.75和.68。总的来说，本科生测量模型的路径系数（最低.49；最高.88）与 Tseng和 Schmitt（2008）的模型较为接近，即观测变量在较大程度上能够反映其潜在变量。而高中生测量模型的路径系数最低为.24（词汇深度对词汇知识的解释力），说明对于本研究受试的高中生而言，词汇深度的测试不能充分反映学习者对词汇知识的掌握程度，最主要的原因可能还是测试题在难度、信度和效度方面不适合高中阶段的学习群体。

4.4 多群组结构方程模型的比较及优选（外在效度）

为了评估高中生和本科生两个群组的模型具有的外在效度，我们又进行多群组结构方程模型分析，以探索同时适合高中生和本科生的具有跨群组效度的模型和最佳模型。

AMOS软件为我们构建出5个模型（见表3）：无参数限制模型（模型A）、有参数限制模型为路径系数相等模型（模型B）、结构系数相等模型（模型C）、结构残差相等模型（模型D）和测量残差相等模型（模型E）。4个参数限制模型的卡方值（CMIN）分别为 129.963，133.420，145.227，186.440；模型自由度（DF）分别为 128，133，139，153。显著性概率值 p分别为.435（p＞.05）；.437（p＞.05）；.342（p ＞.05）；.034（p ＜.05）。前3个达到.05显著性水平，接受虚无假设，说明模型可以被接受，而且这3个模型的卡方自由度比值分别为 1.015，1.003，1.045，均小于 2.000，表示3个模型是合适的。而第四个未达到显著性水平，拒绝虚无假设，说明模型不可以被接受。

表3 多群组模型的比较结果

为进一步验证这3个模型的恒等性，我们进行多群体不变性检测。我们以无参数限制模型为基准模型，假定无参数限制模型为正确的模型，路径系数相等、结构系数相等和结构残差相等3个模型的增加卡方值（CMIN）分别为12.196，15.653，27.460；卡方值增加量显著性检验的p值分别为.143（p＞.05），.268（p ＞.05），.094（p ＞ .05），均未达显著性水平，接受虚无假设，由于无参数限制模型是正确的，其它3个有参数限制模型可视为相等模型。若无参数限制模型具有跨群组效度，其它3个有参数限制模型也具有跨群组效度。

为选出最优模型，我们又查看竞争模型的一些关键指标。从AIC指标值和BCC指标值来看，这3个模型的AIC值分别为293.963，287.420和287.227；BCC 值分别为 312.746，305.058 和303.490。就模型优选而言（competing models），3个模型的多群组测量恒等性都是适配的，但以结构残差相等模型最佳。从ECVI指标值和MECVI指标值来看，该模型也最稳定，因为其ECVI指标值（.984）和 MECVI指标值（1.039）最小，表示模型拟合度的波动性最小。因此，结构残差相等模型既是最佳模型也是最稳定模型。

鉴于“模型评估中如果忽略统计检验力，则模型的检验是不完整的”（吴明隆2009：61），我们最后对结构残差相等模型进行统计检验力的事后检测，以查看该模型推论的正确概率。根据样本总数294，卡方值145.227，我们采用离线效应量计算器得出效应量r值为.703。然后使用GPower软件，输入样本量、效应量和自由度等数值，得出该模型的统计检验力为.99（一般可接受的最小值为.80），即该模型的正确判断概率为99%，说明该模型在推论过程中犯第二类错误（错误地接受虚无假设）的概率只有1%，因此该模型具有极高的统计检验力。一个好的模型应该尽可能准确和相对简洁（侯杰泰2004：4），而结构残差相等模型既准确又简洁，可以说这是一个理想的模型。

5 综合讨论

该模型基于学习动机的动态作用（Dörnyei 2001a），将动机融入语言学习的启动、保持和评价3个阶段，即动机因素渗透于词汇学习的整个过程（Tseng，Schmitt 2008）。模型显示，整个词汇学习过程包含6大要素：初始评价，自我调控，参与程度，策略掌握，词汇知识和事后评价。可以看出，动机在词汇学习的行动前、行动中和行动后3个阶段都发挥重要作用。行动前这里指词汇学习的初始评价；行动中这里指词汇学习的自我调控、参与程度和策略掌握；行动后指词汇学习的事后评价。数据显示，行动前对行动中各阶段以及行动后对行动前的影响系数均达显著水平，前人研究也表明初始评价在很大程度上能够影响自我调控能力（Garcia et al.1998）以及事后评价对初始评价能够产生积极影响，尤其是学习者的自我效能在中间起到关键作用（Dörnyei 2001b）。然而，行动中阶段对行动后阶段虽能产生一些影响，但策略掌握对词汇知识以及词汇知识对事后评价的影响系数均未达到显著水平。主要原因可能有3个：一是词汇知识的测试可能没有真实反映受试的水平；二是词汇知识除策略掌握可能还有其它影响因素；三是事后评价不只基于词汇量和词汇深度的掌握，更多情况是基于语言的综合水平测试。

6 结束语

本研究基于不同学习阶段的二语学习群体，验证Tseng和Schmitt（2008）“动机调控的词汇学习模型”，研究发现：（1）该模型的测量模型不适用于本研究受试的高中生和本科生，但结构模型可以适用；（2）修正后的两个模型观测变量略有减少，但其整体模型与各自的数据拟合，能够反映动机调控的词汇学习过程；（3）以结构残差界定的模型能够同时适用于高中生和本科生的词汇学习模式，也是最佳和最稳定的跨群组模型，因此具有内在效度和外在效度。

研究结果表明，词汇学习是一个由动机调控的系统的循环的过程，在这一过程里，初始的动机、自我调控能力、学习参与度和事后评价的作用都较大。同时，本研究构建的“动机调控的词汇学习模型”对动机在词汇学习的行动前、行动中和行动后3个阶段发挥的重要作用也具有较强的解释力。这类基于动机的动态视角构建的学习模型，在二语习得领域更具应用价值（葛娜娜金立鑫2016），因为它以完成一个任务为核心，考查影响任务动机的各种因素（金海云2013）。“动机调控的词汇学习模型”聚焦词汇学习任务，将有助于我们探析词汇学习动机在整个学习过程中的动态发展和变化特征，可为二语词汇的教学提供参考和启示。

葛娜娜金立鑫.二语动机自我系统与英语学习成效关系的实证研究［J］. 外语学刊，2016（5）.

侯杰泰.结构方程模型及其应用［M］.北京：教育科学出版社，2004.

黄芳铭.结构方程模式理论与应用［M］.台北：五南出版社，2004.

金海云.外语学习动机理论的发展与演变［J］.外语学刊，2013（6）.

任杨何高大.自然拼读法与词汇间接习得有效性实证研究［J］. 外语学刊，2014（5）.

吴明隆.结构方程模型——AMOS的操作与应用［M］.重庆：重庆大学出版社，2009.

周慈波王文斌.大学英语学习者负动机影响因子调查研究［J］.中国外语，2012 （1）.

Dörnyei， Z.Motivational Strategies in the Language Classroom［M］.Cambridge：Cambridge University Press，2001a.

Dörnyei， Z.Teaching and Research Motivation［M］.Harlow：Pearson Education Ltd.，2001b.

Dörnyei， Z.The Psychology of the Language Learner［M］.Mahwah： Lawrence Erlbaum Associates， 2005.

Dörnyei，Z.， Csizér， K.Some Dynamics of Language Attitudes and Motivation：Results of a Longitudinal Nationwide Survey ［J］.Applied Linguistics， 2002 （4）.

Gao，X.Has Language Learning Strategy Research Come to an End？ A Response to Tseng et al. （2006）［J］.Applied Linguistics， 2007（4）.

Garcia， T.， McCann， E.J.， Turner， J.E.， Roska， L.Modeling the Mediating Role of Volition in the Learning Process ［J］.Contemporary Education Psychology， 1998（23）.

Gardner，R.C.Social Psychology and Second Language Learning：The Role of Attitudes and Motivation［M］.London： Edward Arnold，1985.

Jiang，N.Lexical Representation and Development in a Second Language［J］.Applied Linguistics， 2000（1）.

Mizumoto， A.， Takeuchi， O.Adaptation and Validation of Self-regulating Capacity in Vocabulary Learning Scale［J］.Applied Linguistics， 2012 （1）.

Rose，H.Reconceptualizing Strategic Learning in the Face of Self-regulation：Throwing Language Learning Strategies Out with the Bathwater ［J］.Applied Linguistics， 2012（1）.

Tseng， W.T.， Dörnyei，Z.， Schmitt， N.A New Approach to Assessing Strategic Learning：The Case of Self-regulation in Vocabulary Acquisition［J］.Applied Linguistics，2006 （1）.

Tseng， W.T.， Schmitt， N.Toward a Model of Motivated Vocabulary Learning：A Structural Equation Modeling Approach ［J］.Language Learning， 2008（2）.

Yeᶊilbursa， A.， Bilican， R.Validation of Self-regulatory Capacity in Vocabulary Learning Scale in Turkish ［J］.Procedia-social and Behavioral Sciences， 2013（70）.