基于结构方程模型的高级汉语学习者语言技能关系研究
2012-03-27原鑫王佶旻
原鑫,王佶旻
(1.北京华文学院,北京 100037;2.北京语言大学汉语水平考试中心,北京 100083)
基于结构方程模型的高级汉语学习者语言技能关系研究
原鑫1,王佶旻2
(1.北京华文学院,北京 100037;2.北京语言大学汉语水平考试中心,北京 100083)
高级汉语学习者;HSK[高级];结构方程模型;高阶分析;语言技能
本文以HSK[高级]考试的实测数据为研究材料,使用结构方程模型探究高级汉语学习者听、说、读、写四项技能的结构模式以及四项技能间的融合/分散趋势。对包含一阶因子模型和高阶因子模型在内的9个理论模型的验证结果显示:高级水平汉语学习者技能结构模式可以用“听读+说+写”的形式进行描述,四项技能中听力和阅读呈现融合的趋势,相对而言,说的技能与其它技能的区分性比较高,高级水平汉语学习者听、说、读、写四项技能呈现出部分融合的趋势。研究认为,HSK[高级]考试采用主试卷、口语试卷和写作试卷三部分各自独立施测的方法,并将听力和阅读分数进行综合报道,口语、写作分数独立报道,这种做法具有一定的合理性。
1.问题的提出
语言测验的开发要建立在语言能力理论的基础上,这其中对听、说、读、写四项技能关系的研究是十分重要的环节。分立式测验是建立在语言技能独立和分散的理论基础之上的,而近年来流行的综合式测验则是建立在技能融合的观点之上的。然而,目前对学习者四项技能间关系及其纵向发展趋势的实证研究还很不够,这使得测验的开发缺乏必要的理论和实证研究的支撑。
本研究的核心目的在于找出最接近高级水平汉语学习者听、说、读、写四项技能关系真实状况的技能模式,具体问题包括:1)高级水平汉语学习者语言技能因子数量及其构成。2)高级水平汉语学习者四项技能的关系模式。3)高级水平汉语学习者四项技能间的融合/分散趋势。
2.研究背景
上世纪五、六十年代以Lado和Carroll为代表的学者提出了“技能/成分说”,认为语言能力涉及两大方面:语言技能和语言成分。这种学说认为听、说、读、写四项技能是独立的,应分别加以测量。70年代,Oller提出了“单一能力假说”(Unitary Competence Hypothesis),并进行了相关的实证研究。他采取主成分分析法,分析了UCLA英语分班考试和TOEFL,结果得出了一个单一的语言能力因子(Oller,1976;Oller&Hinofotis,1980)。于是Oller认为语言能力不可分割,听、说、读、写四项技能是融合在一起的。90年代,Bachman创立了语言交际能力模型(Com-municative Language Ability,CLA)。他指出,首先要区分听和看两种渠道以及理解性和表达性两类模式。在理解性的语言应用中,需要使用听和看的技能;在表达性的应用中,需要使用神经肌肉技能(比如说话和写字)。我们将Bachman(1990)的阐述整理为下表:
表1:Bachman对四项技能的分类
Bachman的分类只是体现了人们对四项技能最直观化的认识,其他研究者对四项技能的关系也持有一些不同的观点。Benson&Hjelt(1978)持听力领先观点,他们认为,听的技能领先于说、读、写,并相应地提出了一个教学模式,即在语言学习的最初阶段训练听力理解,之后的阶段可同时训练说、读、写的能力。Carroll(1983)和North(2000)则认为听力和阅读在心理认知过程中具有相似性,有别于口语和写作能力。
最近一些研究者认为,二语能力结构并不是一个简单的一阶形式,而是在一个普遍能力因子下面存在几个能力因子。Sawaki etal.(2008)使用多质多法(MTMM;Multitrait-multimethod Matrix)验证性因子分析,在题目层面对TOEFL iBT的试卷结构进行了全面深入的分析。研究结果得到听力、口语、阅读、写作四个一阶因子和一个高阶因子。
除了能力因子的组成结构之外,各技能因子关系的纵向发展趋势也是学界关注的问题。关于这一问题,目前形成两派截然相反的观点:一派认为随着学习者语言水平的提高,各技能因子趋向于融合(Oltman etal.,1988;Alderson,1991;Kunnan,1992);另一派则认为随着学习者语言水平提高,各技能因子趋向于分散(Swinton&Powers,1980;Ginther&Stevens,1998)。周聪(2009)对初级水平汉语学习者语言能力结构进行探索,认为初级水平汉语学习者听、说、读、写四项技能呈现出较为分散的趋势。这一结论与Oltman et al.(1988)、Alderson(1991)、Kunnan(1992)的论断基本相符。
根据上述的相关研究,我们对听、说、读、写四项技能的关系总结出9种不同的假设,并形成9个待验证的基础模型。(参见表2)
表2:9个待验证的模型
3.方法、过程与结果
3.1 样本
本研究的数据来自于2007年10月13日施测的HSK[高级]考试。研究选取了本次考试北京语言大学考点主试卷(考查听力和阅读)、口语、写作三项考试全都参加的考生共98人。考生母语背景、性别情况见表3。
表3:HSK[高级]考试考生基本情况
3.2 方法及指标的设定
本研究使用结构方程模型作为主要的研究方法,采用题目组作为各因子的观测变量,并根据试卷结构来划分题目组。听力理解、综合阅读、口语题目组的划分严格按照试卷结构执行。即听力理解含3个指标,分别命名为L1、L2、L3。综合阅读含4个指标,分别命名为R1、R2、R3、R4。口语含2个指标,分别命名为S1、S2。对于写作考试,我们采取的做法是用两个评分员给出的分数作为两个指标。这样,写作含2个指标,分别命名为W1、W 2。
一般认为结构方程模型中每个因子至少有三个指标是较为合适的。对于含有两指标的多因子模型,侯杰泰等(2004)提出了两指标法则①即对于一个多因子模型,如果有因子只含两个指标,模型可识别的充分条件如下:1)每个因子有两个或两个以上的指标;2)每个指标只测量一个潜变量;3)对每个潜变量,至少有另一个潜变量与之相关;4)误差之间不相关。,我们根据此法则对本研究各理论模型进行了检视,结果均符合法则要求。说明本研究口语因子和写作因子虽只包含两个指标,但模型的建立是可行的。
最终,整个考试被整合为11个指标,分别为:L1、L2、L3、R1、R2、R3、R4、S1、S2、W 1、W2。
3.3 数据分析过程与结果
3.3.1 数据检验结果
使用PRELIS2.54对所有样本在11个观测变量上的原始分数进行缺失值、极端值、一元正态性、多元正态性,以及线性关系和方差齐性检验。数据检验结果显示,不存在缺失数据、极端数据,散点图显示数据不存在非线性的关系也不存在方差不齐的现象。
然而多元正态性检验显示样本分布的偏度检验和总体检验的P值均小于0.01,表明样本分布显著地偏离了正态分布(Hair etal.,1987)。于是我们对样本11个观测变量的一元正态性检验结果进行了逐个检查,检查发现所有变量的峰度不存在严重的偏离,主要是偏度方面偏离的现象较严重。我们根据Hair etal.(1987)针对不同偏态提出的转换法则,对数据进行了处理②对正偏态的变量做开根处理,负偏态的变量求平方。,转换后的P值均大于0.01,数据服从一元正态分布和多元正态分布。转换前后一元正态性及多元正态性检验结果对比见表4和表5。
我们把计算了转换后数据的协方差矩阵作为模型验证时参数估计的基础。
3.3.2 模型拟合检验结果
使用转换后的数据计算样本的协方差矩阵,然后使用LISREL8.80,通过验证性因子分析的方法对9个理论模型进行验证,参数估计使用极大似然法。
3.3.2.1 一阶因子模型分析结果
结构方程验证性因子分析得出了8个一阶因子模型拟合数据的结果,整理如表6。
表4:转换前后各变量一元正态检验结果对比
表5:转换前后各变量多元正态检验结果对比
表6:一阶因子模型拟合指数汇总
根据上表可知,对于“听读+说+写”模型,χ2检验的P值为0.037,大于0.01,说明模型和数据差异不显著,χ2/df等于1.43,小于3,RMSEA介于0.05和0.08之间,表明模型拟合较好。GFI、NNFI、CFI均达到0.90以上,说明拟合结果很好。ECVI、AIC均是8个模型中最小的。综合各项拟合指数的结果来看,在8个一阶模型中,“听读+说+写”模型拟合结果最好。
可以看到,四因子模型各项指数也都达到了拟合标准。但对各拟合指数进一步检视发现,四因子模型的GFI为0.91,略高于“听读+说+写”模型,CFI为0.98,和“听读+说+写”模型相等。除此以外,四因子模型其余各项拟合指数的结果都不如“听读+说+写”模型。这说明“听+说+读+写”四因子模型也是一个可接受的模型,但对于数据的反映不如“听读+说+写”模型适切。
其余6个模型的各项拟合指数则全部或部分未达到模型拟合的评价标准。“听读写+说”和“听+读写+说”两个模型的CFI、NNFI和χ2/df达到了拟合标准。相较而言,“听读写+说”模型拟合效果略好于“听+读写+说”模型。“听读+说写”模型只有CFI和χ2/df勉强达到标准,拟合效果仅次于“听+读写+说”模型。在剩下的“听说+读写”、“听+读说写”和单因子模型中,单因子模型略好于其余两个模型。“听+读说写”模型又略好于8个模型中表现最差的“听说+读写”模型。
按从好到差的顺序,对结构方程一阶因子分析中8个模型拟合效果排序如下:
(1)三因子“听读+说+写”;(2)四因子“听+说+读+写”;(3)二因子“听读写+说”;(4)三因子“听+读写+说”;(5)二因子“听读+说写”;(6)单因子“听说读写”;(7)二因子“听+读说写”;(8)二因子“听说+读写”。
3.3.2.2 高阶因子分析结果
高阶因子模型与数据拟合结果见表7。
表7:高阶因子模型拟合指数汇总
通过与一阶因子模型拟合指数对比,我们发现,高阶因子模型拟合数据的结果比一阶因子模型中拟合结果最好的“听读+说+写”略差,并且好于“听+说+读+写”模型。
综上,8个一阶因子模型和一个高阶因子模型中,拟合结果最好的是“听读+说+写”一阶因子模型,本研究将对“听读+说+写”一阶因子模型参数估计结果作深入分析。
3.3.2.3 最优模型(“听读+说+写”一阶模型)参数估计结果及分析
在模型评价阶段,我们除了需要对模型整体拟合效果进行检验,还需要考察模型的参数估计结果。现将“听读+说+写”一阶模型参数估计标准化解整理如下。
表8:“听读+说+写”一阶模型参数估计标准化解
三因子相关矩阵
我们对以上参数估计结果进行了检视,未发现不恰当的解①参数估计中不恰当的解,指方差、标准误的估计值出现负值;相关的估计值大于1;参数估计显著性检验t值小于2,等。。说明模型的参数估计结果是合理的。
结构方程模型最大优点之一就是能够评估理论模型的构想效度(Hairetal.,1987)。在这里,构想效度是指一系列测量指标能够测到相应潜在构想的程度。构想效度反映了测量的准确性,测量具有构想效度说明测量指标反映了存在于总体中的真实分数。我们主要通过聚敛效度和判别效度来衡量构想效度。
根据Hair et al.(1987)的研究,聚敛效度的考察标准主要包括,因子负荷、方差析出量(Variance Extracted)①方差析出量的算法是:每个因子各指标因子负荷(标准化)平方的平均数。一般方差析出量达到0.5以上表明收敛性较好。和构想信度(Construct Reliability)②构想信度的计算方法为,每个因子各指标因子负荷(标准化)之和的平方,比上各指标因子负荷之和的平方与该因子各指标误差方差之和的和。具体评价标准为:1)标准化的因子负荷应至少达到0.5,0.7以上则较为理想。2)方差析出量达到0.5以上表明收敛性较好。3)构想信度达到0.7以上表示各指标具有内部一致性,说明指标测量了同一个潜在构想。判别效度的考察方法为,将两个因子间相关(标准化)的平方同这两个因子各自的方差析出量进行比较,两个方差析出量都大于相关的平方时,说明测量模型具有较好的判别效度。
根据上述检验方法,我们对“听读+说+写”一阶模型的构想效度进行了考察,相应指标整理如表9和表10。
表9:“听读+说+写”一阶模型聚敛效度检验表
表10:“听读+说+写”一阶模型判别效度检验表
根据表9,本研究所有11个指标在相应因子上的负荷均超过0.5,其中除了指标L1、R1,其余指标标准化因子负荷都高于0.7,每个因子的方差析出量都在0.5以上,构想信度也都高于0.7,表明测量模型具有较好的聚敛效度。
在表10中,我们将三个因子进行两两比较,两个因子各自的方差析出量均大于因子间相关的平方。表明测量模型具有较好的判别效度,因子间区别性比较高。综合聚敛效度和判别效度的检验结果,我们认为“听读+说+写”一阶模型具有较好的构想效度。
4.讨论
4.1 高级水平汉语学习者语言技能因子数量及其构成
验证性因子分析结果表明,“听读+说+写”一阶因子模型是对高级水平汉语学习者语言技能因子结构的较好概括。我们认为高级水平汉语学习者的语言能力总体上由听读、说、写三个独立的因子构成,而这三个因子间又存在一定关联。
本研究的结论证实了语言能力可分的观点。然而,从具体因子构成以及技能间关系来看,本研究结果与前人存在一定差异。目前支持语言能力结构可分的研究的主要结论如下:
Carroll(1983)、Bachman et al.(1995)、以及Kunnan(1995)的研究都发现了“听+读写+说”的因子构成;Stricker etal.(2005)对TOEFL iBT的前身LanguEdge Courseware的跨组别验证性因子分析得出了两个相关的一阶因子:“听读写+说”;Sawaki et al.(2008)对TOEFL iBT整体结构的验证,发现了“听+读+说+写”的四因子组合。
图1:“听读+说+写”三因子模型参数估计路径图
本研究与以上几项研究的差异归结为以下几点:
1)研究材料的不同,Carroll(1983)、Bachman etal.(1995)、以及Kunnan(1995)的研究材料是几个考试的组合,研究材料复杂的内部关系会对因子关系的确定产生影响。
2)研究目的不同,Stricker etal.(2005)的研究目的是讨论语言技能结构的跨组别不变性,而本研究的目的在于讨论高级水平汉语学习者的技能结构。
3)观测变量选择方法的不同,Sawaki et al.(2008)以题目为观测变量,本研究以题目组为观测变量。
4)研究样本的不同,以上研究均以英语学习者为样本,而本研究以汉语学习者为样本,以不同的语言学习者为样本有可能得出不同的语言技能结构。
4.2 高级水平汉语学习者四项技能的关系模式
按照从高到低的顺序对三个技能因子间相关系数进行排序,结果如表11。
听读作为一个融合因子,与写、说的相关分别是0.59和0.47。说和写的相关为0.33。可以说,三个技能因子的相关都是比较低的,说和听读,说和写的相关只有0.47和0.33。可见,三个因子间的区分程度比较高,而且说的技能与其它技能间的分离程度相对较高。
表11:“听读+说+写”模型三项技能因子间相关系数
听力和阅读作为一个融合因子的研究结果,在以往对于四项技能关系的实证研究中从未出现。本研究得出了听读这一融合因子,是比较值得关注和思考的。
首先,从交际方式角度看,按照Bachman(1990)提出的模式和渠道的划分标准,听和读同属理解性技能。其次,从心理认知过程角度看,是听/读者从外界提取信息、加工信息的认识过程。尽管它们接受语言信息的渠道不同(一个来自听觉,一个来自视觉)。但是,它们的心理过程是极为相似的。因此,高级水平汉语学习者听和读的技能呈现较为融合的关系是具有合理性的。
另外,值得注意的是,同属表达性技能的说和写相关非常低,只有0.33。关于说和写的关系,笔者认为,对于汉语学习者来说,由于汉字意音文字的特点,使得汉语学习者的写作技能与其它目的语学习者写作技能呈现出一些不同的特性,这也许是本研究结果显示说和写的技能相关较低的原因。
笔者认为,对于高级水平汉语学习者,同为理解性模式的听力和阅读技能在语言能力发展过程中具有相辅相成的关系,对高级水平汉语学习者语言技能的发展也有着较大的影响。
4.3 高级水平汉语学习者四项技能间的融合/分散趋势
在对于听、说、读、写四项技能关系的研究中,四因子模型代表了技能因子间关系最为分散的状态,单因子模型代表了技能因子间关系最为融合的状态。本研究中,“听读+说+写”模型和“听+说+读+写”模型都达到了拟合数据的标准,而“听读+说+写”模型拟合结果优于“听+说+读+写”模型,二者的主要差别在于听、读两个技能融合/分散关系的不同。较之“听+说+读+写”模型,“听读+说+写”模型中,听、读因子关系更为融合。因此笔者认为,高级水平汉语学习者技能间关系呈现出部分融合的趋势。
5.结论
本研究的主要结论如下:
1)高级水平汉语学习者技能结构模式可以用“听读+说+写”的形式进行描述,四项技能中听力和阅读呈现融合的趋势,相对而言,说的技能与其它技能的区分性比较高。
2)高级水平汉语学习者听、说、读、写四项技能呈现出部分融合的趋势。
3)高级水平汉语学习者的分技能水平可能存在较大差异,如:口语水平较高的学习者,写作水平可能相对较低。
4)HSK[高级]考试,采用主试卷、口语试卷和写作试卷三部分各自独立施测的方法,并将听力和阅读分数进行综合报道,口语、写作分数独立报道。这种做法具有一定的合理性。并且在汉语作为第二语言测验中,对于高级水平被试,听-读类综合式题型是一种比较适用的语言能力考查方式。
侯杰泰温忠麟成子娟2004《结构方程模型及其应用》,教育科学出版社。
周聪2009《综合式测试方法对初级水平汉语学习者的适用性研究》,北京语言大学硕士学位论文。
Alderson,J.C.1991 Language testing in the 1990s:How far have we come?How much further have we to go?In Anivan,S(ed.),Current Developments in Language Testing.Singapore:SEAMEO Regional Language Centre:1-26.
Bachman,L.F.1990 Fundamental Considerations in Language Testing.Oxford:Oxford University Press.
Bachman,L.F.,F.Davidson,K.Ryan,&I.-C.Choi.1995 An Investigation into the Comparability of Two Tests of English as a Foreign Language:The Cambridge-TOEFL Comparability Study.Cambridge,England:Cambridge U-niversity Press.
Benson,P.C.&C.Hjelt.1978 Listening competence:A prerequisite to communication.In Oller,J.W.Jr.,&K.Perkins(eds.),Research in Language Testing.Rowley,MA:Newbury House:13-23.
Carroll,J.B.1983 Psychometric theory and language testing.In Oller,J.W.Jr.(ed.),Issues in Language Testing Research.Rowley,MA:Newbury House:80-107.
Ginther,A.&J.Stevens.1998 Language background,ethnicity,and the internal construct validity of the advanced placement Spanish language examination.In Kunnan,A.J.(ed.),Validation in Language Assessment.Mahwah,NJ:Lawrence Erlbaum Associates:169-194.
Hair,F.J.,C.W.Black,J.B.Babin,F.R.Anderson,&L.R.Tatham.1987 Multivariate Data Analysis.NJ:Pearson Education,Inc.
Kunnan,A.J.1992 An investigation of a criterion-referenced test using G-theory,factor and cluster analyses.Language Testing 9:30-49.
———1995 Test Taker Characteristics and Test Performance:A Structural Equation Modeling Approach.England:Cambridge,Cambridge University Press.
North,B.2000 The Developmentof a Common Framework Scale of Language Proficiency.New York:Peter Lang Publishing,Inc.
Oller,J.W.1976 Evidence of a general language proficiency factor:An expectancy grammar.Die Neuen Sprachen 76:165-174.
Oller,J.W.,&F.A.Hinofotis.1980 Twomutually exclusive hypotheses about second language ability:Factor analytic studies of a variety of language subtests.In Oller,J.W.Jr.,&K.Perkins(eds.),Research in Language Testing.Rowley,MA:Newbury House:13-23.
Oltman,P.K.,L.J.Stricker&T.Barrows.1988 Native Language,English Proficiency,and the Structure of the TOEFL(TOEFLResearch Report No.27).Princeton,NJ:Educational Testing Service.
Sawaki,Y.,L.Stricker&A.Oranje.2008 Factor Structure of the TOEFL Internet-Based Test(iBT):Exploration in a Field Trial Sample.Princeton,NJ:ETS.
Stricker,L.J.,D.A.Rock&Y.W.Lee.2005 Factor Structure of the LanguEdge Test across Language Groups(TOEFLMonograph Series No.MS-32).Princeton,NJ:ETS.
Swinton,S.S.,&D.E.Powers.1980 Factor Analysis of the Test of English as a Foreign Language for Several Language Groups(TOEFLResearch Report No.6).Princeton,NJ:ETS.
The Study of the Relationship between the Four Skillsof the Advanced Chinese Learners:Based on Structural Equation Modeling
Yuan Xin1,Wang Jimin2
(1.Beijing Chinese Language and Culture College,Beijing 100037,China;2.HSK Test Center,Beijing Language and Culture University,Beijing 100083,China)
advanced Chinese learners;HSK[advanced];structural equation modeling;higher order analysis;language skills
This study investigates the factor structure of the four language skills of the advanced Chinese learners and the integrated/differential trend of the four skills,by applying the structural equationmodeling to the data of HSK[advanced]test.The finding of the confirmatory factor analyses of the 9 competing factor models indicates that,the three factor firstordermodel(listening&reading+speaking+writing)is best suited to describe the language ability of advanced Chinese learners,and the listening skill and reading skill take on a integrative trend,comparatively,speaking skill is more differentiated from the other three skills.It is found that for advanced learners,the relationship of four language skills,i.e.listening,speaking,reading and writing,presents a partly integrative trend.Thus,we conclude that HSK[advanced]test offers a reasonable test structure and suitable scoring system by separating the main test paper,speaking paper and writing paper,and scoring listening and reading comprehensively,but speaking and writing separately.
H195.1
A
1674-8174(2012)04-0024-09
[责任编辑 张耀文]
2012-03-17
原鑫(1986-),女,江苏徐州人,北京华文学院教师,硕士,主要从事汉语作为第二语言测试和教学研究;王佶旻(1974-),女,浙江杭州人,北京语言大学汉语水平考试中心教授,博士,主要研究方向为第二语言测试及学习。
国家社科基金青年项目“基于网络的汉语水平自测系统研究”(12CYY028);教育部人文社科重点研究基地重大项目“汉语作为第二语言的能力标准”(06JJD740005)