国内应用语言学界结构方程模型应用研究回顾
2011-01-24李久亮
李久亮
一、引言
结构方程模型(Structural Equation M odeling,简称SEM)是一种线性统计建模技术,最早出现于1921 年W right 发表的一篇论文。其应用始见于上世纪60 年代后期,90 年代初得到广泛应用。SEM在生物、教育、经济、医学、心理学和社会学等领域应用甚广,而在应用语言学研究领域还不多见。在国内,马广惠、文秋芳于1999年在《外语教学与研究》中首次发表了一篇基于SEM的学术论文[1],从而开创了我国外语教育研究领域的先河。在此之后,SEM逐渐被我国应用语言学界理解并接受,有关SEM的著作和研究相继出版。鉴于到目前为止,尚无一篇文章对国内此类研究进行专门、全面的回顾,笔者决定对近10年来发表在国内学术期刊的有关SEM的研究作一简要回顾与总结。
二、结构方程模型简介
结构方程模型是一种实证分析模型,通过寻找变量间的关系,来验证可能存在的某种内在结构关系或模型的假设是否合理,以及所建模型是否正确。如果模型存在问题,还可以帮助研究者进行调整与修改。从技术层面来看,SEM并非单指某一种特定的统计方法,而是一套用以分析协方差结构的多项技术的整合。SEM有时以协方差结构分析(covariance structure analysis)、协方差结构模型(covariance structure modeling)等不同的名词存在,有时则单指因子分析模式的分析,以验证性因子分析(CFA)来称呼之;有时,研究者虽然以SEM的分析软件来执行传统的路径分析,进行因果建模(causal modeling)的探究,但不使用SEM的名义,事实上这也是SEM的重要应用之一。
SEM兼具验证性因子分析(Confirmatory factor analysis,简称CFA)和路径分析(Path analysis)二者的特性,且具有二者不可比拟的优势:路径分析检验观测变量之间的因果关系,验证性因子分析检验观测变量与潜在构念之间的因果关系,而结构方程建模检验观测变量与潜在构念之间及多个潜在构念内部的因果关系。因此,有学者认为结构方程建模是验证性因子分析、路径分析及多元回归分析的总和。
SEM分析最重要的一个特性,是它必须建立在一定的理论基础之上,也就是说,SEM是一个用以检证某一先期提出的理论模型(priori theoretical model)的适切性的一种统计技术。这也是SEM被视为是一种验证性(con firm atory)而非探索性(exp loratory)统计方法的主要原因。在SEM的分析过程中,从变量内容的界定、变量关系的假设、参数的设定、模型的安排与修正,一直到应用分析软件来进行估计,其间的每一个步骤都必须要有清楚的理论概念或逻辑推理作为依据。从统计的原理来看,SEM也必须同时符合多项传统统计分析的基本假设(例如线性关系、常态性)以及SEM分析软件所特有的假设要件,否则所获得的统计数据无法采信。
目前有多种商业软件可以用于执行结构方程模型,其中使用较为普遍的有Bentler (1995)和Bentler 和 Wu (1995)开发的EQS(Equations),Jöreskog和Sörbom(1993) 开 发 的LISREL 8-SIMPLIS,AMOS(Arbuckle于1995年开发)和LISCOMP (M uthén于1987年开发)。其他的SEM应用软件还包括M x, SAS PROC CALIS以及STATISTICA-SEPATH (Schumacker and Lom ax,1996)。这些统计软件各有其优劣与特色,但AMOS更适合广大外语教育研究者,主要有以下几个理由:AMOS软件为SPSS家族系列之一,二者数据文件完全可以互通;AMOS软件中的Graphics绘图区完全以图像按钮为工具,各种SEM理论模型图的绘制均以图形对象表示,基本参数的设定,AMOS均有默认值,使用者只要熟悉工具箱图像按钮的使用,即可快速绘制各种假设模型图;三是AMOS输出的报表数据对使用者而言,解读较为简易[2]。
有关结构方程模型的特性及软件应用,前人已经做了详细介绍,这里不再赘述。关于SEM建模步骤,请参阅韩宝成[3],有关LISREL软件应用,请参阅王立非、鲍贵[4],有关AMOS软件应用,请参阅雷蕾[5]。
三、国内应用语言学界基于结构方程模型研究回顾
(一)研究概况
通过在中国知网进行信息检索,发现到目前为止,国内主要的应用语言学研究学术期刊中共有20篇文章采用了结构方程模型(见表1)。从表中我们可以看出我国应用语言学界对SEM的总体使用情况。第一篇应用此项分析方法的文章出现在20世纪90年代[1]。新千年之后,结构方程模型的应用出现了较为快速的增长,陆续发表了19篇相关论文。
按照出版时间的先后来看,在我国桂诗春[6]是第一位采用验证性因子分析方法的人。他根据中国学习者语料库对中国学习者英语失误分析提出一个认知模型,把失误分为三个层面:在单词层面上的词汇感知失误、在词际层面上词汇语法失误和在句子层面上的句法失误,使用验证性因子分析来检验。文章指出语言迁移在中国学习者写作中发生重要影响。学习者有两个语言系统(一个比较完整,一个较不完整)可供驱使。用哪一个系统取决于写作任务和完成任务的确切程度。
而最早综合使用结构方程模型的则是吴红云和刘润清[7]。作者通过使用结构方程模型对调查数据进行统计分析以及对前期因子分析推导出的“二语写作元认知的理论框架”进行验证和修改,发现元认知由元认知主体评估、元认知策略和元认知任务评估三大要素构成。其中,元认知主体评估和元认知策略对写作成绩有直接和重要的影响,而元认知任务评估通过主体评估对写作成绩产生间接影响。
(二)研究类型
在这20篇文章当中,有6篇属于方法引介类的综述性文章[8][9][10]。应该说近些年结构方程模型使用出现较快增长,和学者们的大力推介密不可分。通过以上综述性文章,我们也可以看出我国应用语言学界对结构方程模型理解与应用的轨迹。LISREL是国际上开发较早、应用广泛的SEM应用软件,而我国第一篇综述性文章(王立非、鲍贵,2003)就向读者介绍了LISREL统计学原理、操作系统和路径分析模型。指出线性结构方程模型是一种从变量间或变量群间的协方差结构出发,研究和确认因果关系的分析方法。文章评述了我国应用语言学研究者运用该方法开展的英语写作和英语学习动机等方面的实证研究。而在当时出版的学术论文当中,仅有两篇采用结构方程模型[1][11],且只涉及路径分析。第一篇系统介绍结构方程模型的文章在2006年出现在《外语教学与研究》,由韩宝成撰稿。该篇文章对结构方程模型的原理及建模步骤进行了详细描述,并指出了这项技术在语言测试研究领域的应用前景。
表1 国内基于SEM的应用语言学研究论文汇总(1999-2010)
这两篇文章的一个共同点都是以LISREL软件为例介绍如何应用结构方程模型开展研究,而在它们出版前后所发表的相关研究也都是以LISREL为分析工具的。这有一部分原因是LISREL开发的较早,有一种先入为主的影响,所以大家习惯上愿意接受并使用它。但AMOS其实更适合绝大多数没有计算机编程基础的应用语言学研究者,它无须复杂的程序语句,只要画出模型,读入数据,就可执行分析工作。雷蕾[5]和彭剑娥[9]在她们的文章里就向读者介绍了AMOS软件,雷蕾更是详细说明了该软件的操作步骤。从表1可以看出,2006年以后至2010年的有关结构方程模型的研究几乎全部采用了AMOS软件,仅有一个例外[12]。许宏晨回顾了近十年来国内外学术期刊中以SEM为研究技术的应用语言学文章,详细说明了国内外学者采用这一研究方法的显著差异。从内容上看,国外学者常用这一技术进行纵向、验证性的全面研究;我国学者多用它进行横向、探索性的专题研究。从形式上看,国外学者对待SEM统计指标比较宽松,模型呈现比较详细,软件使用比较多元;国内学者对待SEM统计指标比较谨慎,模型呈现形式简洁,软件使用比较单一[10]。
通过对所收集的文章进行分析发现,我国利用SEM开展的实证性研究集中在二语习得和语言测试领域。在所收集的20篇文章当中,不考虑上述6篇综述类的,有10篇属于二语习得研究[1][6][7][11][13][14][15][16][17][18],有4篇属于语言测试领域的研究[12][19][20][21]。10篇二语习得研究围绕两大课题,一是有关学习者语言知识和技能等认知方面的研究[1][6][7][17][18];另一个是有关学习者动机和态度等情感因素方面的研究[11][13][14][15][16]。
(三)案例介绍
案例1
从表1可以看出,我国外语研究人员将结构方程模型主要应用到写作研究之上。有关此类文章有8篇之多,其中利用语料库开展学习者写作失误分析的1篇[6]。研究写作策略的有2篇[7][8]。研究写作水平影响因素的有3篇[1][13][17]。研究写作构念效度的有2篇[9][21]。下面我们以修旭东和肖德法的文章为例,对基于结构方程模型的英语写作研究作一简单介绍。
作者对三所高校的463名大学四年级学生进行了问卷和测试调查,目的是了解英语写作策略、英语专业八级写作认知过程及成绩之间的关系。利用LISREL软件建立结构方程模型。根据结构方程模型理论和写作策略、写作认知过程的研究结果,把“写作学习策略”和“写作过程应用策略”作为外生潜在变量(exogenous latent variables),把八级写作子过程作为内生潜在变量(endogenous latent variables)(见模型中间部分)。与此相对应,问卷A中的题项作为观测变量是外生标识(exogenous indicators),问卷B中的题项作为观测变量是内生标识(endogenous indicators)(见模型左右两侧)。
该模型的评价指标比较理想:卡方值(1980.29)与自由度(1906)之比为1.039,远低于最大值2.0;置信度检验P值为0.11533,远大于0.05,即不能拒绝近似误差均方根(RM SEA)小于0.05时的假设;RMSEA为0.009,不仅远小于0.05,更远小于最大值0.08。其它拟合指数为:NNFI =1.02,CFI=1.00,GFI=0.88, AGFI=0.87。综合上述评价指标,该模型拟合度较高[18]。
案例2
就目前我国学者的结构方程模型软件应用情况来看,主要采用的是LISREL和AMOS,使用EQS的仅有一例(邹申、彭康洲、 孔文,2009)。此项研究属于典型的语言测试领域内的构念效度验证,作者在邹申(2007)等人研究的基础上,通过以下三种方法对该部分题目进行效度验证:(1)分析人文知识题的内容关联性和代表性;(2)采用结构方程软件EQS 6.1对人文知识题作验证性因子分析;(3)借助BILOG-MG 3.0软件,采用项目反应理论的三参数模型对2004年出版的《高等英语专业八级考试大纲》增加的人文知识题作项目分析。验证性因子分析旨在验证考试题目的内部结构是否与理论假设的模型拟合,这是效度验证的必要条件。作者根据拟合指标来比较,最终选择拟合指标最好的模型。表2列出了人文知识项目各种模型的拟合指标。
表2 人文知识项目各种模型的拟合指标比较
从表2可以看出,一阶三因子模型的各项拟合指标优越于一阶单因子模型。虽然二阶单因子模型的拟合指标与一阶三因子模型一样,但是它能表明三个因子同属于一个共同的潜在因子:人文知识,故使模型更加简练(见图1),同时,各因子能够组成一个高阶因子,则表明各因子之间的相关系数也很理想。所以,比较各模型的相关指标后,作者认为二阶单因子模型是揭示人文知识项目构念的最佳选择。
四、结语
在我国,从1999年应用语言学界出现第一篇基于结构方程模型的论文起至今,这一研究路径经历了大约10年的发展。通过对这一阶段研究的回顾,可以看出我国学者对这一统计手段的理解在不断进步,理论认识逐步升华,软件应用日趋成熟,研究视野逐步开阔。研究范式经历了从简单到综合的发展历程,从最初的路径分析,到验证性因子分析,再到结构方程模型的综合应用。然而,10年间总共出现14篇相关实证研究,可以说是凤毛麟角。从研究范围来看,目前仅限于二语习得和语言测试,有待进一步拓宽。从研究类型来看,我国学者多用它进行横向、探索性的专题研究。从已发表的论文来看,对相关统计知识及原理的理解似乎有待进一步提高。Kunnan[22]325指出,“主要问题是语言测试研究者如何能够最有效地应用结构方程模型”。应该承认,我们在该领域的研究水平与国外存在差距(参阅许宏晨,2009)。Kunnan曾经为SEM在语言测试研究中的应用指出了几个有前景的发展方向,在这里介绍给读者,希望能有所启示。首先是对应试行为的因子结构进行深入研究与探索;其次是对应试者特征和应试行为之间的关系假设进行检验;第三是采用多层面分析方法对考试成绩进行构念效度验证;第四是对前述三点的拓展,即基于个体特征(例如性别、年龄、种族、母语、语言障碍等)开展多样本分析并对应试数据进行深入研究;第五是对应试者答题时的心理过程进行研究;最后是通过纵向研究方法,对个体能力的成长进行分析。
作为回归分析和因素分析的拓展,SEM 的优点在于能够运用多重指标对研究问题进行全面评估并考虑测量误差,使研究者对实验结果有更深入的了解,成为理论发展的重要工具。鉴于此,须做好结构方程模型在我国应用语言学界的应用和推广,充分发挥其优势,以提高研究者开展实证研究的水平、效率和质量。
[1] 马广惠、文秋芳. 大学生英语写作能力的影响因素研究[J] .外语教学与研究, 1999(31):4.
[2] 吴明隆.结构方程模型:AMOS的操作与应用[M]. 重庆:重庆大学出版社, 2009.
[3] 韩宝成. 结构方程模型及其在语言测试中的应用[J].现代外语2006(29):1.
[4] 王立非、鲍贵. 应用语言学研究的路径分析方法:原理与应用评介[J]. 现代外语, 2003(26):4.
[5] 雷蕾. 结构方程建模及AMOS软件在应用语言学研究中的应用[J]. 中国外语, 2009(6):1.
[6] 桂诗春. 以语料库为基础的中国学习者英语失误分析的认知基础[J]. 现代外语, 2004(27):2.
[7] 吴红云、刘润清. 写作元认知结构方程模型研究[J]. 现代外语,2004(27):4.
[8] 吕生禄. 外语研究中结构方程模型的概念化. 长春理工大学学报[J],2010(5):4.
[9] 彭剑娥. 结构方程模型及其在外语教学与研究中的应用[J].韶关学院学报(社会科学版), 2007(28):8.
[10] 许宏晨. 结构方程模型在国内外应用语言学研究中的运用比较[J]. 外语教学理论与实践(FLLTP), 2009(1).
[11] 秦晓晴、文秋芳. 非英语专业大学生学习动机的内在结构[J]. 外语教学与研究, 2002(34):1.
[12] 邹申、彭康洲、孔文. 应用EQS和BILOG分析TEM 8人文知识项目的构念效度[J]. 中国外语, 2009(6):1.
[13] 雷蕾、韦瑶瑜. 中国非英语专业大学生写作障碍实证研究[J]. 中国英语教学(英文版),2007(30):5.
[14] 倪传斌. 外语磨蚀影响因素间的作用路径与强度.[J].外语与外语教学, 2010(2).
[15] 彭剑娥. 大学生英语交际意愿的多元变量研究[J]. 外国语言文学(季刊), 2007(4).
[16]杨小虎、丁仁仑. 大学生英语听力学习动机维度结构类型及其与听力学习行为的关系[J]. 现代外语,2004(27):3.
[17]王立非、文秋芳. 母语水平对二语写作的迁移:跨语言的理据与路径[J]. 外语教学与研究, 2004(36):3.
[18]修旭东、肖德法. 英语写作策略、八级写作认知过程及成绩关系的结构方程模型研究[J]. 外语教学与研究,2006(38):6.
[19]高霄. 二语写作质量构念效度的结构方程模型分析[J].山东外语教学, 2009 (6).
[20]王永庆、曾用强. 测试方法效应对听力理解成绩的影响作用——NMET和NMET2听力理解测试的对比分析[J]. 现代外语, 2006(29):1.
[21]文秋芳. “作文内容”的构念效度研究——运用结构方程模型软件AMOS 5的尝试[J]. 外语研究,2007(24):3.
[22] Kunnan, A. J. (1998). An introduction to structural equation modeling for language assessment research[J].Language Testing, (15):3.