APP下载

验证性因子分析中允许误差相关的可行性与条件性

2018-10-30马子程

统计与决策 2018年19期
关键词:系统误差研究者修正

胡 鹏,路 红,马子程

(1.广州大学 教育学院,广州 510006;2.中山大学岭南学院,广州 510275)

1 问题的提出

近年来,越来越多的社会科学研究者采用结构方程模型(SEM)来进行量化研究中的数据分析,其主要原因是相对于传统的回归分析,SEM具有允许自变量与因变量均含测量误差、同时处理多个因变量、提供模型拟合指数等优势[1]。事物之间的关系错综复杂,当今的社会科学实证研究需要考虑更多的变量,应用SEM是研究需要,SEM是多变量统计分析的重要方法,广泛应用于心理学、管理学、社会学、教育学和经济学等社科类实证研究。

SEM分为测量模型和结构模型[2],而验证性因子分析(Confirmatory Factor Analysis,CFA)的分析对象正是SEM中的测量模型部分。通常,研究者先根据前人研究并结合理论提出一个因子结构模型,然后通过相关软件建立模型,最后导入数据运用算法去估计模型待估参数,得到参数估计结果和拟合指数,评价模型。

在建构好模型并确保模型可以识别后,选择恰当的估计方法对模型的参数进行估计,目前比较常用的估计方法有ML和PLS[3]。最后是模型评价阶段,模型拟合的评价主要是通过拟合指数的表现来衡量,拟合指数分为绝对拟合指数、相对拟合指数和简约指数[4],目前国内学者普遍建议使用的拟合指数有以下几个:χ2/df、CFI、NNFI(TLI)和RMSEA,每个拟合指数都对应一个临界值,χ2/df最宽松的标准是5以下,CFI和NNFI要达到0.9以上,RMSEA的要求是0.08以下[5-7]。由于在实际研究中,很难一次就达到具有良好拟合的模型,所以目前各大主流SEM软件均报告修正指数(MI),修正指数的实质是对模型修正的“数学”提示,盲目地根据MI来修正模型是不可取的,不能忽略模型背后的理论意义[8]。值得注意的是,目前学界存在的一个较为普遍的现象:为了“提高模型拟合”,根据修正指数来设定CFA中部分条目的误差项相关,但没有紧接着给出一个合理的解释(实际上大多数情况下是解释不清的)。那么究竟在CFA中能不能允许误差相关?什么条件下可以允许误差相关?不能允许误差项相关但拟合不达标又怎么办?这是本文所关注的三个核心问题。本文从误差分解的角度来阐述CFA中允许误差项相关的条件,并结合两个特例模型来说明其允许误差项相关的合理性和必要性。

2 误差分解

提到误差分解,最容易联想到的是经典测量理论(CTT):X=T+E(X为观测分数,T为真分数,E为测量误差),CTT框架下的测量误差分为随机误差和系统误差。随机误差是指那些研究者未知的也无法控制的因素所造成的测量偏差,如被试个人的紧张、生病或者测验场景的偶发噪音等;而系统误差的特点是对所有条目甚至所有被试的影响是一致的,如被试对模棱两可的条目可能存在着一律选“是”或一律选“否”的倾向,这种误差一旦被研究人员所察觉,在下次测量中就可以被控制甚至消除[9]。

CFA框架下的测量误差被细分为:随机误差、系统误差和独特性成分[10],不难发现,与CTT相比,独特性成分是CFA的误差里所独有的,指的是某条目与同因子下其他条目的公共变异被抽取后剩余的成分,反映的是条目自身的独特性,而独特的原因往往是源于条目不同的表述。虽然误差被分解,但无法对三者进行数量上的区分,始终是绑在一起呈现一个数值,而且目前学界关于独特性的大小要求也没有明确的临界值界定,但可以肯定的是条目间是需要有一定程度的独特性的,否则采用多个条目测量同一潜变量的意义将大打折扣。

3 误差相关

CFA中的修正指数主要包括两大类:允许误差相关和条目跨因子负荷。前者是指释放误差相关自由估计,后者是指条目同时负荷于多个因子,修正指数的原理就是通过释放这些参数自由估计来提高模型拟合优度。每释放一个参数自由估计,模型的卡方会减少,拟合相应也会有所改善,理论上说,当模型的所有参数自由估计时,模型达到饱和,拟合最优;固定所有参数时,即为独立模型,拟合最差。在参数估计结果未知时,先验的去固定某些参数值的做法不利于产生数学上最优的再生矩阵,有可能得到欠佳的拟合优度,这时软件从数学的角度指引研究者释放一些MI比较大的参数来减小卡方值提高拟合优度。一味的根据修正指数去不断允许误差相关,模型的拟合一定会越来越好,但这是典型的“数据驱动”,显然不可取。对于软件本身来说,模型只是一堆数学联立方程,而对于研究者来说,模型富有深厚的理论意义,一旦设定一般不可轻易改动的,因此,研究者应始终坚持理论先行,否则改动的模型最终会变得无法解释。那么究竟可不可以允许误差相关?

首先,随机误差是未知的、不可控的,显然,没有任何理由去允许随机误差相关,其中的道理就像先验的让两列数随机,然后承认它们之间相关,这已经违背了随机的本质;其次,系统误差是同一变异源对某些条目的共同影响,如果在特定研究中真的存在这个变异源,那么在澄清这个变异源的情况下允许这些条目间的误差相关是可以接受的,但问题是既然知道为什么不事前去控制这个变异源?又为什么只允许部分条目间的系统误差相关,而不是允许所有条目?成功的解释为什么这个变异源只是对量表中的部分条目产生影响并非易事,因为通常情况下这种变异源的作用对象是所有条目;最后,独特性成分是每个条目所独有的,如果可以允许不同条目间独特性相关,那也就不可以称之为“独特性”了。

综上所述,在CFA中允许不同条目误差项相关是可行的,但理由只能是其中的系统误差相关,因此要解释清楚是什么系统误差对这些条目的得分产生了影响。换句话说,只有当研究者清楚存在某个系统偏差(如方法效应)对条目得分产生影响才能去允许误差项相关。如果没有合理的解释,很难摆脱“纯粹为了提高模型拟合”的嫌疑。

虽然SEM在我国社科类研究中被广泛使用,且越来越普遍,但仍然有很多研究者没有认识到误差相关的实质,不恰当地允许误差相关,具有讽刺意味的是,这些文章是发表在了相关学科的权威杂志上,通过中国知网、万方和维普进行“误差相关”“残差相关”“误差项相关”“残差项相关”等同义关键词的搜索,可以查阅到大量在CFA中允许误差项相关的文献,其中大部分都没有给出一个合理的解释,在此不一一赘述,下面仅以近几年的几篇典型文献来具体说明。

2016年发表在《心理发展与教育》上的《学生学业成绩和教师控制知觉对教师差别行为的影响》在验证其中一个量表的结构效度时论述到:“本文采用Mplus7.0软件对该量表进行验证性因素分析,删除了机会特权维度中的一个项目与负性反馈维度中的两个项目,并分别设定两个维度内共三对项目残差相关,修正后问卷结构效度良好,χ2/df=3.56,CFI=0.92,GFI=0.92,TLI=0.91,RMSEA=0.06”[11]允许了三对项目残差相关后并没有任何解释,保守的说,有单纯为了提高拟合的嫌疑。又如2016年发表在《心理与行为研究》上的《心理健康素质测评系统·中国成年人核心心理健康素质全国常模的制定》在CFA中论述到:“根据模型的修正指数表,依据每步修正对模型改善程度的大小,对测量模型进行逐步修正等。第一次修正:在误差项e4与e6之间建立相关关系;第二次修正第六次修正:在误差项e21与e2之间建立相关关系等。经过六次模型修正,模型拟合指数在可接纳的范围内。”[12]从一个欠佳的拟合出发“硬生生”经过六次误差相关的设定将拟合叠到达标的水平,并没有任何关于误差相关的解释,倘若经过n次误差相关修正后使得模型拟合达标,那不如直接废除模型拟合这个门槛来的直接了当。

除心理学外,其他社会科学也有此类现象,如2016年发表在《学前教育研究》上的《父母冲突与幼儿社会适应的关系:消极情绪的中介作用》在父母冲突量表的CFA中表述为“对该量表进行验证性因素分析和模型修正,设定两个项目残差相关后的拟合指数为:χ2/df=2.31,RMSEA=0.06,GFI=0.95,CFI=0.95,NFI=0.93 ”[13]此处也是在误差相关后紧随一个良好的拟合但没有解释这么做的理由。又如2014年发在《社会学研究》上的文章《检验环境关心量表的中国版(CNEP)》中的表述:“以上两个模型控制了2000版量表15个观测项目可能存在的测量误差以及测量项目之间的误差相关”和“在依照模型修正指数逐步牺牲了一定的模型自由度后,两个模型都达到了饱和,各项模型拟合度指标都达到了可接受标准”[14],前半句表述模模糊糊,后半句则表现出明显的“数据驱动”。以上这些文献均没有对误差相关做出解释。其实也有一些文章给出了“所谓的”理由,比如2013年《管理评论》上的文章《IT治理绩效影响因子分析:基于中国电子政务实施的实证研究》,文中给出允许误差相关的理由是:“尽管建立误差相关违背了模型的基本设定,但是从逻辑关系来讲本测量工具的测量题目之间存在一定的关联关系是可能的,误差相关系数也非常低,修正模型可以接受。修正后的测量模型的拟合情况比较良好,多数指标达到了令人满意的标准,可以接受测量模型。”[15]理论上讲条目间确实是相关的,但这种相关关系已经被公因子所解释,其次条目间相关和误差相关也不是一回事。

综上所述,目前此类不恰当允许误差相关的文章对误差相关的解释分为三类:第一类,直接不解释,可能认为根据修正指数来修正模型提高拟合理所当然;第二类,表述模糊,不明确指出允许了部分条目的误差相关,但内行人能看的出来;第三类,似是而非的解释,主要是类似于“理论上这些条目间是相关的,所以允许误差相关可以接受”之类的表述。

4 允许误差相关的特例模型

在标准的CFA模型中一般不允许条目间误差相关,但有一些特殊CFA模型可以允许误差相关的存在,并且这种允许是合理的、必要的,下文仅以CT-CU模型和纵向等值检验为例来说明其允许误差项相关的合理性和必要性。

4.1 CT-CU模型:允许系统误差相关

关联特质-关联独特性模型(Correlated Trait-Correlated Uniqueness,CT-CU)与标准CFA不同的是,所有条目的得分并不是采用同一种方法测到的,这里面存在一个方法学效应。下面举例说明:

如图1所示,与图1模型不同的是,这里允许e1与e4相关、e2与e5相关、e3与e6相关,之所以这样设定是因为在这个模型中,a1与 a4、a2与a5、a3与 a6这三对条目是分别用不同的方法测量的,比如老师评定、家长评定和自评这三种方法。因此,在这个模型中多了一个方法学效应,同一种方法测得的条目得分都受到该方法产生的系统误差,不同方法造成的系统误差可能是不同的,故可以允许同一种方法测得的条目误差间相关[16]。此种情况下如果误差相关全部限定为0,反而是不合理的,即没有考虑到方法学效应对条目得分的影响。

图1 CT-CU模型

4.2 纵向等值检验:允许独特性相关(相同条目)

与横断研究相比,纵向研究可以考察变量随不同时间点的变化情况,例如考察某群体心理健康水平随时间的变化趋势就需要进行纵向研究设计。需要注意的是,在比较不同时间点变量水平之前,需要进行纵向不变性的等值检验,如果不满足这个前提,则不能进行潜均值的比较[17]。图2即为一个两因子测量两次的纵向等值检验,f1与f2是第一次测量,f12与f22是第二次测量,f1对应f12,f2对应f22。从图2可以看出,允许两次测量中的同一条目间误差相关,如e1与e7,理由是e1与e7是同一条目,同一条目的独特性是相同的,一般认为独特性引起的变异在多次测量间保持恒定[18],因此,这里允许的误差相关是同一条目独特性的相关,并且合理、必要。

图2 纵向等值检验模型

综上,两个特例模型说明CFA在某些情况下是可以允许误差相关的,不难看出,这两个特例中允许误差相关是合情合理、有理有据的,实际上这两个模型也代表了两类可能出现误差相关的模型:方法学效应模型、纵向设计模型。需要强调的是,本文利用这两个模型进行阐述并不代表着只有这两个特例模型可以允许误差相关,其意旨在说明其允许误差项相关的合理性和必要性。

5 相关建议

在实际研究中,由于人力、物力和财力等种种因素,往往很难做到采用多种方法测评或者纵向的追踪调查,最常遇到的是采用同一种方法(如纸笔测验)、相同数据来源(如自评)的横断调查数据,由上述分析可知,在这种情况下去允许误差相关往往是解释不清的,尤其是只允许部分条目误差相关。

如果不允许误差相关,但CFA模型的拟合欠佳,这时该怎么办?可能是研究者最关心的问题,下面按CFA的对象将其分为两类来分别探讨并给出建议:

第一类CFA的对象是成熟量表,研究者利用某公认的成熟量表收集调查数据,这时在进行CFA时一般不建议去改变量表的原结构,除非有特殊的理由(如跨群体研究)。不改变量表的原结构意味着要忽略关于条目跨因子负荷的MI,剩下关于误差相关的MI就显得尤为重要。虽然不允许误差相关,但如果存在多个较大的误差相关的MI值,意味着可能存在某个系统因素对这些条目的得分产生影响,这时可以将所有的条目都负荷在一个潜因子上(图3),即共同方法变异(CMV)统计控制中的“控制未测单一方法潜因子法”[19],共同方法变异指相同数据来源或评分者、相同测量环境等因素所造成的测验条目间或潜构念间的人为共变[20],因此,对于采用此类调查方式收集的量表数据,无论是从理论上还是逻辑上,假定存在一个方法因子可以解释测验条目的部分变异都是合情合理的;此外,从统计上说,在控制这个方法效应后得到的参数估计结果会更加精确,这也应是研究者所追求的;最后,增加一个方法因子后释放了数量等于条目总数的参数,从理论上说,模拟的拟合一定会有所改善,并且改善的幅度一般会比允许部分条目误差相关更大。总之,对于相同测量方法的横断成熟量表数据,如果拟合不达标,建议采用带方法因子的CFA模型,而不是允许部分条目误差项相关。

图3 带方法因子的CFA模型

第二类CFA的对象是自编量表或修订量表,对于这类量表数据的CFA,不仅可以考虑加入方法因子,还应当重点关注条目跨因子负荷的MI,并根据量表背后的理论和条目的表述来判断事先设定的条目的因子归属是否合理,如果存在交叉负荷的条目,建议予以删除。总之,在理论解释条目跨因子负荷的合理性的基础上,可以通过这种方法来提高模型拟合。

6 总结

本文首先利用一个简单的模型阐述CFA的原理及过程,接着从误差分解的角度,在阐述各误差成分含义的基础上,分析得出:

(1)可行性:虽然标准CFA不允许误差相关,但在某些特定模型里可以允许误差相关,如CT-CU模型和纵向等值检验模型。

(2)条件性:允许不同条目误差项相关的理由只能是系统误差相关,只有研究者能够解释可能是什么系统偏差对条目得分产生了影响,才能去允许误差相关,否则允许误差相关是欠妥的。

(3)建议:对于成熟量表的CFA,考虑加入方法因子;对于自编量表或修订量表的CFA,还有重点关注条目负荷跨因子的修正提示,并结合理论来考虑量表的结构是否需要调整。

猜你喜欢

系统误差研究者修正
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正这一天
高等教育中的学生成为研究者及其启示
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
基于ADS-B的航空器测高系统误差评估方法
软件修正
基于Bagging模型的惯导系统误差抑制方法
用系统误差考查电路实验
基于PID控制的二维弹道修正弹仿真