二阶验证性因子模型的AMOS实现
2013-12-04付会斌潘海燕孔丹莉丁元林
付会斌 潘海燕 孔丹莉 丁元林△
结构方程模型(SEM)建模包含内容颇多,如何快速掌握常用的建模方法并用软件准确实现,尽快产生研究成果和经济效益是多数初学者头疼的问题。SEM所包括的类型众多,不同的模型类别具有其特殊的性质,对结构方程后续分析工作产生较大的影响。按照构成模型变量的性质不同,可以分为结构模型和测量模型;按照反映变量之间的关系不同,可以分为验证性因子分析和因果关系模型;根据隐变量的层次可以划分为一阶模型和多阶模型。本文从模型设定、模型求解、模型拟合以及模型修正等方面来介绍利用SPSS AMOS(analysis of moemnt structure)软件作为技术工具实现二阶验证性因子模型的基本方法,采用探索性因子分析(exploratory factor analysis,EFA)和验证性因子分析(confirmatory factor analysis,CFA)相结合的因子分析方法评价量表的结构效度,以期合理和科学地评价CN-ADDQoL量表的因子结构,通过实际的案例分析,以达到快速掌握SEM相关原理和熟悉AMOS软件的目的。
资料来源
资料来源为2006年张广恩〔1〕硕士论文中的调查数据,研究对象为2005年8月至2006年1月广东医学院附属医院内分泌科确诊的2型糖尿病住院和门诊病人,共732例。剔除23例记录不全的病人和12例先发生甲亢等其他疾病后继发糖尿病或两者发生的先后关系不明确定的病人,可用于分析的对象共697例,所有病例均填写基础调查表和CN-ADDQoL量表。
CN-ADDQoL量表的EFA分析
EFA与CFA是探讨所收集资料中隐含的类型或主题的两个重要方法,EFA可以了解资料的潜在意义是什么,而CFA可验证根据先前理论提出的假设。针对CN-ADDQoL量表可能独有的因子结构,本文采用EFA寻找最佳的理论构建,采用 SPSS15.0软件对CN-ADDQoL量表除两个独立分析的条目外,对其余19个条目进行EFA,挖掘出量表所隐含的深层意义与因子结构(哪些条目用于研究哪些公因子?),提出初始模型,采用AMOS7.0软件构建验证性因子模型对CN-ADDQoL量表的结构效度进行分析。
由于CN-ADDQoL量表的第9个问题涉及性生活方面,而大多数糖尿病患者为中、老年人,思想观念较为传统,此题应答率较低,分析时将此项问题删除。量表中除了两个独立分析的条目外的其余19个条目进行因子分析,公因子的提取原则采用特征根大于1,因子负荷的估计方法采用主成分分析法,公因子涵盖的子项按因子载荷大于0.4原则入选,因子旋转采用promax,结果KMO=0.889,Bartlett's球形检验的结果P<0.05,提示数据子项间存在相关性,可进行因子分析。提取的四个公因子依其实际意义(括号内为各因子的因子载荷、含义)分别取名为社会关系维度(v6,0.787,家庭生活;v7,0.809,朋友关系和社交生活;v8,0.809,亲近的个人关系;v13,0.621,人们的反应)、心理感受维度(v10,0.731,身体外表;v11,0.776,自信心;v12,0.812,动力;v14,0.702,未来的感觉)、躯体生理维度(v1,0.699,休闲活动;v2,0.501,工作生涯;v3,0.822,旅程;v4,0.647,度假;v5,0.523,体力活动)、物质生活维度(v15,0.592,经济状况;v16,0.427,不得不依赖他人;v17,0.583,生活状况和生活条件;v18,0.809,吃东西的随意性;v19,0.716,喝东西的随意性),这四个公因子(四个潜在变量)从不同角度反映了糖尿病患者的生存质量状况。EFA提示该量表应该是一个包含四个维度二级结构的量表,为进一步考核量表的结构效度,采用CFA方法对所得数据拟合。
CN-ADDQOL量表的CFA分析的构建与拟合
1.CN-ADDQOL量表的一阶CFA分析的构建过程与拟合结果
(1)模型构建及假设
依据理论及EFA分析结果,量表的四个维度高度相关,构建一阶四因子CFA模型。对模型做一些规定〔2〕:①每个条目都有一个不是零的负荷量在其所测量的一级因子上,但是对其他的一级因子的负荷量为0;②条目与条目之间所联结的测量误差彼此不相关。为解决量尺特质未定性的问题,将某些因子负荷量固定为1,为估计误差的变异量,将测量误差的路径系数全部固定为1,利用AMOS7.0绘制一阶四因子模型的路径图。
(2)模型拟合过程及结果
采用最大似然(ML)估计对模型进行拟合,为便于比较将模型修饰过程中每步骤的总体拟合指数整理成表1,由表4可知,该模型仍未达到理想,某些模型参数之间必须做修正,将修正指数大于20的方差系数整理,见表1。
表1 模型修饰各步骤的总体拟合指数
表2 初始模型参数修正指数摘要表
MI表示一个先前固定的参数被释放后,模型重新估计下所降低的最小卡方值。统计上,一个MI可以解释为一个自由度的卡方分配。由于一个自由度的卡方统计临界值(α=0.05)为3.84,因此,当MI值大于3.84时就被认为足够大,而此参数的因果性有足够的理论支持的话,便可将之释放,重新估计。由表2可知e13-F3、e13-F2、e5-F2 的 MI值分别为21.334、25.080、22.392,显示它们各两项之间存在密切关系,但该结果违反SEM的基本假设:残差与因子间无相关,故不可以释放估计。e18-e19的MI值为83.470,该值很大,查看量表中18题题目(如果我没有患糖尿病,我吃东西的随意性将会?),与19题题目(如果我没有患糖尿病,我喝东西的随意性将会?)发现两题内容虽不完全相同,但都为测量饮食方面对患者生存质量的影响,在此考虑下,对e18和e19的变量先释放,接着查看其适配度的变化。e18和e19的变量释放后,其各项拟合指数见表3,其中χ2RMR、AIC比变量释放前变小,而这三个值愈小愈好,PNFI 、GFI、AGFI、NFI、RFI、CFI较释放前变大,但NFI、RFI仍未达到0.90的临界标准,说明该修正模型虽有改善,但仍需对部分变量进行修正。
表3 释放e18-e19后模型参数修正指数摘要表
由表3可知,e6和e13的MI仍较大,查看量表6题目(询问患者家庭生活)与13题题目(询问人们对患者的反应),从两题题意人们对患者的反应可能影响其家庭生活,即两者存在相关,故释放e6和e13。
表4 释放e6-e13后模型参数修正指数摘要表
由表4可知,e11和e12的MI仍较大,查看量表11题题目(询问自信心)与12题题目(询问动力),从两题题意知人们的自信心与动力可能会相互影响,即两者存在相关,故释放e6-e13。
AMOS7.0中可输出未标准化和标准化的模型,选择标准化的路径图(图1)可显示标准化的回归系数、相关系数以及R2。由图1可知,有些指标的信度似乎不是非常理想(λ值未大于 0.70,R2未大于0.50),且四个潜在变量的相关系数均不小(介于0.59~0.78),提示该模型可能具有更高层次的因子结构。
图1 一阶验证性因子终模型标准化路径系数估计结果
2.CN-ADDQOL量表的二阶CFA分析的构建过程与拟合结果
(1)模型构建及假设
依据理论及一阶CFA分析结果显示,四个潜在变量的相关系数均不小(介于0.59~0.78),提示该模型可能具有更高层次的因子结构,构建糖尿病患者生存质量的二阶四因子CFA模型。模型的假设如下:(1)2型糖尿病患者生存质量可由四个一阶因子及一个高阶共同因子说明。(2)每个题目没有横跨因子的现象,即每个题目均落在所构建的单一因子上。(3)误差项间独立无关。利用AMOS7.0绘制二阶四因子CFA模型的路径图。
(2)模型拟合过程及结果
采用ML估计对模型进行拟合,AMOS的主要的拟合指标如下:χ2=502.568,GFI=0.925 ,AGFI=0.902,RMR=0.289,NFI=0.868,RFI=0.846,CFI=0.898,PNFI=0.734,AIC=582.568。结果显示,该模型仍未达到理想,显示某些模型参数之间必须做修正。
根据AMOS提供的修正指数,结合专业知识,将某些误差变量之间的固定参数释放为自由参数等,然后再进行模型拟合,如此反复修改,最终结果见图2。该模型的初始与最终模型的总体拟合指标见表5。从表5可知,最终模型的总体拟合在可接受范围内,其中GFI=0.935,AGFI=0.937,NFI=0.919,CFI=0.950,均比要求值高,说明所得模型较为理想。
结 论
众所周知,不同人群使用同一份已被证实具有较好信度及效度的量表,结果可能有所不同。因此,对引进量表的结构效度进行评价,以确保结果的准确性与可靠性是必不可少的。由于地区文化背景、风俗习惯和研究对象的差异,CN-ADDQoL量表可能有其独有的因子结构。Garratt等[3]根据其制定的选入和剔除标准,从量表的信度、效度、反应度等方面对ADDQoL量表进行了评价,认为该量表是单维度的。孔丹莉[4]等将该量表按条目含义分为几个维度,然后进行CFA,数据拟合较好,但无法挖掘出中文版量表的因子结构。本文采用EFA对CN-ADDQoL量表的因子结构进行分析,提取出四个公因子依其实际意义分别取名为社会关系、心理感受、躯体生理、物质生活,这四个维度从不同角度反映了糖尿病患者的生存质量状况,结果提示量表应该是一个包含四维度二级结构的量表。按照社会心理流行病学理论,2型糖尿病患者躯体生理方面的生存质量与心理感受方面的生存质量彼此依存、互为因果,若人为割裂它们之间因果关系,把其中某一个单独作为因变量来分析研究,其结果必然是片面的、不切实际的。
表5 二阶验证性因子模型始模型与终模型总体拟合指标
图2 二阶验证性因子终模型标准化路径系数估计结果
依据上述理论及EFA分析结果,量表的四个维度具有高度相关,构建糖尿病患者生存质量的一阶四因子CFA模型,一阶四因子修正模型与资料拟合较好,是一个可行的模型,由模型修正后的终模型知:测量误差间并非完全是独立无关的,而是存在部分相关,可能是受试者本身问题造成(如误答、猜答等)。四个因子的相关系数均不小(介于0.59~0.78),提示该模型可能具有更高层次的因子结构,从而构建并拟合了糖尿病患者生存质量的二阶四因子CFA模型。比较一阶和二阶验证性因子模型终模型的总体拟合指标提示:两者的最终模型相似且最终拟合指标相差不大。从卡方值看,两模型自由度不同,卡方值相差不大;从GFI和TLI两指标看,一阶因子模型好于二阶因子模型;而从AGFI、NFI、CFI等指标看,二阶因子模型又好于一阶因子模型,很难判断哪个模型更能反映该量表的结构。在验证性因子分析时,当模型只有3个一阶因子时(共有3个相关),二阶因子模型在数学上等同于一阶因子模型。本次研究中两最终模型只含有4个一阶因子,由二阶因子模型来看,二阶因子与一阶因子关系很强(0.76,0.77,0.95,0.80),则二阶因子能够充分表达一阶因子间的关系,且一阶与二阶因子模型拟合指数相差不大,可认为由单一高阶因子表达并无不可。因一阶因子模型是一个更为省俭的模型,可以用更少的参数表达变量的关系,故选取一阶验证性因子模型更合理些。
实际上,EFA和CFA是研究过程的两个阶段[5],不能截然分开。只有两者结合运用,才能相得益彰,使研究更有深度。一般来说,如果研究者没有坚实的理论基础支撑,应先用探索性因子分析产生若干关于内部结构的理论,再在此基础上进行验证性因子分析[6]。本文使用EFA和CFA相结合的方法评价CNADDQoL量表的结构效度,结果提示该量表具有较好的结构效度,构建的一阶和二阶验证性因子模型拟合都较好,可认为该量表从四个不同的方面反应了糖尿病患者的生存质量,在CFA过程中,构建的一阶和二阶CFA拟合都较好,可认为该量表从四个不同的维度反映了糖尿病患者的生存质量,而这四个维度又反映了一个总的生存质量,各条目包含了心理健康和社会功能。研究2型糖尿病患者生存质量的影响因素时,为发现同一因素对患者不同维度生存质量的影响因素,把CN-ADDQoL量表判定为四维度量更为合理。根据相关的专业知识和有关的文献回顾可认为2型糖尿病患者躯体生理方面与心理感受方面的生存质量相互影响,社会关系方面和物质生活方面的生存质量对躯体生理方面、心理感受方面的生存质量有影响,物质生活方面对社会关系方面也有影响。整体来看,2型糖尿病患者四个方面的生存质量存在相互影响、相互依存的关系,一个方面的生存质量对另一个方面的生存质量,不但有直接作用还有间接的作用,这提示我们对于2型糖尿病患者如果暂时无法直接改善某一方面的生存质量时,可通过改善其他方面的生存质量来间接加以改善。
1.张广恩.糖尿病特异性生存质量量表的引进及探讨2型糖尿病患者生存质量影响因素的结构方程模型.广东医学院硕士论文,2006.
2.李茂能.结构方程模型软件AMOS之简介及其在测验编制上之运用:Graphic &Basic.台北:心理出版社,2006.
3.Garratt AM,Schmidt L,Fitzpatrick R.Patient-assessed health outcome measures for diabetes a structured review.Diabet Med,2002,19(1):1-11.
4.孔丹莉,张广恩,潘海燕,等.糖尿病特异性生存质量量表的信度与效度初探.中国慢性疾病预防与控制,2007,15(3):202-204.
5.李灿,辛玲.调查问卷的信度与效度的评价方法研究.中国卫生统计,2008,25(5):541-545.
6.付会斌,孔丹莉,潘海燕,等.非线性结构方程模型的研究进展.中国卫生统计,2010,27(1):101-103.