中介分析和自举(Bootstrap)程序应用*
2015-02-25江程铭,李纾
中介分析和自举(Bootstrap)程序应用*
江程铭1,2,李纾2
(1.浙江工业大学经贸管理学院,杭州310023;2.中国科学院心理研究所行为科学重点实验室,北京100101)
摘要:迄今为止,Baron和Kenny(1986)发展的因果步骤方法是使用最多的中介分析的方法。本文总结了这种方法在理论上和实践上的缺陷,建议使用Preacher和Hayes(2008)开发的自举(bootstrap)程序进行中介效应检验。借助SPSS软件,本文进行了逐步演示。本文亦解析了部分中介和完全中介的异同,从而提醒研究者在中介分析时,考虑其它潜在中介变量的影响以及注意中介作用的效应大小。
关键词:中介分析;因果步骤方法;自举(bootstrap)程序;完全中介;部分中介
心理学研究,尤其是社会心理学的研究,不仅是寻找自变量和因变量之间的因果关系,更重要的是发现其中的心理机制。比如,研究者不仅对“期望能否改变行为”感兴趣,更感兴趣的是期望通过什么机制改变行为?是通过自我实现预言?还是通过其它变量实现了行为的改变?中介分析(mediation analysis)无疑是当今最为常用的识别这种心理机制的方法。据Rucker,Preacher,Tormala和Petty(2011)总结:2005~2009年期间,《人格和社会心理学期刊》(Journal of Personality and Social Psychology,JPSP)上59%的文章,以及《人格和社会心理学通报》(Personality and Social Psychology Bulletin,PSPB)上65%的文章至少包含了一个中介分析的检验。根据MacKinnon,Fairchild和Fritz(2007)的统计,社会心理学研究的中介分析大约占了所有心理学研究领域中介分析的34%。
尽管中介分析的方法有很多(MacKinnon,Fairchild,& Fritz,2007;MacKinnon,Lockwood,Hoffman,West,& Sheets,2002),但是,应用最广的是Baron和Kenny(1986)发展的因果步骤(causal steps)的中介方法(MacKinnon et al.,2007;Zhao,Lynch Jr,& Chen,2010)。然而,现在这种方法在理论和实际上正越来越多地受到各种质疑(Hayes,2009;Preacher & Hayes,2008;Zhao et al.,2010)。《人格和社会心理学期刊》“态度和社会认知”(Attitudes and Social Cognition)板块的主编Smith在2012第一期的主编评论(Editorial)中指出,基于旧有的Baron和Kenny(1986)的中介分析方法已经过时,建议投稿者使用新的更准确的、具有更强检验力的方法。
同样,国内心理学研究运用最多的中介分析是根据《中介效应检验程序及其应用》(温忠麟,张雷,侯杰泰,刘红云,2004)所介绍的依据Baron和Kenny(1986)因果步骤和Sobel检验的方法。鉴于中介分析是心理学研究的利器,国内心理学期刊上对于中介方法研究进展的介绍尚少(方杰,张敏强,李晓鹏,2011;方杰,张敏强,邱皓政,2010;刘红云,张月,骆方,李美娟,李小山,2011;温忠麟,侯杰泰,张雷,2005;温忠麟,张雷,侯杰泰,2006),本文意欲介绍一种基于自举(bootstrap)程序的中介效应检验方法。自举程序可用于多种统计检验,国外应用自举程序于中介效应检验大概始于1990年,而较多应用则是在2004年后。国内虽有个别应用散见于正式发表的心理学期刊(李燕萍,涂乙冬,2011;李锐,凌文辁,柳士顺,2009;程宏宇,Ardrade,2011),但这些应用都没有刻意介绍如何操作这种新程序。希望通过本文系统的介绍能帮助国内学者有效地应用中介分析进行研究。
本文将首先总结研究者对Baron和Kenny(1986)因果步骤方法的批评,在接下来的部分应用案例,一步一步地演示如何运用自举程序进行中介效应检验;最后解析了中介分析中争论较多的几个概念。
1什么是中介
假设自变量X导致了因变量Y的变化,如果X是通过影响M从而来影响Y,M便为中介变量,它在X影响Y的关系中起中介作用。图1是只有一个中介变量M的简单中介模型。在这个图中,X代表自变量,Y代表因变量,M代表中介变量,c代表X→Y的总效应(total effect),c′代表了在控制假设的中介变量后的X→Y直接效应(direct effect),a代表X→M的效应,b代表控制了自变量后M→Y的效应。间接效应(indirect effect)为a和b的乘积。
图1 简单中介模型
2Baron和Kenny因果步骤的检验方法
为了检验一个自变量是否通过一个中介变量影响因变量(如图1),Baron和Kenny(1986)推荐使用三步法来判断:
(a)自变量X的变化显著地影响了预想的中介变量,亦即路径a;
(b)中介变量的变化显著地影响了因变量,亦即路径b;
(c)当路径a和b得到控制后,原本显著的自变量和因变量之间的关系不再显著,表现为c′的效应变成0,显示了最强的中介效应(即完全中介)。
由条件(c)可知,(c)成立的首要条件是直接路径c显著。为了满足上述三个条件,需要建立以下三个回归方程:
M=i1+aX+e1
(1)
Y=i2+cX+e2
(2)
Y=i3+c′X+bM+e3
(3)
方程1将中介变量向自变量做回归,方程2将因变量向自变量做回归,方程3将因变量同时向自变量和中介变量做回归。为了建立中介,下面条件必须成立:第一,在第一个方程里,自变量必须影响中介变量;第二,在第二个方程里自变量必须影响因变量;第三,在第三个方程里,中介变量必须影响因变量(Baron&Kenny,1986)。
作为对上述条件(c)的补充,Baron和Kenny又强调,考虑到心理学现象通常都有多个影响因素,所以一般更现实的目标是寻求中介变量显著地减少了路径c的作用,而不是完全消除了自变量和因变量的关系。Baron和Kenny把这种中介称为部分中介。
Baron和Kenny接下来推荐使用Sobel检验来估计间接作用a×b。(Baron和Kenny把间接作用和中介作用视为两个不同的概念;一些学者在按照因果步骤法做完中介分析后,又会用Sobel检验作为补充。本文在后面有对这两个概念的解析。)Sobel检验公式如下所示:
(4)
方程4中的a、b和它们的标准差(sa和sb)分别来自方程(1)和方程(3)。
然而Baron和Kenny的方法在理论上和实际上都存在着一些缺陷:
(a)首先并不需要总体作用显著作为前提才能判断中介作用是否显著,亦即总体作用显著并不是中介作用显著的必要条件;只要直接检验间接作用即可发现是否有中介作用。研究者按照Baron和Kenny因果步骤,会因为总体作用c不显著而停止余下的检验,可能错失发现间接作用a×b显著的机会。总体作用不显著但是中介作用存在的情况可分为两种。
一种情况是:直接作用和间接(中介)作用方向相反,互相抵消,导致总体作用不显著。比如,在图1中,避孕套的使用(X)使人们降低了对多性伙伴危害的认识(M),从而增加了性活动和性疾病传播(Y)(中介作用ab);但是避孕套的使用(X)本身又可以直接减少性疾病传播(直接作用c′)。这两种作用互相抵消,总体作用(避孕套的使用(X)对性疾病传播的影响(Y))不显著,但是此时中介作用ab存在(Zhaoetal.,2010)。
另外一种情况是:同时和中介变量一起存在的还可能有未被研究者考虑到的抑制变量,而抑制变量的存在有可能导致总体作用不显著(Hayes,2009;MacKinnon&Fairchild,2009;Shrout&Bolger,2002;Zhaoetal.,2010)。如图2所示,在此模型中除了路径a和b外还有通过变量S实现的路径g和h(如虚线所示),而如果g×h和a×b的乘积大小相近,
*Bootstrap作为一种重复抽样方法,用于中介效应分析中,可以通过多种软件实现,例如:Amos、Mplus、R、SAS,SPSS等,由于国内的心理学者普遍使用SPSS的统计软件,而Preacher和Hayes(2008)开发的SPSS环境下的中介分析程序易于操作,故在此介绍此程序。
但是方向相反,因而总体作用不显著,而此时中介作用存在(S称之为抑制变量(Suppressor),产生的作用称为抑制作用)。比如政治竞选运动可以通过两个相反的机制对投票行为产生影响:一个是由于竞选运动的影响,选民增加了对投票结果重要性的认识,增加了投票的几率;另一个是竞选运动降低了选民对政府的信任,从而减少了投票的几率。两种作用互相抵消,导致了总体作用不显著(Hayes,2009)。
其次,由于抑制作用的存在,Baron和Kenny所认为的“当在方程(3)中没有直接作用,而仅有间接作用时,中介作用最强”这个结论也是不成立的。因为有时抑制作用部分抵消中介作用,在方程(3)中体现为有直接作用,但是此时中介作用反而要比没有直接作用时要强。
图2 包含抑制变量(suppressor)的中介模型
(b)Baron和Kenny的方法需要a和b都要显著,而直接检验间接作用a×b的中介分析(比如Sobel检验)却只需a和b的乘积显著即可。显然,拒绝两个虚无假设要比拒绝一个要困难。
结合(a)和(b),可以从理论上分析出Baron和Kenny的方法不够准确,并且缺乏检验力。而一些学者通过数据模拟研究发现,在众多检验中介变量的方法中,因果步骤方法的检验力最低,最难以发现中介作用(Fritz & MacKinnon,2007;MacKinnon,Lockwood,Hoffman,West,& Sheets,2002)。
(c)虽然Sobel检验直接检验间接作用a和b的乘积,但是这种方法建立在a和b乘积正态分布的假设基础上,而这种假设一般是不成立的。并且与重复取样的自举程序相比,Sobel检验的效力要低(Fritz & MacKinnon,2007;MacKinnon et al.,2002)。
基于Baron和Kenny的方法以及Sobel检验所存在的问题,本文建议使用基于自举程序的方法进行中介效应检验。自举程序的优点在于它是建立在对中介作用直接进行估计的基础上,但是又不需要像Sobel检验那样对分布的形状进行假设。并且,基于自举程序的中介效应检验方法易于理解和掌握;属于检验效力最高的方法之一(Fritz & MacKinnon,2007;MacKinnon et al.,2002)。
3基于自举程序的中介效应检验
所谓自举程序,是以样本(如,样本大小n=100)来代表总体,在此样本中进行放回抽样(已被抽取的个体允许被再度抽取),直至抽取n个(如100个),组成一个样本。这样的程序反复进行多次(k次),亦即产生多个样本,每个样本都可以算出一个间接作用估计值(a×b),由此可以算出k个值,形成一个实际的分布。这个分布近似于从原始总体中取样的分布。一般建议最少抽样1000次(亦即k=1000),推荐抽样5000次(Preacher & Hayes,2008)。
中介作用真值的统计推论根据这k个估计值产生的ci%置信区间得到。即,把k个值从小到大排列,在这个排列集中,ci%置信区间的下限是位于第k(0.5-ci/200)个的a×b值(如k=1000,95%的置信区间,取位于第25个的a×b值);ci%置信区间的上限是第1+k(0.5+ci/200)个的a×b值(如k=1000,95%的置信区间,取位于第976个的a×b值)。这种程序产生的置信区间的估计有可能会产生偏差。可以用偏差调整(bias corrected)或者偏差调整和加速(bias corrected and accelerated)置信区间调整上限值和下限值。不管使用何种程序,如果0不在上下限的区间之内,就可以有ci %的可信度认为中介作用不是0。也就是在100%-ci%的显著性水平,拒绝中介作用真值为0的虚无假设。
由于国内的心理学者普遍使用SPSS的统计软件,本文推荐使用Preacher和Hayes(2008)基于自举的中介效应检验程序*,此程序可以在他们的网页上下载。在浏览器中打开“http://www.afhayes.com/spss-sas-and-mplus-macros-and-code.html”,在“INDIRECT”部分有“Download INDIRECT:indirect.zip”,把“indirect.zip”下载后,解压打开,可以看到indirect.spd的文件,双击此文件安装自举程序在SPSS中。
本文利用模拟数据在SPSS19.0下进行演示,这些数据用来检验避孕套广告信息框架(积极框架——强调避孕套使用对性疾病降低的作用,相对于消极框架——强调不使用避孕套造成的性疾病增加的危害)通过影响被试对不洁性行为危害的知觉进而影响是否使用避孕套。数据可在http://bdm.psych.ac.cn/publication.php下载。自变量(X)为信息框架;中介变量(M)为危害知觉,在1~9的评定量表上计分,分数越大,被试认为危害越大;因变量为避孕套使用倾向(Y),在1~6的评定量表上计分,分数小代表倾向于不使用安全套,分数大代表倾向于使用。该研究检验对信息框架的操纵(X)是否影响了对不洁性行为的危害知觉(M),进而影响了对避孕套的使用倾向(Y)。
按如下操作,在SPSS中运行自举程序:
步骤一、运行SPSS,打开数据文件,
步骤二、在SPSS程序的菜单栏中找到“分析”栏目下的“回归”,在“回归”下面找到已经安装的自举程序-Preacher and Hayes(2008)Multiple Mediation(INDIRECT) ,
步骤三、运行自举程序,出现对话框,
步骤四、在对话框里的相应的输入框里,输入因变量,自变量,中介变量。如果需要,也可以输入协变量,
步骤五、把自举取样(bootstrap samples)设定为某一数字,建议为5000,
步骤六、设定置信区间(confidence level)为95%或者99%,
步骤七、选择自举方法(Bootstrap Method),建议选择“bias corrected”*本文作者在与Kristopher J.Preacher的个人交流中,他认为“bias corrected”比“bias corrected and accelerated”方法产生了更可信和一致的结果。(报告结果时需说明使用了何种方法),
步骤八、点击“确定”键执行程序。
执行完程序,会出现输出文件。在输出文件中找到“Bootstrap Results for Indirect Effects”和“confidence interval”部分,如果置信区间不包括0,那么中介作用显著,支持中介作用的假设;如果包括0,则不显著,不支持中介作用的假设。
以上虽然是针对简单中介效应检验的程序运用介绍,但是同样适用于多重中介效应检验(具有多个中介变量的中介),只需在上述步骤四的中介变量框里,输入多个中介变量即可。
结果如图3显示(仅截取图的下半部分),危害知觉中介作用95%的置信区间为[0.1547,0.6915],不包含0,因而中介作用显著。
图3运行Preacher和Hayes(2008)自举程序的中介分析结果
4中介作用和间接作用有区别么?
不同的学者对中介作用的定义存在争议,一些学者认为中介作用存在的前提是单独的总效应必须显著,他们区分中介作用和间接作用是不同的概念(Baron & Kenny,1986;Judd & Kenny,1981;Preacher & Hayes,2004);但是另一些学者则认为中介作用不需要有总效应显著这个条件存在;如果路径X到M和M到Y的间接作用显著,就证实了有中介作用(MacKinnon et al.,2002)。后者把中介变量等同于间接作用(Bollen,1987;MacKinnon et al.,2002)。不管使用哪个术语,最重要是发现心理机制——间接作用或是中介作用是否存在。如果研究者在总体作用不显著的情况下,依然发现存在间接作用a×b显著,那么可以叫它中介作用或者间接作用。术语的使用并不会影响实际的结果。
5完全中介比部分中介重要么?
学者们当初区分完全中介和部分中介是为了反应效应值的大小或是中介过程的实际重要性。按照Baron和Kenny(1986)因果步骤的方法,完全中介代表了中介过程可以完全解释X→Y;而部分中介则不能。如此看来似乎完全中介要比部分中介重要或者效应值大。其实不然。
首先,如果所有不能完全解释X→Y的中介效应仅仅被标记为部分中介,那么研究者就会忽视不同中介的效应值的大小。而如果研究者想要表达中介效应的大小,在自变量和因变量都是客观值的情况下,直接用a×b就可以进行说明了:一单位的X的变化,导致了多少单位Y的变化。当然,如果自变量和因变量至少其中之一是非客观值(比如,在几点量表上的主观评定)的情况,解释起来则复杂得多,现在还没有一致的解决方法(MacKinnon,Fairchild,& Fritz,2007)。
其次,完全中介看似黄金法则,然而绝大部分文章报告的都是部分中介(Iacobucci,2008)。即使是按照因果步骤检验的方法出现了完全中介,也完全有可能是伪完全中介,因为运用中介分析方法避免不了测量误差。
最后,也是最重要的,心理学研究中一个因变量的变化通常可以由很多的变量引起,而一个变量的改变也可能同时引起多个变量的变化。事实上,研究者很少能认为操纵自变量时,仅仅影响了预想中的中介变量;实际状况往往是有其它的(研究者没有识别的)中介变量或者是抑制变量同时发生了改变。如果仅仅满足于完全中介,有可能阻碍研究者进一步去发现其它的中介过程。因而,有学者建议放弃部分中介和完全中介的区分(Hayes,2009)。
6结论
Baron和Kenny(1986)提供的方法通常被作为中介分析的标准。但是,现在或许到了该放弃的时候。研究者应该直接分析间接作用来检验中介,而不是间接地通过分析总体作用和直接作用。本文建议研究者使用自举程序进行中介效应检验,因为它更准确、检验效力更高。研究者在中介分析时需要注意,不要仅满足于所谓的完全中介;要考虑和评价是否有其它中介或抑制作用存在;要注意间接作用的大小。只有使用正确的工具,考虑其它潜在的中介变量的影响,研究者才有可能正确地检验假设和建立正确的理论。
致谢:感谢中国科学院心理研究所行为决策课题组全体成员以及郑晓璐等在资料收集、评阅等方面所提供的帮助。
参考文献
程宏宇,Ardrade,H.(2011).思维风格对中美大学生课堂学习行为的影响研究.心理科学,34(3),647-651.
方杰,张敏强,李晓鹏.(2011).中介效应的三类区间估计方法.心理科学进展,19(5),765-774.
方杰,张敏强,邱皓政.(2010).基于阶层线性理论的多层级中介效应.心理科学进展,18(8),1329-1338.
李锐,凌文辁,柳士顺.(2009).上司不当督导对下属建言行为的影响及其作用机制.心理学报,41(12),1189-1202.
李燕萍,涂乙冬.(2011).与领导关系好就能获得职业成功吗? 一项调节的中介效应研究.心理学报,43(8),941-952.
刘红云,张月,骆方,李美娟,李小山.(2011).多水平随机中介效应估计及其比较.心理学报,43(6),696-709.
温忠麟,侯杰泰,张雷.(2005).调节效应与中介效应的比较和应用.心理学报,37(2),268-274.
温忠麟,张雷,侯杰泰.(2006).有中介的调节变量和有调节的中介变量.心理学报,38(3),448-452.
温忠麟,张雷,侯杰泰,刘红云.(2004).中介效应检验程序及其应用.心理学报,36(5),614-620.
Baron,R.M.,& Kenny,D.A.(1986).The moderator-mediator variable distinction in social psychological research:Conceptual,strategic,and statistical considerations.JournalofPersonalityandSocialPsychology,51(6),1173.
Bollen,K.A.(1987).Total,direct,and indirect effects in structural equation models.SociologicalMethodology,37-69.
Chen,X.P.,& Li,S.(2005).Cross-national differences in cooperative decision-making in mixed-motive business contexts:The mediating effect of vertical and horizontal individualism.JournalofInternationalBusinessStudies,36(6),622-636.
Fritz,M.S.,& MacKinnon,D.P.(2007).Required sample size to detect the mediated effect.PsychologicalScience,18(3),233-239.
Hayes,A.F.(2009).Beyond Baron and Kenny:Statistical mediation analysis in the new millennium.CommunicationMonographs,76(4),408-420.
Iacobucci,D.(2008).Mediationanalysis:ThousandOaks.Sage Publications,Inc.
Judd,C.M.,& Kenny,D.A.(1981).Process analysis:Estimating mediation in treatment evaluations.EvaluationReview,5(5),602-619.
MacKinnon,D.P.,& Fairchild,A.J.(2009).Current directions in mediation analysis.CurrentDirectionsinPsychologicalScience,18(1),16-20.
MacKinnon,D.P.,Fairchild,A.J.,& Fritz,M.S.(2007).Mediation analysis.AnnualReviewofPsychology,58(1),593-614.
MacKinnon,D.P.,Lockwood,C.M.,Hoffman,J.M.,West,S.G.,& Sheets,V.(2002).A comparison of methods to test mediation and other intervening variable effects.PsychologicalMethods,7(1),83-104.
Preacher,K.J.,& Hayes,A.F.(2004).SPSS and SAS procedures for estimating indirect effects in simple mediation models.BehaviorResearchMethods,36(4),717-731.
Preacher,K.J.,& Hayes,A.F.(2008).Asymptotic and resampling strategies for assessing and comparing indirect effects in multiple mediator models.BehaviorResearchMethods,40(3),879-891.
Rucker,D.D.,Preacher,K.J.,Tormala,Z.L.,& Petty,R.E.(2011).Mediation analysis in social psychology:Current practices and new recommendations.SocialandPersonalityPsychologyCompass,5(6),359-371.
Shrout,P.E.,& Bolger,N.(2002).Mediation in experimental and nonexperimental studies:New procedures and recommendations.PsychologicalMethods;PsychologicalMethods,7(4),422.
Smith,E.R.(2012).Editorial.JournalofPersonalityandSocialPsychology,102(1),1-3.
Zhao,X.,Lynch,Jr.,John,G.,& Chen,Q.(2010).Reconsidering Baron and Kenny:Myths and truths about mediation analysis.JournalofConsumerResearch,37(2),197-206.
Mediation Analysis and the Application of Bootstrap in Mediation Analysis
Jiang Chengming1,2,Li Shu2
(1.College of Economics and Management,Zhejiang University of Technology,Hangzhou 310023;
2.Key Laboratory of Behavioral Science,Institute of Psychology,Chinese Academy of Sciences,Beijing 100101)
Abstract:Baron and Kenny’s ‘causal steps’ approach for determining if an independent variable affects a dependent variable through some mediator is adopted as the benchmark by psychologists.We presented a summary of the flaws in this approach theoretically and practically,and suggested a bootstap procedure developed by Preacher and Hayes(2008)to do a mediation analysis instead.We gave a step-by-step guide with SPSS.To remind researchers to examine indirect effects directly,to consider the other potential mediators and pay attention to the size of indirect effects when analyzing mediating effects,we explained the differences and similarities between mediation and indirect effect and full and partial effect.
Key words:mediation analysis;‘causal steps’ approach;bootstrap procedure;full mediation;partial mediation
中图分类号:B841.2
文献标识码:A
文章编号:1003-5184(2015)05-0458-06
通讯作者:李纾,E-mail:lishu@psych.ac.cn;s.li@UNSWalumni.com。
基金项目:*国家重点基础研究发展计划(2011CB711000),国家自然科学基金(31170976),中国科学院知识创新工程基础前沿专项研究(KSCX2-EW-J-8),北京市重点学科建设项目资助。