APP下载

中介分析方法及在其医学研究中的应用*

2017-03-09哈尔滨医科大学卫生统计学教研室150081杨春艳

中国卫生统计 2017年1期
关键词:乘积因变量调节

哈尔滨医科大学卫生统计学教研室(150081) 杨春艳 侯 艳 李 康

·方法介绍·

中介分析方法及在其医学研究中的应用*

哈尔滨医科大学卫生统计学教研室(150081) 杨春艳 侯 艳 李 康△

目前,中介分析已经被广泛应用于心理、预防、流行病等的医学研究[1],与传统的多元分析方法不同,中介分析不仅需要分析自变量与因变量之间的关系,还需要对自变量的不同作用加以分析,在一定程度上揭示自变量对因变量影响的内在机制,是一种因果效应推断的方法,已经越来越受到医学科研工作者的关注。本文阐述目前中介分析的主要方法及在医学研究中的应用。

中介分析模型

中介分析的基本模型如图1所示,X、M、Y分别表示自变量、中介变量和因变量。自变量X与因变量Y之间具有因果关系,τ称为总效应;实际中X对Y的效应可以由第三个变量M所介导(b所示),即X的改变引起了M的变化,从而会引起Y的变化。图中,α和β分别称为间接效应,总间接效应为α和β的乘积,参见图1(c)。如果移除间接效应,X对Y仍然存在效应,则这部分X对Y的效应为直接效应τ′,如图1(b)所示。以下介绍中介分析的几个重要概念。

1.完全中介和部分中介

τ′可用来区分完全中介(complete mediation)或部分中介(partial mediation),如果τ′=0,即X对Y的效应完全由M介导,则称M为完全中介,如果τ′≠0,即X对Y的效应不完全由M介导,则称M为部分中介。Baron等人(1986)认为完全中介是表明中介效应存在的最强有力的证据[2]。部分中介可能意味着自变量对因变量的影响并不是唯一的中介路径,需要探索其他的中介变量。有一种情况,如图1(d)中的α1β1与α2β2即使有较大的取值,但如果符号相反,则所得出的中介效应的大小仍有可能很小甚至为零。

2.中介、调节、混杂与抑制的概念

调节变量(moderator)和中介变量(mediator)在研究自变量和因变量关系时,都与回归分析有关,属于第三变量,如果对二者的概念理解不清楚,很容易被混淆。考虑自变量X对因变量Y的影响,如果X通过影响变量M来影响Y,则称M为中介变量。例如,Leanne K Küpers(2015) 发现孕期吸烟会导致脐血中

图1 中介分析的基本模型

基因的甲基化,继而导致低体重出生儿。在此过程中,孕期吸烟为暴露条件,甲基化的基因为中介,最终的结果就是低体重孩子的出生。如果变量Y与变量X的关系是变量M的函数,称M为调节变量,即Y与X的关系受到第三个变量M的影响[2-3]。它影响因变量和自变量之间关系的方向(正或负)和强弱。在研究“调节”与“中介”这两个不同问题时,主要涉及两个相关的模型,即调节中介(moderated mediator)和中介调节(mediated moderator)。不管是调节中介还是中介调节,分析的重点都是在中介效应分析上面。具体来说,调节中介是指自变量和调节变量对因变量的交互影响受到中介变量的作用。在这个模型里面,中介变量介导自变量和因变量的影响,而中介变量的中介效应会受到调节效应的影响,也就是说中介效应会因亚组、性别、年龄不同而不同。调节变量不是自变量和因变量的调节变量,而是中介变量和因变量的调节变量,中介变量对因变量的影响受到调节变量的影响。中介调节则是指自变量通过中介变量最终影响因变量的路径受到调节变量的调节作用。自变量和调节变量的交互作用影响中介变量,而中介变量影响因变量,此时,调节变量通过中介变量起作用,称这样的调节变量是有中介的调节变量。Muller等(2005)通过实例形象地阐述了两者的不同[4-5]。

定义中介变量的前提需要假定变量间的因果关系,中介路径的因果方向是一定的,即X→M→Y。混杂(confounding)因素,指与研究因素和研究疾病均有关,若在比较的人群组中分布不匀衡,则可能掩盖或夸大因素与疾病之间真正联系的因素。

MacKinnon、Fairchild和 Fritz(2007)指出,如果τ′符号与αβ乘积的方向相同,称为一致中介(consistent mediation)模型;如果τ′符号αβ与乘积的方向相反,称为不一致中介(inconsistent mediation)模型[6]。此时主效应可能不显著,但是仍然存在中介效应。对于不一致中介模型,中介表现为抑制(suppression),例如压力、处理方法、心情三个变量,压力越大,心情越糟,直接效应是负的;如果压力越大,能够激发更大的积极性去处理,从而对心情有正向作用,使得间接效应为正。这样一来,总效应就会很小,因为直接和间接效应的方向相反,会相互抵消,直接效应有可能比总效应还要大。

基于回归的中介分析方法

1.经典中介效应分析

经典中介效应分析有两种方法,一种是差异方法(difference method),另一种是乘积方法(product method)[2,7]。差异方法在流行病学及生物科学研究中经常被用到,由两个回归模型构成,回归模型的表达式如下:

E(Y|X=x,C=c)=β0+τx+β2′c

(1)

E(Y|X=x,M=m,C=c)=θ0+τ′x+βm+θ4′c

(2)

其中τ是暴露X对结果变量Y的总效应,C为协变量,这一模型没有把中介包括在内。方程(2)把中介作为一个变量包括在内,由于中介解释了部分暴露对结果的效应,第二个方程里的暴露系数τ′与第一个方程暴露系数τ相比就有所减少。二者之间的差异常被解释为中介或者间接效应(IE):

IE=τ-τ′

(3)

DE=τ′

(4)

乘积方法和差异方法稍有不同,有时称其为乘积系数方法。乘积方法中同样用到差异方法的回归方程,使用因变量对暴露、中介和协变量作回归,然后再做中介对暴露、协变量的回归方程,回归模型的表达式如下:

E(Y|X=x,M=m,C=c)=θ0+τ′x+βm+θ4′c

(5)

E(M|X=x,C=c)=φ0+αx+φ2′c

(6)

这里,第一个回归模型中包括中介变量,其直接效应同样是暴露系数τ′,β为中介变量对因变量的作用;由第二个模型可以得到暴露对中介的作用α,间接效应就是αβ的乘积,αβ可以用来衡量中介效应的大小。

两种方法计算中介效应的差别和联系,首先是常用领域不同,差异方法通常应用于流行病学领域,乘积方法通常应用于社会科学领域。其次,当中介变量M和结果变量Y两者均为连续变量、且模型符合线性条件时,差异方法和系数乘积法的结果等价,即τ-τ′=αβ[8]。然而当结果为二分类的时候,差异方法与系数乘积法得到的中介效应结果就会不一致,这时多采用乘积系数法。

2.中介分析因果推断方法

经典回归方法的前提是数据符合线性模型,且暴露与中介无交互作用。随着中介分析受到越来越多的关注,考虑到交互和非线性的情况,传统的中介分析方法有较多的限制[7]。目前,关于中介分析因果推断的文献更强调在因果解释中控制混杂的重要性,以及在非线性和交互作用存在的条件下直接和间接效应的计算对此可以使用基于反事实的方法(counterfactual-based)[9-10]。

设计意图: 从学生的生活经验引入,再通过资料和血液报告单的分析,让学生真切感受到细胞代谢异常往往会反映在血液生化指标中,同时培养学生获取信息并处理信息的能力。

基于反事实的定义由Robins 等给出,反事实结果可以由下面公式计算得出:

(7)

其中x和x*分别为暴露因素的两个不同水平。假定中介和结果都是连续变量,中介回归模型为

(8)

暴露与中介的交互作用模型为

E(Y|X=x,M=m,C=c)=

θ0+τ′x+βm+θ3xm+θ4′c

(9)

定义三种不同的效应。控制的直接效应(controlled direct effect),固定M=m,自变量水平X=x*和X=x进行结果比较:

CDE(m)=E(Y(x,m))-E(Y(x*,m))

(10)

自然直接效应(natural direct effect),固定M=M(x*),自变量水平X=x和X=x*进行结果比较:NDE=E(Y(x,M(x*)))-E(Y(x*,M(x*)))

(11)

自然间接效应(natural indirect effect),固定X=1,M=M(x) 和M=M(x*),对结果进行比较:

NIE=E(Y(x,M(x)))-E(Y(x,M(x*)))

(12)

则总的因果效应(total causal effect)可以被分解为

TCE=E(Y(x))-E(Y(x*))=NDE+NIE

(13)

基于反事实理论,我们可以定义控制直接效应(CDE),自然的直接效应(NDE),自然的间接效应(NIE),暴露水平由x*到x,结果如下表达:

CDE(m)=(τ′+θ3m)(x-x*)

NDE=(τ′+θ3φ0+θ3αx*+θ3φ2′c)(x-x*)

NIE=(αβ+θ3αx)(x-x*)

在不存在交互情况下(θ3=0),控制的直接效应和自然直接效应都等于τ′(x-x*)。自然的间接效应等于αβ(x-x*)。

中介效应检验方法

1.依次检验法或逐步法

第一步检验式(1)中τ是否有意义,若有统计学意义则进行第二步;第二步检验式(6)中的α是否有意义,若有统计学意义再进行第三步;第三步检验方程(2)中τ′和β是否有意义[2],若τ′和β均有统计学意义,则表示中介M起部分中介作用,若τ′无统计意义而β有意义,则表示M是完全中介效应。然而,近年来有学者对逐步法提出质疑。首先,Baron等人(1986)认为主效应显著是中介效应存在的前提,但诸多研究指出中介效应存在并不需要主效应显著。其次,Baron等人(1986)认为完全中介是表明中介效应存在的最强有力的证据,但大部分研究结果表明完全中介的情况却很少。再有,Baron和Kenny(1986)并非对中介效应做直接检验,而是检验主效应是否显著变化。最后,有部分研究者质疑逐步法其实得到的是相关关系,而不是因果关系[9]。

2.Sobel检验

3.乘积分布法

4.Bootstrap方法

5.蒙特卡罗方法

第三步通过计算获得二元正态分布α*,β*的乘积值来获得中介效应的取值,最后可以得到αβ的置信区间。与bootstrap方法相比,由于省去重抽样的过程,对模型拟合只进行一次,计算速度较快。蒙特卡罗方法还可以适用于bootstrap难以进行的中介分析情形,例如多水平中介模型中样本量很小、或者某个变量数值很不平衡的情况。

中介效应量评估

αβ是衡量中介效应的绝对量,并不能衡量其在总效应中占的比重大小,不便于比较,因此实际中可以使用以下几种方法衡量中介效应。

1.比值法

即通过比值αβ/τ衡量中介效应。Mackinnon(2008)总结了多种中介效果量指标,其中使用最多的是比值法。然而,需要注意,使用这种方法存在一定的局限性[12]:①αβ/τ其比值的大小不能准确表示中介效应量的大小,例如在分母较小的情况下,即使中介效应很小,比值也可能很大;②中介效应αβ与τ′的方向可能相同或者相反,αβ/τ比值有正负号的问题。③αβ/τ比值的大小在样本量很大时才比较稳定(n>500)[13]。④目前所考虑的模型多为单一中介的模型,在具多个中介的情况下,αβ/τ不能很好地反应其他中介的作用。

2.κ2值法

Preacher等人对以上的比值法进行改进,提出使用κ2=αβ/(αβ)max∈[0,1]来确定中介效应量的大小[14]。其中(αβ)max为系数乘积αβ可能的最大值。(αβ)max可以由以下三个步骤获取:第一步,计算暴露、中介和因变量的协方差矩阵;第二步,固定α和τ,求β的区间或者固定β和τ,求α的区间;第三步,计算αβ的置信区间,若αβ为正值则以区间上限为(αβ)max,反之,以下限为(αβ)max。

展 望

近年,中介分析方法的研究在流行病学中发展迅速,这种方法与黑盒箱流行病学的理论、概念框架,以及分子流行病学的发展密切相关。流行病学中经典的病因推断——因果推断的基本原则是有时间顺序,以及关联强度、关联的可重复性、暴露因素与疾病分布的一致性,其中时间顺序为因果推断的必要条件。显然,使用断面研究因果关系有其局限性,最好的方法是队列研究。Mackinnon等人(2007)总结了多种用于检验队列研究数据的中介效应的分析方法,如潜生长模型(latentgrowthmodeling),潜差异分数模型(latentdifferencescoremodeling),自回归模型(autoregressivemodeling)[16]。从中介分析模型发展来看,国内对这方面的研究多停留在单一中介水平上,而国外已开展对多重中介以及多水平中介分析方法进行研究。

目前做中介分析主要使用的是线性模型,其应用受到一定的限制,如对模型误差项的正态性和方差都有一定的要求,同时对于具有多中介效应及调节变量的情况可能会受到共线的影响。这时是否可以使用惩罚回归或者其他非线性回归方法,如随机森林回归等方法进行中介分析,值得研究。从统计学角度看,因果推断也完全可以从断面研究中获得推断,如使用贝叶斯网络分析方法等[17-18]。使用网络分析的好处是可以在比较复杂的情况下对中介效应进行分析,而且既可以适合静态数据分析,同时适合动态数据分析。无论使用何种方法,统计分析给出的结果是在一定的假设条件下可能具有的中介效应,而真实的中介效应则必须能够从专业角度进行解释。

[1]PreacherKJ.AdvancesinMediationAnalysis:ASurveyandSynthesisofNewDevelopments.AnnualReviewofPsychology,2015,66(1):825-852.

[2]BaronRM,KennyDA.TheModerator-MediatorVariableDistinctioninSocialPsychologyResearch:Conceptual,StrategicandStatisticalConsiderations.JournalofPersonality&SocialPsychology,1986,51(6):1173-1182.

[3]温忠麟,叶宝娟.有调节的中介模型检验方法:竞争还是替补.心理学报,2014,46(5):714-726.

[4]EdwardsJR,LambertLS.Methodsforintegratingmoderationandmediation:ageneralanalyticalframeworkusingmoderatedpathanalysis.PsychologicalMethods,2007,12(1):1-22.

[5]MullerD,JuddCM,YzerbytVY.Whenmoderationismediatedandmediationismoderated.JournalofPersonality&SocialPsychology,2005,89(6):852-863.

[6]MackinnonDP,FairchildAJ,FritzMS.MediationAnalysis.AnnualReviewofPsychology,2007,58:593-614.

[7]VanderWeeleTJ.MediationAnalysis:APractitioner′sGuide.Annualreviewofpublichealth,2016,37:17-32.

[8]MacKinnonDP,GhulamWarsi,DwyerJH.ASimulationStudyofMediatedEffectMeasures.MultivariateBehavioralResearch,1995,30(1):41.

[9]Stone-RomeroEF,RosopaPJ.TheRelativeValidityofInferencesAboutMediationasaFunctionofResearchDesignCharacteristics.OrganizationalResearchMethods,2008,11(2):326-352.

[10]VansteelandtS.Understandingcounterfactual-basedmediationanalysisapproachesandtheirdifferences.Epidemiology,2012,23(6):889-891.

[11]SpringerMD.SelectedTablesinMathematicalStatistics(Vol.VII),TheProductofTwoNormallyDistributedRandomVariables.Technometrics,1983,25(2):211-212.

[12]MackinnonDP.Introductiontostatisticalmediationanalysis.Introductiontostatisticalanalysis,2008,23(3):1-8.

[13]MacKinnonDP,WarsiG,DwyerJH.Asimulationstudyofmediatedeffectmeasures.Multivariatebehavioralresearch,1995,30(1):41-62.

[14]PreacherKJ,KelleyK.Effectsizemeasuresformediationmodels:quantitativestrategiesforcommunicatingindirecteffects.PsychologicalMethods,2011,16(2):93-115.

[15]FairchildAJ,MackinnonDP,TaborgaMP,etal.R2,effect-sizemeasuresformediationanalysis.BehaviorResearchMethods,2009,41(2):486-498.

[16]MackinnonDP,FairchildAJ,FritzMS.MediationAnalysis.AnnualReviewofPsychology,2007,58:593-614.

[17]JingY,AiguoW,KunxiaW,etal.DiscoveringCausalRelationsfromCross-SectionalData.InternationalConferenceonSoftwareTechnologyandEngineering(ICSTE2012).ASMEPress,2012.

[18]范丽珺,游顶云,张旺,等.贝叶斯因果关系网络模型在断面调查数据中的应用.中国医院统计,2010,17(2):97-100.

(责任编辑:郭海强)

国家自然科学基金资助(81473072,81573256),黑龙江省青年基金资助(QC2015098)

△通信作者:李康,E-mail:likang@ems.hrbmu.edu.cn

猜你喜欢

乘积因变量调节
基于代谢调节的抗血管衰老新策略
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
乘积最大
2016年奔驰E260L主驾驶座椅不能调节
最强大脑
最强大脑
偏最小二乘回归方法
谈谈如何讲解多元复合函数的求导法则
精心设计课堂 走进学生胸膛
“无限个大于零小于1的数的乘积不等于零”的一则简例