纵向数据的调节效应分析*
2022-11-15温忠麟
方 杰 温忠麟
·研究方法(Research Method)·
纵向数据的调节效应分析*
方 杰1温忠麟2
(1广东财经大学新发展研究院/应用心理学系, 广州 510320) (2华南师范大学心理学院/心理应用研究中心, 广州 510631)
目前调节效应检验主要是基于截面数据, 本文讨论纵向(追踪)数据的调节效应分析。如果自变量和因变量有纵向数据, 调节效应可分为三类:调节变量不随时间变化、随时间变化、调节变量从自变量或因变量中产生。评介了基于多层模型、多层结构方程模型、交叉滞后模型和潜变量增长模型的纵向数据的多种调节效应分析方法。调节效应的分解和潜调节结构方程法的使用是纵向数据的调节效应分析的两大特点。对基于四类模型的调节效应分析方法进行综合比较后, 总结出一个纵向数据的调节效应分析流程。随后用实际例子演示如何进行纵向数据的调节效应分析, 并给出相应的程序。随后展望了纵向数据的调节效应分析的拓展方向, 例如基于动态结构方程模型的密集追踪数据的调节效应分析。
纵向数据, 调节效应, 多层模型, 多层结构方程模型, 交叉滞后模型, 潜变量增长模型
调节(moderation)是社会科学研究中重要的方法学概念。如果自变量对因变量的作用随第三个变量的变化而变化, 则称在和之间起调节作用, 此时称为调节变量(见图1)。近30年来, 调节研究备受关注, 分析方法和实际应用都得到长足发展。然而目前调节效应分析主要涉及截面数据(cross-sectional data), 许多研究者对截面数据的调节效应分析早已驾轻就熟, 但是, 当面对纵向(追踪)数据(longitudinal data)时, 如何进行调节效应分析呢?近年来, 纵向数据的调节效应分析已经成为调节研究的新热点(方杰等, 2018; 邱皓政, 2017; 温忠麟, 刘红云, 2020; Ozkok et al., in press; Preacher et al., 2016; Wen et al., 2014)。本文在评介多层模型(也称多水平模型, Multilevel Modeling, MLM)、多层结构方程模型(Multilevel Structural Equation Model, MSEM)、交叉滞后模型(Cross-Lagged Model, CLM)和潜变量增长模型(Latent Growth Model, LGM)的纵向数据的调节效应分析方法后, 对基于4类模型的调节效应分析方法进行了综合比较, 并提出一套纵向数据的调节效应分析流程; 然后用实际例子演示如何进行纵向数据的调节效应分析。最后展望了纵向数据的调节效应分析的拓展方向。
图1 基于多层模型的纵向数据的调节模型
1 基于多层模型的纵向数据的调节效应分析
纵向(追踪)数据可看成是一个两层结构, 重复测量或测量点为第1层, 观测个体为第2层, 可使用多层模型进行纵向数据分析。如果调节变量不随时间变化(即时不变, 只需要一次测量), 则调节变量在层2 (用Z表示), 自变量和因变量都在层1, 可使用2×(1→1)调节模型(这三个数字依次代表调节变量、自变量和因变量的层级, 数字2表示层级2, 数字1表示层级1)进行纵向数据的调节效应分析, 具体分析方法详见综述方杰等(2018), 不再赘述。但如果调节变量是随时间变化(即时变)的, 可以像自变量和因变量那样获取纵向数据(用Z表示), 此时的调节效应分析复杂多了, 以下将详述相应的调节效应分析方法。
1.1 传统的多层调节效应分析
将方程(2a)和(2b)代入方程(1)得:
调节项为XZ(见方程(3)), 调节效应的大小由回归系数30表示, 如果回归系数30显著不为0, 则表示调节效应显著, 简单斜率为10+30Z。需要说明的是, 方程(2)中的0j、1j、2j和3j表示层2的残差, 说明截距0j和斜率1j、2j和3j在个体间可以变化(称为随机截距和随机斜率), 反映了个体间的差异。实际研究中, 为了简化模型, 研究者可将1j、2j和3j设为固定效应(即令1j、2j和3j为0)。
1.2 无混淆的多层调节效应分析
1.2.1 显变量的多层调节效应分析
将方程(5a)~(5c)代入方程(4)得:
1.2.2 潜变量的多层调节效应分析
多层结构方程模型的纵向数据的调节效应分析如图2所示。第一, 将每个层1测量的观测变量都分解为个体内部分和个体间部分两个潜变量(方杰, 邱皓政等, 2011; 方杰等, 2014, 2018; Preacher et al., 2016)。例如, 观测变量X分解为个体内部分潜变量R和个体间部分潜变量U。同理,Z分解为两个潜变量R和U,Y分解为两个潜变量R和U。第二, 使用潜调节结构方程法(Latent Moderate Structural Equations, LMS, Klein & Moosbrugger, 2000), 根据
进行纯B×B的层2调节效应分析, 其中纯B×B调节项为UU, 如果回归系数03显著, 就表示纯B×B调节效应显著。同理, 根据
图2 基于多层结构方程模型的纵向数据的调节模型
2 基于交叉滞后模型的纵向数据的调节效应分析
2.1 传统的交叉滞后的调节效应分析
传统的交叉滞后模型的调节效应分析(图3)可表示为
其中, 下标表示个体, 系数β和β表示自回归效应(autoregressive effect, 即每个变量前后时间点的效应), 系数γ和γ表示滞后效应(lag effect, 即每个变量对前因变量的回归)。调节项是X(t−1)Y(t−1), 如果系数C和(或) C显著不为0, 则表示调节效应显著。值得注意的是, 自回归系数、滞后系数和调节系数的下标都没有时间, 表示自回归效应、滞后效应和调节效应在不同时间点都具有稳定性(目的是简化模型)。ε和ε表示误差项, 服从正态分布。
图3 传统的交叉滞后调节模型
交叉滞后模型的调节效应至少有两个意义(以C为例进行说明)。第一,X(t−1)调节了滞后效应Y(t−1)→X。第二,Y(t−1)调节了自回归效应X(t−1)→X(Ozkok et al., in press)。总之, 交叉滞后模型可以考察具有时间先后关系的变量间的调节效应, 这是交叉滞后模型的一大特色。值得说明的是, 在截面数据的调节研究中, 调节变量是一个不同于自变量和因变量的变量。但是, 在纵向数据的调节研究中, 就不一定是这样了。例如, 在交叉滞后模型中, 自变量和因变量变成了四个变量(X、X(t−1)、Y和Y(t−1)), 就可以不需要一个新的调节变量了(公式(9)和(10)), 这是纵向数据的调节研究有别于截面数据的一个特点。
2.2 无混淆的交叉滞后的调节效应分析
传统的交叉滞后模型的纵向数据的调节分析方法(见方程(9)和(10))同样存在不足, 即变量(如X和Y)也将随时间变化的个体内部分和不随时间变化的个体间部分混在一起。为了解决这一不足, Hamaker等(2015)建议将中心化后的观测分数X分解为两个潜变量X和X(图4), 即
其中,X表示不随时间变化(下标没有时间)的个体间差异, 即随机截距;X表示随时间变化的个体内差异, 从而将变量X的个体内和个体间部分区分开。同理, 将中心化后的观测分数Y分解为两个潜变量Y和Y(图4), 即
从而将变量Y的个体内和个体间部分区分开。此时, 方程(9)和(10)的调节项X(t−1)Y(t−1)变为:
可以看到X(t−1)Y(t−1)实际上包含了3种调节效应(Ozkok et al., in press)。第一种是纯W×W调节效应, 即随时间变化的个体内调节效应X(t−1)Y(t−1); 第二种是纯B×B调节效应, 即不随时间变化的个体间调节效应XY, 第三种是B×W跨层次调节效应YX(t−1)和XY(t−1)。接下来将分别介绍这三种调节效应分析, 然后再介绍三种调节模型的整合分析。
2.2.1 纯个体内的潜调节效应分析
纯个体内的潜调节效应分析(图4)可表示为方程(14)和(15)
图4 纯W×W的交叉滞后调节模型 (改编自Ozkok et al., in press)
2.2.2 跨层次的潜调节效应分析
跨层次的潜调节效应分析(图5)可表示为方程(16)和(17)
图5 B×W的交叉滞后调节模型 (改编自Ozkok et al., in press)
2.2.3 纯个体间的潜调节效应分析
纯个体间的潜调节效应分析可表示为方程(18)和(19)
其中,Z是一个新的个体间变量(如性别), 调节项是ZY和ZX, 如果C和(或)C显著, 表示调节效应显著(Ozkok et al., in press)。
2.2.4 三种潜调节效应的整合分析
如果一个研究只有两个变量X和Y, 可以将两种潜调节效应整合在一起进行分析。具体地, 由方程(14)和(15)进行个体内的潜调节效应分析, 方程(16)和(17)进行跨层次的潜调节效应分析即可, 无法进行个体间的潜调节效应分析。
如果自变量X和因变量Y随时间变化(纵向数据), 调节变量Z不随时间变化(截面数据), 就可以将三种潜调节效应整合在一起进行分析。具体地, 由方程(14)和(15)进行个体内的潜调节效应分析, 方程(18)~(20)进行个体间的潜调节效应分析(如果调节变量是二分类别变量, 则去掉方程(20)),
跨层次的潜调节效应分析则需要在方程(16)和(17)中都各自加上两个调节项ZY(t−1)和ZX(t−1)即可(Ozkok et al., in press)。Ozkok等人用一个示例演示如何将潜调节结构方程法和Bayesian法相结合, 对不随时间变化的调节变量(性别)做三种潜调节效应的整合分析。
如果所有变量都随时间变化(如X、Y和Z), 同样也可以将三种潜调节效应整合在一起进行分析。第一, 方程(14)和(15)都各自增加Z(t−1)、X(t−1)Z(t−1)和Y(t−1)Z(t−1)三项, 再加方程(21), 即可进行个体内的潜调节效应分析。
第二, 由方程(18)~(20)进行个体间的潜调节效应分析。第三, 方程(16)和(17)中都各自增加Z(t−1)、ZY(t−1)、ZX(t−1)、ZZ(t−1)、YZ(t−1)、XZ(t−1), 再加上方程(22), 即可进行跨层次的潜调节效应分析。
需要说明的是, 三种潜调节效应的整合分析会有很多个调节项, 这无疑增加了数据不收敛的可能, 也大大增加了运行时间。在实践中, 建议研究者先从理论上排除一些没有充分理论依据的调节项, 从而减少计算时间。
3 基于潜变量增长模型的纵向数据的调节效应分析
如果自变量、因变量和调节变量都随时间变化(纵向数据), 则潜变量增长模型的纵向数据的调节效应分析包括四个潜变量增长模型, 分别是自变量的潜变量增长模型、调节变量的潜变量增长模型、因变量的潜变量增长模型、和调节项的潜变量增长模型(图6), 分析的关键是如何构建调节项的潜变量增长模型, Wen等(2014)采用乘积指标构建了调节项的初始水平, 用差积指标构建了调节项的变化率。具体地, 自变量的潜变量线性增长模型可以表示为
图6 基于潜变量增长模型的纵向数据的调节模型(改编自Wen et al., 2014)
其中,a和S都是潜变量, 各自表示变量的初始水平(截距)和变化率。同理, 调节变量的潜变量线性增长模型可以表示为
将方程(23a)乘以(24a), 整理得:
至此, 初始水平的调节效应模型(图6), 即a对a和a关系的调节效应可表示为
其中, 调节项为潜变量aa,11是aa的指标, 由于是单指标潜变量, 因此固定其负荷为1。如果系数显著, 表示初始水平的调节效应显著(温忠麟, 刘红云, 2020; Wen et al., 2014)。
将方程(23b)减去(23a)、方程(24b)减去(24a), 得到:
将方程(27a)乘以(27b), 整理得:
同理, 由方程(23d)、(23c)和方程(24d)、(24c), 得到:
至此, 变化率的调节效应模型(图6), 即S对S和S关系的调节效应可表示为
除了上述需要构建乘积项的乘积指标法, 还可以使用无需构建乘积项的潜调节结构方程法进行基于潜变量增长模型的纵向数据的调节效应分析(详见第6部分的示例)。潜调节结构方程法的一个优势是, 除了初始水平(调节项aa)和变化率(调节项SS)的调节效应外, 潜调节结构方程法还可以便利地产生其它调节项(如aS、aS和aS), 灵活地进行其它调节效应分析。甚至当调节变量是不随时间变化时, 潜调节结构方程法也可以便利地产生调节项(如aZ、SZ), 进行调节效应分析。另外, 由于潜变量增长模型将自变量分为a和S两个潜变量, 从理论上说, 则可以将S当成调节变量, 利用潜调节结构方程法分析S对a→S关系的调节效应, 并不一定需要一个新的调节变量。
4 纵向数据的调节模型的综合比较
多层模型(MLM)、多层结构方程模型(MSEM)、交叉滞后模型(CLM)和潜变量增长模型(LGM)的调节模型比较如表1所示。纵向数据的调节效应分析的一大特点是调节效应的分解。具体地, 多层模型、多层结构方程模型和交叉滞后模型都将变量区分为随时间变化的个体内部分(W)和不随时间变化的个体间部分(B), 从而将纵向数据的调节效应分解为三部分, 即纯W×W调节、纯B×B调节和B×W跨层次调节。潜变量增长模型将纵向数据的调节效应分解为初始水平的调节效应和变化率的调节效应。
纵向数据的调节分析的另一个特点是进行潜变量的调节效应分析, 而且大都推荐使用潜调节结构方程(LMS)法进行潜变量的调节效应分析(Asparouhov & Muthén, 2021; Ozkok et al., in press; Preacher et al., 2016; Wen et al., 2014)。具体地, Preacher等(2016)明确指出, 只有潜调节结构方程法能适用于1×(1→1)调节模型的W×W调节效应分析(即方程(8)的RR)。Wen等(2014)比较了乘积指标法和潜调节结构方程法在潜变量增长模型的变化率的调节效应检验中的表现。结果发现, 在正态条件下, 尤其是在小样本时, 潜调节结构方程法比乘积指标法在参数估计时产生更小的偏差。但是在数据非正态条件下, 乘积指标法比潜调节结构方程法在参数估计时产生更小的偏差。因此, 当数据正态分布条件下, 推荐使用潜调节结构方程法; 数据非正态条件下, 推荐使用乘积指标法。
目前, 潜调节结构方程法可通过软件方便实现(Muthén & Muthén, 1998-2017)。但是,默认在潜调节结构方程法的调节效应估计中, 采用极大似然估计(Muthén & Muthén, 1998- 2017)。当自变量和调节变量都是潜变量时, 极大似然估计必须用到数值积分(numerical integration), 这将导致计算量很大(Asparouhov & Muthén, 2021)。有研究者建议, 当自变量和调节变量都是潜变量时, 将潜调节结构方程法和Bayesian法相结合(8.3及以后版本方可实现), 得到调节效应的Bayesian估计(Asparouhov & Muthén, 2021; Ozkok et al., in press)。Asparouhov和Muthén(2021)的模拟研究表明, 在潜调节结构方程法的调节效应分析中, 相比Preacher等(2016)使用的极大似然估计而言, Bayesian估计会更快、更准确(表现为更小的绝对偏差(absolute bias)和更好的区间覆盖率(interval coverage rate) )、且收敛率更高。
第三, 收集纵向数据进行分析的一个重要目的就是为了进行历时性因果推断(温忠麟, 2017), 如果要进行历时性因果推断, 在本文介绍的几类纵向模型中, 只有交叉滞后模型及其变体可以实现, 因为只有交叉滞后模型体现了历时性因果推测所必须的测量时间点先后关系, 同时考虑了自回归效应(方杰等, 2021)。其他三种模型在建模过程中, 没有考虑变量之间影响的先后顺序, 其调节效应分析本质上与截面数据的调节分析无异, 要得出因果推论还要有统计以外的理据(温忠麟, 2017; 方杰等, 2021)。
另外, 如果是显变量的调节效应检验或想耗时少, 建议选择多层模型; 如果是测量次数只有两次, 建议选择交叉滞后模型; 如果是考察初始水平和(或)变化率的调节效应检验, 建议选择潜变量增长模型。
5 纵向数据的调节效应分析流程
面对一个纵向数据的调节效应分析任务, 研究者应当如何进行呢?根据前面的讨论, 我们总结出一套纵向数据的调节效应分析流程(见图7):
表1 纵向数据的调节模型比较
注:“√”表示可以考察,“×”表示无法考察。
(1) 需要进行历时性因果推论吗?如果是, 则用交叉滞后模型进行调节效应分析。否则, 进入步骤2。
(2)将纵向数据当成多层数据吗?如果是, 则用多层结构方程模型进行调节效应分析。多层结构方程模型和多层模型更适合于描述个体间差异。否则, 使用潜变量增长模型进行调节效应分析。只有潜变量增长模型可以同时研究某些变量对变化的影响(将变化作为因变量, 如S)和变化如何影响其他变量(即把变化作为自变量, 如S) (温忠麟, 刘红云, 2020)。
(3)多层结构方程模型收敛吗?如果是, 报告多层结构方程模型的调节效应分析结果。否则, 使用多层模型进行调节效应分析。多层结构方程模型和多层模型的主要差别在于计算组均值时是否考虑抽样误差(见1.2.2部分), 但多层结构模型的收敛难度更大, 因此优先使用考虑了抽样误差的多层结构方程模型, 收敛不了再考虑多层模型。
图7 纵向数据的调节效应分析流程图
6 纵向数据的调节效应分析示例
下面用一个实际例子演示如何用图7的流程进行纵向数据的调节分析。本例的变量有家庭冲突()、青少年被欺负()和烟酒使用, 变量及其数据(每间隔半年重复测量1次, 共重复测量4次, 共1132名11~15岁的美国青少年)均来自Little (2013)的研究。采用8.3软件进行纵向数据的调节效应分析(程序见网络版附录)。
6.1 基于交叉滞后的纵向数据的调节效应分析
如果需要进行历时性因果推论, 则使用交叉滞后模型进行纵向数据的调节效应分析。为了简化模型, 本例使用家庭冲突()和青少年被欺负()两个变量, 将Bayesian法和潜调节结构方程法相结合进行纯W×W的无混淆的交叉滞后模型的潜调节效应分析(方程(14)和(15), 有3个调节项X1Y1、X2Y2和X3Y3)。分析前, 自变量和因变量按总均值进行了中心化。
第一, Bayesian法是以马尔科夫链(Markov Chain)收敛为前提的, 常用轨迹图(trace plot, 如果多条马尔科夫链的轨迹高度重叠表明马尔科夫链收敛)和PSR(Potential Scale Reduction, 如果PSR<1.1 (或更严格的标准1.05)表明马尔科夫链收敛)来检验马尔科夫链是否收敛, 更详细的介绍见综述方杰和张敏强等(2011)。轨迹图和PSR结果(TECH8报告第7700次迭代时PSR = 1.049)表明马尔科夫链收敛。
第二, 纯W×W的潜调节效应分析结果显示,X(t−1)→X的自回归效应β= 0.482,= 0.025, 95%可靠区间[0.431, 0.532]不包含0, 自回归效应β显著, 表明随着时间的推移, 家庭冲突逐渐加重。Y(t−1)→X的滞后效应γ= 0.003,= 0.02, 95%可靠区间[−0.037, 0.044]包含0, 滞后效应γ不显著, 表明−1时刻的青少年被欺负不能显著预测后一时刻的家庭冲突。X(t−1)Y(t−1)→X的调节效应C= −0.053,= 0.026, 95%可靠区间[−0.105, −0.004]不包含0, 调节效应C显著, 表明X(t−1)调节了滞后效应Y(t−1)→X, 或者Y(t−1)调节了自回归效应X(t−1)→X。
第三,Y(t−1)→Y的自回归效应β= 0.286,= 0.028, 95%可靠区间[0.228, 0.341]不包含0, 自回归效应β显著, 表明随着时间的推移, 青少年被欺负逐渐加重。这也符合实际, 被欺负的青少年更容易继续被欺负。X(t−1)→Y的滞后效应γ= 0.07,= 0.028, 95%可靠区间[0.016, 0.126]不包含0, 滞后效应γ显著, 表明−1时刻的家庭冲突显著增加了后一时刻的青少年被欺负。这可解释为, 青少年和父母冲突越多, 会让其他人认为, 这个青少年缺少安全保护, 会更容易将之作为欺负的对象。X(t−1)Y(t−1)→Y的调节效应C= −0.039,= 0.033, 95%可靠区间[−0.105, 0.024]包含0, 调节效应C不显著。
第四, 不随时间变化的个体间关系X→Y的效应为0.564,= 0.058, 95%可靠区间[0.459, 0.681]不包含0,X→Y的效应显著, 表明家庭冲突显著增加了青少年被欺负的风险。需要说明的是, 本例的纯W×W的潜调节效应检验(有3个调节项)耗时3个半小时, 因此, 跨层次的潜调节效应检验会耗时更长。
6.2 基于多层结构方程模型的纵向数据的调节效应分析
如果将纵向数据当成两层数据, 则使用多层结构方程模型进行调节效应分析。要研究的是烟酒使用()对家庭冲突()和青少年被欺负()的调节效应。采用Bayesian法和潜调节结构方程法、随机系数预测法相结合进行潜调节效应分析。其中, 随机系数预测法仅用来考察跨层次的潜调节效应, 其余潜调节效应用潜调节结构方程法进行考察。为了简化模型, 将2j和3j设为0。
第一, 轨迹图和PSR结果(TECH8报告第900次迭代时PSR = 1.044)表明马尔科夫链收敛。第二, 基于多层结构方程模型的纵向数据的调节效应分析显示, 纯个体内(纯W×W)的潜调节效应30= −0.191,= 0.077, 95%可靠区间[−0.35, −0.047]不包含0,30显著不为0, 表明纯个体内的潜调节效应显著。第三, 纯个体间(纯B×B)的潜调节效应03= 0.232,= 0.086, 95%可靠区间[0.063, 0.394]不包含0,03显著不为0, 表明纯个体间的潜调节效应显著。第四, 跨层次的调节效应11= −0.113,= 0.156, 95%可靠区间[−0.403, 0.209]包含0,11不显著, 表明跨层次的潜调节效应不显著。其它参数估计见表2。
6.3 基于潜变量增长模型的纵向数据的调节效应分析
要研究的是烟酒使用()对家庭冲突()和青少年被欺负()的调节效应。采用Bayesian法和潜调节结构方程法相结合进行基于潜变量增长模型的潜调节效应分析(有二个调节项aa和SS)。
第一, 轨迹图和PSR结果(TECH8报告第1900次迭代时PSR = 1.011)表明马尔科夫链收敛。第二, 变化率的调节效应检验结果发现(以下呈现的是标准化解),S对S的效应显著(= 0.363,= 0.084, 95%可靠区间[0.2, 0.528]不包含0);S对S的效应显著(= −0.21,= 0.105, 95%可靠区间[−0.418, −0.007]不包含0); 变化率的调节效应显著(= 0.052,= 0.024, 95%可靠区间[0.006, 0.098]不包含0), 即烟酒使用的变化率正向调节了家庭冲突的变化率与青少年被欺负的变化率的关系。
第三, 初始水平的调节效应检验结果发现(以下呈现的是标准化解),a对a的效应显著(= 0.417,= 0.082, 95%可靠区间[0.264, 0.581]不包含0);a对a的效应不显著(= −0.117,= 0.064, 95%可靠区间[−0.251, 0.001]包含0); 初始水平的调节效应显著(= −0.173,= 0.053, 95%可靠区间[−0.282, −0.074]不包含0), 即烟酒使用的初始水平调节了家庭冲突的初始水平与青少年被欺负的初始水平的关系。
7 讨论和拓展
表2 多层结构方程模型的调节分析的部分参数估计结果
在阐述了基于多层模型、多层结构方程模型、交叉滞后模型和潜变量增长模型的多种纵向数据的调节效应分析后, 对基于四类模型的调节效应分析方法进行了综合比较, 接着总结出一个纵向数据的调节效应分析流程图, 并用示例演示如何进行纵向数据的调节效应分析。但是, 有关纵向数据的调节效应分析仍存在不足, 尚需进一步深入研究和拓展。
第二, 本文仅涉及测量次数较少(≤10)的纵向数据的调节效应分析, 如果是重复测量次数较多(≥10)的纵向数据, 常称为密集追踪数据(Intensive Longitudinal Data, 唐文清等, 2020; 郑舒方等, 2021), 如何进行纵向数据的调节效应分析呢?密集追踪数据常用动态结构方程模型(Dynamic Structural Equation Models, DSEM)进行数据分析(郑舒方等, 2021; McNeish & Hamaker, 2020)。动态结构方程模型是将交叉滞后模型和多层模型相结合, 其本质是在多层模型中添加自回归效应和滞后效应(方程(31)和(32))。基于动态结构方程模型的密集追踪数据的调节效应分析可表示为
第三, 本文仅涉及纵向数据的调节效应分析方法, 已有研究还介绍了纵向数据的中介效应分析方法(刘国芳等, 2018; 方杰等, 2021), 那么纵向数据的中介和调节效应整合在一起, 如何进行纵向数据的有调节的中介效应分析呢?目前, 纵向数据的有调节的中介效应检验可采用多层模型(Bauer et al., 2006)和多层自回归模型(Zhang et al., 2018)进行分析。但这两种方法都没有将变量分为随时间变化的个体内部分和不随时间变化的个体间部分。那么, 在纵向数据的有调节的中介效应分析中, 如何实现随时间变化的个体内效应和不随时间变化的个体间效应的有效分离呢?还有待深入研究。
纵向数据在心理学和其他社科领域研究中经常遇到, 但不仅纵向数据的调节分析的方法学研究滞后于中介分析方法的发展, 而且纵向数据的调节分析的应用研究在国内也很少, 本文试图为应用研究者提供相应的方法学支持。实际上, 纵向数据的调节效应的分析方法仍处蓬勃发展期, 还有诸多问题函待解决。例如, 基于交叉滞后模型的纵向数据的调节效应分析, 目前仅能提供非标准化解, 那么如何提供标准化解呢?又如, 纵向数据的调节效应分析目前主要通过软件实现, 这在一定程度上限制了应用研究者进行纵向数据的调节效应分析, 如何才能在其他软件上进行纵向数据的调节效应分析呢?再如, 虽然潜调节结构法方程法优势突出, 但很多应用研究者放弃该法的一个重要原因就是该法耗时长, 如何才能减少潜调节结构方程法的耗时呢?方法的进步给研究者提供了一个深入理解和应用纵向数据进行调节效应分析的机会, 相信随着纵向数据的调节分析方法研究的深入, 会不断增加我们对纵向数据的调节效应问题的理解。
方杰, 邱皓政, 张敏强. (2011). 基于多层结构方程模型的情境效应分析——兼与多层线性模型比较.,(2), 284–292.
方杰, 温忠麟, 邱皓政. (2021). 纵向数据的中介效应分析.,(4), 989–996.
方杰, 温忠麟, 吴艳. (2018). 基于结构方程模型的多层调节效应.,(5), 781–788
方杰, 温忠麟, 张敏强, 任皓. (2014). 基于结构方程模型的多层中介效应分析.,(3), 530–539.
方杰, 张敏强, 李晓鹏. (2011). 中介效应的三类区间估计方法.,(5), 765–774.
刘国芳, 程亚华, 辛自强. (2018). 作为因果关系的中介效应及其检验.,(11), 665–676.
邱皓政. (2017).——. 台湾: 五南图书出版股份有限公司.
唐文清, 张敏强, 方杰. (2020). 时变效应模型及在密集追踪数据分析中的应用.,(2), 488–497.
温忠麟. (2017). 实证研究中的因果推理与分析.(1)200–208.
温忠麟, 刘红云. (2020).. 北京: 教育科学出版社.
郑舒方, 张沥今, 乔欣宇, 潘俊豪. (2021). 密集追踪数据分析: 模型及其应用.,(11), 1948–1969.
Asparouhov, T., & Muthén, B. (2021). Bayesian estimation of single and multilevel models with latent variable interactions.,(2), 314–328.
Bauer, D. J., Preacher, K. J., & Gil, K. M. (2006). Conceptualizing and testing random indirect effects and moderated mediation in multilevel models: New procedures and recommendations.,(2), 142−163.
Hamaker, E. L., Kuiper, R. M., & Grasman, R. P. P. P. (2015). A critique of the cross-lagged panel model.,(1), 102–116.
Klein, A. G., & Moosbrugger, H. (2000). Maximum likelihood estimation of latent interaction effects with the LMS method.,(4), 457–474.
Little, T. D. (2013).. NY: Guilford Press.
McNeish, D., & Hamaker, E. L. (2020). A primer on two- level dynamic structural equation models for intensive longitudinal data in Mplus.,(5), 610–635.
Montoya, A. K. (2019). Moderation analysis in two-instance repeated-measures designs: Probing methods and multiple moderator models.,(2), 61–82.
Muthén, L. K., & Muthén, B. O. (1998-2017).(8th ed.). Muthén & Muthén.
Ozkok, O., Vaulont, M. J., Zyphur, M. J., Zhang, Z., Preacher, K. J., Koval, P., & Zheng, Y. (in press). Interaction effects in cross-lagged panel models: SEM with latent interactions applied to work-family conflict, job satisfaction, and gender..
Preacher, K. J., Zhang, Z., & Zyphur, M. J. (2016). Multilevel structural equation models for assessing moderation within and across levels of analysis.,(2), 189–205.
Wen, Z., Marsh, H. W., Hau, K-T., Wu, Y., Liu, H., & Morin, A. J. S. (2014). Interaction effects in latent growth models: Evaluation of alternative estimation approaches.,(3), 361–374.
Zhang, Q., Wang, L. J., & Bergeman, C. S. (2018). Multilevel autoregressive mediation models: Specification, estimation, and applications.,(2), 278–297.
附录:
基于交叉滞后模型的纯W×W调节效应分析的Mplus程序:
DATA: FILE = 1.dat;
VARIABLE: NAMES = x1-x4 m1-m4 y1-y4;
USEVARIABLES = x1-x4 y1-y4;
DEFINE: CENTER x1-x4 y1-y4 (GRANDMEAN); !按总均值中心化
ANALYSIS: ESTIMATOR = BAYES; !使用Bayesian法
TYPE = RANDOM;
PROCESSORS = 8; !多个处理器, 加快运算速度
CHAINS = 2; !两条马尔科夫链
THIN = 2; !抽取后验分布的间隔
FBITERATIONS = 30000; !马尔科夫链迭代3万次
MODEL: xb by x1-x4@1; !设置x的个体间部分, 即随机截距
yb by y1-y4@1; !设置y的个体间部分, 即随机截距
xw1 by x1@1; x1@0.01; !设置x的个体内部分
xw2 by x2@1; x2@0.01;
xw3 by x3@1; x3@0.01;
xw4 by x4@1; x4@0.01;
yw1 by y1@1; y1@0.01; !设置y的个体内部分
yw2 by y2@1; y2@0.01;
yw3 by y3@1; y3@0.01;
yw4 by y4@1; y4@0.01;
xb yb with xw1-xw4@0 yw1-yw4@0; !随机截距和个体内部分相关为0
yb on xb; !个体间效应
xw4 on xw3(beta_x); !自回归效应
xw3 on xw2(beta_x);
xw2 on xw1(beta_x);
yw4 on yw3(beta_y);
yw3 on yw2(beta_y);
yw2 on yw1(beta_y);
xw4 on yw3(gama_x); !滞后效应
xw3 on yw2(gama_x);
xw2 on yw1(gama_x);
yw4 on xw3(gama_y);
yw3 on xw2(gama_y);
yw2 on xw1(gama_y);
xw1-xw4 yw1-yw4 WITH xw1-xw4@0 yw1-yw4@0; ! 限制所有相关为0
xw1 with yw1; xw2 with yw2; !允许自由估计的相关
xw3 with yw3; xw4 with yw4;
xwyw1 | xw1 XWITH yw1; !构建调节项
xwyw2 | xw2 XWITH yw2;
xwyw3 | xw3 XWITH yw3;
xw2 on xwyw1(cx);
xw3 on xwyw2(cx);
xw4 on xwyw3(cx);
yw2 on xwyw1(cy);
yw3 on xwyw2(cy);
yw4 on xwyw3(cy);
OUTPUT: TECH8;
PLOT:TYPE = PLOT2;
注:如果要进行跨层次调节效应分析(以XY(t-1)为例), 只需要添加如下语句
xbyw1 | xb XWITH yw1; !构建调节项
xw2 on xbyw1(c1x);
基于多层结构方程模型的调节效应分析的Mplus程序:
DATA: FILE = 1.csv;
VARIABLE: NAMES = x z y person;
CLUSTER = person;
ANALYSIS: TYPE = TWOLEVEL RANDOM;
ESTIMATOR = BAYES;
ALGORITHM = GIBBS(RW);
POINT = MEAN; !用均值作为点估计
CHAINS = 2;
PROCESSORS = 3;
BITERATIONS = 50000 (20000); !马尔科夫链最少迭代2万次,最多5万次
THIN = 10;
MODEL: %within%
xw by x@1; x@.01;
zw by z@1; z@.01;
s1 | y on xw;
s2 | y on zw;
xw with zw;
xzw | xw XWITH zw; !构建个体内的调节项
y on xw zw xzw; ! LMS法求调节效应30
%between%
xb by x@1; x@.01;
zb by z@1; z@.01;
s1 on zb; !随机系数预测法求调节效应11
xzb | xb XWITH zb; !构建个体间的调节项
y on xb zb xzb; !LMS法求调节效应03
xb with zb;
OUTPUT: CINTERVAL(hpd) TECH8;
plot: type = plot2;
基于潜变量增长模型的调节效应分析的Mplus程序:
DATA: FILE = 1.dat;
VARIABLE: NAMES = x1-x4 z1-z4 y1-y4;
ANALYSIS: ESTIMATOR = BAYES;
TYPE = RANDOM;
POINT = MEAN;
CHAINS = 3;
PROCESSORS = 3;
BITERATIONS = (20000);
BCONVERGENCE = 0.025; !马尔科夫链收敛标准
THIN = 10;
MODEL: IX SX | x1@0 x2@1 x3@2 x4@3; !构建LGM模型
IZ SZ | z1@0 z2@1 z3@2 z4@3;
IY SY | y1@0 y2@1 y3@2 y4@3;
int1 | SX XWITH SZ; !构建变化率的调节项
int2 | IX XWITH IZ; !构建初始水平的调节项
SY ON SX SZ int1;
IY ON IX IZ int2;
OUTPUT: CINTERVAL(hpd) TECH8; STDYX;
PLOT: TYPE = PLOT2;
Moderation analysis for longitudinal data
FANG Jie1, WEN Zhonglin2
(1 Institute of New Development & Department of Applied Psychology, Guangdong University of Finance & Economics, Guangzhou 510320, China) (2 Center for Studies of Psychological Application & School of Psychology, South China Normal University, Guangzhou 510631, China)
At present, the analysis of moderating effect is mainly based on cross sectional data. This article discusses how to analyze the moderating effect with longitudinal data. If the independent variableand the dependent variableare longitudinal data, longitudinal moderation model can be divided into three categories according to the type of moderator: time-invariant moderator, time-variant moderator, and moderator generated fromor. Four types of longitudinal moderation analysis approaches are summarized: 1) Multilevel model (MLM); 2) Multilevel structural equation model (MSEM); 3) Cross-lagged model (CLM); 4) Latent growth model (LGM). It is found that the decomposition of the moderating effect and the use of latent moderating structural equation (LMS) method are the two characteristics of the moderation analysis for longitudinal data. A procedure for longitudinal moderation analysis is proposed. An example is illustrated with the software. Directions for future research on moderation analysis of longitudinal data are discussed, such as the moderation analysis for intensive longitudinal data based on the dynamic structural equation model.
longitudinal data, moderation effect, multilevel model, multilevel structural equation model, cross- lagged model, latent growth model
B841
2021-10-16
* 国家自然科学基金项目(32171091)、国家社会科学基金项目(17BTJ035)资助。
温忠麟, E-mail: wenzl@scnu.edu.cn