优势比下带有测量误差的非线性因果中介模型的效应估计①
2022-08-24周跃进
刘 近, 周跃进
(安徽理工大学数学与大数据学院,安徽 淮南 232001)
0 引 言
因果中介分析是揭示变量间因果机制的一个有效的分析工具,其广泛用于心理学、行为学、流行病学、生物医学的研究。2001年,Pearl基于反事实框架提出了直接效应和间接效应的定义。基于反事实框架的优点在于直接效应和间接效应的定义不需要基于模型的假定。在Pearl(2001)的方法中,因果中介效应具有可加性,自然直接效应和间接效应之和等于总效应。在一定的假设下,这些因果效应能被识别,从而获得估计,并在Pearl(2009)中进行全面的阐述。本文研究当中介变量具有测量误差时考虑无交互作用和有交互作用两种情形下,分别通过建立逻辑回归和线性回归模型,估计出直接效应和间接效应。
1 模型与定义
因果中介分析研究自变量是否通过中介变量影响结果变量的因果机制,其一般关系如图1所示,其中A表示自变量,M表示中介变量,C表示混杂变量,Y表示结果变量。
图1 因果中介分析路径图
当C=c时,自变量从a到a*时,总效应被定义为:
类似地,可以定义基于优势比的直接效应和间接效应。自然直接效应定义为:
中介变量固定在M a*时,自变量从水平a变化到水平a*的效应。自然间接效应定义为:
总效应可分解为自然间接效应和自然直接效应的乘积,即
考虑中介变量具有测量误差的因果效应估计问题。观察值与真实值之间的关系为:
M*=M+μ,则路径图为图2:
图2 具有测量误差的因果中介分析路径图
其中假设条件为:
1.1 无交互作用的效应估计
建立logistic回归和线性回归模型,即如下所示。
然而,在考虑中介变量具有误差的情形下,logistic回归和线性回归结构方程表示为:
自然直接效应OR NDEa,a*|c(a*)表示为:
在假设结果变量稀疏性假定下,自然直接效应和间接效应近似解析表达式为:
对模型中参数可由极大似然估计方法获得其估计,从而估计自然直接效应和间接效应。
1.2 有交互作用的效应估计
模型为:
在稀疏结果的假定下,则自然直接效应和间接效应的解析表达式分别为:
可由极大似然估计方法获得模型参数估计,从而估计自然直接效应和间接效应。
2 模拟研究
在无交互作用情形下,为了进行模拟研究,模型参数分别设置为:03;对模型误差分布考虑三种情形,分别服从N(0,1),N(1,1)和N(1,4),对每一种模拟情形,重复500次。获得自然直接效应和间接效应的偏差,标准差和置信区间。模拟结果如表1所示。
表1 无交互作用时效应估计
当自变量服从各种模拟情形时,估计的偏差、标准差和置信区间都较小,表明提出的方法表现良好。
考虑在有交互作用的情形时,模拟结果如表2所示。
表2 有交互作用时效应估计
从表2中可得,对于模型误差服从三种不同分布,真实值与估计值的差别很小,这表明我们提出的方法表现良好。
3 结 论
本文研究了当中介变量具有测量误差时,考虑利用优势比定义了中介效应,通过建立逻辑回归和线性回归模型的结构方程,估计出直接效应和间接效应。在有限样本下用R语言进行模拟分析,结果表明提出的方法具有良好表现。本文在推导过程中都假定结果变量是稀疏的,从而获得效应估计的近似解析表达式。在未来的工作中,将进一步地考虑结果变量非稀疏性假定时,中介因果效应估计的精确解析表达式。