定量流行病学和医学科学研究中的因果联系
2022-08-23陈心广
陈心广
(西安交通大学全球健康研究院,西安 710020)
对事物间因果关系的兴趣和好奇,是人类的天性。几乎所有的学科领域,都关注因果关系方面的研究。与其他学科一样,因果关系研究在医学领域占有非常重要的地位,包括基础医学、药理学、临床医学和预防医学。医学领域所关注的是影响健康和疾病的因素,包括健康危险因素、健康保护因素和健康促进因素。例如:为什么生活在环境污染严重的大城市居民的期望寿命,比生活在农村的人还长?在相同的条件下,为什么一些人感染新冠病毒,而另外一些人却不感染?为什么不是每个超重或肥胖的人都患有高血压、糖尿病和心脏病?为什么同一种病用相同的治疗方法,有些病人效果好而有些却不好?
笔者将从一个的新的角度,阐述因果联系研究的本质、研究设计和分析方法。
1 二元分析因果探索
1.1 因果关系研究的本质
大多数医疗卫生工作人员的研究工作都是基于疾病和健康的因果关系研究。然而,很少有人发问:因果关系究竟指的是什么?比如,当研究体重与糖尿病之间的关系时,我们研究的究竟是什么?为什么得到的结论不像新冠肺炎与新冠病毒感染之间的关系那样具有确定性?
根据发表的文献和个人的实际经验,最近出版的《Quantitative Epidemiology》[1]一书的作者提出,我们进行任何一项关于因果关系的研究,事实上都是从复杂的、相互依存的关系网络里提取出来的,是我们认为可能存在的一种关系。如图1 所示,宇宙间万事万物相互依存、互相关联,形成错综复杂的关系网络体系。而医学研究人员则是根据实际需要、客观条件、个人背景、兴趣和能力等,从网络体系中挑选出与健康或者疾病相关的一小部分进行研究。
图1 对未知事物间因果联系的探究,常常集中在广袤宇宙多元多层次的网状结构里某个小小的,我们比较熟悉的部分
例如,在真实情况下,疾病d 与3 个因素a、b、c之间存在如图1所示的关系。某研究人员根据文献资料和个人经验,认为d 与a 有关。为证明这一假设,他设计一个科研项目来证明两者之间的关系。然而,这个研究忽略了未知因素b 和c。由于因素c处在a 和d 之间,a 与d 之间的关系要通过c 才能实现。我们称c 为中介因素,即位于刺激与反应变量之间还存在着没有或者就不能观察到的变量[2]。在不知道a-c 和c-d 关系的条件下,不能确定a-d 的关系。因素c 有可能阻断a-d 关系,也有可能促进a-d关系。如果c是阻断作用,所得到的结果可能是d与a无关;如果c是促进作用,其结果可能会放大d与a之间的关系。由此可见,仅仅忽略一个中介因素,对研究结果的干扰就如此严重。不难想象,当有多个因素介于我们研究的因素X和疾病Y之间,问题会有多严重。
第二,除了中介因素,还有影响因素b,也可称为协变量或者混杂因素,即与因变量有相关关系,并且在探讨自变量与因变量关系时需要加以控制的变量[2]。除了对d的影响,b还可以改变d与c和c与a 的关系。协变量的作用可能要比中介变量小,但是忽略了重要的协变量,也会严重影响因果推断的结果,导致偏差,增加因果关系结论的不确定性。
最后,有些情况下很难事先确定d与a之间作用的方向,即无法事先知道是a 影响d 还是d 影响a。比如在研究慢性病与体力活动之间的关系时,往往无法事先确定是因为缺乏体力活动导致慢性病?还是因为患有慢性病而妨碍个人参加体力活动?由于一项研究一般只分析两个变量的某个方向的关系,通常人为地指定X(自变量)和Y(应变量)。如果指定对了,即能够得到预期的结果;反之,则不能。
理解在因果关系研究中上述的本质特点,有利于我们思考、设计、实施和评价科学研究项目,有助于准确地解释自己观察到的研究结果,和正确理解他人的研究结果。
1.2 慢性病和传染病因果关系模式的差异
医学科学研究另外一个重大问题是慢性病与传染病的病因学模式。现代医学科学的建立,在很大程度上是基于对传染病病因的生物学研究,而基于病因学建立的有效预防和治疗方法则是通过传染病的研究和实践,自然而然地形成了疾病的因果联系模式,最典型的是科赫法则[3]。
以细菌性肺炎为例(图2 的上面部分),要诊断病人患有细菌性肺炎,首先寻找的证据是肺炎双球菌。如果通过细菌培养找到了,按照病因学推理模式,肺炎双球菌很可能就是病因了。除了细菌培养之外,寻找病因的办法还有抗生素治疗,如果通过抗生素治愈,从病因学的角度可以进一步判断肺炎双球菌就是病因。
图2 慢性病(以前列腺癌为例)不能套用传染病(以细菌性肺炎为例)的病因学推理模式
推断传染病因果联系的模式深入人心,使得广大的医务工作者和绝大多数科研人员在医学科学研究和实践中,很自然地以此模式作为指导。图2的下半部分是关于前列腺癌因果关系推断的例子。这一个例子证明,用传染病模式来研究慢性病的病因会得到错误的结论。
目前,治疗前列腺癌的第一线方法就是抗雄激素睾丸酮治疗,不仅疗效好,而且稳定。这种疗法是基于上世纪70 年代获得诺贝尔奖的动物实验研究结果发展而来[4]。公认的病因学研究和几十年成功的临床实践,这让我们自然地形成了高雄激素是前列腺癌病因这一因果推断。与前面介绍的推断细菌性肺炎的因果联系模式如出一辙,抗菌素治好了由细菌引起肺炎,因此推理可知,细菌就是肺炎的病因;抗雄激素治好了前列腺癌,同理,雄激素就是前列腺癌的病因。
可是,雄激素的水平在青年时期最高,而前列腺癌的发病高峰是在老年期即65~70 岁之间,在这个年龄阶段,体内雄激素处在低水平已经很长时间了。因此,根据抗雄激素治疗前列腺癌的结果,来判断雄激素过高是前列腺癌病因是经不起事实检验的[5]。这个问题也许可以用另外一个理论来分析:前列腺癌的发病和进展是两个不同的过程。前列腺癌发生的原因不是雄激素太高,而是性激素随年龄下降太快。因此,不能仅仅依据抗雄激素治疗效果明显,来确定慢性病发病的原因就是雄激素过高,这个新理论已经得到不同研究的证实[6-8]。
1.3 研究特征与变量之间的关系
除了因果关系研究的本质特征和传染病——慢性病因果联系的模式的差异,病因学或者说因果关系研究还有一个被忽略的问题,就是研究特征与分析时所用的变量之间的关系。在《Quantitative Epidemiology》一书中,作者认为在提出一个关于病因学研究的课题时,我们关注的往往是某个特征,比如,研究疾病时我们考虑的是“病”,如高血压、心脏病、糖尿病、肺癌、肠癌等等。研究影响因素时,我们考虑的是“因素”,如个人卫生、饮食习惯、体育锻炼、吸烟、饮酒等等。
但是在开展具体研究时,我们测量的是“变量”。所谓变量,指的是相对单一的、可以客观测量的指标。因此,一个特征可以用多种变量来测量(如图3 左边部分所示)。比如,在研究吸烟与肺癌的关系时,“吸烟”是我们关注的特征。可是在具体研究时,有很多变量可以用来反映(度量)吸烟这一特征。典型的例子如血清里或者唾液里尼古丁的代谢产物、体内呼出的气体中二氧化碳的浓度等。除了实验室指标,还有大量的调查指标,如开始吸烟的年龄、累计吸烟的年数、每个月吸烟的天数,每天吸烟的支数、累计吸烟的支数等等。选择不同是指标,得到的研究结果一定是不同的。
图3 研究考察的特征与因果联系分析时用的变量之间的关系
除了影响因素,研究疾病也不例外。比如,研究糖尿病时,可以用是否死于糖尿病(死亡登记)、是否患有糖尿病(临床诊断)、血糖水平、尿糖水平、AIC比例等等。这些变量从不同的侧面反映了糖尿病这个“特征”。然而,采用不同的变量来分析因果关系,得到的结果可能会各不相同。以糖尿病死亡作为指标最可靠,因为死亡能够准确地测量,但是影响死亡的因素却是最不敏感的指标。而且影响死亡的因素,不一定是影响发病的因素。相对而言,以是否患有糖尿病作为变量比死亡敏感多了。但是,临床诊断会出现误差,进行病因学研究时也要考虑。实验室指标在病因学研究中最常用,可是实验室检测的误差有时候比简单测量和调查数据的误差还要大。
与一个特征对应多个变量关系相反的情况是,一个变量往往可以反映多个特征(如图3 右边所示)。例如,在上个世纪90 年代有一个非常有名的因果联系研究,该研究发现拥有电脑与个人收入密切相关,而且控制了很多混杂因素后关系依然存在[9]。通过分析发现,拥有电脑这个变量可以反映很多特征,包括教育水平、职业和工作特点。遵循这一思路,后来有人研究证明,是否喜欢坐着、喜欢玩铅笔、喜欢打电话也与个人收入密切相关。这是因为经常坐着、常常打电话、和喜欢玩铅笔的人常常也用电脑,而且大都属于高薪人群[10]。
1.4 认真选择结果变量
在进行因果关系研究时,一定要认真选择指标来测量结果变量Y。这一点对研究健康或者疾病问题尤其重要。因为对同一个疾病选择不同的变量来进行测量,就会得到不同的研究结果。图4 用反映身体、心理和行为问题的4 种疾病来演示结果变量的选择。如果选择发病作为结果变量,研究会聚焦在发病的原因。虽然发病原因非常重要,可是在实际工作中,确定发病是最难的,尤其是慢性病。
图4 因果关系研究,包括身体心理疾病和行为问题,可以根据不同发展阶段来选择不同的结果变
其次,就是诊断,包括临床和实验室诊断,或者二者的结合。以诊断结果作为结果变量,也能够很好地反映发病的原因。与发病相比,干扰诊断的仅仅只有那些延误诊断的因素。相对于发病与诊断,疾病的进展和预后反映的内容包括两个方面,而且传染病和慢性病有所不同。如果是传染病,影响疾病的进展和预后的除了医疗保健的差异,还有导致发病的原因,即致病菌。如果是慢性病,情况就更复杂,因为慢性病的发病、进展和转归,可以是由完全不同的因素导致的。这方面需要更多的研究。
2 二元分析交互与中介建模
2.1 因果关系的探索性分析
开展因果关系研究和推论非常具有挑战性。除了借用扎实的理论基础之外,还需要有支持证据。我们必须通过大量的探索性统计学分析,来判断所选择的X和Y是否符合事实。简单线性回归模型可以进行探索性分析:
模型(1)中,Yi表示因变量,Y有i 个指标,分别从1到i=I;Xj表示自变量,X有j个指标,分别从1到j=J;βij表示X的第j个指标与Y的第i个指标之间的关系;e表示模型的残差。
根据模型(1)可知,完成一轮探索性分析一共要用I乘以J个回归模型。假设X有20个指标,那么J=20;Y有10个指标,那么I=10;那么,完成一轮探索性分析一共要运行10×20=200个回归模型。
用模型(1)完成探索性分析之后,记录下估计的βij和相应的统计学检验得到的P值。如果所有的自变量X都是标准化的,就可以选择P值最小的一个或几个度量X的指标作进一步分析。这是因为,在同等的条件下P值最小的那些测量X的指标,是最有可能与相应的测量Y的指标有内在关系的。
2.2 多元回归确认X-Y关系
完成探索性分析之后,就要通过多元回归模型来确认结果。具体做法是,从探索性模型分析的多对测量X和Y的指标中选择一两对或者两三对关系比较肯定的指标。然后,逐一地进行多元回归模型分析。用多元回归的目的,是控制一些在研究设计时无法控制的因素,比如人口学变量,以及与X和Y相关的协变量。这一步通常用下面的回归模型来完成:
模型(2)中,X和Y是通过探索性分析选出来的变量;β是反映X与Y的关系的回归系数;Deml表示一个人口学变量;Covk表示k个其他方面的协变量。
如果通过模型(2)的分析发现,在控制了人口学变量和协变量之后估计的回归系数β仍然具有统计学显著性(P<0.05),表明从统计学的角度X与Y之间有彼此有联系,可以用来推断二者之间是否有依存关系。如果控制人口学和其他协变量之后估计的回归系数β不显著,就有理由相信X与Y之间没有真正的联系,不能证实探索性分析得到的结果。
2.3 中介效应分析
从前面介绍的所有内容来看,分析因果联系时每一次最好只纳入一个自变量X。因为加入更多的自变量,问题就会变得很复杂。不但要考虑每个X的影响,还有考虑这些X之间的相互作用后对因变量Y的影响。按照图1所示的因果联系网的理论框架,即便选择合适的变量,也很难确保根据所选变量建立的模式符合客观事实。
目前通过大量的理论分析和科学研究尝试,建立了一些同时分析两个自变量X的方法。最引人注目的两种方法就是中介变量分析(mediator analysis)和交互作用分析[11-12]。这里先介绍中介效应分析。
如图1,通过文献资料及理论分析发现,变量c可能是介于因变量d和自变量a之间的一个因素。在这种情况下,就可以用中介效应模型来进行分析验证。令Y=d,X=a,M=c(这里M表示中介变量),那么中介效应模型(mediation effect model)可以表述为:
通过模型(3)和(4)估计出回归系数a,b,c之后,就可以用下面的方法计算中介效应:
通过模型(3)估计的回归系数c就是自变量X对因变量Y的直接效应。数学上可以证明,估计的直接效应加上中介效应,就是X对Y的总效应。
2.4 交互效应分析
交互效应(interaction effect)也是经常用来研究两个自变量与一个因变量之间的关系。假设第一个自变量仍然为X;为了与中介效应模型的中介变量M区别,令第二个自变量为W;分析交互效应的回归模型可以表示为:
模型(6)中,X×W表示交互效应,而回归系数表示交互效应的大小和方向;与模型(3)相同,e是残差。
如果通过模型(6)估计的回归系数β3具有统计学意义,就表示X与W具有交互效应。为了进一步证实交互效应,模型(6)可以仿照模型(3)进一步扩展,加入人口学变量和其他协变量。
3 讨论
探索因果关系,是医学科学研究中一个非常重要的命题。尤其当绝大多数基础性研究不可能直接在人体上进行实验,只能在尽可能接近实际的情况下展开,这时无法排除多种干扰因素。因为真实的事物关系处于一个庞大的关系网络,我们只能选择一对因素(X与Y)来进行评价分析其关系,所选择的只是纷繁复杂的因果关系网络里的一小部分。要想科学地证明所选择的两个变量X与Y之间的关系是否真实,这是极具挑战性的工作。除了需要具备扎实的理论功底和丰富的实践经验之外,还需掌握牢固的流行病学基础和严谨的统计学方法。
探索因果联系的方法很多,新的方法和技术也在不断涌现。本文希望能够起到抛砖引玉的作用,引导更多从事医疗卫生工作的研究人员思考疾病与健康之间的因果关系,这样既能提高我们发现问题、解决问题的能力,也能助推医学科学不断发展进步。