老年人抑郁和认知功能纵向关联的研究进展
2024-02-20黄薇薇王晓颖韩耀风
黄薇薇,王晓颖,韩耀风
厦门大学公共卫生学院卫生经济与政策研究中心 厦门 361100
随着我国人口老龄化程度的加重,老年人的心理健康问题日益突出。抑郁和认知功能障碍是老年人最常见的心理健康问题[1],二者常常同时发生[2-3],导致一系列不良健康结局,严重影响其生活质量[4-7]。鉴于老年人抑郁和认知功能障碍的高患病率、共病性及危害性,国内外众多学者围绕两者的关联展开了一系列研究。横断面和随访研究结果均显示老年人抑郁状态与认知功能有关联[8-9],抑郁是认知功能障碍的预测因素[9],认知功能障碍也可能是抑郁的危险因素[8]。研究[10-11]表明老年人抑郁状态和认知功能均随时间而动态变化,二者存在纵向关联。基于纵向数据的研究可以更好地捕捉这种动态变化过程,揭示健康状态的增长规律,在因果关系推断方面优于横断面和随访研究。
纵向数据是指按时间顺序对个体进行重复测量得到的资料,其最大的特点就是同一对象的多次观测之间有相关倾向。此外,纵向数据变量多,维度高,数据分布较难呈正态性;反应变量类型多样,有连续型变量,也有离散型变量;数据往往不均衡。如何处理和分析这些数据是一个重难点,若不顾纵向数据的这些特点以及特定方法的适用条件,会导致研究结果产生一定的偏性,有时甚至得出相悖的结论。因此,本文以统计学建模方法为主线,阐述国内外老年人抑郁和认知功能纵向关联的研究进展,为深入探索二者的关联提供依据,也为进行性发展健康事件之间的纵向关联研究提供方法学参考。
1 广义估计方程
广义估计方程(generalized estimating equation,GEE)是在广义线性模型基础上发展起来的专门用于处理非独立的纵向数据等重复测量资料的统计模型[12]。GEE通过作业相关矩阵(代表个体内不同时点测量值的相关性)对传统回归参数进行修正,从而突破传统回归中数据独立性的限制,获得稳健的参数估计值[13]。此外,GEE通过不同的联接函数可以接受多种分布的应变量,如正态分布、二项分布和Poisson分布的联接函数分别为identity、logit和log函数。
在采用GEE探索老年人抑郁与认知功能纵向联系的研究中,多以认知功能得分或者是否患轻度认知功能障碍为重复测量应变量,抑郁程度为自变量进行建模。Sugarman等[14]采用GEE对美国≥50岁人群进行分析发现,与抑郁程度较轻者相比,抑郁程度较重者从认知功能正常进展为轻度认知功能障碍的风险较高。Oh等[15]基于韩国≥45岁中老年人的纵向数据,按性别分层构建GEE,结果显示,抑郁是老年男性认知功能下降的重要预测因素,但是在老年女性中抑郁与认知功能无关。但郑涵[16]关于欧洲≥50岁人群中的研究仅在女性中发现严重抑郁症状会增加认知功能障碍的风险,而在男性中未发现此关联。
以上研究均采用GEE探究老年人抑郁与认知功能之间的纵向联系,考虑了抑郁或认知功能纵向多次测量值间的相关性,研究结果的准确度较高,统计量的估计较为稳健,不仅能以呈正态分布的认知功能得分为应变量,还适用于非正态分布的结局变量(如是否患有认知功能障碍的二项分布)。GEE的局限性在于分析时主要考虑了固定效应,只能处理两水平的资料,未能对随机效应进行深入的分解[17]。
2 线性混合效应模型
线性混合效应模型(liner mixed effect model,LMEM),又称随机系数模型、多水平模型等,由一般的线性模型拓展而来,适用于分析具有层次结构或嵌套式结构的非独立性数据[18]。对于重复测量资料,测量的时点(第一水平)嵌套在个体(第二水平)之中。LMEM的主要思想是通过分解估计各水平上的方差(第一水平方差为个体内不同时间点之间的变异,第二水平方差为个体之间的变异)来获得回归系数的有效估计,因此也可以处理非独立纵向数据。
LMEM在老年人抑郁与认知功能纵向联系研究中的应用分为两方面。大部分学者以认知功能量表得分为重复测量应变量,以基线抑郁程度为自变量进行建模。宋艳龙等[19]对中国≥60岁轻度认知功能障碍老年人的研究发现,与非抑郁组相比,抑郁组老年人认知功能得分随时间下降的速率更快。Jones等[20]基于美国≥50岁帕金森病患者的4 a随访研究发现,基线更严重的抑郁症状与处理速度、语言学习和记忆力等方面表现较差有关,且具有更严重抑郁症状的个体在整体认知功能和语言学习方面恶化得更快。Zheng等[21]的研究对象是≥50岁英国中老年人,该研究发现基线抑郁得分每增加一个单位,整体认知功能得分、记忆力得分、定向力得分均有不同程度的下降。Ravona-springer等[22]基于以色列≥65岁糖尿病患者的随访研究发现,基线抑郁症状仅与基线较差的认知功能有关,而与随访过程中认知功能的变化无关。另一方面,也有一些学者将认知功能作为自变量分析其与随访中抑郁症状变化趋势的关系。宋秋月等[23]对随访4 a的≥60岁美国老年人的分析发现,痴呆、轻度认知功能障碍老年人抑郁得分高于正常认知老年人,但是不同随访时间点老年人的抑郁症状差异无统计学意义。陈旺生等[24]基于中国≥65岁社区老年人的3次随访研究结果显示,认知损害组和非认知损害组抑郁症状加重的趋势有差异,认知损害组老年人的抑郁症状加重的速率更快。
LMEM同时考虑固定效应和随机效应,弥补了GEE不能估计随机效应的不足,有利于更全面地分析数据信息,从而深入探索抑郁和认知功能之间的关系。通过在模型中设定随机系数,引入个体特定效应来处理个体间异质性问题,能够提供个体水平所代表的潜在总体特征的信息,结论可推广到更广的人群中。由于以正态性和线性为基础,LMEM不适用于分类结局变量,如无法对结局变量为是否患有轻度认知功能障碍的资料进行分析,此时需要采用更加复杂的广义LMEM;LMEM利用相对简单的回归结构来分析抑郁与认知功能之间的关系,无法探究两者之间存在的间接关联及潜在因子[25-26]。
3 潜变量增长曲线模型
潜变量增长曲线模型(latent growth curve model,LGCM)是一种以结构方程模型为基础、描述个体随时间变化趋势的模型,用不可测量或难以测量的潜变量来描述总体的平均增长趋势,可以纠正观测指标中的测量误差;多元LGCM还可以分析多个变量的纵向关联[27]。在LGCM中,通过两个潜变量因子,即截距和斜率,来反映重复测量应变量的初始水平和变化速度[26]。截距表示个体的基线状态,描述了第一次测量时总体均值的估计和变异;斜率描述了个体轨迹增长速率的均值和变异。
韩耀风等[28]基于我国农村≥56岁老年人的认知功能重复测量数据构建的LGCM发现,老年人的认知功能得分在随访期间呈下降趋势,且其基线得分和变化率均存在个体差异;与无抑郁倾向的农村老年人相比,有抑郁倾向者基线认知功能得分较低,但衰退轨迹较为平缓。Brailean等[29]使用来自阿姆斯特丹的≥65岁老年人的追踪数据构建了多元LGCM,结果显示,随着时间推移,老年人抑郁症状中的消极情绪和躯体症状增加,积极情绪下降,认知功能下降,而且抑郁和认知功能得分的初始水平和变化率在个体之间存在差异;基线时较差的延迟回忆力预示着消极情绪会随着时间的推移急剧增加,随访过程中处理速度急剧下降也预示了抑郁状态的躯体症状急剧增加;但是该研究结果并不支持抑郁症状可能是认知功能下降的危险因素。
LGCM可以较准确地描述老年人抑郁症状和认知功能随时间的变化趋势[26],分析抑郁症状和认知功能之间存在的直接和间接因果关系,也可以方便地分析潜变量间的关系,这一点是LMEM所不具备的。LGCM不仅可以容纳固定协变量,还可以分析随时间而变化的时变协变量,以充分探讨协变量对发展轨迹的影响。但是,LGCM不适用于定性结局变量,模型构建较复杂,且存在模型识别及收敛困难的问题[30]。有研究[31]表明老年人抑郁和认知功能的变化趋势存在异质性,因此由LGCM所得的平均变化趋势准确度欠佳。
4 交叉滞后模型
交叉滞后模型(cross-lagged panel model,CLPM)是利用两期或以上的追踪数据,通过交叉滞后路径和路径系数来探索两个变量间因果时序关系的一种统计模型[32]。该模型的特点是估计的路径系数具有明确时间顺序关系,为流行病学“因在前、果在后”的因果推断原则提供参考;此外,在分析变量间相互预测作用的时候,该模型有效控制了同一变量前测状态对后测的影响。
李峥等[33]利用我国≥60岁老年人的二次随访资料构建了CLPM,以探索老年人抑郁症状与认知功能之间的相互预测关系。该研究发现在控制时点1的抑郁程度后,时点1的认知功能可以负向预测时点2的抑郁程度,但控制了时点1认知功能的影响后,时点1的抑郁程度对于时点2的认知功能不具有预测意义。Bae[34]利用韩国≥60岁老年群体的3个时间点的重复测量数据建模,结果显示,老年人不同时点的抑郁程度和认知功能之间具有双向预测作用,即较严重的抑郁症状与随后较低的认知功能有关,认知功能对后续的抑郁程度有负向影响。Dewitte等[35]对比利时≥65岁痴呆老年人的纵向数据进行交叉滞后设计分析,研究结果表明老年人抑郁症状和认知功能之间并不存在相互预测作用。
通过构建CLPM可以同时验证老年人抑郁和认知功能之间的相互预测作用,能够对因果关系做出更细致、更接近真相的推断[36]。但是,CLPM无法描绘抑郁症状和认知功能随时间的动态变化趋势;此外该模型未考虑随机效应,所以准确度有限,这个问题可以通过采用带有随机效应的CLPM来解决[37]。
5 潜变量增长混合模型
对于发展轨迹存在异质性的纵向重复测量健康事件的资料,可以使用潜变量增长混合模型(latent growth mixture model,LGMM)进行分析。当前较常用的两种拟合LGMM的方法是增长混合模型(growth mixture model,GMM)[38]和组基轨迹模型(group-based trajectory model,GBTM)[31],两种方法都包含了一个潜在类别变量,代表总体中包含的K个异质小组,其应变量变化轨迹互不相同。GMM和GBTM的区别在于前者允许同一组内不同个体的轨迹围绕平均轨迹随机变化,允许轨迹在同一组内有变化,而后者假定同一组内不同个体轨迹是固定、非随机的。
现有研究多以通过LGMM识别出的认知功能发展轨迹为应变量,以是否抑郁为自变量,结合多分类Logistic回归,探究二者之间的纵向关系。Zhang等[39]以我国≥45岁的高血压中老年人为研究对象,分别以认知功能中的执行力和记忆力重复评估数据构建LGMM,识别出老年人执行力的3种轨迹(稳定、急剧下降和平稳下降)和记忆力的2种轨迹(稳定和下降);抑郁症状较严重的人更有可能属于执行力急剧下降轨迹组;但是抑郁症状不影响记忆力轨迹发展。Lobo等[40]、Yoon等[41]分别基于西班牙老年人和韩国女性老年人的认知功能追访数据进行建模,结果显示,老年人认知功能存在3类异质化发展轨迹,与非抑郁者相比,抑郁者属于认知功能较差轨迹组的可能性较大。此外,一些学者以抑郁轨迹为自变量,认知功能下降速率为应变量,分析二者的纵向关联。Formnek等[42]基于欧洲≥50岁老年人数据,识别出4类不同的抑郁症状轨迹(持续低水平、持续高水平、症状加重和症状减轻),结合LMEM进一步分析发现,认知功能下降最快的是抑郁症状加重轨迹组而不是持续高水平抑郁症状组,而症状减轻组认知功能不发生下降。Zhu等[43]基于美国和英国≥50岁老年人数据进行LGMM分析,发现两个队列中的老年人均存在5类抑郁轨迹(无抑郁、轻度症状、持续高水平、症状加重和症状减轻),与无抑郁轨迹组相比,持续高水平和症状加重轨迹组会经历较快的认知功能下降,轻度症状轨迹组的认知功能也呈现一定的下降趋势。
LGMM对纵向追踪数据的分析更加科学、全面,可识别出老年人群中抑郁和认知功能的异质性发展轨迹,从而有助于对不同人群采取有针对性的干预措施。上述基于LGMM的单轨迹分析仅探究抑郁对认知功能轨迹的单向影响效应,或者抑郁的不同发展轨迹对随后认知功能下降趋势的单向作用,仅拟合抑郁或认知功能其中之一的发展轨迹,无法体现这两种心理健康状态在纵向过程中的动态重叠关系。此外,该模型在建模过程中难以同时满足低错分率与具有实际意义的轨迹类别,需要兼顾拟合度指标和轨迹的实际意义确定较佳轨迹类别数[31]。
6 组基双轨迹模型
组基双轨迹模型(group-based dual trajectory model,GBDTM)是GBTM的一种拓展[44],它可以对两个结局变量的纵向异质性发展轨迹进行联合估计,并以条件概率的形式描述两个变量轨迹间的相互关联程度。GBDTM分析的可以是两个同时测量的结局变量(如老年人抑郁和认知功能),也可以是在不同时间测量的结局变量(如儿童时期的身体攻击性和青少年时期的暴力行为)。
目前老年人抑郁和认知功能异质性发展轨迹及其关联的研究主要聚焦国外人群。基于一组美国≥50岁男同性恋人群的纵向追踪数据,Armstrong等[45]通过构建GBDTM发现,抑郁和认知功能均存在3类异质性发展轨迹,且老年人抑郁程度对认知功能的下降具有一定的预测作用:随着抑郁程度的加重,认知功能最差轨迹组的占比增加,提示老年人抑郁程度和认知功能水平朝相同方向发展。Graziane等[46]关于美国一般老年人群的研究发现,抑郁存在5类发展轨迹,认知功能存在6类轨迹,持续低水平认知功能轨迹组成员在中等程度抑郁轨迹组的占比最高,在重度抑郁轨迹组中的占比却最低,说明抑郁轨迹与认知功能轨迹之间不具有简单的负向关联关系。
GBDTM的优势是可以充分利用抑郁和认知功能的重复测量数据,以概率形式而非简单的统计量(如比值比、回归系数等),来评价抑郁不同轨迹组和认知功能不同轨迹组之间的跨组关联,不仅可以揭示关联的平均趋势,还可以体现关联的个体差异,为纵向关联模式研究提供了更为详细和多样的信息[31]。同LGMM一样,GBDTM也具有产生错误分类的风险。
7 小结与展望
本文基于常见的几种纵向重复测量数据建模方法,对老年人抑郁和认知功能纵向关联的研究进行了综述。不同研究的结果并不一致,差异可能源于样本的代表性、涵盖的调查时期、建模方法及健康测量指标等不同。大多数研究关注的是老年人抑郁和认知功能的平均关联程度,忽视了两者关联模式的异质性;少量关于异质性关联的研究聚焦国外人群,国内尚未见相关研究。本文简要分析了几种常见的处理纵向数据的模型的适用条件和优缺点,为进行性发展健康事件之间的纵向关系研究提供了方法学参考。其他纵向重复测量资料的分析模型,如非线性混合效应模型(研究非线性增长趋势)、广义LMEM(研究分类结局变量)等,由于在老年人抑郁和认知功能关联研究中应用较少而未被述及。有关缺失值(缺失率和缺失类型)对模型结果(如潜类别个数保留、模型收敛)影响的研究并没有全面总结,有待以后深入探讨。