APP下载

潜变量增长混合模型在慢性心衰患者生理症状变化轨迹研究中的应用*

2023-10-18丁凤琴孟冰霞韩琳艾韩清华张岩波

中国卫生统计 2023年4期
关键词:亚类生理轨迹

丁凤琴 田 晶 孟冰霞 韩琳艾 李 靓 韩清华△ 张岩波,3△

【提 要】 目的 分析慢性心力衰竭(chronic heart failure,CHF)患者报告结局(patient-reported outcomes,PRO)纵向随访数据,探索不同潜在亚类及个体发展轨迹。方法 纳入2017年5月-2019年6月山西三所三甲医院的286例CHF患者,选取患者住院时、出院后6、12、18、24月的CHF-PRO数据,对患者的生理领域及躯体状况、食欲睡眠和身体独立三个维度拟合潜变量增长混合模型,识别异质性亚类及个体轨迹变化规律。结果 生理领域和各维度变化轨迹存在差异。生理领域中3类二次函数模型最优,第一潜在亚类随时间先下降后上升,第二、三潜在亚类随时间先上升后趋于平稳。躯体症状维度中3类非定义曲线模型最优,3个潜在亚类都是先上升后趋于平稳。食欲睡眠维度2类二次函数模型最优,第一、二潜在亚类随时间先上升,之后第二潜在亚类出现下降趋势。身体独立维度2个潜在亚类整体好转,最后均趋于平稳。结论 患者出院后CHF-PRO的生理领域及各维度水平变化存在不同亚类及个体发展轨迹,对患者给予针对性干预措施具有重要作用。

慢性心力衰竭(chronic heart failure,CHF)是由心脏供血功能障碍引起的复杂临床综合征[1],其患病率不断上升,具有不良的预后结局,严重威胁人们的生存质量[2]。患者报告结局(patient-reported outcomes,PRO)提倡以病人为中心,通过量表的方式评估患者的生活质量[3],对临床实践和预后效果评估具有重要作用[4-5]。传统的增长模型假设总体发展趋势具有同质性,其探究个体之间的发展趋势,没有考虑群体异质性特征。而潜变量增长混合模型(latent growth mixture modeling,LGMM),不仅能识别个体随时间的变化趋势,也能识别不同潜在亚类的差异。因此,本研究采用LGMM探索CHF患者PRO的生理领域及各维度得分动态发展轨迹,识别不同特征的潜在亚类,并描述个体随时间变化趋势。

资料与方法

1.数据来源

本研究数据来源于慢性心力衰竭前瞻性队列和预测预后研究(注册号:ChiCTR2100043337)临床试验项目。严格按照纳入排除标准选择山西医科大学第一医院、山西省心血管病医院和山西白求恩医院三所三甲医院2017年5月-2019年6月明确诊断为CHF患者进行研究,分别在患者住院时、出院后6、12、18、24月进行随访。

本研究纳入标准:年龄≥18岁;按照心力衰竭指南[1]明确诊断为CHF;自愿参加并签署知情同意书;能正确应答并独立或在调查者的帮助下完成填写调查问卷;随访时间大于2年的患者。排除标准:近2个月发生急性心血管事件;并发精神疾病及其他危及生命的疾病;拒绝参加本研究项目的患者。最终纳入数据分析的研究对象总计286人。本研究经山西医科大学伦理委员会批准。

2.测量工具

采用本课题组自主研发的《慢性心力衰竭患者报告结局》量表(以下简称 CHF-PRO量表)评估患者生命质量。CHF-PRO量表共计4个领域,12个维度,57个条目,每个条目分值为1~5分,量表条目得分采用Likert 5级评分法,得分越高,说明患者生活质量越高。CHF-PRO量表经验证具有良好的信度、效度和可行性[6]。

3.研究方法

本研究采用Mplus 8.3软件构建LGMM,描述CHF-PRO的生理领域以及各维度发展轨迹。LGMM是在潜变量增长曲线模型(latent growth curve modeling,LGCM)基础上引入分类潜变量,不仅描述个体发展轨迹,也可以考察其异质性。采用最大期望(expectation-maximization,EM)算法估计模型参数和后验概率[7]。

模型表达式:

(1)

αik=μαk+ξαik

(2)

βik=μβk+ξβik

(3)

假设样本量为N,i=1,2,…,N为样本中的个体,t=0,1,…,T为重复测量的时间点,Y[t]i表示个体i的T次重复测量值向量;c为类别潜变量,表示不可观测的亚类,共包含k个类别;p为类别概率,p(ci=k)表示个体i属于第k类的概率,取值为0

模型设定:采用探索性分析思路,根据模型拟合结果选择潜在亚类数,当亚类数c=1时,LGMM模型简化为LGCM模型。Α0、Α1分别表示具体发展轨迹,考虑到模型解释性,Α0一般设为A0=(1,…,1)固定向量,Α1捕获轨迹的变化,在线性增长模型斜率载荷设定为等距,也允许自由估计,不同的设定表示不同的时间效应或发展轨迹,在非定义曲线中,用未指定的因子载荷对模型进行限制,将斜率因子在第二时点测量之后的因子载荷设定为自由估计,允许随着测量时间的变化形式可以得到一个最佳模型的估计。

模型评价:常用的评价指标为LL、AIC、BIC、aBIC、Entropy、LMR(lo-mendell-rubin)检验和BLRT(bootstrapped likelihood ratio test)检验。LL、AIC、BIC和aBIC越小模型拟合效果越好。Entropy值表示模型能够将个体归为相应类别的精确度,取值在0~1之间,熵值为0.40、0.60和0.80,分别代表低、中、高精确度分类,越接近1表示模型分类越准确[8]。LMR和BLRT检验比较含k类的模型与k-1类模型拟合情况,若P<0.05,则提示含k类的模型更优,否则含k-1类模型拟合较优[9]。一般要求类别个体占比不小于5%[10]。

结 果

本研究假定心衰患者群存在2、3、4个潜在亚类,对CHF-PRO的生理领域及各维度分别拟合线性、二次函数型和非定义曲线类型的LGMM。

1.生理领域模型拟合结果

LGMM模型中,线性拟合结果表明,4个潜在亚类的LL、AIC、BIC、aBIC值均低于2类和3类,但LMR指标无统计学意义。3个潜在亚类模型分类结果有意义,Entropy值较高,因此3个潜在亚类模型为线性拟合最优模型;二次函数拟合结果表明,3个潜在亚类模型为最优模型,模型的LMR、BLRT都有统计学意义,且Entropy较高;非定义曲线拟合结果表明,2、3、4亚类的LMR都无统计学意义。综合比较,生理领域中3类潜在亚类二次函数模型为最优模型。拟合结果见表1。

表1 CHF-PRO生理领域水平潜变量增长混合模型拟合结果

2.各维度模型拟合结果

综合比较,CHF-PRO生理领域躯体症状维度的3个潜在亚类的非定义曲线模型最优,食欲睡眠、身体独立维度都是2个潜在亚类的二次函数模型最优。结果见表2。

表2 CHF-PRO生理领域各维度潜变量增长混合模型拟合结果

3.生理领域及各维度参数估计结果

参数估计结果见表3。生理领域最优模型的平均发展趋势图如图1A所示,第一潜在亚类初始得分较低,呈先上升后下降又上升的趋势;第二潜在亚类初始得分也较低,总体呈上升趋势;第三潜在亚类初始得分较高总体也呈上升趋势。类内个体初始值差异有统计学意义,变化率也有统计学意义。初始得分越高的个体,变化速度越慢。

图1 最优模型的平均发展趋势图

表3 CHF-PRO生理领域及各维度潜变量增长混合模型参数估计

躯体症状维度最优模型的平均发展趋势如图1B所示。第一潜在亚类的初始得分较低,随时间呈上升趋势,上升速度较快;第二潜在亚类的初始得分较高,随时间呈上升趋势,上升速度较慢;第三潜在亚类初始得分高,随时间呈上升趋势,上升速度较慢。类内个体初始值差异有统计学意义,变化率无统计学意义。初始值高的个体变化速度慢。

食欲睡眠维度最优模型的平均发展趋势如图1C所示。第一潜在亚类总体呈上升趋势,变化速度较慢;第二潜在亚类先上升后下降,变化速度快。类内个体初始值差异有统计学意义,变化率也有统计学意义。初始值高的个体变化速度慢。

身体独立维度最优模型的平均发展趋势如图1D所示。第一潜在亚类初始得分较高,呈先上升后下降趋势;第二潜在亚类初始得分较低,呈先下降后上升趋势。类内个体初始值差异有统计学意义,变化率也有统计学意义。初始值较高的个体变化速度较慢。

讨 论

随着社会医学模式的转变,许多慢性病包括CHF的主要治疗目标不再是单纯的治愈或延长生命,而更加注重提高患者生命质量。已有研究表明,CHF患者生理领域如睡眠障碍和呼吸困难、食欲下降及身体独立性较差与不良结局的发生有关,跟踪监测患者生理领域及各维度生命质量的变化有重要意义[11-13]。课题组前期已应用传统的潜变量增长模型进行相关领域的研究,但该模型只能研究个体变化轨迹[14]。LGMM模型的优点是在传统增长模型的基础上,将潜在类别引入到增长模型中,考虑群体异质性特征,进一步识别和预测纵向数据中潜在的或不可观测的亚群,评估轨迹的差异。因此,本研究使用LGMM模型探索CHF-PRO的生理领域及各维度的异质性亚群及个体发展轨迹,为患者制定针对性的干预措施和患者自我管理提供理论依据。

本研究设定的是无条件增长混合模型,研究结果显示生理领域水平和生理领域各维度有着不同的增长轨迹和潜在亚组,生理领域水平分为3个潜在亚类,变化轨迹随着时间变化基本趋于稳定;躯体症状维度分为3个潜在亚类,一年之内变化速度较快,说明住院治疗快速缓解了患者的不良症状;身体独立分为2个潜在亚类,整体呈好转状态,一年内的变化趋势与躯体症状和食欲睡眠不同,提示一年内更应该关注该维度;而食欲睡眠维度分为2个潜在亚类,第二类随着时间的变化出现下降趋势,提示在患者出院一年之后可以重点关注该维度。总体来说,在一年之内轨迹变化趋势明显,之后趋于平稳,这与以往的研究一致[15],因此更应该关注患者出院后一年内的病情变化。

本研究也有一定的局限性。由于收敛性差,LGMM模型部分参数采用跨类别定值估计,增长因子均值自由估计,且跨类别自由变化;增长因子方差和协方差自由估计,同时限定跨类别等同。但实际数据复杂,类别之间方差可能不相等,限定跨类别等同会影响估计结果[16]。有研究表明如果样本量大,所有参数自由估计效果好[17]。本研究只对生理领域及各维度进行模型拟合,在未来研究会进一步从不同领域的不同维度进行研究,同时还会探讨各个维度轨迹类别与预测变量之间的关系,识别各亚类的危险因素,进一步描述各亚类轨迹的特征。

猜你喜欢

亚类生理轨迹
基于草原综合顺序分类法的中国山地草地亚类分类研究
轨迹
轨迹
打破生理“平衡”
基于BP神经网络的旋转血泵生理控制
轨迹
进化的轨迹(一)——进化,无尽的适应
免疫球蛋白G亚型检测在小儿反复呼吸道感染中的应用
妈妈们产后的生理烦恼
“DIY式”小创新在神经电生理监测中的应用