APP下载

基于Logistic 回归模型与决策树模型分析缺血性脑卒中后抑郁影响因素

2023-10-01张新月沙凯辉宋淑霞程美玲

护理研究 2023年18期
关键词:决策树半胱氨酸红细胞

张新月,沙凯辉*,宋淑霞,王 芳,程美玲

1.滨州医学院护理学院,山东 256600;2.滨州医学院附属医院

卒中后抑郁(post-stroke depression,PSD)是最常见的脑卒中继发病,临床核心症状为情绪失调、情感淡薄、认知受损、睡眠障碍、自杀倾向等。PSD 是影响病人伤残调整寿命年(disability adjusted life year,DALY)减少的重要原因之一,与病人生存质量、康复预后及死亡率密切相关[1]。既往研究表明,罹患PSD 的病人死亡率是未患PSD 病人的3~4 倍,其中缺血性脑卒中病人PSD 风险更高,其发病后3 个月内PSD 累积发生率高达45.5%[1-2],给病人带来沉重负担。PSD 危险因素复杂多样,早期精准识别其危险因素以加强预防对病人预后至关重要。目前已有大量学者围绕PSD 发病机制及影响因素展开分析和讨论[3-4],但PSD 风险预测研究鲜有报道。Logistic 回归和决策树算法是构建预测模型最常用的研究方法,二者对数据信息处理的侧重点不同,联合运用可以实现功能互补,增强预测性能。本研究通过建立Logistic 回归模型和决策树C5.0 模型探讨缺血性脑卒中病人PSD 发生的危险因素,从而为PSD 的早期筛查和预防提供参考。

1 对象与方法

1.1 研究对象

采用便利抽样法选取2022 年1 月—10 月滨州市某三级甲等医院确诊为缺血性脑卒中的215 例病人为研究对象。纳入标准:1)符合缺血性脑卒中诊断标准[5],经CT 和/或MRI 首次确诊为缺血性脑卒中;2)年龄≥18 岁;3)意识清楚且脑卒中发作时间<1 周;4)病人自愿参加研究并签署知情同意书。排除标准:1)短暂性脑缺血发作(TIA);2)伴有严重心、脑、肾等器官系统疾病;3)存在言语障碍或认知障碍;4)有抑郁史或情感障碍性疾病;5)存在精神疾病或智力缺陷。剔除标准:1)疾病复发、病情恶化或联系中断;2)由于各种原因退出本研究;3)资料数据不完整。本研究已通过滨州医学院伦理审查委员会审查(编号:2022-397)。

1.2 调查工具

1.2.1 PSD 影响因素调查表

通过阅读文献和专家咨询自行编制PSD 影响因素调查表,内容包括:1)基本资料,如性别、年龄、婚姻状况、脑卒中家族史、职业类型等;2)临床资料,如脑卒中部位、病灶数目、脂蛋白a、同型半胱氨酸(Hcy)、血小板平均体积(MPV)、红细胞分布宽度(CV)等。病人入院次日晨采集血液标本。

1.2.2 美国国立卫生研究院卒中量表(National Institute of Health Stroke Scale,NIHSS)

NIHSS 用于评估脑卒中病人神经功能缺损程度,量表包括意识水平、凝视、视野、面瘫等11 个条目,根据损伤程度计分,满分为42 分,其中,0~<1 分表示正常或近乎正常,1~4 分为轻度损伤,5~15 分为中度损伤,>15 分为重度损伤。经过不断优化改进,NIHSS趋于完善,目前已成为神经内科用于评估病人神经功能状态的常用量表,其Cronbach's α 系数为0.886[6]。

1.2.3 日常生活活动能力量表(Barthel Index,BI)

BI 用于评估脑卒中病人的自理能力,量表包括修饰、洗澡、穿衣、进食等10个条目,满分为100分,≤40分为重度依赖,41~60 分为中度依赖,61~99 分为轻度依赖,100 分为无需依赖,得分越高表明病人状况越好,其自理能力越强。经过不断优化改进,BI 趋于完善,其Cronbach's α 系数为0.916,具有较高信度和效度[7]。

1.2.4 汉密尔顿抑郁量表17 项(17-items Hamilton Depression Scale,HAMD-17)和蒙哥马利抑郁量表(Montgomery-Asberg Depression Rating Scale,MADRS)

联合使用HAMD -17 和MADRS 诊断PSD。HAMD-17 包括迟缓、激越、疑病、精神焦虑等17 个条目,采用0~4 分评分,根据抑郁程度计分,总分7~13分为轻度抑郁,14~19 分为中度抑郁,>19 分为重度抑郁,本研究借鉴前人经验[8],以总分≥7 分为诊断PSD 的临界值,量表Cronbach's α 系数为0.714[9]。MADRS 包括观察到的抑郁、食欲减退、懒散、感受不能等10 个条目,根据抑郁程度采用0~6 分计分,分值越高代表抑郁症状越严重,本研究参考许健的诊断标准,以总分8分作为诊断PSD的临界值,量表Cronbach's α系数为0.847[10]。病人同时满足HAMD-17 和MADRS的诊断标准即可判定为PSD。

1.3 资料收集方法

资料收集分为2 个阶段,第1 阶段为PSD 危险因素数据收集阶段,第2 阶段为PSD 评估诊断阶段。PSD 危险因素数据收集工作于病人脑卒中发作后1 周内完成,由2 名具有10 年以上工作经验的主管护师负责。PSD 评估诊断工作于病人脑卒中后10~12 周门诊随访时完成,由2 名具有10 年以上工作经验的主治医生负责,若对病人PSD 的诊断结果存在分歧,则邀请精神科主任医师进行评定。调查过程中首先征得病人同意,然后采用统一指导语告知其调查目的和填表要求,强调根据实际情况填写。问卷当场收回并核对填写信息。

1.4 质量控制

调查开始前成立研究小组,所有成员了解本次研究的目的和内容,培训合格后方可参与调查工作。为提高研究结论的有效性和可靠性,第2 阶段的调查对调查人员实施盲法。由两名研究者录入数据并进行严格核对以保证数据的准确性。

1.5 统计学方法

建立Excel 数据库,导入SPSS 26.0 软件进行统计分析。定性资料采用频数、百分比(%)表示,进行单因素分析时,采用χ2检验或秩和检验,将P<0.05 的变量进一步纳入Logistic 回归进行检验。Logistic 回归模型的建立采用二元Logistic RL 向前筛选法,同时使用功能强大的SPSS Modeler 18.0 建立决策树C5.0 模型。采用MedCalc绘制两种模型的受试者工作特征(ROC)曲线并进行比较。

2 结果

2.1 缺血性脑卒中病人一般资料

共发放236 份调查问卷,研究过程中疾病复发或恶化病人2 例,因失访退出或资料不全病人19 例,剔除以上病人,剩余215 例,回收有效问卷215 份,问卷有效回收率为91.10%。215 例缺血性脑卒中病人中女86例(40.0%);年龄>60 岁132 例(61.4%);已婚191 例(88.8%);小学及以下91 例(42.3%);经诊断发生PSD的病人81 例(37.7%)。

2.2 缺血性脑卒中病人PSD 发生影响因素的单因素分析(见表1)

表1 缺血性脑卒中病人PSD 发生影响因素的单因素分析单位:例(%)

2.3 缺血性脑卒中病人PSD 的Logistic 回归模型与决策树C5.0 的分析及比较

2.3.1 变量赋值方式

将是否发生PSD 作为因变量,将单因素分析中P<0.05 的变量(性别、是否合并糖尿病、脑卒中部位、NIHSS 评分、BI 评分、同型半胱氨酸、红细胞分布宽度)作为Logistic 回归模型和决策树C5.0 模型的自变量,变量赋值方式见表2。

表2 变量赋值方式

2.3.2 缺血性脑卒中病人PSD发生影响因素的Logistic回归分析

女性、脑卒中部位为左侧大脑半球、同型半胱氨酸>15 μmol/L、红细胞分布宽度>15.4%为缺血性脑卒中病人PSD 发生的独立危险因素,BI 评分≥61 分为PSD发生的保护因素。见表3。

表3 缺血性脑卒中病人PSD 发生影响因素的Logistic 回归分析结果

2.3.3 缺血性脑卒中病人PSD 危险因素的决策树分析

决策树经本研究设置的生长和修剪规则后,可分为4 层3 个解释变量,即BI 评分、脑卒中部位、是否合并糖尿病。见图1。

图1 缺血性脑卒中病人PSD 影响因素的决策树C5.0 模型

2.3.4 Logistic 回归模型和决策树C5.0 模型的比较

Logistic回归模型的ROC 曲线下面积(AUC)、灵敏度、约登指数均高于决策树C5.0 模型,两种模型的特异度相等。两者比较,差异无统计学意义(Z=1.737,P=0.082)。Logistic回归模型和决策树C5.0 模型预测性能比较结果见表4,Logistic 回归模型和决策树C5.0 模型的ROC 曲线比较结果见图2。

图2 Logistic 回归模型和决策树C5.0 模型的ROC 曲线比较

表4 Logistic 回归模型和决策树C5.0 模型预测性能比较

3 讨论

3.1 缺血性脑卒中病人PSD 发生率较高

Ayerbe 等[11]研究结果显示,脑卒中病人发病后1~6 个月的抑郁发生率为23%~34%。储丹丹[12]研究结果显示,脑卒中病人发病后3 个月的抑郁发生率为45.5%,与慕丽等[13]研究结果存在差异。本研究发现缺血性脑卒中病人3 个月内PSD 发生率为37.7%。国内外研究报道的PSD 发生率存在差异,原因可能为PSD 的危险因素复杂多样且存在共变效应,也可能与社会文化背景、研究对象特点、样本量及研究方法等因素不同有关。刘锐芮等[14]研究显示,2015—2019 年我国PSD 检出率为45.07%,高于2000—2015 年的检出率,可见我国PSD 发生率居高不下且呈上升趋势,精准识别PSD 危险因素,实施早期科学预防和治疗尤为重要。

3.2 缺血性脑卒中病人PSD 影响因素

3.2.1 自理能力

两种模型均显示BI 评分是PSD 的重要预测因子,BI 评分越高,PSD 患病风险越低。李长红等[15]研究证实BI 评分较高为PSD 的保护因素。其原因可能为自理能力反映病人自我照护能力、疾病严重性和对他人的依赖性,自理能力较弱会增加家庭负担和经济压力,自理能力较弱的病人身心遭受双重打击,心理应激反应使其实际感知和心理体验产生落差,极易导致抑郁情绪产生。针对自理能力较弱的病人,应及时给予照顾、安慰和鼓励,以减少病人PSD 发生。

3.2.2 脑卒中部位

两种模型均显示脑卒中部位为左侧大脑半球者抑郁发生率较右侧大脑半球更高,与柯绪芬等[16]的研究结果相似。从抑郁发生机制来看,可能与神经递质调节有关,脑干、基底节和额叶存在神经递质传导通路,左侧大脑半球脑卒中病变会阻断神经递质传导,致使去甲肾上腺素含量下降,病人产生抑郁的可能性增大。此外,在言语文字、逻辑推理等方面,左侧大脑半球为优势半球,其损伤更易造成心理精神障碍。

3.2.3 性别

Ayis 等[17]为期10 年的随访研究显示,女性病人PSD 发病率是男性的2 倍,而Chun 等[18]分析结果表明PSD 发病率与性别无关。目前学术界对于性别与PSD 的相关性莫衷一是。本研究Logistic 回归模型显示,女性病人PSD 发病风险高于男性。女性更易患PSD,一方面可能与社会文化因素有关,女性具有丰富的情感体验,善于表达自我情绪,更易受内在和外在因素影响;另一方面可能与激素水平有关,孕激素和雌激素会影响神经递质传导和内分泌功能,激素水平异常可导致情绪失调,这同样是产后抑郁发生的主要原因。性别与PSD 的发生是否有关,学术界见解不一,有待进一步考证。

3.2.4 糖尿病

Zhang 等[19]探讨糖尿病与迟发性PSD 的关系,结果证明糖尿病是迟发性PSD 的独立危险因素,本研究决策树C5.0 模型结果显示,合并糖尿病的病人罹患PSD 的可能性更大,可将其作为一个预测因素。其原因可能为糖尿病是缺血性脑卒中病人死亡的一大影响因素,约34.2%的缺血性脑卒中病人合并糖尿病且再发风险高达45%[20],血糖调控异常会影响神经功能恢复。控制血糖最基本的疗法为饮食疗法,饮食模式、饮食质量和营养成分会影响病人情绪调节,消极情绪反过来影响饮食行为,对疾病的治疗和预后存在不利影响。此外,慢性病程会加重病人躯体不适和经济负担,极易使其产生抑郁情绪。提示,对合并糖尿病的缺血性脑卒中病人要加强健康知识宣教,并予以心理疏导,根据病人实际情况采用差异化的干预方案。

3.2.5 同型半胱氨酸

Logistic 回归模型显示,同型半胱氨酸是PSD 的重要预测因子,同型半胱氨酸>15 μmol/L 会增加PSD 患病风险,与柯绪芬等[16]的研究结果一致。其原因可能与PSD 发生机制有关[8],同型半胱氨酸是蛋氨酸和半胱氨酸代谢的中间产物,不良生活方式及机体营养物质缺乏会影响同型半胱氨酸的代谢,同型半胱氨酸异常升高可影响蛋氨酸形成,并进一步抑制DNA甲基化,进而干扰神经递质代谢,使得抑郁发生率增加;另一方面会影响脑能量代谢,使磷酸和磷酸肌酸含量减少,一氧化碳合酶活性和一氧化氮生成量降低,阻碍脑血管内皮细胞再生,增加病人发生PSD 的可能性。对于脑卒中后同型半胱氨酸过高者,及时给予叶酸、维生素等营养物质干预,可降低PSD 发生风险。

3.2.6 红细胞分布宽度

Logistic 回归模型显示,红细胞分布宽度是PSD的重要预测因子,红细胞分布宽度值较高,PSD 发生风险较高,与慕丽等[13]研究结果一致。原因可能为红细胞分布宽度可反映外周血红细胞体积的异质性,是公认的脑卒中炎症标志物。氧化应激的慢性炎症过程会导致红细胞生长抑制,原始红细胞释放入血,加重组织缺氧和动脉粥样硬化进展,进而增加缺血性脑卒中发生风险。同时,炎症反应可改变人体体液调节,影响与抑郁相关的神经递质分泌,从而诱发抑郁。Long等[21]研究显示,红细胞分布宽度与抑郁具有相关性。虽然红细胞分布宽度对PSD 具有一定预测价值,但针对合并血液系统疾病的缺血性脑卒中病人,有必要辨证和谨慎解读诊断结果。

3.3 缺血性脑卒中病人PSD 的Logistic 回归模型和决策树C5.0 模型比较

本研究中决策树C5.0 模型筛选出3 个解释变量,Logistic 回归模型筛选出5 个解释变量,两种模型均显示,BI 评分和脑卒中部位是PSD 的重要预测因素。两种模型分析的差异性可能是因检验方法不同引起[22]。两种模型预测效能比较,差异无统计学意义(P>0.05),但两种模型检验侧重点不同,能够实现功能互补,增强预测性能[23]。决策树C5.0 模型能深入挖掘数据,充分展现自变量之间的互变效应,并将结果直观、形象地展现出来,但其易受实际数据影响,具有过度拟合和不稳定性;Logistic 回归模型能通过OR 值和95%CI 体现变量间的依存关系,但变量间容易相互影响,不能直观展示结果和体现决策作用。本研究中决策树C5.0 模型显示BI 评分≤40 分的病人PSD 发生风险为86.957%,BI 评分≥61 分、左侧大脑半球病变且合并糖尿病的病人PSD 发生风险为71.429%,临床工作者应重点关注;Logistic 回归模型中红细胞分布宽度的OR 值最高,说明其是PSD 发生的重要危险因素。两种模型联合使用,可以进行更为全面的分析,从而增加解释和预测的有效性。

4 结论

综上所述,缺血性脑卒中病人PSD 的发生率高。Logistic 回归模型和决策树模型联合分析结果提示医护人员要重点关注左侧大脑半球病变、自理能力低下、女性、合并糖尿病、同型半胱氨酸和红细胞分布宽度增高的病人,早期筛查并预防PSD 的发生,根据病人实际情况制定差异化的干预方案,以改善病人预后。本研究存在局限性:纳入的变量有限且选取的样本仅来自1 所医院,样本量较少,可能存在选择偏倚。未来可开展大样本、多中心的前瞻性研究,更全面地评估PSD 的危险因素并构建PSD 预测模型,实现PSD 的早期识别和预防。

猜你喜欢

决策树半胱氨酸红细胞
红细胞的奇妙旅行
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
西安地区同型半胱氨酸参考区间的初步建立
基于决策树的出租车乘客出行目的识别
猪附红细胞体病的发生及防治
同型半胱氨酸与慢性心力衰竭合并肾功能不全的相关性分析
基于肺癌CT的决策树模型在肺癌诊断中的应用
86例同型半胱氨酸与脑梗死相关性分析
羊附红细胞体病的诊疗