APP下载

住院老年患者轻度认知功能障碍风险预测模型的构建

2024-02-20吴瑞凯周晓辉韩正风

医学新知 2024年1期
关键词:决策树神经网络住院

吴瑞凯,马 龙,周晓辉,韩正风

1.新疆医科大学公共卫生学院(乌鲁木齐 830011)

2.新疆医科大学第一附属医院老年医学科(乌鲁木齐 830054)

随着老龄化进程的进一步加剧,全球60岁以上人口中高达42.0%受到轻度认知障碍(mild cognitive impairment,MCI)的影响,我国60岁以上人群中有983万阿尔茨海默病(Alzheimer's disease,AD)患者、3 877万MCI患者[1]。AD是老年人失能和死亡的主要原因,随着人口老龄化,我国已成为全球AD患者增速最快的国家之一[2]。AD防治是一个世界性难题,首要原因在于难以早期发现早期诊断,我国综合医院门诊早期痴呆诊断率仅0.1%。MCI是正常老化到痴呆之间的过渡状态,同时也是痴呆防治的重要“干预窗口期”[3],因MCI仍保留有一定的认知能力和认知的可塑性,部分MCI患者可恢复正常认知状态,逆转率达31%,此时期是干预并防止MCI向AD转换的最佳时期。目前针对住院老年患者MCI的风险预测模型研究较少,且多为单一的传统统计预测方法,本研究基于Logistic回归模型、决策树模型、神经网络模型构建住院老年患者MCI风险多组预测模型,为医护人员进行早期筛查和干预提供参考。

1 资料与方法

1.1 研究对象

选择2023年1月至2023年9月在新疆医科大学第一附属医院老年医学科住院的老年患者,采用方便抽样法进行横断面研究。纳入标准:①年龄≥60岁;②知情同意并配合完成问卷调查;③诊断为MCI患者。排除标准:①患有能引起认知功能改变的中枢神经系统疾病,如脑肿瘤、颅内感染、帕金森病等;②有严重躯体疾病或全身重要脏器衰竭或晚期肿瘤;③痴呆患者;④长期卧床失能者;⑤资料不全者。本研究经新疆医学大学第一附属医院伦理委员会审核批准,所有调查对象均知情同意(审批号:20120216-66)。

1.2 诊断标准

MCI为痴呆前阶段,是指具有记忆或其他认知功能损害,但日常生活能力并未受到明显影响,尚未达到痴呆的标准[4];参照《阿尔茨海默病源性轻度认知障碍诊疗中国专家共识2021》[2]中MCI临床诊断标准,同时符合以下几项即诊断为MCI:①患者或知情者报告,或有经验的临床医师发现认知损害;②存在1个或多个认知领域损害的客观证据(神经心理测试),其中情景记忆损害最为常见;③复杂的工具性日常能力可以有轻微的损害,但保持独立的日常生活能力;④尚未达到痴呆的诊断标准。

1.3 研究方法

1.3.1 病史资料收集

通过查阅病历和询问病史,记录所有受试者住院疾病诊断、生化检查资料。

1.3.2 问卷调查及量表评估

采用成套的诊断性检查量表进行面对面的调查询问,包括:

一般情况调查表:内容包括研究对象的社会人口学特征(年龄、性别、文化程度、婚姻状况、居住情况)、生活方式(是否吸烟、是否饮酒)等。

认知功能评估:采用蒙特利尔认知评估量表(Montreal Cognitive Assessment,MoCA),主要测试项目包括执行功能、语言流畅性、定向力、计算、抽象思维、延迟回忆、视知觉、命名、注意和集中,总分范围为0~30分,得分越低认知功能越差[5]。MCI筛查分界值根据文化程度不同有所差异,文盲水平为MoCA量表评分≤13分、小学水平为≤19分、初中及以上水平为≤24分。

老年抑郁量表(Geriatric Depression Scale,GDS-15):用于筛查老年人抑郁症状,该量表包括15个项目,以“是”“否”作答,“是”计1分,“否”计0分,总分范围为0~15分,得分越高,患者抑郁症状越明显,0~4分为正常,5~8分为轻度抑郁,9~11分为中度抑郁,>11分为重度抑郁[6]。本研究以<5分作为筛查标准,排除抑郁导致的认知功能减退。

日常生活能力评定量表(Activity of Daily Living Scale,ADL):使用Barthel指数评估包括进食、穿衣、洗澡、大便控制、小便控制、修饰、上下楼梯、转移、如厕、步行10个条目,总分范围为0~100分,60分以上被认为基本生活可自理,60分以下被认为生活需要部分帮助。

Fried衰弱量表:评估体质量是否下降、步速是否减慢、握力是否降低、躯体活动是否下降、是否疲乏等条目,总分范围为0~5分,0分为无衰弱,1~2分为衰弱前期,3~5分为衰弱。

1.3.3 质量控制

由汉族和其他民族的双语工作人员进行调查,所有调查人员均经过统一培训;由老年医学科副高级及以上职称医师结合病史、详细的体格检查、神经心理测验和检测结果进行MCI的诊断;所有数据均由2名工作人员独立进行输入,并设有专人对输入数据进行复核。

1.3.4 预测模型构建

多因素Logistic回归预测模型:应用多因素Logistic回归分析探讨MCI发生的影响因素,以是否发生MCI 为因变量,单因素分析P < 0.05差异具有统计学意义变量为自变量,方差膨胀因子(variance inflation factor,VIF)均< 5,容忍度均远> 0.1,纳入的自变量不存在多重共线性,并筛选有统计学意义的指标构建Logistic回归预测模型。采用受试者工作特征(receiver operating characteristic,ROC)曲线对风险预测模型的预测效能进行验证。P<0.05为差异有统计学意义。

决策树预测模型:运用SPSS Modeler软件构建决策树模型,采用决策树CHAID算法分析MCI的影响因素,并筛选有统计学意义的指标构建决策树预测模型,最大树深度设为3,共12 个节点数,终端节点数8 个,最小父节点设为50,最小子节点设为25。模型参数:将研究对象按7 : 3的比例随机分配至训练集和检验集,训练集构建决策树预测模型,采用ROC曲线对风险预测模型的预测效能进行验证。P<0.05为差异有统计学意义。

神经网络预测模型:运用SPSS多层感知器(multi layer perceiver, MLP)进行多因素分析,其可以解决单层感知器不能解决的线性不可分问题,采用神经网络算法分析MCI的影响因素,并筛选有统计学意义的指标构建神经网络预测模型。将研究对象按7:3的比例随机分配至训练集和检验集,训练集构建神经网络预测模型。采用ROC曲线对风险预测模型的预测效能进行验证。P<0.05为差异有统计学意义。

1.4 统计学分析

采用SPSS 26.0统计软件,不符合正态分布的计量资料以中位数和四分位数间距[M(Q1,Q3)]表示,采用Mann-Whitney U检验进行两组比较;计数资料用频数和百分比(n,%)表示,采用χ2检验进行两组比较。多因素Logistic回归分析住院老年人MCI影响因素,以P<0.05为差异有统计学意义,计算比值比(odds ratio,OR)及95%置信区间(confidence interval,CI)。采用ROC曲线下面积值AUC、约登指数、灵敏度和特异度评价模型区分能力。ROC评分标准:AUC>0.9,模型具有非常高的准确度;0.7<AUC<0.9,模型的准确度较好,具有一定的临床应用价值;0.5<AUC<0.7,模型的准确度较低,临床应用价值不大。

2 结果

2.1 MCI组与非MCI组一般资料

共纳入住院老年患者992例,年龄范围为60~99岁,平均年龄(73.28±8.18)岁,其中男性457例(46.1%)、女性535例(53.9%)。根据MCI诊断标准将研究对象分为MCI组210例、非MCI组782例,住院老年人MCI检出率为21.17%(210/992),男性22.54%(103/457)、女性20.00%(107/535)。两组间在年龄、用药种数、文化程度、职业状况、婚姻状况、吸烟、日常生活能力评分、Fried衰弱量表评分、冠心病、脑血管病、慢性阻塞性肺疾病、营养风险方面差异具有统计学意义(P值均<0.05);在性别、饮酒、高血压、糖尿病方面差异无统计学意义(P值均>0.05),详见表1。

表1 MCI组与非MCI组一般资料的比较(n,%)Table 1.Comparison of general data between the MCI group and the non-MCI group(n, %)

2.2 影响老年人MCI的Logistic回归分析

多因素Logistic回归分析显示,年龄较大、日常生活需要帮助、患有脑血管病是住院老年人发生MCI的危险因素,文化程度的增加是住院老年人发生MCI的保护因素(P值均<0.05),见表2。

表2 影响老年人MCI的Logistic回归分析Table 2.Logistic regression analysis of MCI affecting the elderly

2.3 决策树预测模型分析

年龄、脑血管病、文化程度是决策树预测模型中影响MCI的重要解释变量。年龄对MCI的影响最为重要,年龄>84岁的患者发生MCI的风险高达78.3%,远高于其他年龄阶段;年龄为82~84岁的老年人中,脑血管病患者发生MCI的风险高于未患者(76.5% VS.51.0%);年龄为60~69岁的老年人中,文化程度为文盲或小学水平者发生MCI的风险为5.9%,高于中学及以上文化程度者(0.0%)。决策树预测模型构建风险为0.139,标准误为0.013,详见图1。

图1 住院老年人MCI的决策树预测模型Figure 1.Decision tree prediction model of MCI for hospitalized elderly

2.4 神经网络预测模型分析

神经网络预测模型结构如图2所示为三层的拓扑结构,即输入层1 层,12 个神经元;隐含层1 层,7 个神经元;输出层1 层,2 个神经元。输入变量对于神经网络预测模型的重要性程度详见图3,排名前三的分别是年龄、文化程度和日常生活能力评分。

图2 住院老年人MCI的神经网络预测模型Figure 2.Neural network prediction model of MCI in hospitalized elderly

图3 神经网络预测模型中重要特征排名Figure 3.Ranking of important features in the neural network prediction model

2.5 三组预测模型的预测结果及评价

Logistic回归预测模型、决策树预测模型、神经网络预测模型准确率分别为89.1%、86.1%、88.7%,均大于70%,三组模型的预测准确度均较好。Hosmer-Lemeshow检验χ2=9.722,P=0.285,拟合优度检验一致性较好。以Logistic回归预测模型、决策树预测模型、神经网络预测模型的预测值作为状态变量,绘制三组模型的ROC曲线。Logistic回归预测模型ROC曲线下面积AUC为0.933[95%CI(0.916,0.950)],灵敏度和特异度分别为0.881和0.852,约登指数为0.733。决策树预测模型ROC曲线下面积AUC为0.908[95%CI(0.888,0.927)],灵敏度和特异度分别为0.919和0.753,约登指数为0.672。神经网络预测模型ROC曲线下面积AUC为0.933[95%CI(0.915,0.950)],灵敏度和特异度分别为0.876和0.861,约登指数为0.737,见表3。

表3 三组预测模型构建结果Table 3.Results of three groups of prediction models

2.6 三组预测模型结果差异显著性分析

三组模型预测准确率均>70%,预测效能较好,三组模型比较差异无统计学意义(χ2=0.122,P=0.941),说明三组模型均能较好的预测老年人MCI的发生,见表4。

表4 三组预测模型结果比较Table 4.Comparison of results of three groups of prediction models

3 讨论

随着老龄化问题的进一步加剧,MCI患病率呈逐年上升的趋势,国内外学者研究显示老年人群MCI患病率为13%~ 50.15%[7]。Lee 等研究发现,大脑颞叶深处的海马体神经元对人的感知和体验进行分类和理解,随着年龄的增长,器官和组织老化,海马神经元萎缩,记忆会发生衰退[8-9]。本研究结果显示住院老年人MCI检出率为21.17%,与夏艳秋等综合医院老年住院患者MCI检出率24.05%基本一致[10]。因此,构建多种住院老年人MCI风险预测模型,及时筛查、评估并早期干预显得尤为重要。

本研究中多因素Logistic回归模型、决策树模型、神经网络模型均显示年龄、脑血管病、文化程度为MCI主要影响因素,此外,多因素Logistic回归模型、神经网络模型还显示日常生活能力评分较低(生活需要部分帮助)也是MCI的影响因素,与禹延雪等研究结果一致[11]。Logistic回归预测模型、决策树预测模型、神经网络预测模型的准确率分别为89.1%、86.1%、88.7%,均大于70%,说明三组模型的准确度均较好,模型预测效能与王黎等研究结果一致[12]。

Logistic回归预测模型作为传统的统计学预测模型[13-14],在临床研究中已有相关的应用,主要反映因变量与各自变量之间的依存关系,但Logistic回归对多重共线性数据较为敏感,难以对不平衡数据集进行处理,且模型的准确率不稳定,在拟合数据真实分布上的能力相对较弱。近些年,机器学习、决策树模型、神经网络模型等新型统计学方法被不断应用于临床疾病的发生和不良结局的预测上[15-17]。神经网络模型利用计算机强大的计算能力模拟动物神经网络的信息传递过程,是由大量处理单元互相连接组成的大规模、非线性、自适应动力学系统,具有自组织、自适应、自学习的能力,其同时具有很强的抗干扰性,对不平衡数据和有大量缺失的数据集可以维持较高的准确度,与传统统计学方法相比,处理非线性问题的能力更高。Logistic回归预测模型和神经网络模型虽然能反映住院老年人MCI与各变量的相互关系,但不能直观反映各个影响因素对MCI的重要程度,决策树预测模型采用自上而下的树分类法,可通过树型图更加清楚直观地显示分析过程,具体展现MCI各影响因素及因素之间的交互作用,而且能够显示某因素在各亚群中有无意义,预测路径更加详细,有助于临床工作者方便、快捷地发现高危个体,为临床决策提供了新思路。决策树模型的应用可很好地弥补Logistic回归模型和神经网络模型的不足,但是决策树预测模型、神经网络预测模型无法输出OR值,而Logistic回归模型可输出OR值,能弥补决策树预测模型、神经网络预测模型这一缺陷。

因此,本研究在既往研究的基础上,基于Logistic回归预测模型、决策树预测模型、神经网络预测模型,构建多组住院老年人MCI相对风险预测模型。结果显示年龄增加、受教育年限短、患有脑血管病、日常生活能力下降会增加老年人发生MCI的风险;三组模型在可靠性上没有明显差异,预测模型的准确度均较好。多组预测模型相结合能互为补充,充分解释变量间的相互关系,发挥三组预测模型的优越性,为临床实践提供更有力的证据。

本研究也存在一定局限性。首先,本研究基于单中心住院老年人进行MCI的调查研究,无法避免存在选择偏倚;其次,研究样本量较少,代表性比较局限。故期待有多中心、大样本研究对预测模型进行进一步的外部验证和完善,使用机器学习新型技术并运用到临床评估中,为临床医务人员提供可靠、便捷的早期识别住院老年人MCI风险的评估工具。

猜你喜欢

决策树神经网络住院
妈妈住院了
神经网络抑制无线通信干扰探究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
QCC在预防神经内科住院患者跌倒与坠床的应用
精神病人住院自缢 医院担啥责
基于决策树的出租车乘客出行目的识别
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
Alzheimer’s patient’s heart doesn’t forget a mother’s day tradition