APP下载

基于机器学习和解释模型的类风湿性关节炎合并骨质疏松症患者预后预测

2024-03-13阿不都许克尔阿不都卡地尔玉苏甫买提努尔尔西丁买买提

中国医药导报 2024年4期
关键词:评定量表类风湿关节

阿不都许克尔·阿不都卡地尔 玉苏甫·买提努尔 尔西丁·买买提

1.新疆医科大学公共卫生学院,新疆乌鲁木齐 830011;2.新疆维吾尔自治区维吾尔医医院,新疆乌鲁木齐 830049

类风湿性关节炎(rheumatoid arthritis,RA)是一种以关节炎症和结构损伤为特征的持续性自身免疫性疾病,影响着世界上大约百分之一的人口[1]。骨质疏松症(osteoporosis,OP)是以骨量降低和骨组织微结构破坏为特征的代谢性骨病,为RA 常见的并发症之一[2]。RA 早期可表现为关节周围骨量下降,与正常人群比较,随着RA 患者疾病进展,OP 发病率也随之升高,绝经后女性患者OP 的发病率更是高达50%[3-5]。骨折是OP 最严重的不良后果之一[6]。OP 给RA 患者带来严重不良预后,提高了RA 的致残率和病死率,如何确定危险因素并早期判断患者预后,是医学界目前面临的问题。本研究应用机器学习(machine learning,ML)方法建立RA 合并OP 患者的预后预测模型并通过SHAP 解释模型找出关键预后因素,将RA 合并OP 患者的风险进行个性化预测,为RA 合并OP 患者的临床研究提供参考依据。

1 资料与方法

1.1 一般资料

本研究回顾性纳入了2021 年6 月至2023 年7月新疆维吾尔自治区维吾尔医医院收治的RA 合并OP患者,共194 例。纳入标准:符合RA 诊断标准[7];符合《老年骨质疏松诊疗指南》[8]中OP 诊断标准;至少完成3 个月的随访,随访资料完整。排除标准:急、慢性感染引起的关节炎;妊娠期或哺乳期;合并恶性肿瘤。本研究通过新疆医科大学公共卫生学院伦理审查。

1.2 预后评估

出院后以定期复查、视频电话等方式对RA 合并OP 患者进行为期3 个月的随访,在本研究中根据美国风湿学会(American College of Rheumatology,ACR)标准[9]。患者关节疼痛数和关节肿胀数改善≥50%,并且以下5 项中至少3 项改善≥50%,定义为“ACR50”:①视觉模拟评分法评分;②医师总体病情评估;③患者总体病情评估;④物理功能评估;⑤红细胞沉降率或C 反应蛋白。本研究将改善程度≤ACR50的患者纳入预后不良组(46 例),改善程度>ACR50的患者纳入预后良好组(148 例)。

1.3 预测模型构建

通过单因素比较构建随机森林(random forest,RF)、支持向量机、朴素贝叶斯、BP 神经网络、XGBoost预测模型,同时采用多因素logistic 回归模型分析患者预后的影响因素。通过受试者操作特征(receiver operating characteristic,ROC)曲线及PR 曲线筛选出最佳预测模型,将194 例患者作为总样本,预测模型均采用70%的训练集,30%的测试集模式。采用SHAP解释模型对最佳预测模型进行特征解释,并随机抽取1 例患者进行模型评估。

1.4 统计学方法

采用SPSS 26.0、Python 3.9 统计学软件进行数据分析。正态分布的计量资料采用均数±标准差()表示,比较采用t 检验;偏态分布的计量资料采用中位数(四分位数间距)[M(Q)]表示,比较采用非参数检验。计数资料采用例数和百分率表示,比较采用χ2检验。通过测试集数据来评估模型的性能,评估模型预测效能的指标有准确率、灵敏度、特异度、F1 值及ROC、PR 曲线的相关参数。以P<0.05 为差异有统计学意义。

2 结果

2.1 两组临床资料比较

两组年龄、吸烟史、职业、类风湿因子、抗链球菌溶血素、IgM、红细胞沉降率、谷草转氨酶、热盐包治疗情况、针灸治疗情况、推拿治疗情况、骨质疏松仪治疗情况、关节功能状态分期、患者健康评定量表评分、视觉模拟评分法评分比较,差异有统计学意义(P<0.05)。见表1。

表1 两组临床资料比较

2.2 RA 合并OP 患者预后不良的影响因素分析

将年龄、吸烟史(有=1,无=0)、职业(体力劳动=1,脑力劳动=0)、类风湿因子、抗链球菌溶血素、IgM、红细胞沉降率、谷草转氨酶、热盐包治疗(使用=1,未使用=0)、针灸治疗(使用=1,未使用=0)、推拿治疗(使用=1,未使用=0)、骨质疏松仪治疗(使用=1,未使用=0)、关节功能状态分期(Ⅳ级=3,Ⅲ级=2,Ⅱ级=1,Ⅰ级=0)、患者健康评定量表评分、视觉模拟评分法评分作为自变量,RA 合并OP 患者预后情况为因变量(不良=1,良好=0)进行多因素分析。结果显示,年龄、职业、是否使用骨质疏松仪治疗、关节功能状态分期、患者健康评定量表评分是RA 合并OP患者预后不良的独立影响因素(P<0.05)。见表2。

表2 RA 合并OP 患者预后不良的影响因素分析

2.3 预测模型结果比较分析

将年龄、吸烟史、职业、类风湿因子、抗链球菌溶血素、IgM、红细胞沉降率、谷草转氨酶、热盐包治疗情况、针灸治疗情况、推拿治疗情况、骨质疏松仪治疗情况、关节功能状态分期、患者健康评定量表评分、视觉模拟评分法评分预后预测模型中,采用6 种算法进行预后预测,结果显示,测试集在RF 预测模型的预测性能最好,可信性最高。见图1~2、表3。

图1 6 种算法预测模型的受试者操作特征曲线

图2 6 种算法预测模型的PR 曲线

表3 6 种算法模型在测试集中预测效果比较

2.4 基于SHAP 解释模型的RA 合并OP 患者预后影响因子分析

SHAP 解释模型显示,类风湿因子水平、患者健康评定量表评分、职业等均为类风湿性关节炎合并骨质疏松症患者预后不良的影响因素。见图3。患者模型评估结果中蓝色代表该特征对预测有负向影响(箭头朝左),红色代表该特征对预测有正向影响(箭头朝右),预测结果显示类风湿因子水平、职业、患者健康评定量表评分、年龄、是否推拿治疗为该例患者预后的主要影响因素。该例患者SHAP 值为0.50,基础预测值为0.56,提示模型预测其发生预后不良的可能性较小。见图4。

图3 随机森林预测模型的SHAP 解释模型

图4 抽取患者的模型评估

3 讨论

RA 会导致关节周围骨量减少和全身性骨丢失,从而增加OP 的风险[10]。流行病学调查报告显示,全球每年大约发生900 万例由OP 引起的脆性骨折,进而导致患者的生活质量下降和死亡风险增加[11]。因此,明确患者预后的影响因素是制订针对性干预措施的重要前提。

近年来,由于ML 在获取数据体征与分析复杂数据方面具有显著优势,并且能够快速和高精度的检测疾病,ML 越来越受到关注[12-14]。本研究将单因素分析中差异有统计学意义(P<0.05)的特征纳入XGBoost、RF、支持向量机、朴素贝叶斯、BP 神经网络、logistic 回归模型构建RA 合并OP 患者预后预测模型。结果显示,RF 模型预测效能和可信性最高,可为前瞻性研究提供相应的支持。在后续研究中可开发应用于RA 合并OP 患者预后的预测软件,预测患者预后情况。

本研究基于RF 算法的RA 合并OP 患者预后预测模型的SHAP 特征解释结果显示,类风湿因子、患者健康评定量表评分、年龄、视觉模拟评分法评分、关节功能状态分期、职业、骨质疏松仪治疗是RA 合并OP 患者预后的影响因素,与logistic 回归预测中的独立影响因素部分重合。有研究表明,检测患者血液中特异性因子水平变化可预测患者预后[15]。Li 等[16]研究得出IgA、IgG、IgM 水平是预测RA 风险的有价值指标,其值越高患者发生预后不良的可能性越高。相关研究表明,随着年龄及RA 病情进展,病程>6 个月的RA 患者中,大约有30%会发展成OP,导致患者预后不佳[17]。早期合理治疗对患者的功能状态和生活质量是至关重要,本研究发现,患者功能状态分期越高,其预后越差。此外,本研究中发现与脑力劳动者比较,从事体力劳动者会增加RA 预后不良的风险,这与既往研究报道一致[18-20]。Lee 等[21]在研究中得出患者健康评估问卷评分是RA 患者持续缓解的独立预测因子。推拿等作为中医特色疗法,对RA 合并OP 患者有一定的效果[22-25]。

综上所述,对RA 合并OP 患者制订精准、个体化的治疗策略,可有效改善预后和生活质量。基于ML算法的RA 合并OP 患者预后不良预测模型能有效地预测患者发生预后不良情况,能够为患者预后预测及对疾病的预防和干预提供一定的参考。然而,本研究有一定的局限性:①患者数据仅来自一家医院,数据可能有一定的偏差。②数据样本量不够大,但是预测效果较好,这可能跟数据质量、特征选择等因素有关,因此需要扩大样本量检验模型的泛化能力。今后的研究中可以扩大样本量,纳入不同地区的人群,开展多中心和大样本量的队列研究,优化模型的准确性,进一步验证预测模型的性能。

利益冲突声明:本文所有作者均声明不存在利益冲突。

猜你喜欢

评定量表类风湿关节
益肾蠲痹丸治疗类风湿关节炎的Meta分析
求医更要求己的类风湿关节炎
用跟骨解剖钢板内固定术治疗跟骨骨折合并跟距关节及跟骰关节损伤的效果探讨
介绍一种恶性综合征评定量表——Francis-Yacoub恶性综合征评定量表
miRNA-140、MMP-3在OA关节滑液中的表达及相关性研究
给手指“松关节”为何会发出声响
骨折后关节僵硬的护理
中西医结合治疗类风湿关节炎活动期50例
藏药浴治疗类风湿关节炎48例
SHANGHAI ARCHIVES OF PSYCHIATRY INSTRUCTIONS TO AUTHORS