APP下载

下肢骨科手术后深静脉血栓形成风险的预测模型构建与验证

2024-01-12张建楠李荣华周红梅徐敏逸蔡靓羽

实用临床医药杂志 2023年23期
关键词:二聚体年龄变量

张建楠, 李荣华, 周红梅, 徐敏逸, 蔡靓羽

(江苏省无锡市中医医院 麻醉科, 江苏 无锡, 214071)

下肢骨科手术(LEOS)包括选择性全髋关节置换术(THR)、全膝关节置换术(TKR)、髋骨骨折手术(HFS)等,若未及时采取血栓预防措施,患者术后极易发生深静脉血栓形成(DVT)[1-4]。DVT的发生不仅会延长患者的住院时间,影响患者的康复进程,还可能引发致命的肺栓塞(PE)[5], 因此早期诊断及预测DVT具有重要的临床意义。研究[6]显示,影像学检查、D-二聚体检测等方法可在一定程度上有效诊断DVT。目前,术前概率评估、D-二聚体和超声联合检测被推荐为诊断DVT的一线方案[7]。尽管抗凝治疗可以降低复发性血栓的发生风险,但亦会增加大出血的发生风险,故预测DVT风险具有重要意义[6]。近年来,相关研究[8-9]构建了DVT风险预测模型,其中年龄、性别均为关键特征变量。目前, LOES患者术后DVT风险预测模型的相关研究较少,这可能与数据收集难度大或对复合诊断的不确定有关。本研究通过链式方程多元插补(MICE)方法整合缺失值,旨在确定LOES患者术后DVT的潜在预测因素并构建术后DVT风险预测模型,现报告如下。

1 对象与方法

1.1 研究对象

回顾性收集2017年1月—2019年10月无锡市中医医院收治的住院LEOS患者的基线资料、既往史和实验室指标检测结果,所有数据来自住院电子病历系统。排除标准: ① 年龄<18岁者; ② 有精神异常、语言障碍和意识障碍者; ③ 多发伤患者。根据开发临床预测模型的要求[10]纳入充足样本量,本研究最终共纳入5 773例患者,将其随机分为训练集4 041例和验证集1 732例。本研究严格遵循赫尔辛基宣言的原则,已获得无锡市中医医院医学伦理委员会审核批准(SWJW2019082907), 并确认免除患者知情同意。

1.2 变量选择

搜索已发表文献中的无时间和语言限制的DVT相关变量,为增强实用性和解释性,采用德尔菲法选择与临床相关的合理变量。收集患者的基线资料,包括年龄、手术时间、体质量指数(BMI),其中手术时间作为连续变量之一,使用预设时限点(<2 h或2~3 h或>3 h)转换为离散变量。收集患者的既往史,包括吸烟史、饮酒史、输血史、高血压病和糖尿病病史。收集患者的实验室指标检测结果,包括红细胞(RBC)、白细胞(WBC)、血小板(PLT)、血红蛋白(Hb)、淋巴细胞(LYM)、中性粒细胞(NEU)、红细胞压积(HCT)、红细胞平均血红蛋白(MCH)、红细胞平均血红蛋白浓度(MCHC)、红细胞平均体积(MCV)、血小板分布宽度(PDW)、红细胞分布宽度(RDW)、谷丙转氨酶(ALT)、谷草转氨酶(AST)、尿酸(UA)、胆碱酯酶(CHE)、总蛋白(TP)、球蛋白、D-二聚体、凝血酶原(FIB)、活化部分凝血活酶时间(APTT)、凝血酶时间(TT)和凝血酶原时间(PT)。如果患者存在多个医疗记录,仅选取最新数据。

1.3 DVT判定

术后下肢DVT的判定依据: ① 受影响肢体的腹股沟或小腿出现饱满感或剧烈疼痛,伴有明显触痛; 受影响肢体皮肤呈暗红色,温度升高; 表浅静脉兴奋; Homans征阳性; ② 有卧床、手术、创伤、恶性肿瘤、血栓性倾向、静脉血栓栓塞症(VTE)、妊娠史以及其他DVT风险因素史; ③ 多普勒超声和静脉造影可确认诊断; ④ D-二聚体水平急性升高; ⑤ 排除急性动脉栓塞、急性淋巴管炎、丹毒、盆腔原发肿瘤、下肢局部血肿或肌筋膜炎。

1.4 数据处理

提取数据并存储于电子表格中,导入R软件(4.2.1版本)进行初步处理。纳入和排除之前,将非结构化和异常数据通过删除或适当替换方法进行手动筛选与处理。年龄(1%)、BMI(12%)变量存在少量缺失,根据数据分布情况以均值填补。此外,部分实验室指标检测数据也存在不同比例的缺失。假设缺失是随机缺失(MAR),通过MICE方法填补缺失值。

1.5 统计学分析

将单因素分析中P<0.05的变量纳入多因素Logistic回归分析,应用向后逐步选择法确定DVT的潜在预测因素。绘制受试者工作特征(ROC)曲线,独立评估各预测因子的预测效能。通过一致性指数(C指数)和曲线下面积(AUC)评估预测模型的区分能力,通过Hosmer-Lemeshow拟合优度检验和校准曲线评估预测模型的校准能力,通过决策曲线评估预测模型的临床实用性(阈值概率、净收益)。通过敏感性分析验证MAR假设的有效性,在原始数据集中进行多因素Logistic回归分析。P<0.05为差异有统计学意义。

2 结 果

2.1 临床资料分析

训练集、验证集患者的DVT发生率分别为0.74%(30/4 041)、1.27%(22/1 732), 差异无统计学意义(P=0.07)。训练集、验证集中, DVT患者的年龄均高于非DVT患者,差异有统计学意义(P<0.05); 训练集中, DVT患者的高血压病史与非DVT患者比较,差异有统计学意义(P<0.05), 见表1。除高血压病以外,训练集与验证集的其他变量均表现相似,分布也相似。

表1 训练集与验证集患者的基线资料及既往史比较[M(P25, P75)][n(%)]

训练集中, DVT患者的RBC、Hb、LYM、HCT、MCHC、PDW、UA水平均低于非DVT患者, TT短于非DVT患者, WBC、NEU、D-二聚体、FIB水平均高于非DVT患者,差异有统计学意义(P<0.05); 验证集中, DVT患者的RBC、Hb、LYM、HCT、MCHC、PDW、UA、CHE水平均低于非DVT患者, NEU、RDW、D-二聚体、FIB水平均高于非DVT患者,差异有统计学意义(P<0.05), 见表2。除WBC、RDW、CHE、TT以外,训练集与验证集的其他变量表现相似。

表2 训练集与验证集患者实验室指标检测结果比较

2.2 模型构建

基于训练集进行的单因素分析结果显示, 31个协变量中共筛选出14个潜在预测因素,分别为年龄、高血压病、RBC、Hb、LYM、HCT、MCHC、PDW、UA、TT、WBC、NEU、D-二聚体、FIB。将这些变量进一步纳入多因素Logistic回归分析,应用向后逐步选择法最终共筛选出5个预测因素(无多重共线性问题)。多因素Logistic回归分析结果显示,年龄、MCHC、D-二聚体、PDW、TT均为LEOS患者术后DVT的独立预测因素(P<0.05), 见表3。

表3 下肢骨科手术患者术后发生DVT的多因素Logistic回归分析结果

2.3 模型效果验证

根据5个预测因素构建DVT风险列线图预测模型,每个预测因素对应至标尺可得到相应分值,将各项分值相加即得到总分值,进而可获得DVT风险概率,见图1。该预测模型的C指数为85.8%; 在训练集中进行2 000个分层引导法复制后,该模型预测DVT的AUC为0.859, 在验证集中预测DVT的AUC则为0.857, 表明该预测模型具有良好的区分能力,见图2。

图1 基于5个预测因素构建的列线图预测模型

A: 训练集; B: 验证集。

校准曲线显示,预测模型在训练集、验证集中的表现与理想模型一致性良好,仅略微偏离,说明该模型具有良好的校准能力,见图3。Hosmer-Lemeshow拟合优度检验结果显示,P=0.879, 表明该模型校准度高。决策曲线显示,与“所有患者干预”和“无患者干预”临床方案相比,当阈值概率为0.01~0.16时, DVT预测模型将提供正净获益,见图4。

A: 训练集; B: 验证集。

图4 DVT风险列线图预测模型的决策曲线

2.4 敏感性分析

在未使用缺失值填补的数据集中进行多因素Logistic回归分析,得到了类似结果,见表4。由此提示,缺失值填补是稳定的,即证明MAR假设是有效的。

表4 2个多因素Logistic回归模型的敏感性分析

3 讨 论

本研究5 773例LOES患者中, 52例术后发生DVT, 发生率为0.9%。本研究从31个协变量中初步筛选出14个潜在预测因素,并通过向后逐步选择法最终筛选出5个预测因素(年龄、MCHC、D-二聚体、PDW和TT)构建列线图预测模型,该模型在训练集中的AUC为0.859, 在验证集中的AUC为0.857, 提示该模型具有良好的区分能力。

本研究训练集中, DVT患者和非DVT患者的中位年龄分别为74.9岁和60.3岁,主要为中老年人。相关研究[11-12]显示,中年患者(40~44岁)的DVT发生率为PE的3倍,而老年患者(80~84岁)的情况则正好相反。由于D-二聚体在老年人群中的特异性较低,许多研究[13-14]采用≥50岁患者的年龄乘以10倍的D-二聚体切点值,与传统标准(500 μg/L)相比,其表现通常更好。本研究中, D-二聚体特异性较低,可能是因为DVT患者年龄较大。研究[15-16]显示, D-二聚体联合PDW或TT具有区分DVT和非DVT的显著效果,与本研究结论一致。MCHC作为反映凝血功能的常用指标,亦是本研究DVT风险预测模型中的预测因素之一。相关研究[17]显示, MCHC是VTE的风险因素之一。

将机器学习方法与传统方法联合应用于DVT筛查中,可改善DVT疑似患者的诊疗过程,并减少医疗资源的浪费[18]。与传统方法相比,机器学习方法诊断DVT大多是及时有效的(除各自缺陷外)[19-20]。然而,由于中国各医院医疗数据的差异性较大和完整性不足,数据挖掘困难,人工智能(AI)算法在预测模型构建中的应用受到限制。鉴于此,首先需要优化数据清理步骤,其中MICE方法起着关键作用。从方法论角度出发,多变量填补(MI)在临床预测模型中处理遗漏数据时常被推荐使用[21]。相关研究开发了预测患者DVT发生风险的模型,发现在缺失重要预测因素(D-二聚体)、较弱预测因素(小腿周长差异)或两者皆有的3种情况下, MI导致校准截距最接近真值。

综上所述,本研究通过MICE方法整合缺失值,构建了由5个关键预测因素(年龄、MCHC、D-二聚体、PDW和TT)组成的LEOS患者术后DVT风险预测模型,该模型具有良好的区分能力、校准能力和临床实用性,有助于医生对下肢骨科手术后DVT患者进行分类并制订早期治疗方案。但本研究的临床数据来自单中心,且仅涉及术后DVT风险,未来还需结合术前DVT风险预测进一步开展多中心研究加以验证。

猜你喜欢

二聚体年龄变量
变小的年龄
抓住不变量解题
也谈分离变量
TOO YOUNG TO LOCK UP?
年龄歧视
算年龄
D-二聚体和BNP与ACS近期不良心血管事件发生的关联性
SL(3,3n)和SU(3,3n)的第一Cartan不变量
联合检测D-二聚体和CA153在乳腺癌诊治中的临床意义
两种试剂D-二聚体检测值与纤维蛋白降解产物值的相关性研究