基于机器学习的经皮肾镜碎石取石术结石残留研究*
2021-07-23毛钤镶承垠林赖聪汤壮许可慰周毅
毛钤镶, 承垠林, 赖聪, 汤壮, 许可慰, 周毅
(1.中山大学生物医学工程学院,广州 510006;2.中山大学孙逸仙纪念医院,广州 510030;3. 中山大学中山医学院医学信息教研室,广州 510080)
1 引 言
泌尿系结石是泌尿外科常见病之一,具有发病率高、复发率高等特点。加拿大、瑞典、美国等国家的泌尿系结石发病率在5%~10%[1],而我国的泌尿系结石发病率也在1%~5%[2]。约1/17的中国成年人患有肾结石,其中男性发病率为6.5%,女性发病率为5.1%[3]。大量研究表明,世界各地的泌尿系结石发病率和流行率还在不断上升[4]。泌尿系结石的患者中大部分是肾结石,治疗肾结石的方法有很多,经皮肾镜碎石取石术(PCNL)因其安全可视、取石彻底、创口微小及治疗快捷,常用于直径在2 cm以上的肾结石[5],但由于结石患者的情况复杂,个体差异较大,术后仍然会出现结石残留的情况。
在现代医学决策中,有效的预测工具有助于患者的术前规划与准备。临床上关于结石预测评估的研究主要围绕各种肾结石评分系统展开,包括Guy′s评分、S.T.O.N.E.评分、S-ReSC评分、CROES列线图、SHA.LIN协和评分等[6-10],这些模型均有一定的预测效能[11-12]。而影响结石残留的因素较多,作用方式复杂且临床数据易存在缺失值,因此,在临床应用中存在较大局限性。目前尚无一个受到广泛认可、性能相当的评分体系或预测模型可以对PCNL术后的清石率进行预测评估。
机器学习是以计算机辅助的数据挖掘技术为核心建立的人工智能预测方法,预测结果较为稳定,在医学领域已有广泛应用[13-15]。特别是随机森林(RF)算法,在疾病风险预测、预后评估及临床决策中发挥着重要作用,已有相关研究体现其良好的性能[16-17]。目前相关研究非常有限,主要有Aminsharifi等[18-20]运用人工神经网络、支持向量机(SVM)等方法预测PCNL术后结石清除情况,样本量较少,且由于种族、地域等不同,该研究结果是否适用于其他国家和地区还有待验证。张鹏等[21]用人工神经网络预测体外冲击波碎石治疗肾结石的成功率,朱学华等[22]将机器学习算法应用于肾结石输尿管软镜碎石术后早期结石清除率的预测,模型准确性良好。因此,基于机器学习的PCNL术后结石残留情况预测,对于提升临床治疗水平有着十分积极的意义。
本研究对近些年在中山大学孙逸仙纪念医院治疗的肾结石病例进行回顾性分析,全面收集可能影响PCNL术后结石清除率的指标,用RF、XGBoost 和SVM算法等算法构建PCNL术后结石清除预测模型,检验模型预测价值,尝试找到适用于临床普及的方法。
2 实验
2.1 数据收集
本研究数据来自中山大学孙逸仙纪念医院泌尿外科2014年1月至2018年12月收治的行PCNL的肾结石患者,收集整理以下资料:
(1)一般情况包括:年龄、性别、身体质量指数(body mass index, BMI)。
(2)术前情况包括:既往同侧手术史、抗凝药服用史、高血压病史、糖尿病史、高尿酸血症史、术前血白细胞(white blood cell,WBC)、血红蛋白(hemoglobin, Hb)、血小板(blood platelet,PLT)、术前尿白细胞(urine white blood cell count,UWBC)、尿红细胞(urinary red blood cell,URBC)、术前血清肌酐(creatinine,CREA)、术前尿培养结果。
(3)结石和肾脏特征:结石位置类型(肾盂、肾上盏、肾中盏、肾下盏、鹿角形肾结石)、是否存在输尿管狭窄、结石负荷、结石数量、肾积水程度、结石CT值、经皮肾通道长度,Guy′s结石评分,S.T.O.N.E.评分,S-ReSC评分。
(4)手术情况包括:美国麻醉医师协会(American Standards Association,ASA)手术危险性分级、手术时间。
(5)术后情况:住院时间、是否结石残留。
相关数据收集及测量方法说明如下:
(1)身体质量指数(BMI):身体质量指数=体重/身高2(Kg/m2)。
(2)结石负荷:结石负荷=长径×短径×0.78(mm)。
(3)结石CT值:取结石CT扫描最大层面测量结石核心位置及边缘四点位置的CT值,取平均值则定义为结石CT值。(见图1)
图1 结石CT值测量方法
(4)肾积水程度:①没有或轻度肾积水:肾集合系统分离0~3 cm;②中重度肾积水:肾盂肾盏较明显扩张,实质变薄,肾集合系统分离>3 cm。(见图2)
图2 肾积水程度测量方法
(5)经皮肾通道长度:在CT横截面上,测量0°、45°、90°结石中心到皮肤的距离然后取三者平均值。(见图3)
图3 经皮肾通道长度测量方法
(6)Guy′s评分方法见表1,将所有患者清除风险分成4等级。
表1 Guy′s评分系统
(7)S.T.O.N.E.评分方法见表2,将所有患者清除风险评为5~13分。
表2 S.T.O.N.E.评分系统
(8)S-ReSC评分方法见表3,将所有患者结石清除风险评为1~9分。
表3 S-ReSC评分系统
(9)是否结石残留: 术后一个月随访已行PCNL手术的患者,依据复查的KUB、泌尿系CT或泌尿系B超检查未发现残留结石或残留结石直径≤4 mm且无临床症状定义为无结石残留。
2.2 方法
对数据进行预处理,利用统计学方法进行变量相关性检验,进行初步的特征选择。采用RF、XGBoost和SVM等机器学习算法分别对数据进行训练,通过准确率、特异性、灵敏度、AUC等指标评价各PCNL术后结石残留预测模型性能。
2.2.1数据预处理 首先应用Excel软件建立结石患者数据表,录入患者基本信息以及术前各项检查检验指标。对数据进行预处理,根据临床标准对数据进行整理,并剔除有较多缺失值、异常值或者重复出现的数据,具体数据说明见表4,最终有788例纳入研究。再采用 SPSS2 6.0软件对数据进行统计学分析,对变量进行相关性检验,P<0.05 为差异有统计学意义,由此来进行初步的特征选择,基于筛选得到的特征应用机器学习算法构建预测模型。
表4 数据集属性说明
2.2.2机器学习模型 RF是一种集成算法,比大多数单个算法的准确性高、鲁棒性好,具有一定的抗噪声能力。XGBoost也是一种集成算法,其核心思想是根据基学习器的表现对训练样本分布进行调整,直至基学习器数目达到指定值,最终将这些基学习器加权结合。基于XGBoost算法构建预测体外冲击波碎石术(ESWL)治疗后尿路结石患者的结石排出率,预测效能好[23]。SVM是经典的机器学习算法,在小样本数据集的情况下有广泛应用[24]。本研究使用 Python 3.8 从 sklearn库中导入各种算法建立模型,训练测试数据以8:2划分,主要调节参数包括RF基分类器数目n_etimators为25,SVM选用高斯核函数(kenel为rbf),其他参数采用默认值。
2.3 评价指标
为了评价模型的性能,采用TP、FP、TN和FN分别表示真阳性、假阳性、真阴性和假阴性,可以计算出准确率(Accuracy)、精度值(Precision)、召回率(Recall)和F值(F-Measure),具体如下:
(1)
(2)
(3)
(4)
除上述评价标准外,我们还使用受试者工作特征(ROC)曲线和曲线下面积(AUC)来评价分类器的优劣。ROC曲线表示真阳性率(TPR)和假阳性率(FPR)之间的权衡,其中TPR和FPR的定义如下:
(5)
(6)
ROC曲线越接近图的左上角,模型越好。AUC是曲线下的面积,面积越接近1模型效果越好。
2.4 实验结果
2.4.1变量相关性检验 分类型变量和连续型变量检验的结果见表5,由统计学方法初步筛选出既往同侧手术史、术前CREA、术前尿培养、肾中盏结石、鹿角形肾结石、输尿管狭窄、结石负荷、结石数量、肾积水程度、结石CT值、经皮肾通道长度、ASA分级(ASA)12个与结果相关的变量,基于这些变量构建预测模型。
表5 变量相关性检验的结果
表5 变量相关性检验的结果(续)
2.4.2机器学习模型 各种机器学习模型的效果见表6,其中RF模型的效果最好。
表6 机器学习模型效果评价
绘制ROC曲线,见图4,求得曲线下面积(AUC)RF模型为0.838,XGBoost模型为0.818,而SVM模型为0.839。
图4 机器学习模型的ROC曲线
RF和XGBoost变量重要性得分占比见图5,其中RF影响因素排序从大到小依次为结石负荷、结石数量、鹿角形肾结石、术前CREA、肾积水程度、结石CT值、术前尿培养结果、ASA、既往同侧手术史、经皮肾通道长度、肾中盏结石、输尿管狭窄。XGBoost影响因素主要性分析排序从大到小为结石负荷、结石数量、结石CT值、肾积水程度、术前CREA、术前尿培养结果、既往同侧手术史、ASA、经皮肾通道长度、肾中盏结石、鹿角形肾结石、输尿管狭窄。
图5 变量重要性得分占比
2.4.3机器学习预测模型与Guy′s、S.T.O.N.E.、S-ReSC的比较 国内外的一些研究显示Guy′s评分系统、S.T.O.N.E.评分系统等对术后结石清除率的评估均有一定的效能[25-27]。对纳入构建机器学习预测模型的患者进行Guy′s评分、S.T.O.N.E.评分以及S-ReSC评分,对比预测效能差异。见图6,结果显示Guy′s评分的AUC为0.725,S.T.O.N.E.评分的AUC为0.737,S-ReSC评分的AUC为0.763。机器学习(RF、SVM、XGBoost)预测模型的AUC均高于结石评分系统(Guy′s评分、S.T.O.N.E.评分、S-ReSC评分)。
图6 各预测模型的ROC曲线对比
3 总结
在我国肾结石患者基数大,需行手术治疗的患者数量多,然而目前临床上还未广泛使用性能相当的术后结石残留及并发症预测的评分体系或预测模型。相比于传统基于Logistic 回归模型分析建立评分系统的方法,本研究基于RF、XGBoost和SVM等机器学习方法构建了PCNL术后结石残留预测模型,具有较好的预测能力。
RF和XGBoost模型进行分类的同时,可以得到各个变量的重要性,由此推测结石残留的重要影响因素。结果表明,结石负荷、结石数量、结石CT值、肾积水程度、术前CREA等指标在两种模型的决策中作用较大。有研究显示,是否为鹿角形结石和结石负荷是影响PCNL结石清除的独立危险因素,结石数量是预测PCNL术后结石残留的重要预测因子[28]。术前CREA可影响术后碎石的排出,进而影响PCNL手术的结石清除。肾积水程度、结石CT值和经皮肾通道长度是否可影响PCNL术后结石清除仍存在争议[29-30],未来需要更多的研究以确定这些指标是否影响PCNL术后结石清除。
综上,本研究基于机器学习算法建立的模型可于术前预测肾结石患者PCNL术后结石残留情况,并为临床决策及预后评估提供参考,但模型的可靠性还需要多中心的外部资料进行验证,并在推广过程中不断优化和提高其预测性能。