基于支持向量机多模态超声模型诊断肾疾病
2020-07-23李广涵武敬平马立勇刘跃军
李广涵,刘 建,武敬平,田 艳,刘 将,马立勇,刘跃军,张 波,郑 敏*
[1.中日友好医院超声医学科,北京 100029;2.北京大学中日友好临床学院,北京 100029;3.哈尔滨工业大学(威海)信息科学与工程学院,山东 威海 264209;4.哈尔滨理工大学自动化学院,黑龙江 哈尔滨 150080]
肾脏疾病发病率较高, 易致终末期肾病[1],需早期诊断与治疗,以延缓肾功能恶化。不同类型肾脏疾病的临床表现及治疗方法存在较大差异[2]。常规超声、彩色多普勒超声等能观察肾脏的大小及血流等情况,却难以判断肾脏组织的硬度。弹性成像通过无创方式判断组织硬度,得到相应部位杨氏模量,以客观反映其弹性,其数值随组织硬度的增大而增大[3],近年来显示出对于肾脏疾病具有良好应用前景;但由于肾脏位置较深,结构复杂,且测量硬度受血液和尿液的影响较大,单独应用弹性成像评价肾脏疾病存在一定局限性。本研究观察基于常规超声、彩色多普勒超声和弹性成像的多模态超声诊断肾脏疾病的价值。
1 资料与方法
1.1 一般资料 选取2019年5—12月在中日友好医院接受超声检查的肾脏疾病患者,排除无法屏气接受弹性成像、单侧肾脏缺如、肾盂积水或肾脏肿瘤者。以94例经肾脏粗针穿刺活检获得明确病理诊断者作为肾病组,男60例,女34例,年龄17~70岁,平均(42.1±13.1)岁;包括原发肾小球肾炎者53例,继发肾小球肾炎者28例,小管-间质疾病13例。选取同期109例肌酐正常且排除可能影响肾脏的疾病的住院或门诊患者作为对照组,男59名,女50名,年龄16~79岁,平均(52.9±15.0)岁。患者均签署知情同意书。
1.2 仪器与方法 按照预先设计的调查问卷记录2组患者一般情况后,采用迈瑞昆仑R8超声仪进行常规超声、彩色多普勒超声及弹性成像。嘱患者仰卧或侧卧,先以常规超声分别测量双肾长度、宽度、皮质厚度、髓质厚度、实质厚度及距皮深度。随后行彩色多普勒检查,于肾髓质间测量叶间动脉,于肾动脉起始段或肾门处测量肾动脉主干,分别测量上述血管的收缩及舒张期血流流速及血流阻力指数。最后进入剪切波弹性模式,使探头尽可能与肾脏包膜垂直,适当经探头施压后行弹性检查,待弹性图像稳定后嘱患者屏息,尽量调小圆形ROI的面积,确保其内彩色充满且均匀一致,并在5~10 s内完成测量。每次测量后暂停弹性系统,重新开启后再行下一次测量。依次测量右肾及左肾皮质、髓质和肾窦部剪切波速度,剪切波速度最少测量3次,取中位数为剪切波数值(图1~3)。由2名具有5年以上超声腹部诊断经验和弹性成像操作经验的超声科主治医师完成上述操作。
图1 正常肾脏弹性成像图,肾皮质弹性值8.74 kPa
1.2.1 数据处理与统计 使用Microsoft Excel 2007软件录入临床数据。按照3∶1比例将全部203例患者随机分为2组,以其中153例作为训练样本、50例为验证样本。采用SPSS 25.0统计分析软件,以独立样本t检验比较单因素连续变量,筛选与肾病存在统计学关联的指标建模。以肾病组=1和对照组=0为因变量,将筛选出的单因素变量纳入多因素Logistic回归,变量纳入的标准设置为0.05。采用Logistic混合逐步前向回归(LR法)建立Logistic回归预测模型,得到存在肾病与否的预测结果。P<0.05为差异有统计学意义。
1.2.2 SVM建模 采用Logistic回顾和SVM法,SVM采用二类支持向量机,其核函数包括线性核函数、高斯核函数和径向基函数,通过优化方法对核函数及其参数获得最佳值,从而建立诊断模型。于Python 3.7平台运行SVM模型,以scikit-learn 0.22软件进行分析。采用网格优化方法搜索SVM算法的核函数和各参数,逐步得到准确率最高的模型架构,选择准确率最高的核函数和参数作为预测模型。以敏感度、特异度、准确率及AUC作为评价诊断效能的指标。
图2 男,52岁,不典型膜性肾病,弹性成像图,肾皮质弹性值4.96 kPa
图3 男,31岁,IgA肾病伴缺血性肾损伤,弹性成像图,肾皮质弹性5.77 kPa
2 结果
2.1 单因素分析 6个单因素变量与肾病存在统计学关联(P<0.05),分别为右肾宽度、右肾实质厚度、右肾皮质厚度、左肾实质厚度、左肾皮质弹性硬度和右肾皮质弹性硬度。其他观察指标与肾病无明显统计学关联。见表1。
表1 单因素变量检验结果
2.2 建立Logistic多因素回归模型 多因素回归预测模型中包括3个因素,即右肾实质厚度、右肾皮质弹性硬度和左肾皮质弹性硬度。Logit(p)=2.090×右肾实质厚度—0.611×右肾皮质弹性硬度—0.735×左肾皮质弹性硬度+6.345。其中P为归于肾病组的概率,取0.5为判断界值,即P>0.5为肾病组,P<0.5归为对照组。见表2。
表2 多因素逐步Logistic回归结果
2.3 模型诊断效能比较 对建立的Logistic回归模型进行测试,用敏感度、特异度、准确率和AUC评价诊断效能,SVM模型准确率85.10%,与Logistic回归模型(83.74%)接近(χ2=0.21,P=0.65)。见表3。
表3 SVM与Logistic回归模型预测效果比较
3 讨论
支持向量机(support vector machine, SVM)是一种基于结构最小化理论的机器学习方法,适用于处理样本量少的高维度的线性及非线性医学相关数据[4]。本研究应用SVM和Logistic回归构建模型判断不同肾脏疾病,观察联合应用常规超声、彩色多普勒超声和弹性成像诊断肾脏病变的效能,比较不同模型诊断能力的差异。
肾脏具有维持机体水和电解质稳定的重要作用,也是多种疾病的靶器官。不同类型肾损伤可导致肾小球硬化、肾小管萎缩及肾间质病变等多种不同组织改变。肾脏代偿能力较强,常规血尿检验提示异常时,通常肾脏损伤已比较严重[5],而此时常规超声和彩色多普勒超声可无特异性发现,仅能对肾脏大小和血流改变进行观测,使得无创且能定量评估肾脏疾病的影像学检查手段成为临床迫切需要。实时剪切波弹性成像技术是近年发展起来的新型超声检查技术[6],通过向目标组织施加激励使之产生相应组织位移,以超声结合数字信号后处理技术评价目标组织的弹性硬度,能无创、定量地反映组织弹性,现已逐步用于临床诊断肾脏及肾脏相关疾病[7-8]。目前相关研究多单独分析剪切波弹性成像与肾损伤的关系,联合应用常规超声、彩色超声和弹性成像诊断肾脏疾病者较少,且缺乏联合诊断建立肾损伤的模型观察。
本研究采用传统统计学方法为Logistic回归建模,需要较多样本,对于分析小样本高维度数据存在一定缺陷,故引入SVM思想建立诊断模型。首先将原始样本数据映射到高维特征空间,然后识别一个超平面,将数据项分为2类;该超平面通过最大化两类的距离和最小化分类错误得到,具有较好的泛化能力[9]。既往研究[10-11]已证明SVM是解决医疗问题的有效方法。通过10次随机分组方式,本研究建立的SVM模型计算10次检验结果平均的准确率,可最大程度地减少抽样不均匀对训练样本和测试样本造成的诊断结果的随机误差,从而更真实有效地反映SVM模型对肾脏疾病的诊断效能。
单因素分析结果显示,常规二维超声所示右肾宽度、右肾实质厚度、右肾皮质厚度及左肾实质厚度在肾病组与对照组之间的差异具有统计学意义,且肾病组大于对照组。本研究肾病组患者均接受肾穿刺活检,其中慢性肾病急性发作及急性肾病占比相对较高,急性肾病时肾脏存在肿胀和充血等改变,导致肾脏不同程度增大,故部分肾脏常规超声测值增大。弹性成像测值中,双侧肾皮质硬度组间差异有统计学意义,且肾病组低于对照组,可能与肾脏疾病患者肾血流减少,肾脏周围纤维被膜形成,弹性受血液压力影响大有关,与既往研究[12]相符。本研究Logistic回归模型和SVM模型均将超声弹性列为最终计算参数,提示剪切波弹性数值对于判断肾病具有重要参考价值;但肾脏彩色多普勒血流参数在肾病组与对照组之间差异无明显统计学意义,可能与肾病组仅包含1例高血压肾病有关。本研究中Logistic回归模型的预测准确率为83.74%,SVM模型为85.10%,提示2种模型均具较好诊断效能,而SVM模型的可拓展性更高:Logistic模型主要在数据层面建立,而SVM可进一步分析包括医疗图像、文字描述等数据在内的更多医疗信息,提高对肾脏疾病的判断能力。
综上所述,多模态超声是无创诊断肾脏疾病的较好手段;SVM模型和Logistic模型均有较高诊断效能,尚需要更多数据加以进一步优化。