基于非局部先验的高维影像数据计算机辅助诊断与应用*
2020-06-28郑茜茜侯雅文
郑茜茜 陈 征 侯雅文△
【提 要】 目的 探索基于胃肠道病变高维影像数据的计算机辅助诊断模型,特别为医疗资源匮乏地区提供胃肠腺瘤检测的机器学习技术。方法 选取UCI Gastrointestinal数据集中76位增生或腺瘤患者的698维结肠镜的白光影像资料。采取非局部先验的贝叶斯变量选择方法进行变量筛选,与传统高维数据变量筛选Lasso方法比较,根据logistic回归模型预测结果计算正确率、Youden指数、灵敏度和特异度,运用该模型结果与医生个人和团队诊断结果比较上述评价指标。结果 与Lasso结果比较显示,非局部先验的贝叶斯变量选择方法能够更为有效地筛选出预测变量,模型具有较强的泛化能力。与医生和其团队诊断结果比较发现,模型分类结果在正确率、Youden指数和特异度都具有最优效果,灵敏度也优于医生个人水平。结论 基于非局部先验贝叶斯变量筛选的logistic回归模型,运用到计算机辅助诊断技术中,具有较好的预测性能,可为医疗诊断提供高效的决策支持。
世界卫生组织(WHO)将胃腺瘤定义为局部息肉病变,由异常发育的上皮细胞的管状或绒毛状结构组成[1]。根据其组织学结构,Nakamura将胃息肉分为Ⅰ型和Ⅱ型(增生性息肉),Ⅲ型和Ⅳ型(腺瘤)[2]。在西半球国家,胃腺瘤的发病率在0.5%~3.75%之间,而在患胃癌风险高的国家,如中国,胃腺瘤的发病率高达9%~20%[3]。胃腺瘤性息肉通常位于胃窦中,且在潜伏期无明显症状,但存在腺瘤恶化的重大风险,随着肿瘤大小的增加,恶化的风险也会增加[4]。Rubio在对胃锯齿状腺瘤(gastric serrated adenoma)病例研究中发现,该患者同时也是一名Lynch综合症患者,表明锯齿状腺瘤可能带有遗传特征[5]。肠腺瘤与胃腺瘤类似,由腺瘤发展为腺癌的情况日益受到重视,在我国呈现出年轻化趋势。因此,在早期进行胃镜和肠镜检查以尽快发现胃肠道病变对治疗有着重要意义[6]。
医生观察胃肠镜影像并做出诊断,是目前国内医院确诊胃肠腺瘤普遍采用的诊断方式。这种主观判断的行为,更易受到自身专业水平和经验的影响,存在误判或遗漏细节的可能性,而计算机辅助诊断(computer-aided diagnosis,CAD)能客观地给出参考意见[7]。近年一些CAD[8]或计算机辅助支持系统(computer-aided decision support systems,CADSSs)[9]应用到疾病诊断之中,降低医师临床诊断的主观性,减少误诊率和漏诊率,提高诊断水平。CAD技术首先对图像资料进行病变特征提取,再基于提取的特征进行统计建模,分类判别。其中,国内外学者大多采用人工神经网路、支持向量机等机器学习方法[10-12]。这些方法能够在一定程度上对病变进行判别分类。但随着影像资料所记录下的病变信息维度增多,如病变处的纹理、形态以及颜色等等,相对于病患样本,这种形式的数据被视为高维数据[13],上述算法可能会导致过度拟合的算法失效问题。随着数据维度由百维以内增至千维级别时,处理高维数据常用的Lasso方法同样存在过拟合等问题。
因此,本文基于高维数据的非局部先验贝叶斯变量选择方法[14],对UCI数据库中关于胃肠道病变的常规胃肠镜检查的影像资料进行特征筛选,并通过特征变量进行logistic回归,对比传统Lasso方法和贝叶斯方法在计算机辅助诊断的有效性。对比模型预测结果、医师诊断结果与病患真实情况的正确率、Youden指数、灵敏度和特异度指标。
方法介绍
1.基本原理
以影像数据信息为自变量,病患是否诊断为胃肠腺瘤作响应变量,建立logistic回归模型。对任意一个可能的模型γj(j=1,2,…,2p),后验概率表示为:
2.参数先验
基于局部先验(local prior)的贝叶斯变量选择方法会导致真实模型的后验概率趋近于0,如intrinsic bayes factors[15],fractional bayes factors[16]和g-先验[17]等。Johnson和Rossell提出非局部先验[14],不同于local先验密度函数在回归系数为零时,其函数值大于零,非局部先验密度函数在回归系数为零时,其函数值等于零,从而筛选出最佳预测变量。通过非局部先验可将真实模型的后验概率逼近于1,使模型具有一致性。且控制假阳性率的同时保持参数的敏感性[18]。
非局部先验密度有两种形式:乘积矩先验(pMOM)和乘积逆矩先验(piMOM)。本文采用PiMOM先验,表达式为:
其中τ>0,为尺度参数,该参数决定了密度函数在β=0周围图形的分散程度,r是密度函数的序(r=1,2,…),βk为模型系数βj中第k个系数值,K=|βj|,表示模型γj对应系数总数。Nikooienejad等人通过从模型的空间先验中抽样的方式以选择合适的超参数r和τ[19]。
3.模型空间先验
4.模型后验概率
结合模型先验、参数先验和模型后验,模型后验概率表示为:
Johnson和Rossell认为由于在确定模型后验概率时,模型的边缘密度计算过于复杂。为了减少参数空间的维度,首先对每个模型的边缘密度进行Laplace近似,得到边缘密度的近似表示:
通过MCMC(Markov chain Monte Carlo)[12]算法最大化模型的后验概率,从而得到最高后验概率模型。利用修正的耦合检验[19]验证MCMC算法的收敛性,从而保证通过适量的迭代次数可以得到确定的最高后验概率模型。
实例分析
1. 数据来源
数据来自UCI数据库(http://archive.ics.uci.edu/)常规胃肠镜2D和3D检查影像,共有76名患者的内镜影像,将其分别在白光(WL)和窄带成像技术(NBI)两种不同视角下观察,本文选取白光下的影像资料进行辅助诊断。每段影像记录时间在30sec~1min之间,共记录病变属性698个,包括:2D纹理特征(422个)、2D颜色特征(76个)和3D形状特征(200个),其中3D形状特征是通过SFM算法提取得到[21]。数据集包含三种病变结果:锯齿状腺瘤(15个),腺瘤(40个)和增生(21个),锯齿状腺瘤和腺瘤归为一类,增生归为一类。
同时,数据集包含4名专家和3名初学者的临床诊断意见(将具有8年及以上临床经验的胃肠道医生视为专家,将具有4年及以下临床经验的胃肠道医生视为初学者),以及样本的真实诊疗情况:若是良性增生则无需手术,而若是腺瘤则需要进行手术。
2.分析过程
数据按照6∶4划分训练集和测试集,训练集样本数为45,测试集样本数为31。将数据集的影像资料变量标示为x1,…,x698,其中x1,…,x422表示2D纹理特征,x423,…,x498表示2D颜色特征,x499,…,x698表示3D形状特征。首先对预测变量数据进行标准化处理,分别通过贝叶斯变量选择方法和Lasso方法筛选最佳模型。
白光下698个变量使用基于非局部先验贝叶斯变量选择方法对训练集建模,选择变量为x170,属于2D纹理特征。将变量x170作为预测变量,病变类型作为响应变量进行logistic回归,结果如表1所示。截距项和变量的系数显著,logistic回归模型有效,AIC=34.278。
表1 非局部先验贝叶斯方法logistic模型回归结果
Lasso方法共选择出包含x170在内的23个变量,来自2D纹理特征变量12个,分别为x6,x8,x11,x12,x98,x110,x132,x133,x135,x137,x170,x218,2D颜色特征10个,分别为x424,x448,x464,x465,x471,x472,x474,x475,x483,x486,3D形状特征1个,为x600。logistic回归模型效果较差,23个预测变量系数均不显著,且P值都为1,AIC=48。
根据上述两种方法的变量筛选结果,结合logistic回归模型,分别针对训练集和测试集进行预测,与胃息肉的真实情况(增生为0,腺瘤为1)进行比较,计算评价指标:正确率、Youden指数、灵敏度和特异度,如表2所示。
表2 Lasso方法与非局部先验贝叶斯方法模型评价
同时,根据预测结果和真实结果,分别针对训练集和测试集作两种方法的ROC曲线,如图1所示。
图1 Lasso法与非局部先验贝叶斯法的ROC曲线
根据上述结果,采用非局部先验贝叶斯方法作为计算机辅助诊断模型(记为Model),与医生诊断结果进行比较。在医生诊断结果中,考虑医生的最高、最低和团队决策能力。首先从4名专家中选择出诊断准确率最高的1名医生作为该医院的最高水平(记为Expert),从3名初学者中选择出诊断准确率最低的1名医生作为该医院的最低水平(记为Beginner)。综合考虑4名专家的诊断结果,若有2人及以上的医生认为该病变属于腺瘤,则专家综合的评价结果即为需要手术(记为Average_Expert);再考虑3名初学者的诊断结果,若认为该病变类型为腺瘤的人数超过1人,则初学者综合评价的结果即为需要手术(记为Average_Beginner);最后考虑全部医师的诊断结果,若有超过3人认为该病变属于腺瘤,则全部医师的综合评价结果即为需要手术(记为Average_All)。
根据表1的计算机辅助诊断模型给出预测结果和医生诊断结果,计算各评价指标如表3所示。
表3 计算机辅助诊断与医生诊断结果指标对比
*:A_E表示Average_Expert,A_B表示Average_Beginner,A_A表示Average_All
3.分析结果
针对高达698维影像数据,Lasso方法出现变量选择的过拟合问题,模型泛化能力差,非局部先验贝叶斯方法具有更少的变量个数,从训练集到测试集的评价结果比较如表2显示,4个指标均有较大提高,Lasso方法正相反,从图1的ROC曲线也可看出,非局部先验贝叶斯方法泛化能力更强。
计算机辅助诊断和医生诊断对比中,如表3所示,在正确率指标上,Model值为0.8684,相较于Expert、Beginner和A_B都有明显优势,与A_E和A_A水平持平,表明Model总体诊断能力较优。在Youden指数上,Model值为0.7299,真实性最优。在灵敏度指标上,A_A的评价结果最优。灵敏度数值越高表明更多的恶性样本能被正确检测出来。考虑到将腺瘤误判为增生给患者带来的严重性,A_E的团队4人投票规则设置,会增强灵敏度值。Model在灵敏度指标的诊断能力相较于单人医生更强。在特异度指标上,Model和Expert的评价结果最优。特异度数值越高表明更多的良性样本能被正确检测出来,模型和最高水平的医生能够对良性样本具有最优的诊断能力,大大降低病患心理负担。
综合而言,通过基于非局部先验的贝叶斯方法筛选出的变量,进而建立的logistic回归模型,其预测效果在各个指标上都处于中等或最优水平。表明在高维情况下,利用贝叶斯方法筛选出的变量X170解释性强,代表性好,具有很好的计算机辅助诊断价值。
讨 论
本文通过基于非局部先验设置的贝叶斯变量选择方法对UCI数据库的Gastrointestinal数据集进行实证分析,针对76段病变处的影像资料,从698个病变特征中筛选出最佳的预测变量X170(2D纹理特征)。在变量筛选方法上,对比传统高维数据的Lasso方法,测试集评价结果表明非局部先验的贝叶斯方法更为有效、简洁。并将该模型与医院医生各种可能诊断配置比较结果显示,医生投票方式能有效地将腺瘤样本正确分类,模型的灵敏度虽略差于医生投票诊断结果,但明显优于单人的诊断;除此之外,模型预测结果可以达到与医生投票或最好的医生结果一致,甚至更优。从各个指标结果综合分析,模型的诊断结果表现较好,体现出基于非局部先验设置的贝叶斯变量选择方法的优势,相比于其他应用到医学图像判别的机器学习方法,该方法更加适用于高维的医学影像数据。在鼓励创新检测技术与产品研发,通过技术更新提升我国防癌体检效率的大背景下,论文采用贝叶斯变量选择与logistic回归模型作为计算机辅助诊断技术,有效降低医生个体诊断的主观性,特别针对医疗师资条件匮乏的地区,达到提高诊疗效率的根本目的。