超声影像组学助力左心室肥厚病因鉴别
2021-06-17余其徽马雨琴夏良华
余其徽,俞 霏,马雨琴,夏良华,张 波,张 麒
(1.上海先进通信与数据科学研究院(上海大学),上海 200444;2.上海大学通信与信息工程学院,上海 200444;3.同济大学附属东方医院超声科,上海 200120;4.上海市医疗图像与医学知识图谱人工智能重点实验室,上海 200051)
0 引言
高血压性心脏病(hypertensive heart disease,HHD)、肥厚型心肌病(hypertrophic cardio myopathy,HCM)、尿毒症性心肌病(uremic cardiomyopathy,UCM)是左心室肥厚(left ventricular hypertrophy,LVH)的主要病因[1-2]。胸超声心动图(transthoracic echocardiography,TTE)可以通过特定的形态学特征对部分LVH病因进行诊断[3]。但在其他许多具有非特异性特征的病例中,肥厚原因的鉴别仍具有很大的挑战性[4-5]。因此,临床亟需一种可广泛应用的新技术,揭示真正的病因,辅助医生进行临床决策。
近年来,人工智能在心血管影像分析中的应用颇受关注[6-8]。假设不同病因导致的LVH组织学改变的差异将导致不同的心肌纹理,计算机在捕捉这些细微影像差异方面通常优于人类肉眼观察。本研究回顾性地分析了HHD、HCM和UCM患者的超声心动图像,提取并分析多组心肌纹理特征,以辅助鉴别LVH病因。
1 材料和方法
首先,采集HHD、HCM和UCM患者的超声心动图像,并进行感兴趣区域(region of interest,ROI)处理。然后,用计算机提取ROI的两类纹理特征,并对这些特征进行统计学分析。接着,通过阈值法分类,以期发现临床上单个分类能力较好的显著特征。使用支持向量机(support vector machine,SVM)算法探讨所有显著特征的整体分类能力。
HHD、HCM和UCM患者的超声心动图分析流程如图1所示。
图1 超声心动图分析流程图
1.1 图像采集和ROI处理
本文研究的超声心动图像来自上海东方医院超声科,共获得75例左心室肥厚患者的TTE资料。所有病例均行临床资料仔细核实,以确定入选和分组。其中,HHD、HCM和UCM患者各25例。所有病例均采用高级彩超诊断仪,包括GE vivid E9、GE vivid7、Phillips IE33、Phillips EPIQ7c。超声检查时,按常规超声心动图检查流程留取各切面图像,提取心尖四腔心切面进行计算机分析。左心室肥厚超声心动图的病变处理如图2所示。
图2 左心室肥厚超声心动图的病变处理
为保证分析的准确性,本文由具有丰富临床经验的超声医生手动勾勒超声心动图中的肥厚室间隔ROI轮廓,如图2(a)所示。接着,通过二值化处理得到超声心动图对应的掩膜图像,如图2(b)所示。其中,掩膜图像中白色像素点对应病变ROI,黑色像素点对应背景区域。
1.2 纹理特征提取
根据原始超声心动图及其对应的掩膜图像,本文提取了ROI的两类心肌纹理特征,包括一阶统计量特征和和灰度共生矩阵(gray level co-occurrence matrix,GLCM)特征。
一阶统计量特征基于超声灰度图提取,包括ROI内部像素的均值、中值、标准差(standard deviation,Std)、变异系数。与一阶统计量特征不同,本研究使用了两种类型的GLCM特征,即对比度(Contrast)和均一度(Homogeneity)。作为一种常用的纹理分析方法,GLCM不仅关注像素整体的分布情况,也可以反映具有接近或相同灰度的像素点之间的位置分布特性[9]。求取GLCM特征时,为减少计算量,将原来的256 个灰度级量化到 8 个灰度级,即得到 8×8 的灰度共生矩阵G(i,j)(i=1,2,...,8;j=1,2,...,8),再归一化G(i,j)得到概率矩阵p(i,j),进而提取纹理特征。同时,本研究设定矩阵方向为 0°、45°、90°、135°,最后求取4个方向特征的平均值作为最终的GLCM纹理特征。其中,Contrast值越小,Homogeneity值越大,则ROI病灶局部间的灰度越接近,像素分布越均匀。
1.3 统计学分析
为评价纹理特征对左心室肥厚病因的鉴别有效性,本研究对提取的所有特征进行了统计学分析。三组间的特征变量采用方差分析。而对于两组间的特征变量,假设特征参数对应的数据为正态分布,采用非配对t检验进行分析;否则,采用KW检验分析。其中,p值小于0.05表示有统计学意义。
1.4 分类
1.4.1 阈值法分类
对于有统计学意义且能区分HHD、HCM和UCM三组的特征,在所有数据集上,本文以约登指数(youden index,Yi)最优为参考,调节确定合适的特征分类阈值,从而计算此时所有数据集对应的分类精度(accuracy,Acc)、灵敏度(sensitivity,Sen)、特异性(specificity,Spc)和曲线下面积(area under the curve,AUC),以期发现临床上分类能力较好的显著特征。
1.4.2 SVM分类
本文运用SVM算法,进一步探讨所有显著特征的整体分类性能。SVM是一种有监督的学习算法。该算法通过非线性变换,将输入的特征空间映射到高维特征空间,然后在高维特征空间寻找到经验误差最小、分类间距最大的最优分类超平面[10]。在本研究中,合并HHD、HCM和UCM中的任意两组之后,使用SVM二分类算法分类,最后再次使用SVM二分类算法区分被合并的两组。每次分类时,首先按照6∶4的比例,将数据集分成训练集和测试集。然后,在训练集上,使用5次交叉验证寻找特征的最优模型,用于测试集的分类。最后,可以获得了两次分类过程中测试集对应的分类性能,包括Acc、Sen、Spc、Yi和AUC。
2 结果分析
2.1 统计学分析结果
入组病例均经详细临床资料核实确定LVH病因,包括HHD、HCM和UCM患者各25例,共75个ROI病灶。对提取的所有心肌纹理特征进行统计分析,能显著区分HHD、HCM和UCM三组的特征如表1所示。表1中:0表示HHD组,1表示HCM组,2表示UCM组。与此同时,表1给出了对应特征的均值和标准差。
表1 显著区分HHD、HCM和UCM的纹理特征
从表1中可以看出,当区分HHD、HCM和UCM三组左心室肥厚疾病(0vs1vs2)时,Std、Contrast和Homogeneity有一定的参考作用(p<0.001,Std;p=0.002,Contrast;p=0.004,Homogeneity)。当区分HHD、HCM组和UCM组(0,1vs2)时,Std、Contrast和Homogeneity三个参数均有显著差异(p<0.001,Std;p<0.001,Contrast;p=0.048,Homogeneity),UCM组的Std、Contrast值更大,Homogeneity值更小,表明UCM的ROI像素分布最不均匀。同时,相较于HCM组,HHD组表现更不均匀(0vs1),且在Std、Contrast和Homogeneity三个参数上有显著差异(p=0.034,Std;p<0.001,Contrast;p<0.001,Homogeneity)。此外,相较于HHD、UCM组,HCM组表现更均匀(0,2vs1),且在Std、Contrast和Homogeneity三个参数上均有显著差异(p=0.021,Std;p<0.001,Contrast;p<0.001,Homogeneity)。同时,相较于UCM组,HHD组表现更均匀(0vs2),但仅在Std和Contrast两个参数上有显著差异(p=0.001,Std;p=0.016,Contrast)。
2.2 阈值法分类结果
利用阈值法分类探讨临床上单个显著特征的分类能力时,Contrast参数表现最好。Contrast的阈值法分类结果如表2所示。
表2 Contrast的阈值法分类结果
当区分HHD、HCM组与UCM组(0,1vs2)时,AUC为0.769;进而区分HHD和HCM组(0vs1),AUC为0.800。由此表明,Contrast对临床上HHD、HCM和 UCM的区分有潜在的重要参考价值。
2.3 SVM分类结果
为区分HHD、HCM和UCM三组病因,本文分别运用了两次SVM分类算法。其中,利用所有特征先区分HHD、HCM和UCM组(0,1vs2),接着再区分HHD组和HCM组时(0vs1),测试集分类性能表现更好。测试集的分类结果如表3所示。
表3 测试集的分类结果
分类结果表明,UCM组和HHD、HCM组更好区分,测试集Acc、Sen和Spc分别为0.867、0.875和0.833。当区分HHD组和HCM组时,测试集Acc、Sen和Spc分别为0.800、0.857和0.769,Sen和Spc相对不平衡。两次分类模型的ROC曲线如图3所示。
图3 两次分类模型的ROC曲线
3 结论
本研究将人工智能影像学技术应用于75例LVH图像分析。分析结果表明,Contrast能显著区分HHD、HCM和 UCM(p=0.002),这与心肌病理生理特征密切相关[11-13]。同时,在SVM模型中区分HHD、HCM组和 UCM组时,AUC为0.910;区分HHD组和HCM组时,AUC为0.857。由此表明,医生可从心肌纹理分析中获益以辅助诊断三种LVH病因。本研究也存在一定的局限性:病例数相对较少,需不断积累病例为临床诊断提供更可靠的参数。后续可将影像组学特征应用于多模态超声研究,以获取更多新指标。