影像组学模型对自发性脑出血早期血肿扩大的预测及与常规影像征象的比较
2021-06-04李青润陈红日常璐璠张洪英
李青润 韩 雷 陈红日 常璐璠 叶 靖 张洪英
自发性脑出血占所有脑卒中的10%~30%,是一种高致残性、高致死性疾病,发病后1个月内死亡率约为30%~50%,近半数患者在发病后2天内死亡[1]。血肿扩大在脑出血患者中高达30%,是患者预后不良和死亡风险增加的独立预测因素[2]。准确识别早期血肿扩张对于指导临床决策及评估患者预后具有重要意义。
既往研究[3-5]证实,CT图像血肿混合征、漩涡征、岛征以及CT血管成像(computed tomography angiography,CTA)点征等影像学征象与脑出血早期血肿扩大有关,尤其是CTA点征目前在临床应用中被作为血肿扩大的影像学基准。然而CTA检查由于其复杂性及存在对比剂过敏等风险,并不是急诊检查的首选项。CT常规影像征象作为定性特征,部分定义有重叠、标准欠规范,易受观察者主观影响。
Lambin等[6]于2012年首先提出的影像组学概念,已广泛应用于肿瘤研究[7-8],但很少用于出血性疾病。本研究的目的是探讨基于CT平扫图像的影像组学模型在预测自发性脑出血患者早期血肿扩大时的价值,并与常规影像征象的预测效能进行对比。
方 法
1. 研究对象
回顾性分析2015年6月至2019年2月在苏北人民医院就诊的急性自发性脑出血患者CT影像资料。纳入标准:①发病6 h内行首次头颅CT检查,并于24 h内行头颅CT复查;②年龄≥18岁;③出血部位位于幕上。排除标准:①创伤性脑损伤;②继发性脑出血,如动脉瘤、动静脉畸形、肿瘤卒中、脑梗死出血转换等;③原发性脑室内出血;④24 h复查CT前行外科手术干预;④图像质量不佳。经以上标准筛选后,共纳入209例患者。
本研究经苏北人民医院伦理委员会审核通过。
2. 图像采集
首次CT检查及CT复查均在GE 128层螺旋CT Optima CT660(GE公司,美国)进行,矩阵512×512,层厚5 mm、层间距5 mm,并将所有扫描图像传输至后处理工作站ADW4.6(GE公司,美国)。
3.影像资料分析
使用ADW4.6工作站中的Volume Viewer 9.6.25b软件,分别在首次CT及复查CT图像上分割血肿区域并计算体积。血肿扩大定义为复查CT血肿体积对比首次CT血肿体积增加>6 ml或>33%[2]。分析首次CT图像,记录血肿形状(规则/不规则)、岛征(有/无)、漩涡征(有/无)、混合征(有/无)、黑洞征(有/无),并建立多变量二元逻辑回归分析模型。以上工作由2名放射科住院医师(分别有2年、4年神经影像诊断经验)完成,最终由1名神经影像学主任医师(有25年神经影像诊断经验)最终确认,且均为盲法评定。
4.影像组学方法
4.1 图像分割
将纳入患者首次CT图像以DICOM格式导入Darwin智能科研平台(北京医准公司,中国),采用人工分割,2名放射科医师沿血肿边界逐层手工勾画出三维感兴趣区(region of interest,ROI)。
4.2 特征提取
利用Darwin平台从每个ROI中提取一阶特征、形状特征(3D)、灰度共生矩阵(gray level cooccurrence matrix,GLCM)、灰度游程矩阵特征(gray level run length matrix,GLRLM)、灰度区域大小矩阵(gray level size zone matrix,GLSZM)、邻域灰度差分矩阵(neighbouring gray tone difference matrix,NGTDM)和灰度依赖矩阵(gray level dependence matrix,GLDM)共7类特征。在提取特征之前,对图像分别进行多种滤波处理,包含平方、平方根、对数、指数、梯度、小波变换操作等,并采用标准化方法对特征进行预处理(使之均值为0,方差为1)。
4.3 特征筛选及模型构建
按照训练集与测试集4∶1的比例,将209例患者分为训练集(167例)和测试集(42例)。采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)进行特征参数选择(图1),筛选出与血肿扩张最相关的特征参数。利用筛选出来的特征,分别结合支持向量机(support vector machine,SVM)、逻 辑 回 归(logistic regression,LR)分类器进行预测模型训练,并由独立的测试集对所构建的模型进行验证。
图1 LASSO最优特征数优化过程
5. 统计学分析
所有统计分析均由SPSS软件(版本25.0)完成。连续变量用均数±标准差(±s)表示,分类变量用例数(百分率)[n(%)]表示。连续变量2组间差异检验采用独立样本t检验或Mann-WhitneyU检验,分类变量2组间差异检验采用卡方检验或Fisher精确检验。应用受试者操作特征(receiver operating characteristic,ROC)曲线分析,评估预测模型性能。P<0.05为差异有统计学意义。
结 果
1.患者基本资料比较
根据复查CT结果,将患者分为血肿扩大组(71例)和血肿未扩大组(138例)。血肿扩大组入院收缩压为(168.2±19.8)mmHg,高于未扩大组的(164.6±14.1)mmHg,差异有统计学意 义(P=0.014);男/女性别比、年龄、入院舒张压在2组间差异均无统计学意义(P>0.05)。详见表1。
表1 血肿扩大组与未扩大组临床资料比较
2.常规影像学征象比较
单变量分析时,训练集和测试集中的初始血肿体积、血肿形状、漩涡征、混合征和岛征在血肿扩大组与未扩大组之间比较,差异有统计学意义(均P<0.05),提示这些征象均与血肿扩大有关。黑洞征在训练集中,其在血肿扩大组与未扩大组之间差异有统计学意义(P=0.005),而在测试集中,其在2组间差异无统计学意义(P=1.000)。详见表2。
纳入训练集和测试集中在血肿扩大与未扩大组之间均有统计学差异的变量(初始血肿体积、血肿形状、漩涡征、混合征和岛征),构建多变量二元逻辑回归分析模型,进行ROC曲线分析。结果显示:训练集ROC曲线下面积(AUC)、灵敏度、特异度、准确度分别为0.744、0.614、0.791、0.737;测试集AUC、灵敏度、特异度、准确度分别为0.852、0.714、0.893、0.810(图2)。
表2 血肿扩大组与未扩大组常规影像征象比较
图2 训练集(A)和测试集(B)中影像组学SVM模型、LR模型与常规影像征象模型ROC曲线比较
3.影像组学预测模型的构建与评估
图像预处理后的特征提取数总共达到1 223个,采用LASSO回归模型最终筛选出16个特征,其最优惩罚系数α=-0.945(图1),其中一阶特征类7个(中位数、均值、均方根、峰度、小波变换图像第10百分位数、原始图像第10百分位数、一致性),灰度连通区域矩阵类4个(指数变换图像大面积低灰度优势、低灰度区域优势、灰度非一致性、小波变换图像大面积低灰度优势),灰度游程矩阵类2个(长游程优势、游程方差)、灰度相关矩阵类2个(相依熵、小相关性高灰度优势),灰度共生矩阵类1个(相关性信息度量2)。
分别结合SVM、LR分类器对以上16个特征参数构建预测模型,进行ROC曲线分析,发现两者在训练集和测试集均有很好的效果(图2)。SVM模型中训练集AUC、灵敏度、特异度、准确度分别为0.933、0.891、0.860、0.880,测试集AUC、灵敏度、特异度、准确度分别为0.918、0.893、0.857、0.881;LR模型中训练集AUC、灵敏度、特异度、准确度分别为0.939、0.882、0.895、0.886,测试集AUC、灵敏度、特异度、准确度分别为0.900、0.893、0.857、0.881。除测试集中常规征象模型特异度稍高于影像组学SVM模型和LR模型外,训练集和测试集中影像组学SVM模型及LR模型AUC、灵敏度、准确度均优于常规征象模型(图2)。
讨 论
早期血肿扩大是一个动态过程,通常发生在自发性脑出血症状出现后24 h内。明确血肿扩张的影像学预测因素对于患者选择合适的治疗方案是非常重要的。在本回顾性研究中,我们基于CT平扫图像的影像组学特征构建了2个稳定的血肿扩大预测模型,同时比较了基于常规影像征象的多变量逻辑回归模型。本研究提供了一种客观、便捷的方法来预测急性自发性脑出血患者早期血肿扩大的风险。
本研究中的几个常规影像表现征象与以往研究[3-4,9-12]结果基本一致,可初步对血肿扩大的发生进行预测;同时,我们还建立了多变量逻辑回归分析模型。在常规影像学表现征象中,较大的初始血肿体积,可能是由于血肿牵拉周围脑组织,导致周围微小血管破裂,进一步诱发活动性出血引起[12];血肿形状不规则更可能出现在有多灶出血点的血肿中[13],岛征则代表了形状极端不规则的特例[4];而血肿密度不均匀,出现漩涡征、混合征、黑洞征等低密度征象是因为血肿中未凝结血液与脑实质相比呈等或低密度,可能反映了不同时间活动性脑出血的存在或者提示有多发出血灶[13]。尽管这些影像学表现较CTA点征相对简便,但均是建立在定性或半定量评分系统基础上的,易受工作经验等主观影响,且灵感度普遍较低,其预测结果的准确性及稳定性亦不太理想。因此,本研究进一步挖掘病灶的内在影像组学特征,并通过机器学习的方法处理大量影像组学特征信息,以期实现准确分析和预测自发性脑出血患者的早期血肿扩大。
Barras等[14]证明了定量CT密度测定在预测血肿扩大的价值,但未利用机器学习构建预测模型。随着纹理分析、影像组学模型在肿瘤等疾病的应用,Shen等[15]将纹理分析首先应用于对血肿扩大的预测,认为方差、均匀度等纹理参数可以独立预测血肿扩大。在本研究中,我们在提取特征前对图像进行多种滤波处理,这种处理手段和特征组合的方式大大丰富了特征个数,从不同级别(一阶、二阶及高阶)量化血肿扩大组和未扩大组图像中血肿的灰度差异,可以发现血肿扩大患者组因存在活动性出血而导致的密度更不均匀、异质性更高。使用LASSO回归模型筛选出2组间差异最显著的16个特征,建立的SVM模型及LR模型的AUC均在0.900以上,灵敏度也都在0.882以上,说明影像组学的机器学习模型有优良的预测价值。
同时,本研究将影像组学预测模型与常规影像征象逻辑回归分析模型进行比较,得出影像组学模型具有更好的预测性能,尤其灵敏度明显高于常规影像征象模型,更有利于准确预测有血肿扩张高风险的患者,以提示临床及早进行干预。并且,由于影像组学特征参数提取为定量分析,受主观因素影响小,可以看到影像组学SVM模型和LR模型在训练集和测试集中的结果相仿,且表现均比常规影像征象模型更稳定。
本研究的局限性:①仅围绕影像资料进行,未将血压、口服抗凝药等相关临床因素纳入探讨,有待在以后的研究中结合其他临床资料加以探讨。②未考虑患者间不同治疗方式对血肿扩大可能造成的影响。③尽管我们尽力将手工分割ROI的影响降到最低,但如果能引入计算机自动分割可能更精确。④本研究为单中心研究,样本量较小,需要多中心、大样本研究进一步验证。
结 论
在本研究中,我们证实了影像组学模型在血肿扩张预测中的应用价值,同时对比常规影像征象分析,发现影像组学预测模型效能明显优于常规征象。在今后的临床工作中,影像组学模型将会更好地应用到血肿扩大的预测中,从而有利于对高风险患者采取更合适的治疗方式,并改善其预后。