基于多期CT影像组学鉴别卵巢良、恶性肿瘤的临床应用价值
2023-09-20徐静雅吴树剑范莉芳翟建
徐静雅, 吴树剑, 范莉芳, 翟建
卵巢肿瘤是妇科常见的肿瘤,根据异常组织分化及侵袭性分为良性、交界性和恶性肿瘤,根据组织来源分为上皮性肿瘤、生殖性肿瘤、性索-间质肿瘤、转移性肿瘤和其他来源肿瘤[1]。卵巢良性肿瘤预后较好,恶性肿瘤预后较差。卵巢癌的预后取决于临床早期发现、及时的手术干预和术后的系统管理。相关研究发现,卵巢癌是全世界女性妇科癌症死亡重要原因,确诊5年后的总体生存率仅为47%,Ⅲ期和Ⅳ期患者5年的生存率低于30%[2]。CT影像诊断主要是放射科或临床医师依据肿瘤大小、形态、边界、密度、肿瘤与周围组织的关系及相关肿瘤抗原指标,对肿瘤的影像特征依赖主观判断,且与影像科与临床的经验和专业水平相关,缺乏客观性和重复性,且卵巢良恶性肿瘤的影像特征存在重叠,肉眼难以区分。影像组学主要研究思路是从医学图像中提取高通量的定量特征分析疾病,具有客观性,为妇科肿瘤(尤其是卵巢肿瘤)的临床相关诊疗提供一个新的思路。本研究基于多期CT影像组学模型及联合模型探讨其对卵巢良恶性病变的鉴别诊断价值。
材料与方法
1.研究对象
回顾性搜集2018年1月-2022年7月于本院就诊的卵巢肿瘤患者。病例纳入标准:①术前行腹盆腔CT平扫及增强扫描;②术后病理证实为卵巢单发来源肿瘤;③临床资料完整;④术前无穿刺和放化疗治疗史。病例排除标准:①图像质量差,存在伪影;②合并其他病变;③病变多发。最终本研究共纳入326例患者(326个病灶)。
2.检查方法
所有患者均行腹盆腔CT平扫及增强检查,检查前患者禁食6~10 h,检查前10 min内饮水800~1000 mL,并且对每位受检者进行呼吸训练,使用Siemens Somatom Definition Flash双源CT及Philips螺旋CT,扫描参数:管电压120 kV,管电流250 mA,层厚、层间距均为5 mm,矩阵37.5 cm×37.5 cm。患者取仰卧位,先行平扫,平扫结束后经肘静脉以2.5 mL/s流率注射非离子型对比剂(碘佛醇,碘浓度350 mg/mL),剂量1.5 mL/kg,分别在注射对比剂后40~60 s、80~120 s、180~240 s行动脉期、静脉期及延迟期扫描。
3.CT多期影像组学分析
病灶ROI勾画及特征提取:图像均以JPEG格式CT图像(窗宽250 HU,窗位50 HU)存取。使用ITK-SNAP软件勾画,由2位分别具有5年及12年工作经验的影像科医师采用双盲法阅片,并达成一致意见。在横轴面多期CT图像上沿最大病灶边缘勾画ROI,提取特征(图1)。由其中1位医生随机抽取各30%的病例评估两位医师阅片的一致性及可重复性,后由其中1位医师完成勾画。
图1 卵巢肿瘤患者,女,65岁,ITK-SNAP软件勾画病灶。a)红色区域为平扫病灶的ROI;b)红色区域为动脉期病灶的ROI;c)红色区域为静脉期病灶的ROI;d)红色区域为延迟期病灶的ROI。
采用Pyradiomics软件提取ROI的特征,将提取特征正则化,采用Spearman相关分析,相关系数大于0.9,保留其一特征,再使用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)回归算法对组学特征进行降维、筛选,选取非零系数特征与其系数相乘建立各期影像组学标签。
临床数据筛选及联合模型的构建:统计患者年龄、绝经情况、病灶左右、形态、边界、肿瘤成分、腹水、卵巢肿瘤标记物(CEA、CA199、CA153、CA125、HE4)等基本临床资料,筛选两组有统计学意义的指标(P<0.05)参与联合模型的构建。对于横轴面多期影像组学特征提取、降维、筛选,构建各期相模型的受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under curve,AUC)、敏感度、特异度评估各期相的诊断效能,筛选出优势期相后,再结合临床资料构建多因素Logistics回归模型。制作预测模型列线图,使用临床校准曲线评估模型的校准性能,使用临床决策曲线评估临床获益情况。
4.统计学分析
采用SPSS 27.0、Medcalc(20.0)及R(4.2.1)软件进行统计学分析。对于连续性定量资料符合正态分布者以均值±标准差表示,采用独立样本t检验进行组间比较;不符合正态分布者以M(Q1,Q3)表示,采用Mann-WhitneyU检验进行组间比较。对于分类资料采用行×列表的χ2检验或Fisher确切概率法进行组间比较。利用Delong检验评估模型间的诊断效能。采用组间相关系数(intraclass correlation coefficient,ICC)评估两次提取特征组学特征的一致性,ICC>0.8提示一致性较好。以P<0.05为差异有统计学意义。
结 果
1.一般结果
根据术后病理结果将326例患者分为良性组和恶性组(分类标准参照WHO 2020年卵巢肿瘤分类法)。恶性组182例,其中浆液性囊腺癌114例,转移瘤17例,黏液性囊腺癌14例,交界性12例(黏液性交界性肿瘤8例,浆液性交界性肿瘤4例),透明细胞癌10例,子宫内膜样癌9例,粒层细胞瘤4例,非成熟畸胎瘤2例。良性组144例,其中黏液性囊腺瘤52例,浆液性囊腺瘤42例,卵泡膜细胞瘤24例,良性畸胎瘤24例,良性Brenner瘤2例。根据卵巢肿瘤的CT表现将326例患者分为3型:Ⅰ型61例,完全囊性,呈单房或多房,均匀水样密度,壁薄而规则,无囊内赘生物。Ⅱ型177例,囊实性,包括三个亚型,Ⅱa型95例,以囊性为主(囊性成分>2/3);Ⅱb型49例,混合型(实性成分占1/3~2/3);Ⅱc型33例,以实性成分为主(实性成分>2/3)。Ⅲ型88例,完全实性。
2.两组临床资料比较
训练组及验证组中卵巢良恶性肿瘤的基本临床资料见表1,统计学分析结果显示,病灶的形态、边界、肿瘤成分及有无腹水差异有统计学意义(P<0.05)。
表1 训练组及验证组卵巢良、恶性肿瘤临床及影像特征比较 (例)
3.多期影像组学特征提取及标签构建
所有患者CT扫描4期共提取特征108个,将提取特征正则化,采用Spearman相关分析,相关系数大于0.9,保留其一特征, 使用LASSO回归分析后筛选出平扫、动脉期、静脉期、延迟期的特征数分别是22、7、10、22个,其特征用于影像组学标签的评分,由截距加选出的特征乘以各自系数之和所得,结果见图2。基于多期CT 影像组学筛选后的特征,利用Logistic回归模型分析诊断效能显示延迟期的组学特征对模型的贡献优于其它各期相,训练组中AUC为0.857,验证组中AUC为0.838,各期组学标签的诊断效果见表2。
表2 各期影像组学、临床模型及联合模型鉴别卵巢良恶性肿瘤的效能
图2 基于CT各期相影像组学特征选择。a) 基于CT各期相影像组学特征的LASSO系数分布图,使用10倍交叉验证选择非零系数特征; b) 根据最小准则(1-se准则)的1个标准误差,通过交叉验证选择LASSO模型中的调优参数(λ);c) 影像组学特征采用Spearman相关分析;d) 筛选出影像组学特征的权重分布图。
4.构建联合模型并评估其诊断效能
将CT影像上所表现的形态、边界、肿瘤成分、腹水与延迟期病灶图像影像组学标签建立联合模型并制作列线图(图3),用校准曲线评价联合模型的拟合度,结果表明拟合度良好(图4)。各个模型的AUC、准确度、敏感度、特异度、阳性预测值和阴性预测值见图5、表2。
图3 基于联合模型构建的列线图。HE4:0,阴性;1,阳性。Shape(形态):0,规则;1,不规则。Boundry(边界):0,清晰;1,不清晰。Ascites(腹水):0,无腹水;1,有腹水。Cysitic or Solid:0,囊性;1,实性;2,囊实性。Rad-score-D:延迟期影像学标签得分。 图4 基于临床模型、延迟期影像组学及联合模型的校准曲线。fit1:延迟期影像组学模型,fit2:临床模型,fit3:联合模型。a)训练组;b)验证组。 图5 基于临床模型、延迟期影像组学及联合模型的ROC曲线。a)训练组;b)验证组。
讨 论
目前,卵巢恶性肿瘤是妇科常见癌症之一,近几年不断改进放化疗及手术方法,但患者的总体生存率及预后只是得到轻微改善[3]。早期卵巢癌的5年生存率显著高于晚期卵巢癌,早期发现、早期诊断、早干预对患者的预后至关重要。寻找一种简单、高效、微创甚至无创的诊断方法,是诊断卵巢癌急需解决的问题。这年来影像组学的发展,为早期无创诊断卵巢恶性肿瘤提供了新思路,在卵巢肿瘤诊断、治疗、预后中也有相关应用[4]。有相关研究已经探讨了从医学图像提取高通量的数据,能够精准预测卵巢肿瘤的病理类型、无进展生存时间及总的生存率[5,6]。近年来,已经有多项研究发现,基于CT或MRI图像的影像组学在卵巢肿瘤的鉴别上具有很高的临床应用价值[7-10]。丁聪等[7]研究发现HE4结合Radscore的影像组学的列线图在训练集及测试集的AUC分别为0.947、0.914,均高于单一模型。Park等[11]利用增强CT图像提取纹理特征,结果显示其对卵巢恶性病变的诊断具有较高的灵敏度和特异度。
本研究通过分析326例单发卵巢肿瘤患者的CT平扫、动脉期、静脉期、延迟期影像数据及相关临床数据(年龄、腹水、卵巢肿瘤标志物等),多因素研究结果显示腹水、病灶形态、边界、肿瘤成分是卵巢恶性肿瘤的独立危险因素。利用相关性分析及LASSO回归筛选出平扫、动脉期、静脉期、延迟期的特征数分别为22、7、10、22个,其特征用于影像组学标签的评分。利用Logistic回归构建了有效的预测卵巢良恶性肿瘤性质的影像组学模型图,在训练组和验证组均发现延迟期的AUC值高于其它各期模型。将延迟期影像组学模型与临床模型构建联合模型(训练组AUC:0.870,95%CI:0.824~0.916;验证组AUC:0.844,95%CI:0.76~0.927),其AUC均高于各期模型。本研究结果显示在训练组中延迟期影像组学模型获得了较高的诊断效能,推测这可能与两组肿瘤的成分及强化特点有关,卵巢良性肿瘤主要是以囊性成分为主,病理上以卵巢浆液性及黏液性囊腺瘤为主,增强后囊性成分无强化;恶性肿瘤以囊实性或实性成分为主,肿瘤实性部分内含丰富的血管网,增强后实性成分呈不均匀中度或较明显强化,增强CT多期影像组学都有很高的鉴别诊断价值,查阅文献发现类似研究较少,后期仍需要进一步研究及病理组织学证实。单一的影像组学模型和临床模型虽然也获得了较高的诊断效能,但其总体诊断效能不如联合模型。影像组学模型有较高的敏感度,漏诊率较低;临床模型有较高的特异度,误诊率低,两组模型各有一定优势。基于CT卵巢肿瘤的横轴面最大截面来分析,是因为病灶图像易获取,ROI易勾画,提取特征复杂性较低、便捷[12]。本研究将复杂的模型简单化,提高了模型预测准确性,并构建精简的列线图模式,可作为无创性决策工具。
本研究与既往研究不同之处:①纳入病例数较多,涉及病理组织学范围较广;②卵巢肿瘤CT扫描的4期影像特征均纳入研究,不局限于平扫或某期图像,进而评估优势期相。同时本研究存在以下局限性:①本研究为单中心回顾性研究,样本选择可能会出现偏倚;②未发现肿瘤的标记物为独立危险因素;③仅利用Logistic回归算法,未涉及其它机器算法(支持向量机等)优化模型;④交界性肿瘤样本量较少,将其纳入恶性组,可能对研究结果有一定影响。
综上所述,CT扫描延迟期的影像组学特征鉴别卵巢良、恶性肿瘤的效能优于其它期相。基于临床模型与延迟期的影像组学构建的联合模型,有较高的诊断效能,具有一定临床应用价值。