CT影像组学模型鉴别孤立结节型肺隐球菌与肺腺癌的价值
2022-05-30林苗苗李凯
林苗苗 李凯
摘要:目的 探讨基于CT平扫的影像组学模型在鉴别孤立结节型肺隐球菌(PC) 与肺腺癌的价值。方法 纳入24例孤立结节型PC和54例肺腺癌患者,手动分割对病灶感兴趣区(region of interest,ROI) 进行勾画,并提取内部影像组学特征,进而筛选出最佳特征。同时采用邻近算法(k-nearest neighbor,KNN) 、支持向量机(support vector machine,SVM) 及逻辑回归(logistic regression,LR) 3种分类学习器构建鉴别诊断模型。采用ROC曲线评价模型的鉴别诊断效能。结果 经Lasso降维后共选出10个最优影像组学特征进行建模,采用KNN构建的模型在训练集中的AUC为0.957,测试集中AUC为0.864 ;采用SVM构建的模型在训练集中的AUC为0.98,测试集中AUC为0.782;采用LR构建的模型在训练集中的AUC为0.953,测试集中AUC为0.80。结论 基于KNN、SVM和SVM的CT影像组学模型在鉴别诊断孤立结节型PC和肺腺癌方面都具有较好的诊断效能,其中KNN模型更为稳定。影像组学可为孤立结节型PC与肺腺癌鉴别诊断提供新的手段。
关键词:隐球菌;肺肿瘤;影像组学;体层摄影,X线计算机
肺隐球菌病(pulmonary cryptococcosis,PC)是由隐球菌引起的一种亚急性或者慢性真菌病,常见于免疫功能受损患者,如艾滋病、接受器官移植及恶性肿瘤的患者,也可以见于健康人群,其影像学表现多样,最常见为孤立结节、多发结节、团块及肺炎实变型[1]。当其表现为孤立性结节时,易被误认为周围型肺癌、转移瘤或肺结核等,容易造成误诊、漏诊。隐球菌对脑膜及神经组织有极大的亲和性,常常透过血脑屏障造成严重中枢神经系统感染,因此尽早明确诊断非常重要[2]。影像组学模型是一种通过从医学图像中提取的高通量定量影像组学特征建立诊断模型,为临床实施个性化诊疗提供了一种新型的潜在工具[3],目前,影像组学已经广泛应用于肿瘤领域[4~5]。本研究对影像组学模型鉴别诊断孤立结节型PC与肺腺癌的可行性进行探讨。现报道如下:
1资料与方法
1.1 一般资料
回顾性分析2018年1月~2021年10月收治的24例经术后病理证实的孤立结节型PC(PC组) 、54例病理确诊肺腺癌(肺腺癌组) 的胸部CT平扫资料。PC组中男性13例,女性11例,年龄23~70岁,平均年龄(51.86±11.18) 岁,血清HIV均为阴性。肺腺癌组中男性31例,女性23例,年龄34~73岁,平均年龄(57.22±8.96) 岁。所有患者接受胸部CT检查前均未经任何治疗,所有病灶均为单发,且最大径≤3 cm。
1.2 仪器与方法
采用美国GE公司256排螺旋CT进行扫描。患者取仰卧位,吸气末屏住呼吸,扫描范围从胸廓入口至双侧肾上腺水平。扫描参数:管电压100 kv,自动管电流,扫描层厚5 mm,重建层厚1.25 mm。
1.3 病灶分割、特征筛选及模型建立
病灶ROI分割如图1A。每个病灶提取了1409个影像组学特征。按8∶2比例将所有样本分为训练集和测试集。依次使用方差阈值法、最佳K折法及Lasso算法筛选特征,如图1B。分别采用KNN、SVM及LR建立模型,绘制ROC曲线,以AUC、准确度、敏感度及特异度评价其鉴别效能。
2结果
2.1 孤立结节型PC与肺腺癌CT影像组学特征筛选
经特征选择获取针对孤立结节型PC与肺腺癌的10个较优特征,具体如图2。
2.2 3种孤立结节型PC与肺腺癌CT影像组模型的鉴别诊断效能
在训练集中,3种影像组学鉴别诊断模型的AUC比较结果为:SVM>KNN>LR;准确度比较结果为SVM=LR>KNN;敏感度方面KNN、SVM及LR三者之间相同,特异度比较为SVM=LR>KNN(表1) 。所构建的3种影像组学鉴别诊断模型在训练集中的ROC曲线,如图3A。测试集中,3种影像组学鉴别诊断模型的AUC比较结果为:KNN>LR>SVM;准确度比较结果为KNN=LR>SVM;敏感度方面KNN、SVM及LR三者之间相同,特异度比较为KNN=LR>SVM(表2) 。所构建的3种影像组学鉴别诊断模型在训练集中的ROC曲线,如图3B。
3討论
PC是由新型隐球菌感染引起的一种较为少见的肺真菌病,呈急性或者慢性感染过程,可经过呼吸道,消化道或者皮肤黏膜侵入人体引起感染,其中以呼吸道吸入感染为主。近年来,肺隐球菌病的发病率呈上升趋势,其中无免疫缺陷的患者也逐渐增多[6~7]。血清CrAg检测对于HIV阴性PC患者的敏感度仅为25 %~56 %,诊断较为困难[8]。PC临床症状及影像学表现均缺乏特异性,其中具有分叶征、毛刺征、空泡征等征象的孤立结节型PC,易被误诊为肺癌。PC是良性病变,而肺癌是恶性肿瘤,二者在治疗方案选择全然不同。PC患者治疗目的主要在于控制感染,防止播散,尤其是防止隐球菌脑病发生。对于轻中症状患者,推荐氟康唑治疗,疗程为半年至1年,重症人群加以两性霉素B进行诱导治疗[9]。对于肺腺癌,尤其是早期肺癌,主要以手术治疗方式为主。
既往研究多集中在结节型PC与肺腺癌的临床特征与影像学表现上[10~11],研究表明晕征、支气管充气征、蘑菇兄弟征等征象更倾向于发生在PC,以及PC更好发于两肺胸膜下及肺野外带。但是当PC表现为结节型且单发时,且伴有分叶、毛刺征、空泡征,影像特征不典型时,极易与肺癌相混淆。影像组学可以很好反映病灶异质性,对图像纹理信息进行深度挖掘以及定量分析。Weiya Shi等[12]研究HIV患者的机会性肺部感染中央型病变(包括结核、非分枝杆菌、隐球菌) 的逆差距显著高于癌症组,并认为良性病变同质性较大。樊梦思等[2]对28例结节/ 肿块型肺隐球菌、30例肺腺癌及26例肺结核CT平扫图像进行影像组学分析,结果显示CT平扫的影像组学模型可有效鉴别结节/ 肿块型肺隐球菌、肺腺癌及肺结核。
本研究在上述基础上进一步扩展机器学习模型的范围,基于24例孤立结节型PC与肺腺癌的CT平扫图像,从每个病灶提取1409个特征,再通过方差阈值法、最佳K折法及Lasso算法筛选出孤立结节型PC与肺腺癌组间差异最明显10个影像组学特征用于构建模型。在模型训练阶段采用KNN、SVM及LR三种机器学习模型,结果显示KNN模型综合鉴别诊断效能最稳定,除了准确度,其他指标均达到80 %以上。KNN也叫K-最近邻算法,是著名的模式识别统计学方法,在学习分类算法中占有重要地位。其中K是一个参数,是指包含的最近邻的数量。它根据所有样本的集中的数据,由相似性度量选择K个最近的邻居并按照邻居的类别进行分类。KNN优点在于易于理解与实现,灵活的距离度量方法选择,适用于处理多分类问题及回归问题,适用于小样本数据集,本研究样本总数为78例,属于小样本数据,这可能是KNN各项模型评估效能指标都较优越原因之一。但KNN算法也存在不足,当样本数量不平衡时,输入一个新样本可以使得该样本的K个邻近确定样本中大容量类样本占据多数,导致结果出现偏差。研究中孤立结节型PC与肺腺癌的样本数量不均衡,肺腺癌样本居多,可能导致KNN算法鉴别诊断新的孤立结节型PC样本时因邻近K样本中肺腺癌数量占多数而被误判为肺腺癌,这可能是导致KNN模型在训练集和测试集中准确度均偏低的原因之一。
综上所述,基于KNN、SVM及LR三种分类器构建影像组学模型均可以较好用于鉴别诊断孤立结节型PC及肺腺癌,其中,KNN鉴别诊断效能表现最佳,这为临床准确诊断和个体化治疗提供依据。本研究尚存不足:(1) 样本量少;(2)仅采集平扫肺窗单层病灶图像,难以提取病变全部信息;(3) 未将临床、影像特征等信息纳入进行联合分析,有待完善。
参考文献
[1]杨海,刘子姗,陈盈,等.免疫正常患者肺隐球菌病的CT征象分析[J].中華全科医学,2018,16(2): 279-282+290.
[2]樊梦思,赵红,曹捍波,等.基于CT平扫影像组学模型鉴别结节/ 肿块型肺隐球菌病及肺腺癌与肺结核[J].中国医学影像技术,2020,36(6):853-857.
[3]Aerts HJ.The Potential of Radiomic-Based Phenotyping in Precision Medicine:A Review [J].JAMA Oncol, 2016,2(12):1636-1642.
[4]Yang L,Gu D, Wei J,et al.A Radiomics Nomogram for Preoperative Prediction of Microvascular Invasion in Hepatocellular Carcinoma [J]. Liver Cancer,2019,8(5):373-386.
[5]Jiang Y,Wang W,Chen C,et al.Radiomics Signature on Computed Tomography Imaging: Association With Lymph Node Metastasis in Patients With Gastric Cancer [J].Front Oncol,2019,9:340.
[6]谷雷,文文,赖国祥.肺隐球菌病诊治进展[J].中华医学杂志,2020,100(4):317-320.
[7]Liu K,Ding H,Xu B,et al.Clinical analysis of non-AIDS patients pathologically diagnosed with pulmonary cryptococcosis [J]. Journal of Thoracic Disease,2016,8(10):2813-2821.
[8]Zhou Y,Lin P,Ye J,et al.The performance of serum cryptococcal capsular polysaccharide antigen test, histopathology and culture of the lung tissue for diagnosis of pulmonary cryptococcosis in patients without HIV infection [J]. Infect Drug Resist,2018,11:2483-2490.
[9]浙江省医学会呼吸病学分会.肺隐球菌病诊治浙江省专家共识[J].中华临床感染病杂志,2017,10(5):6.
[10]甘慧,张冬,文利,等.结节肿块型肺隐球菌病的临床特征及CT表现[J].中华肺部疾病杂志(电子版),2021,14(5):564-568.
[11]毛海霞,韩砆石,杨洋,等.孤立结节型肺隐球菌病与肺癌的CT鉴别诊断[J].中华临床医师杂志(电子版),2014,8(17):3083-3088.
[12]Shi W,Zhou L,Peng X, et al.HIV-infected patients with opportunistic pulmonary infections misdiagnosed as lung cancers: the clinicoradiologic features and initial application of CT radiomics [J]. J Thorac Dis,2019,11(6):2274-2286.