不同阅片者对肺亚实性结节临床处理一致性的影响
2018-06-13李焕国崔凤杨勇瞿华钟琦邱焕杜亮
李焕国 崔凤 杨勇 瞿华 钟琦 邱焕 杜亮
随着低剂量CT(low dose computed tomographic,LDCT)在胸部检查中的广泛应用,肺结节的检出率日益增加。根据CT图像上肺结节的不同表现分为实性结节和亚实性。目前针对肺结节的管理已有多个指南[1-4],均是通过肺结节在CT图像上的形态学特点进行良恶性的评估以及管理,而目前对于肺结节的形态学评价主要依靠放射科诊断医生的主观判断。多项研究发现,不同阅片者对于实性结节的评估具有较高的一致性,而对于亚实性结节的分类及临床处理策略存在较大差异[5-6]。在这些研究中,阅片者来自不同的工作地点,且为10年以上(10~30年)高年资医生,并未分析10年以下以及不同工作场所对结节分类及管理的影响情况。因此本研究通过不同医院的不同级别放射诊断医生对同一组亚实性结节进行评估,以进一步分析影响阅片者间一致性的因素。
1 资料和方法
1.1 一般资料 回顾2016年1月至2017年1月在我院确诊为腺癌的亚实性肺结节患者49例,共49个结节,年龄 38~86(55.57±11.67)岁,其中男 14 例,年龄40~86(55.93±12.09)岁,女 35 例,年龄 38~74(55.63±11.16)岁。
1.2 检查方法 检测前去除患者身上金属物品,防止金属伪影,并指导患者屏气训练。采用Philips 256iCT、SIEMENS 16 排 CT(SOMATOM Perspective)进行肺部扫描,扫描范围从肺尖到肺底。扫描参数:(1)Philips 256iCT:机架转速0.27s/r,探测器128×0.625mm,管电压120kV,自动管电流,层厚5mm,螺距1.0,重建层厚1.5mm,重建层间距 1.5mm,肺窗窗宽 1 500,窗位-549;(2)SIEMENS 16 排 CT:机架转速 0.35s/r,探测器 16×0.75mm,管电压120kV,自动管电流,层厚5mm,螺距1.0,重建层厚1.5mm,重建层间距1.5mm,肺窗窗宽1 500,窗位-549;扫描矩阵 512×512。
1.3 图像分析与处理 将所选取的患者进行随机编号,将层厚为1.5mm的肺窗影像(DICOM格式)导入相应的编号内,在新的编号中滤掉患者的所有个人信息以及原有的报告,所有图像均可以调节窗宽窗位。共有3家医院8位阅片者,包括A单位6位(高级职称A1、A2,分别为 20 年、16 年工作经验;中级职称:A3、A4,均为9年工作经验;初级职称:A5、A6,5年、3年工作经验各1位)、B与C单位各1位(工作经验为10年,记为B1、C1)。所有阅片者需要完成的内容包括:判断结节的类型(实性、部分实性、纯磨玻璃)、测量大小[大小=(长径+短径)/2,包括整个结节的大小、部分实性结节的实性部分大小,精确到mm],所有阅片者独立完成阅片,并在1个月后再次进行阅片,并记录上述内容。
亚实性结节的定义:是指不能完全掩盖其内走行的血管、支气管影的直径介于0.3~3.0cm的圆形或不规则形状密度影,包括纯磨玻璃密度结节和部分实性结节[7]。
依据影像学结果,结节的下一步临床处理分为2种:CT随访(纯磨玻璃影结节、实性成分<5mm的亚实性结节及≤8mm的实性结节)和临床干预(实性成分≥5mm的亚实性结节,>8mm的实性结节)[6]。阅片者中至少有一位与其它阅片者意见不一样,即为分歧结节。
1.4 统计学处理 采用R统计软件的Kappa检验,其中Multirater Fleiss Kappa检验用于分析阅片者之间的一致性,Cohen Kappa检验用于分析阅片者自身的一致性,并计算95%可信区间(95%CI),阅片者之间的一致性均采用第一次阅片结果进行比较分析;一致性评价原则:差(Kappa≤0.20),一般(Kappa=0.21~0.40),中度(Kappa=0.41~0.60),好(Kappa=0.61~0.80),非常好(Kappa=0.81~1.00)。采用SPSS 17.0统计软件,计数资料两组非参数配对检验采用Wilcoxon秩检验,多组非参数配对检验采用Friedman检验。
2 结果
2.1 不同阅片者内部对肺结节临床处理方法的一致性比较 阅片者A5的内部一致性最低,属于一般,其次为阅片者A2,一致性为中等,其余阅片者均为好,详见表1。
2.2 不同阅片者之间对肺结节临床处理方法的一致性比较 A单位高级、中级、初级职称阅片者间的一致性逐渐降低,其中高级职称、中级职称组间的临床处理方法均无统计学差异(均P>0.05),而初级职称组间的临床处理方法有统计学差异(P<0.05);因A5阅片者的内部一致性一般,故在评价A单位所有阅片者之间的一致性时未参与,其余A1~4、A6间的临床处理方法均有统计学差异(均P<0.05);ABC 3个单位同年资阅片者间均为中等,临床处理方法有统计学差异(P<0.05),详见表2。
表1 不同阅片者内部对肺结节临床处理方法的一致性比较
表2 不同阅片者间对肺结节临床处理方法的一致性比较
2.3 不同阅片者内部对肺结节分类的一致性比较 8位阅片者对49个肺结节的分类结果中,仅1位阅片者A5的内部一致性为一般,其余7位阅片者的内部一致性为好,详见表3。
表3 不同阅片者内部对肺结节分类的一致性比较
2.4 不同阅片者之间对肺结节分类的一致性比较 A单位高级、中级职称各组间的结节分类均无统计学差异(P>0.05),初级职称者间的结节分类有统计学差异(P<0.05);去除阅片者A5的其余5位阅片者的一致性为中等,该5位阅片者的结节分类一致性有统计学差异(P<0.05),而前 4位(A1~4)阅片者的结节分类无统计学差异(P>0.05),这是因为A1与A6、A4与 A6间的结节分类均有统计学差异(均P<0.05);3个单位间的一致性为中度,其结节分类有统计学差异(P<0.05),详见表4。
表4 不同阅片者间对肺结节分类的一致性比较。
2.5 临床处理方法出现分歧结节的比较分析 通过对阅片者在临床处理方法出现分歧结节进行分析发现,同一单位不同年资阅片者间、不同单位的同年资阅片者间出现分歧的结节分类均为部分实性结节患者,不同的是前者对分歧结节的分类一致性较好,后者对分歧结节的分类一致性较差,通过对部分实性结节的大小分析,对于实性大小的测量两者的一致性均较差。在A单位相同年资的分歧结节均为部分实性结节,对于实性部分的大小,两位阅片者一致性较差,详见表5。
3 讨论
随着LDCT检查的广泛应用,肺结节的检出率日益增加,但对肺结节的管理在不同诊断医生间存在差异。通过对不同阅片者的结果分析,49例结节的临床处理的内部一致性及不同阅片者间的一致性存在一定差异,所有阅片者的内部一致性为0.385~0.791,A单位的阅片者 A1~4、A6 间的一致性为 0.492(95%CI:0.404~0.580),临床处理方法有统计学差异(均P<0.05);但进一步分析发现,9年以上工作经验的阅片者(A1~4)间的临床处理方法无统计学差异(P>0.05);不同单位间同年资阅片者间有30.61%(15/49例)的分歧结节,其一致性属于为中等(Kappa=0.5,95%CI:0.338~0.662),临床处理方法有统计学差异(P<0.05)。本研究临床处理由结节的分类和部分实性结节的实性成分的大小两方面决定。通过临床处理方法出现分歧的结节研究发现,不同阅片者间出现分歧的原因也存在差异,同单位不同年资阅片者间、同单位同年资阅片者间主要是部分实性结节的实性部分大小的测量为造成分歧的主要原因(Kappa=0.091,95%CI:-0.088~0.270),而不同单位相同年资间结节的分类、实性部分的测量一致性较差(Kappa=0.171,95%CI:-0.131 ~0.473;Kappa=-0.335,95%CI:-0.677~0.007)。
表5 临床处理方法出现分歧结节的比较分析
对于结节的分类,不同阅片者间的一致性存在差异。研究发现,同单位8位阅片者在结节分类中一致性为 0.392~0.804(95%CI:0.540~0.721),其中 1 位阅片者的内部一致性为一般,其余的内部一致性为好;A单位的所有阅片者的一致性位于中等(Kappa=0.539,95%CI:0.556~0.722),这与 Ridge等[5]研究结果大致相同,为中等,这5位同单位不同年资阅片者对于结节的分类仍存在差异(χ2=10.95,P=0.009),造成差异可能的主要原因:(1)目前对于亚实性结节定义缺乏客观的量化参考[5],本研究将穿行其内的血管、支气管作为对比,若能观察到这些结构就定义为亚实性,但位于肺野外带肺纹理较中内带稀疏、纤细,所以同样的结节位于不同的肺野时,可能会出现不同分类结果;(2)低年资可能对结节的分类可能不够准确。本组研究中,A单位5位阅片者的分类结果存在统计学差异,其原因是低年资阅片者A6与A1、A4 2位相对高年资阅片者间存在差异,而A1~4 4位9年以上工作经验阅片者间无统计学差异;(3)不同工作单位也可能会影响结节的分类。在本研究中,A单位中同年资的阅片者A3与A4间的一致性非常好,为0.676(95%CI:0.404~0.984),对结节的分类结果无统计学差异(Z=-1.414,P=0.157),而不同单位同年资阅片者间的一致性仅为中度水平,对结节的分类结果也存在差异(χ2=16.000,P=0.000),这可能与不同单位间平时诊断工作中采用的诊断标准存在差异有关;尽管我们统一制定了诊断标准,但由于诊断标准自身的缺陷及阅片者长时间养成的诊断习惯,最终造成差异。此外,结节周围正常肺组织的模糊度也可能会影响结节的分类[2,7]。
对结节临床处理出现分歧的病例分析发现,该类结节主要是部分实性结节,无论是阅片者内部还是不同阅片者间,尤其是同单位同年资阅片者均为部分实性结节,尽管结节的分类相同,但是临床处理方法却不同,这是因为部分实性大小的测量出现差异(Kappa<0.2),而造成测量差异的主要原因可能是目前对于显示部分实性结节的窗宽窗位没有达成共识,Fleischner学会建议在纵隔窗对部分实性结节进行分析测量[6],但是纵隔窗常规的设为400/40(窗宽/窗位),只有当实性部分的CT值超过-160Hu时才会显示,而在一项研究中发现浸润性成份的CT值大部分介于-261~-160 Hu[8]。Schohen等[9]与顾亚峰等[10]的分别应用结节分析软件对部分实性结节进行分析发现,-300Hu为显示与测量实性部分的最佳阈值。在本研究中部分实性结节的分析测量是在肺窗上进行的,并且阅片者可以根据自己的需要调节窗宽窗位,这可能是造成临床处理方法差异的主要原因。其次部分结节的实性成分形态不规则,会对测量造成了一定地影响。
本研究存在局限性。第一,本研究样本较小且仅对亚实性结节进行了分析,可能会对结果造成偏倚。第二,本研究均采用低剂量扫描,这可能使得影像噪声增加,信噪比降低,最终图像质量下降,对结节的分析造成影响;第三,本研究并没有与病理结果进行对比分析,仅对影响阅片者的诊断一致性的因素进行了分析;第四,本研究没有考虑其它因素对结节临床处理方法的影响。
综上所述,肺结节的临床处理方法、分类以及实性成分的测量在不同阅片者间存在一定的差异,年资、工作单位都可能会影响肺结节的分类、测量以及临床处理策略,如何尽可能的消除阅片者的主观因素的干扰,依然是当前的一个难题,需要进一步的研究探讨。
4 参考文献
[1]Bankier AA,MacMahon H,Goo JM,et al.Recommendations for Measuring Pulmonary Nodules at CT:A Statement from the Fleischner Society[J].Radiology,2017,285(2):584-600.doi:10.1148/radiol.2017162894.
[2]Naidich DP,Bankier AA,MacMahon H,et al.Recommendations for the Management of Subsolid Pulmonary Nodules Detected at CT:AStatement from the Fleischner Society[J].Radiology,2013,266(1):304-317.doi:10.1148/radiol.12120628.
[3]Manos D,Seely JM,Taylor J,et al.The Lung Reporting and Data System(LU-RADS):a proposal for computed tomography screening[J].Canadian Association of Radiologists journal,2014,65(2):121-134.doi:10.1016/j.carj.2014.03.004.
[4]Lung-RADS Assessment Categories.Version 1.0.American College ofRadiology.Lung CTScreening Reporting and Data System(Lung-RADS)Web site.http://www.acr.org/Quality-Safety/Resources/LungRADS.Published April28,2014.Accessed September 15,2014.
[5]Ridge CA,Yildirim A,Boiselle PM,et al.Differentiating between Subsolid and Solid Pulmonary Nodules at CT:Inter-and Intraobserver Agreement between Experienced Thoracic Radiologists[J].Radiology,2016,278(3):888-896.doi:10.1148/radiol.2015150714.
[6]van RielSJ,Sánchez CI,Bankier AA,et al.Observer Variability for Classification of Pulmonary Nodules on Low-Dose CT Images and Its Effect on Nodule Management[J].Radiology,2015,277(3):863-71.doi:10.1148/radiol.2015142700.
[7]Hansell DM,Bankier AA,MacMahon H,et al.Fleischner Society:glossary of terms for thoracic imaging.Radiology,2008,246(3):697-722.doi:10.1148/radiol.2462070712.
[8]Lee KH,Goo JM,Park SJ,et al.Correlationbetween the size of the solid component onthin-section CT and the invasive componenton pathology in small lung adenocarcinomasmanifesting as ground-glass nodules[J].J ThoracOncol,2014,9(1):74-82.doi:10.1097/JTO.0000000000000019.
[9]Schohen ET,Jacobs C,van Ginneken B,et al.Detection andquantification of the solid component in pulmonary subsolidnodules by semiautomatic segmentation[J].Eur Radiol,2015,25(2):488-496.doi:10.1007/s00330-014-3427-z.
[10]顾亚峰,李琼,范丽,等.不同窗宽窗位下肺亚实性结节及其实性成分大小对病理等级的预测价值[J].中华放射学杂志,2017,51(7):484-488.doi:10.3760/cma.j.issn.1005-1201.2017.07.002.