计算机辅助诊断系统和超声医师诊断甲状腺肿瘤的对比分析
2021-09-18苏淇琛叶冯颖苏珊珊林文杰徐晚虹吕国荣
苏淇琛,叶冯颖,苏珊珊,林文杰,徐晚虹,吕国荣,2
(1. 福建医科大学附属第二医院超声医学科,福建 泉州 362000;2. 泉州医学高等专科学校,福建 泉州 362011)
医学人工智能在医学影像、辅助诊断和机器人手术等方面的应用越来越广泛[1-4]。其中智能化的计算机辅助诊断(computer-aided diagnosis,CAD)系统可以辅助医师,提供诊断和治疗建议[5]。目前超声医学CAD较为成熟的是甲状腺结节的诊断,甲状腺CAD系统与超声医师诊断效能的对比是研究的热点,均采用的是总体甲状腺结节的诊断效能对比,未见甲状腺单发结节和多发结节情况下的分类对比研究。本研究旨在探讨CAD系统在甲状腺单发结节和多发结节不同情况下的诊断价值,并与超声医生比较,以期协助超声医师更有效地临床应用CAD系统。
1 资料与方法
1.1研究对象 前瞻性纳入于2020年1月—2020年10月在福建医科大学附属第二医院进行甲状腺超声检查,并行甲状腺手术或结节细针穿刺的患者279例(共515个甲状腺结节),其中女202例,男77例,年龄12~77岁,平均(46.1±12.0)岁;手术治疗结节322个,细针穿刺结节193个;良性结节220个(结节性甲状腺肿148个、甲状腺腺瘤21个、亚急性甲状腺炎1个、桥本甲状腺结节16个、滤泡性结节34个);恶性结节295个(包含甲状腺乳头状癌268个、滤泡癌21个、髓样癌5个、间变性癌1个)。其中甲状腺单结节组115例,多结节组164例。病例纳入标准:①甲状腺结节性质经超声引导下细针穿刺活检或手术病理的证实;②甲状腺双侧叶结节数量≤5个;③结节超声图像标准清晰;④结节图像需以高清格式保存在超声设备上;⑤结节图像为灰阶图,无影响图像识别的测量痕迹。排除标准:①结节无明确病理结果者;②结节图像不够清晰。本研究由我院医学伦理委员会批准备案,所有患者均知情同意。
1.2仪器与方法
1.2.1仪器 所用超声仪器包括:DC-8、Resona 8(迈瑞,中国);LogicE9、Voluson E10、Voluson E8(通用电气,美国); HI Vision Preiru(日立,日本);Aixlorer(声科,法国)。采用7.5~12兆赫高频线阵探头进行甲状腺扫查。使用的CAD软件为台湾安克生医公司研发的安克侦(AmCAD-UTDetection),该软件已获得美国食品药品监管总局、中国食品药品监管总局批准。
1.2.2超声图像采集方法 图像采集由2位具有15~20年临床经验的超声医师完成,均具有高级职称。先进行CAD软件的应用培训,每个甲状腺结节至少采集3张规范的图像,包括最大径线切面和具有特征性的切面。并将病例分为甲状腺多结节病例组和单结节病例组。
1.2.3CAD图像分析 将图像导入CAD软件,软件可自动勾勒结节边界,形成感兴趣区域(ROI)并分析其超声特征,包括结节的大小、回声、形态、边缘、纵横比、内部成分等。根据这些特征,CAD得出检测报告(见图1)。
注:A:CAD软件自动勾勒出结节边界;B:CAD软件对结节的大小、边缘、形态、纵横比进行分析;C:CAD软件对结节的回声、内部成分进行分析;D:CAD软件给出检测报告。
1.2.4超声医师图像分析 选取3位分别有5年、15年和30年超声诊断经验医师(以下分别称为初级、中级和高级医师),根据1.2.2所采集的结节图像独立分析,得出良恶性的判断。3位超声医师对病例的临床信息不知情。
1.2.5诊断效能的分析比较 分析比较CAD和各级医师对于甲状腺多结节病例组和单结节病例组的诊断效能。
1.3统计学方法 应用MedCalc 15.2.2统计软件,以病理结果为金标准,绘制受试者工作特征(ROC)曲线,计算曲线下面积(AUC)。分别计算CAD和3位超声医师的AUC、敏感性、特异性、阳性预测值(PPV)和阴性预测值(NPV)。组间敏感度、特异度的比较采用McNemar’s 检验。组间AUC 比较采用DeLong 检验。P<0.05为差异有统计学意义。
2 结果
以甲状腺手术或结节细针穿刺的病理结果为标准,比较CAD和各级超声医师对甲状腺结节良恶性的诊断效能,其中CAD组诊断出单结节85例,多结节104例;初级医师组诊断出单结节88例,多结节122例;中级医师组诊断出单结节98例,多结节139例;高级医师组诊断出单结节104例,多结节145例;分别计算其敏感性、特异性、PPV、NPV和AUC,见表1。
超声医师和CAD之间诊断效果的比较见表1和图2。
表1 CAD和各级超声医师对甲状腺结节的诊断效能对比
图2 CAD和各级超声医师的诊断敏感性、特异性ROC曲线对比
CAD诊断甲状腺单结节病例的敏感性与高级超声医师相当(88.52%vs. 89.41%,P>0.05),优于初级或中级超声科医师(88.52% vs. 73.42%,88.52% vs. 83.22%,P均<0.05)。CAD诊断甲状腺多结节病例的敏感性与中级超声医师相当(81.61% vs. 82.39%,P>0.05),优于初级超声医师(81.61% vs. 71.68%,P<0.05),但低于高级超声科医师(81.61% vs. 88.53%,P<0.05)。两组CAD的AUC与初级超声科医生相当,小于高级或中级超声科医师。但特异度均低于3位超声医师(P均<0.05)。CAD对于甲状腺单结节病例组和多结节病例组的诊断指标(敏感性、特异性、PPV、NPV、AUC)有差异(P均<0.05),单结节病例组的诊断效能优于多结节病例组。3位超声医师自身对比,诊断甲状腺单结节病例和多结节病例的诊断指标(敏感性、特异性、PPV、NPV、AUC)均无差异(P均>0.05)。
3 讨论
随着医学水平的进步和健康意识的提高,甲状腺结节的检出率逐渐提高。超声是甲状腺结节最常用的检查手段[6]。据以往学者的研究报道,AmCADUT软件对于甲状腺结节的良恶性分类具有良好的诊断效果[7-8],但均无细分单结节病例和多结节病例的情况。本研究结果表明,CAD软件对单结节病例的诊断效能要明显优于多结节病例。其主要原因分析如下:①多发结节病例,相邻结节的边缘区域会在图像上产生相互干扰影响,这对于执行特征识别的CAD软件来说,可能会造成不同程度的误判、错判。②对于质地较软的结节,可能存在结节间的相互挤压而变形,而目前的CAD无法对结节的硬度进行判别,可能导致对结节形态的误判而误诊。③多发结节甲状腺病例多合并有弥漫性的甲状腺回声的改变,这可引起甲状腺背景回声的改变,可能会影响CAD对于结节整体回声的判定。
本研究对于不同水平的超声科医生诊断效能进行比较,发现与医师的专业水平呈正相关,但与CAD组的不同之处在于对医师来说,不论是单结节病例或多结节病例,其诊断指标(敏感性、特异性、PPV、NPV、AUC)均无明显的自身差异,也就是说单结节和多结节对于同一医师来说并不会引起诊断效能上的差异,而CAD却表现出了明显的差异。
通过比较CAD软件与超声医师的诊断效能,发现高级超声医师的绩效指标(敏感性、特异性、AUC、PPV、NPV)最好,其次是中级超声医师和初级超声医师。绩效指标的差异主要是由于经验的影响,这与先前研究的结论一致[9-11]。CAD的诊断敏感性也很高,甚至可以与高级超声科医生相媲美。因此,它可以用于大规模癌症筛查以提高效率,但由于其相对较低的特异性,特别是对于多结节的情况下,应避免给患者造成不必要的活检或手术。以往的研究表明,人工智能辅助诊断可以减轻医生的工作量,有助于向需要帮助的患者提供高质量的医疗服务[12-13]。因此,在临床实践中,当试图提高诊断效率时,可以使用CAD辅助,但超声医师的人工审核至关重要。
本研究有局限性,首先,本研究的恶性结节多为乳头状癌。滤泡癌、髓样癌和间变性癌的超声特征不同于乳头状癌[14-15]。因此,AmCAD-UT对这三种病理类型的诊断效果有待进一步研究。其次,FNA细胞学结果可能包括假阴性结果,可能会影响结果的准确性。总之,计算机辅助诊断具有良好的临床应用价值,但也应该认识到这种技术还存在许多不足。目前诊断特异度仍较低,特别是对于甲状腺多发结节的病例更应慎重应用,临床应用上超声医师的人工审核至关重要。