CT 重建层厚对人工智能辅助诊断系统肺炎检测效应的影响
2021-05-01张梦琦何新华胡永胜王自勇
黄 杨,张梦琦,何新华,胡永胜,王自勇
(合肥市第一人民集团医院<合肥市滨湖医院>CT 室 安徽 合肥 230000)
肺炎是临床上最常见的一种呼吸系统疾病,其发病一般较为急骤,且与其他肺部疾病临床症状较为相似,单纯内科体格检查较难直观地确诊。肺部CT 诊断技术对肺炎敏感度、特异性高,可以准确、有效、快速地诊断肺炎,从而给临床提供治疗依据,但CT 诊断受阅片者经验及主观性影响较大,尤其是较小病灶易发生漏诊等情况。近年来随着人工智能(artificial intelligence, AI)的发展,医学领域的人工智能研究亦进展迅速[1],其中医学影像人工智能在肺结节、甲状腺结节、糖尿病视网膜病变等疾病的筛查、定位、分析等方面,取得了重要进展[2]。我院在与安徽省科大讯飞医疗信息技术有限公司的深入合作中,将人工智能影像辅助诊断系统用于肺炎的筛查及诊断,本研究通过探讨不同重建层厚对人工智能辅助诊断系统在肺炎检测效应的影响,为标准化数据收集提供依据。
1 材料及方法
1.1 研究对象
收集合肥市滨湖医院2020 年1 月—3 月进行肺部CT扫描患者240 例,分为三组,每组80 例。其中男142 例,女98 例,年龄13 ~91 岁,平均年龄(50.17±19.31)岁。纳入标准:①临床纳入肺炎筛查患者;②无肺部先天性疾病;③肺部扫描数据完整;④图像无严重伪影。
1.2 仪器与方法
所有患者均接受多层螺旋CT 扫描(SIMENS SOMATOM Definition 和SIMENS Emotion),开展肺炎人工智能诊断,数据源要求依据相关指南、共识[3]。扫描参数:管电压100 ~120 kV,管电流30 ~50 mAs,开启管电流自动调制技术,螺距≤1,均采用lung 70 s 卷积核算法重建肺部1 mm、2 mm、5 mm 的肺部图像,无间隔重建。(窗宽1500 HU、窗位-450 HU)。
使用安徽科大讯飞医疗信息技术有限公司研发的人工智能影像辅助诊断系统肺炎筛查功能对240 例胸部CT检查影像资料进行检测,当系统检测到肺炎病灶时为阳性病例,反之为阴性病例。同时由2 名胸部组放射科医师及1 名高年资主任医师对图像进行阅片、分析,达成一致意见,对肺炎病灶进行确认,并以此诊断结果作为“金标准”,计算人工智能影像辅助诊断系统在三组不同CT重建层厚的病例资料中,检测肺炎的灵敏度、特异度、误诊率、漏诊率、阳性预测值、阴性预测值、以及单个病灶的正确率。
1.3 统计学方法
采用SPSS 21.0 统计软件进行统计学分析。计量资料以均数±标准差(±s)表示,采用χ2检验,采用配对计数资料的χ2检验和K 系数检验,计数资料以相对数构成比(%)表示,以P<0.05 为差异有统计学意义,K 系数检验中K ≥0.7,表示吻合度较强;0.7 >K ≥0.4 表示吻合度一般;K <0.4,表示吻合度较弱。
2 结果
2.1 在三种不同层厚下,AI 影像辅助诊断系统与诊断医师诊断结果的比较(见表1)。在层厚为1 mm 时,其诊断正确率为0.95,明显高于另外两组。McNemar 检验中AI系统与诊断医师诊断结果无显著差异(P>0.05)。K=0.867,两种诊断结果吻合度较强有统计学意义(P<0.05)。在层厚为1.5 mm 时,其诊断正确率为0.83,介于1.0 mm 组及5.0 mm 组之间。McNemar 检验结果显示AI系统与诊断医师诊断结果差异有统计学意义(P<0.05)。K=0.576,两种诊断方法吻合度一般有统计学意义(P<0.05)。在层厚为5 mm 时,其诊断正确率为0.81,明显低于另外两组。McNemar 检验结果显示差异有统计学意义(P<0.05)。K=0.333,(P<0.05),说明两种诊断方法吻合度较弱,有统计学意义(P<0.05),见表2。
2.2 人工智能影像辅助诊断病灶的基本情况中,A、B、C 三组检出总病灶数分别为(293,427,490)个,阳性病灶数分别为(175,232,201)个,误诊病灶数分别为(118,195,289)个,漏诊病灶为(5,40,30)个。A组的检出率高于B, C 组。组间比较差异均有统计学差异(χ2=31.69,P均<0.05),见表1。
表1 三种层厚AI 影像辅助诊断系统诊断结果的比较
表2 三种层厚AI 影像辅助诊断系统肺炎病灶检出效能
3 讨论
在过往研究中,Ather 等[4]通过总结全球近年来放射学在肺结节中的相关应用现状,明确了人工智能对肺部疾病影像诊断的重要作用,人工智能对肺结节检测效能敏感性高已经得到论证。而在人工智能肺结节辅助诊断系统研究中大部分使用不同的软件、扫描条件及后处理,鉴于国内外医学影像AI 辅助诊断领域缺乏明确规范的质量控制标准,金晨望[5]等在智能辅助诊断技术在低剂量CT 肺结节筛查中应用及质控中提到了数据统一,扫描参数的重要性,而针对CT 扫描参数特别是重建层厚对人工智能在肺炎检测中的影响未见相关报道。值此新型冠状病毒肺炎防控之际,为进一步完善新冠肺炎综合防控医疗工作,人工智能影像辅助诊断系统肺炎筛查功能的诊断应用逐渐凸显。本研究旨在探讨CT 参数中不同重建层厚对其效能的影响以及对肺炎的识别及检出的价值。
图像重建层厚的大小可以决定图像的质量,进而决定肺内组织的显示及肺部病变的表征能力。本研究中人工智能辅助诊断系统对三组重建层厚识别的灵敏度高,1 mm 重建层厚的灵敏度及特异度均高于2 mm 和5 mm。理论上螺旋CT 重建层厚越大会相应增加容积效应,降低图像质量并产生伪影,本研究中三组图像均有容积效应导致的误诊。其中5 mm 最明显,病灶误诊率达到58%。分析发现,容积效应导致的血管迂曲增粗、支气管扩张合并管壁增厚为误诊主要原因。
本研究表明,1 mm 的重建层厚综合效能相对较优。基于人工智能识别机制,肺部CT 影像输入人工智能辅助诊断系统进行分析,进行病灶检出与识别,以及病灶分割。病灶识别分割后进行体积测量、密度及属性分析。对可疑病变区域进行量化分析以判别其性质,这要求薄层重建采集容积CT 数据信息,系统检测到更准确适合于肺炎参数量化的信息,此时体现了薄层数据的重要性。有研究[6]提示CT 层厚越小越有利于人工智能系统识别病灶,推荐层厚在1.25 mm,本研究进一步得到了验证。
在CT 扫描工作中,重建间隔越小所需要的时间越长.相应的,人工智能影像辅助诊断系统识别病灶所需运算量也将大符加大,所需时间也将相应延长,这对系统本身和计算机的性能都提出更高的要求,随着临床应用数据量的日益扩大,在重建层厚的算法优化和计算机算法的改善上人工智能将进行不断的改进和升级[7]。
然而本研究仍存在一定局限性,因样本量较小未能完全克服不同类别的样本量不均衡问题,今后将通过扩大样本量及细化分析通过深度学习,进一步利用人工智能技术提升在诊断肺炎中的价值。
综上所述,人工智能影像辅助诊断系统对肺炎识别诊断的效能跟重建层厚关系密切,CT 重建层厚在1 mm 时更有利于人工智能辅助诊断系统识别出肺炎,从而减轻医师的工作负担、降低漏诊风险,逐步体现出自身的价值和优越性。