深度学习迭代重建算法优化儿童头颅CT 图像噪声和图像纹理的可行性
2024-03-12田宏伟彭芸刘道永李昊岩刘勇洪天予孙记航
田宏伟,彭芸,刘道永,李昊岩,刘勇,洪天予,孙记航
首都医科大学附属北京儿童医院影像中心,北京 100045;
CT扫描快速快、噪声低,便于放置抢救设备,是急诊常用的检查方法。儿童急诊颅脑疾病的病因与成人不同,主要为头颅外伤而非脑卒中。由于头颅CT检查可同时、完整显示颅内脑组织、颅骨及相邻软组织病变,一次检查可以判断有无颅内出血、颅骨骨折,已成为儿科急诊筛查颅脑外伤常用的检查方法[1-2]。CT使用的X射线会对人体造成辐射损伤,眼球邻近颅脑,X射线的电离辐射效应可使眼球晶状体变性浑浊,最终影响视力。根据尽可能低剂量原则[3],在保证图像质量符合诊断要求的前提下,需要尽可能降低头颅CT检查的辐射剂量,通过严格限制儿童头颅CT适应证以降低检查数量[4],或改良头颅CT扫描方案[5],减少儿童的辐射损伤,提升生命质量。虽然应用迭代重建(iterative reconstruction,IR)算法可以在降低辐射剂量的前提下保证图像质量[6],但由于其自身的限制,高权重IR图像会改变图像纹理,产生边缘模糊伪影,降低病变的检出率。通常IR算法仅能使用50%~70%的权重,限制其降低噪声的效率。深度学习迭代重建(deep learning iterative reconstruction,DLIR)算法较IR算法能够更明显地降低图像噪声[7-9],并且不会产生IR模糊伪影,可以进一步降低辐射剂量[10]。因此,本研究通过观察一组儿童急诊头颅外伤CT,研究DLIR算法相比常规的自适应迭代重建(adaptive statistical iterative reconstruction-veo,ASIR-V)算法能否降低图像噪声并改善图像质量,使进一步降低儿童头颅外伤CT辐射剂量成为可能。
1 资料与方法
1.1 研究对象 回顾性连续收集2020年12月7—11日因颅脑外伤行急诊头颅CT检查的患儿80例,男50例,女30例,年龄0.4~14.0岁,平均(4.9±3.1)岁,扫描电流(172.6±15.4)mA,容积CT剂量指数(19.5±3.1)mGy,剂量长度乘积(287.4±58.6)mGy·cm。纳入标准:①有24 h内的明确或可疑头颅外伤史;②年龄<18岁。排除标准:因患儿镇静不良导致图像出现严重运动伪影,影响诊断结果。本研究经本院伦理委员会批准(BCH2019-46),豁免患儿知情同意。
1.2 仪器与方法 使用GE 256排CT,固定管电压120 kVp,16 cm宽体探测器一次轴扫完成扫描,转速0.8 s,固定管电流,根据患儿年龄采用150~210 mA进行扫描。所有扫描均在患儿安静状态下进行,哭闹不配合者给予10%水合氯醛0.4 ml/kg,待其安静熟睡后进行扫描。
1.3 图像重建 将得到的原始数据重建为层厚5 mm、层间距5 mm的标准窗图像、骨窗图像,层厚0.625 mm、层间距0.625 mm的标准窗图像、骨窗图像,每组图像包括50% ASIR-V及高权重DLIR图像(DL-H)2种重建方法,共8组图像。所有图像采用标准核心算法,不采用图像增强。
1.4 主观评价 所有图像传输至GE AW4.7工作站,遮蔽所有患儿信息及扫描信息,采用固定窗宽窗位(标准窗:窗宽100,窗位30;骨窗:窗宽4 000,窗位700)进行观察,除0.625 mm骨窗图像可以附加使用三维后处理工具外,其他图像仅使用轴位扫描进行观察。
根据Zhu等[11]研究的头颅CT主观评价方法体系并结合本组病例特点,最终确定由2名分别有16、7年儿科影像诊断经验的副主任、主治医师采用4分制共同对图像质量做出主观评价,2分为合格,4分为最好。主观评分具体标准:①脑沟脑室的显示能力:可清晰分辨为4分;可分辨并准确测量为3分;可分辨,不能保证准确测量为2分;无法分辨为1分。②脑实质显示能力:可清晰显示脑实质、病变并区分灰白质为4分;显示较清晰,可测量病变大小、脑灰质/白质厚度为3分;可大致明确病变、灰质/白质位置,不能准确测量为2分;脑实质及病变分界不清为1分。③骨质显示能力:清晰显示骨质及骨折线为4分;可显示骨折线并可测量长度为3分;可发现骨折线,不能准确判断长度为2分;无法清晰显示骨折线为1分。同时统计各个图像发现的病灶数量,包括出血病变、脑软化、颅内积气、脑疝、骨折及头皮软组织肿胀等。
完成主观评价后,2名医师共同在AW工作站上进行客观测量,在每份病例的基底节层面,放置面积为15.2 mm2的感兴趣区,灰质选取右侧外囊中央均匀部分,白质选择同层面右侧额叶白质均匀部分,得到的测量值即为灰质及白质的CT值及噪声(SD)值,通过CT值及SD值计算图像的对比噪声比(CNR):CNR=(CT灰质-CT白质)/[1/2×(SD灰质+SD白质)]。测量完毕后,导出该层面DICOM图像,进行模糊度量指数(blur metric index,BMI)测定[12]。BMI通过比较原始图像和低通滤波图像相邻像素间的强度变化量化图像纹理的清晰度,值为0~1,较低表示图像清晰度良好,较高表示图像模糊,为了便于统计,将结果扩大100倍作为BMI。
1.5 统计学方法 使用SPSS 17.0软件。符合正态分布的计量资料以±s表示,利用配对t检验进行分析;不符合正态分布的资料使用Wilcoxon配对法检验,比较两种重建方法5 mm、0.625 mm层厚标准窗图像、骨窗图像的差别,并利用Pearson相关分析检验5 mm的50% ASIR-V与0.625 mm的DL-H图像主观评分及客观测量结果的相关性。P<0.05为差异有统计学意义。
2 结果
2.1 主观评分 在5 mm和0.625 mm图像上,与50%ASIR-V相比,DL-H均可以提升脑沟脑室显示能力、脑实质显示能力(P均<0.05),见表1。5 mm的50% ASIR-V与0.625 mm的DL-H图像脑沟脑室显示能力、脑实质显示能力差异无统计学意义(P=0.32、0.05),且相关性好(r=0.2~0.9,P均<0.05)。在骨质显示能力方面,5 mm、0.625 mm的50% ASIR-V、DL-H图像均可以达到满分4.0分。5 mm的50% ASIR-V与DL-H图像均可在80例患者中发现共35处病变,包括出血病变12处,颅内积气1处,骨折9处,头皮软组织肿胀13处,未发现脑软化、脑疝,0.625 mm薄层图像与5 mm图像比较,发现病变数量相同(图1)。
图1 男,2岁,头颅外伤,CT明确颅脑损伤情况。A、B为5 mm的50% ASIR-V、DL-H图像;C、D为0.625 mm的50% ASIR-V、DL-H图像;E、F为50% ASIR-V、DL-H的3D重建图像;G、H为50% ASIR-V、DL-H的5 mm骨窗图像;左侧枕部可见硬膜外出血(箭头,D),在0.625 mm薄层图像可清晰显示病变位置和范围,但由于C图病灶边缘模糊,影响厚度测量的准确度;由于层厚较大,A、B图均不能满意显示,需结合其他层面图像才能确定病灶的存在;DL-H图像质量最能满足诊断要求,可以同时清晰显示灰白质分界(箭,D),图像质量与A相近;50% ASIR-V和DL-H图像均可显示骨折情况(箭,F、G),不受层厚和图像重建方式影响
表1 不同图像重建方法图像主观评分比较
2.2 客观评分 5 mm图像两种重建方法灰质CT值差异约0.8%,差异有统计学意义(P<0.05),其余两种重建方法的CT值差异无统计学意义(P=0.05~0.54)。DL-H图像SD值低于50% ASIR-V图像,CNR高于50%ASIR-V图像(P均<0.05),见表2。5 mm的50% ASIR-V与0.625 mm的DL-H比较,灰质CT值增高约4.0%(P<0.05),其余指标差异无统计学意义(P=0.05~0.90)。各项指标相关性好(r=0.5~0.9,P均<0.05)。BMI结果显示DL-H图像优于50% ASIR-V图像,5 mm的50%ASIR-V与0.625 mm的BMI差异无统计学意义(t=2.6,P=0.28)。
表2 不同图像重建方法图像客观评价指标比较(±s)
表2 不同图像重建方法图像客观评价指标比较(±s)
注:ASIR-V:自适应迭代重建;DL-H:高权重深度学习;SD:图像噪声;CNR:对比噪声比;BMI:模糊度量指数;*为层厚、层间距5 mm的50% ASIR-V与0.625 mm的DL-H比较
指标层厚、层间距5 mm 层厚、层间距0.625 mm t值*P值*50% ASIR-V DL-H t值P值50% ASIR-V DL-H t值P值灰质CT值(Hu) 32.17±2.44 31.91±2.43 5.5 <0.0532.08±2.80 32.03±2.63 0.6 0.54 1.6 0.03灰质SD值3.24±0.86 2.20±0.53 21.4<0.05 5.74±1.16 3.33±0.71 35.7<0.05 2.20.13白质CT值(Hu) 25.08±2.91 25.17±2.80 1.8 0.08 24.97±3.16 25.09±2.92 2.0 0.05 0.1 0.90白质SD值3.11±0.66 1.96±0.36 26.2<0.05 5.54±1.19 3.04±0.62 34.6<0.05 1.7 0.09 CNR 2.34±0.88 3.32±1.11 21.2 <0.051.30±0.58 2.23±0.81 28.6 <0.05 2.0 0.05 BMI 31.50±4.15 29.12±1.99 6.1<0.05 33.16±5.77 31.43±4.10 10.0<0.05 2.6 0.28
3 讨论
CT是儿科常用检查方法[13-14],头颅外伤CT是排除儿童外伤所致的颅骨骨折、颅内出血或脑疝的首选检查方案[2,15]。在使用头颅CT排除病变的同时,减少辐射损伤一直是放射学者关注的问题[16]。使用IR算法可以在满足儿童头颅CT图像诊断要求的前提下,通过降低CT图像噪声降低辐射剂量[17]。但由于IR算法本身的限制,其在高权重状态下会使图像产生模糊伪影,影响诊断准确性,故临床无法使用高权重IR,限制了降低辐射剂量的能力。DLIR目前应用广泛,可以提升图像质量同时消除IR的模糊伪影。为了观察DLIR在儿童颅脑外伤CT中应用的可行性,本研究将一组检查重建为常规的50% ASIR-V图像和先进的DL-H图像[15-16],根据诊断需要重建为5 mm及0.625 mm的脑窗和骨窗图像,观察两种重建方法的差异。
本研究发现使用DLIR重建方法不会改变图像的CT值,虽然5 mm DL-H图像灰质CT值与ASIR-V图像存在显著差异,但数值差异仅为0.8%,考虑为统计学方法限制所致,其余5 mm图像白质CT值及0.625 mm图像的CT值均无显著差异。图像SD方面,DL-H图像降低SD效果较ASIR-V更为明显,5 mmDL-H图像SD值较50% ASIR-V图像降低了32.1%~37.0%,0.625 mm DL-H图像SD值降低了42.0%~45.1%,表明DLIR降低SD的能力是非线性的,在高SD条件下降低SD的能力会得到提升。由于DLIR利用深度学习识别图像正常组织与SD,可以针对性地剔除图像中的SD,在高SD环境下,可以更明显地降低图像SD,在进一步降低SD的同时,并未产生模糊伪影而影响图像显示效果[18-19],未降低主观评分。DLIR的另一个优点是可以在降低SD的同时保持图像纹理,Franck等[20]研究证明IR图像会改变图像纹理使图像出现模糊伪影,不利于病灶识别,图像纹理可以通过噪声频率谱[21]或BMI[12]进行测量评价。本研究使用BMI进行图像纹理观察,发现在5 mm和0.625 mm层厚,DL-H图像的BMI均低于50%ASIR-V图像,表明DLIR图像模糊效应更低,更利于显示细微结构。同时,为了更好地评价DLIR的应用可行性,本研究比较0.625 mm的DL-H图像与5 mm的50% ASIR-V图像,除灰质CT值外,所有指标均无显著差异,两组灰质CT值图像差距仅为0.4%,考虑为统计学限制所致,说明DLIR可以优化高SD的薄层图像,生成符合诊断要求质量的图像。
图像主观质量方面,由于颅骨与软组织对比分界明显,不同重建方法、不同层厚均可清晰显示骨质结构,不会影响骨折的诊断,所有评分均为满分。脑沟脑室与脑实质对比度较大,有助于不同密度组织边缘的识别,所有重建方法均可显示结构轮廓,评分均高于2分;部分0.625 mm的ASIR-V图像由于SD影响造成边缘模糊,不易准确测量,造成评分低于3分;DL-H图像与5 mm的ASIR-V图像均可以测量脑沟脑室的宽度,评分均高于3分。脑实质显示能力方面,部分5 mm的50% ASIR-V图像脑灰质、白质分界模糊,不能准确测量脑皮层厚度,造成评分低于3分;但所有5 mm的DL-H图像均高于3分,体现了DLIR算法可以高度还原组织结构的特点,避免了IR伪影造成的模糊效应,提高了诊断能力。同时,5 mm的50% ASIR-V与0.625 mm的DL-H图像间无显著差异,结合客观测量结果,0.625 mm的DL-H图像显示效果近似等效于5 mm的50% ASIR-V图像。所有图像识别病灶数量一致,未造成漏诊,但5 mm的图像由于部分容积效应,无法准确测量小病灶边缘,而0.625 mm图像可以对病灶的体积、边缘做出更精确地判断和描述。而ASIR-V图像由于噪声过大,对小病灶边缘识别很难达到3分,造成测量准确性信心不足,因此0.625 mm的DL-H较常规的5 mm图像具有更高的应用前景。
本研究尚存在一些局限性:仅对一组数据不同重建方法间的图像质量对比,虽然主观结果及客观结果表明0.625 mm的DL-H图像可以达到常规5 mm的ASIR-V图像效果,但还需要进一步的前瞻性研究证实;同时,本组头颅外伤患者均为保守治疗,未采取手术及其他检查方法验证诊断的准确性及病灶识别的准确性。
总之,使用DLIR图像重建算法,可以较常规的50%ASIR-V图像更明显降低图像噪声,提升图像纹理显示能力,保证儿童头颅外伤CT的图像质量,0.625 mm的DL-H图像质量接近5 mm的50% ASIR-V图像,可以达到诊断要求,使进一步降低辐射剂量成为可能。