基于深度学习的胸片心脏增大判定研究
2020-03-14潘亚玲陈桥然王晗琦陈彤彤严福华
潘亚玲 陈桥然 王晗琦 陈彤彤 严福华 陆 勇
胸片成本低、辐射小,常用于心胸疾病筛查、术前评估及随访[1]。心胸比率(cardiothoracic ratio,CTR)是胸片衡量心脏大小的重要指标,成人CTR>0.5,视为心脏增大[2]。目前医师主要借助笔尺或PACS 系统测量CTR,两者均需手动操作,人工判定心脏增大。近年来,深度学习技术迅速发展,已在肺结节影像诊断领域取得显著进展[3]。本研究旨在利用深度学习技术实现CTR 自动测量,评价自动测量与手动测量CTR 的相关性和一致性,比较自动测量、手动测量、肉眼观察三种方法判定心脏增大所用时间和准确性差异。
方 法
1.临床资料
回顾性分析本院2018 年1 月至6 月符合以下标准的健康体检者。纳入标准:①体检行胸部X 线检查;②年龄>18 岁。排除标准:①胸片存在明显金属伪影;②有肺叶/肺段切除手术史;③胸片显示重度胸腔积液、完全性肺不张、弥漫性肺部严重渗出。1312例胸部X 线摄片纳入研究。对全部数据脱敏并重新编号,标注肺野和心脏轮廓后,将其随机分为训练数据集(881 例)、验证数据集(221 例)和测试数据集(210 例)
2.X 线检查方法
X 线摄片采用美国飞利浦DR 机行吸气后屏气曝光,拍摄立位后前位胸片,拍摄距离180cm,投照电压81kV, 管电流2.85mA,曝光时间<0.01 秒。
3.CTR 自动测量
Mask R-CNN[4]深度卷积网络是目前最高水平的实例分割算法,是在Faster R-CNN 深度卷积网络的基础上融合了全卷积网络(fully convolutional networks, FCN) 和特征金字塔网络(feature pyramid networks,FPN)思想的一种多任务深度神经网络。Mask R-CNN 有两个阶段,第1 阶段,Mask R-CNN 的主干网络(ResNet 101 和FPN)提取胸片的特征图,利用区域建议网络(region proposal network, RPN)生成目标的建议框,筛选建议框得到感兴趣区(region of interest, ROI);第2 阶段,利用卷积神经网络预测每个ROI 的类别、边界,并行输出边界的二值掩膜,用以描述目标的像素级分割结果。通过训练数据集训练Mask R-CNN深度卷积网络检测、分割肺野和心脏,验证数据集调整、优化网络参数。基于网络分割的肺野和心脏轮廓(图1),分别确定肺野和心脏轮廓各点在胸片坐标系上的坐标值。心脏最大横径是胸廓中线分别至左、右心缘的最大距离之和,等于心脏轮廓在胸片坐标系中最大横坐标值与最小横坐标值之间的差值;胸廓最大横径是最大胸廓处的肋骨内缘间距,等于肺野轮廓在胸片坐标系中所有同一横坐标轴上的最大横坐标值与最小横坐标值之间差值中的最大值。计算心脏最大横径与胸廓最大横径之比得到CTR[5]。设定CTR>0.5 为心脏增大,CTR ≤0.5 为心脏大小正常。
4.评价方法
对测试数据集胸片分别采用自动测量、肉眼观察、手动测量三种方法判定心脏增大。测试Mask R-CNN深度卷积网络分割肺野和心脏的准确性,并记录自动测量所得CTR 值和心脏增大判定结果。2 名高年资放射诊断医师在盲法状态下于同一PACS 工作站,采用肉眼观察法独立判定心脏增大。若2 名医师判定结果不一致,则以原先影像报告中的判定结果为准。间隔1 个月后,打乱胸片编号,2 名医师再次于同一PACS 工作站双盲手动测量CTR,以两者CTR 均值判定心脏增大。使用秒表分别记录自动测量、肉眼观察、手动测量判定心脏增大的所用时间。
5.统计分析
采用SPSS 22.0 软件统计分析。计量资料用x±s表示。采用Pearson 相关与Bland-Altman 分析自动测量与手动测量CTR 的相关性和一致性。以手动测量为判定标准,计算自动测量、肉眼观察判定心脏增大以及Mask R-CNN 深度卷积网络分割肺野和心脏的灵敏度、特异度及准确度。采用Kappa 检验分别分析自动测量、肉眼观察与手动测量判定心脏增大的一致性,κ=1 为完全一致,κ>0.75 为一致性较好,0.4 ≤κ ≤0.75 为一致性中等,κ<0.4 为一致性差。判定心脏增大所用时间两两比较采用LSD检验。以P<0.05 为差异有统计学意义。
结 果
1.胸片伴随征象及Mask R-CNN 深度卷积网络的分割效能
测试胸片共210 例,除心脏增大外,伴随肺内、肺外其他征象的胸片分别有65 例和106 例。Mask R-CNN 深度卷积网络基于测试胸片分割肺野和心脏的准确度均>98%, 其中分割心脏的特异度(88.99%)低于肺野(95.48%),见表1。
表1 胸片伴随征象及Mask R-CNN 深度卷积网络的分割效能
表2 自动测量、手动测量及肉眼观察对心脏增大的判定结果和所用时间
表3 自动测量与肉眼观察对心脏增大的判定效能
图1 Mask R-CNN 深度卷积网络对肺野(绿色)和心脏(黄色)的分割结果(A)CTR的测量径线(B)a+b 为心脏最大横径,c 为胸廓最大横径,0.44 为CTR。
2.自动测量与手动测量CTR 的相关性及一致性
自动测量与手动测量CTR分别为0.514±0.080,0.506±0.078。Pearson 相关分析显示自动测量与手动测量CTR 呈强相关性(r=0.976,P<0.001)。自动测量与手动测量CTR 的线性回归方程为CTR(Y=0.016+0.955X,P<0.001)( 图2A)。Bland-Altman 分析显示自动测量与手动测量CTR 的差值均数为0.008,95%一致性界限为(-0.027,0.042),93.33%(196/210) 的点在一致性界限内(图2B)。
图2 自动测量与手动测量CTR 的散点图(A)和Bland-Altman图(B)。
3.自动测量、手动测量及肉眼观察对心脏增大的判定结果和所用时间
自动测量、手动测量及肉眼观察对心脏增大的判定结果和所用时间(表2)。自动测量与手动测量判定心脏增大的一致性较好(κ=0.895,P<0.001),而肉眼观察与手动测量判定心脏增大的一致性中等(κ=0.667,P<0.001)。自动测量、手动测量、肉眼观察判定心脏增大所用时间分别为5.62 秒/例、9.81 秒/例、2.57 秒/例, 两两间比较差异均有统计学意义(P<0.001)。
4.自动测量与肉眼观察对心脏增大的判定效能
以手动测量为心脏增大的判定标准,自动测量判定心脏增大的灵敏度、特异度及准确度分别为99.03%、90.65%、94.76%,均高于肉眼观察法(85.44%、81.31%、83.33%),见表3。
讨 论
本研究中,肺野和心脏分割是深度学习自动测量CTR 的前提。Mask R-CNN 深度卷积网络可基于体检胸片精准分割肺野和心脏,分割的准确度均大于98%,优于研究报道的结果[6]。Mask R-CNN 深度卷积网络分割心脏的特异度低于肺野,这可能与心脏上下界在胸片上显示不确切有关。研究[6]提出仅分割肺野,测量两肺野内缘之间的最大距离作为心脏最大横径计算CTR,可以规避心脏分割效果不理想的情况。本研究结果显示Mask R-CNN 深度卷积网络自动测量与医师借助PACS 系统手动测量CTR 具有强相关性(r=0.976,P<0.001)。 Bland-Altman分析显示自动测量与手动测量CTR 的差值均数为0.008,约93.33%的点在一致性界限内,两者测量CTR 的相差幅度很小,具有较好的一致性。因此,利用Mask R-CNN 深度卷积网络分割肺野和心脏,能够实现体检胸片CTR 的自动精确测量。
在实际临床工作中,绝大多数医师为节省读片时间,一般仅凭肉眼观察判定心脏增大。本研究以手动测量为心脏增大判定标准,发现肉眼观察与手动测量判定心脏增大的一致性中等(κ=0.667),而自动测量与手动测量判定心脏增大的一致性较好(κ=0.895)。肉眼观察判定心脏增大缺乏客观性,而自动测量与手动测量CTR 判定心脏增大不受主观因素影响,还能够定量反映心脏增大的程度。研究[7]表明CTR>0.55 时先心病患者的死亡风险是CTR <0.48 患者的8 倍。Chana 等[8]研究显示CTR>0.5 预测左、右心室功能不全的灵敏度和特异度分别为73.9%和47.4%。Yotsueda 等[9]的多中心大样本前瞻性队列研究表明CTR 增大是血液透析患者死亡的独立危险因素,会增加心血管疾病的发生风险。尽管CTR 对预测心脏功能不全有一定局限性,但目前CTR 仍然是胸片诊断心脏增大、评估心血管疾病的重要指标。因此,相较于肉眼观察,精确测量CTR 评价心脏大小对心脏病变筛查和预后评估更具临床价值。
基于深度学习自动判定心脏增大的研究思路主要分为两类:①用肺野或心脏的标注数据训练深度学习分割模型,基于分割结果测量相关参数如心胸面积比(cardiothoracic area ratio,CTAR)和CTR,间接判定心脏增大;②用正常和心脏增大的标注数据训练深度学习分类模型,直接判定心脏增大。Hasan 等[10]提出基于部分肺野和心脏的分割结果测量CTAR 判定心脏增大,但心脏与膈肌的分界在胸片上通常显示不确切,容易造成标注的心脏下界出现误差。理论上,相较于心脏和肺野面积,心脏和胸廓最大横径对分割精度的依赖性更低。因此,CTR 较CTAR 对深度学习模型分割肺野和心脏的容错率更高。Dallal 等[11]采用图割(graph-cut)算法分割肺野,通过Harris 角点算法在分割的肺野边缘检测与心脏边界相关的角点来确定心脏边界,该方法测量CTR 和CTAR 的平均误差率分别为7.9%和26.4%。Cicero 等[12]通过语义分析法在影像报告中提取“心脏增大”关键词,以关键词作为分类标签训练的GoogLeNet 模型,判定心脏增大的灵敏度和特异度分别为81%、80%。提取影像报告关键词作为分类标签较人工标注可以大幅度降低标注成本。然而,有些影像报告中心脏增大的判定结果是仅凭肉眼观察获得的。本研究结果显示肉眼观察判定心脏增大的准确度为83.33%。因此,影像报告中关键词本身尚不够精确,加之语义分析法提取关键词存在一定误差,可能会直接影响深度学习分类模型训练和测试结果的准确性。
本研究利用Mask R-CNN 深度卷积网络分割肺野和心脏,基于分割结果测量CTR,自动判定心脏增大的准确度为94.76%,所用时间为5.62 秒/例,而医师借助PACS 手动测量CTR 判定心脏增大所用时间为9.81 秒/例。因此,基于Mask R-CNN 深度卷积网络自动测量CTR 能够准确判定心脏增大,有效避免重复的手动操作,且所用时间短,适用于实时的临床诊断环境。
本研究存在一定的局限性。Mask R-CNN 深度卷积网络的训练和测试数据均为体检胸片,因此可能不适于测量住院患者的胸片CTR。尤其当住院患者的胸片存在大面积胸腔积液、完全性肺不张、弥漫性肺部严重渗出时,会导致肺野或心脏的边界非常模糊甚至肉眼难以分辨,给深度学习分割肺野和心脏带来巨大挑战。综上所述,基于深度学习自动测量与手动测量CTR 具有强相关性和较好的一致性。利用深度学习技术自动测量CTR 可快速、准确地判定胸片心脏增大,为胸部X线体检心脏病变筛查提供有效途径。