人工智能技术在新型冠状病毒肺炎患者应用中需要注意的问题
2020-02-10沈聪郭佑民
沈聪 郭佑民
目前,新型冠状病毒肺炎(简称“新冠肺炎”)已经成为威胁全球的重要公共健康卫生事件[1-2]。新冠肺炎的主要确诊手段为实时逆转录聚合酶链式反应(real-time reverse transcription polymerase chain reaction, RT-PCR),但由于各种原因(试剂盒灵敏度、咽拭子或鼻拭子取材操作、取材时机与病毒载量等)导致其检测敏感度仅为60%~70%[3-4]。CT作为主要的影像学检查手段,在新冠肺炎患者的病变检出[5]、辅助确诊[4,6]、病情严重程度评估[7]、鉴别诊断[8]、随诊复查[9]及预后预测[10]中发挥着很重要的作用。
疫情早期,有研究在CT图像上通过人工读片对病变征象及病变严重程度进行分析[11-13]。即在轴面CT图像上将病变密度分为:0,透亮度正常;1,磨玻璃样密度;2,实变。根据每个肺叶的受累程度分为6层次:0,无病变;1,<5%; 2,5%~<25%;3,25%~<50%;4,50%~75%;5,>75%。然后分别将5个肺叶的病变性质分数和肺叶受累分数相乘,后相加以获得最终的CT分数,则:最大病变分数为5(个肺叶)×5(肺叶受累范围)×2(实变)=50。也有研究者将病变的性质分为4个程度:1,磨玻璃样密度;2,实变;3,实变与磨玻璃样密度混合,磨玻璃样密度占比>50%;4,实变与磨玻璃样密度混合,实变密度占比>50%。Lyu等[12]通过对病变的CT征象分析,发现病变累及的肺段数和肺叶数越多、病变内实性成分越高,病变越严重。Li等[11]使用人工评价的方法鉴别重型新冠肺炎患者,曲线下面积达到0.918。半定量评价方法在短期内解决了患者快速分流的问题,但具有一定的主观性,耗时耗力且受观察者本身的经验影响。
随着疫情的扩大,确诊的患者例数激增,且确诊患者的首选检查及多次随诊复查均采用CT,需要分析大量的影像学图片,对于影像科的读片工作是一个巨大的挑战。在此紧迫需求的基础上,大量影像学计算机辅助的病变检测及定量[12,14-18],以及各种人工智能诊断系统辅助检测病变得到广泛应用[19-22],包括部分发表在网络预印本(MedRxiv)上的深度学习或人工智能技术应用于新冠肺炎的检测及严重程度判断[23-26]。关于人工智能技术在新冠肺炎患者CT读片中的应用,仍然需要注意以下几点问题。
一、对病变的准确分割是病变定量及深度学习的关键
不论是病变定量分析,还是病变的特征提取,都基于对病变的准确分割。分割包括手动分割、半自动分割及自动分割。手动分割在图像深度学习领域被认为是金标准,往往需要由专业的影像科医师读片时标注感兴趣区,整个过程费时费力,且不能避免读片者对病灶勾勒的主观性,因此手动分割结果需要更高级的医师进行审核。
二、基于经验和知识的定量指标兼具快速、精准、定量的特点
根据医师对新冠肺炎患者CT征象[27]的认识,研究者设计了一些病变的定量特征,包括病变的体积、密度、百分比、分布、病变内的磨玻璃样成分、病变质量等[14-15,17]。Shen等[14]和Cheng等[15]比较了人为设计的定量指标与人工评价的相关性,发现二者相关性较高,且定量指标能更真实地反映病变的情况。Yu 等[28]在准确分割病变的基础上,采用密度直方图分析病变内的密度组成成分及比例。结果发现,病情早期,病变密度较淡薄且均一,密度直方图呈靠左的单峰;随着病变进展,病变密度增高,直方图的峰值右移;随着病变吸收,病变不同位置消散程度不一致,直方图由单峰变为双峰,峰值逐渐向左移。Yu等[17]纳入421例新冠肺炎患者,经计算机自动分割病变后,计算不同肺叶病变的体积及密度;结果发现,双肺上叶病变密度较实是患者预后差的独立危险因素。Liu等[18]采用人工智能技术自动分割病变,计算病变内的磨玻璃状影部分的体积、半实性部分的体积和实性部分的体积,计算病程首日和病程第4天的以上指标的差值,可以较好地鉴别出重型新冠肺炎患者。因此,定量影像学兼具了精准定量与有监督学习的特点,其结果具有可解释性,容易理解且被临床所接受,准确性和时效性均高于人工评价方法。
三、基于人工智能技术对新冠肺炎患者CT图像识别中的价值
医学图像复杂度及精确度高,且多为容积成像,需要采用三维(3D)的卷积核进行特征识别,因此需要更高的计算机处理能力和更快的处理速度。在此次疫情中,一些学者(或联合厂商)做了一些深度学习的探索性研究。Li等[19]收集了1296例新冠肺炎患者、1735例社区获得性肺炎患者和1325例非肺炎患者的CT图像。使用Res-Net50作为深度学习的模型骨架,使用3D卷积核提取2D及3D特征,对以上患者进行分类[29];但文中使用深度学习模型分割得到的结果,未经过多方专家的审阅与矫正,可能会高估深度学习算法的智能性。
在Bai等[21]的研究中,包括了521例新冠肺炎患者和665例非新冠病毒感染的肺炎患者的CT图像。在病变分割中,首先对肺部组织进行分割,且肺组织的分割允许医师手动修改不满意的地方。病变的每一层均采用手动分割结果作为深度训练的输入层。如前所述,手动分割费时费力,因此纳入的患者例数有限,作者通过翻转、旋转、随机噪声、模糊、人为调节对比度等多种方法增加输入样本量。再者该深度模型采用了ImageNet上训练所得的参数作为初始参数,该数据集的分辨率及分割的精准要求与医学图像相去甚远,训练的结果仍然具有一定的局限性。
Murphy等[22]以RT-PCR为金标准,在肺结核胸片的自动检测[30]基础上进一步用于胸片上对RT-PCR阳性患者与阴性患者的鉴别,与人工读片的结果进行对比发现,使用人工智能技术鉴别RT-PCR患者的曲线下面积高于人工读片,敏感度和特异度分别为85%和61%。该方法使用医学图像(22 184 张胸片,包括7851张正常胸片和5012张肺炎胸片)的训练结果作为预估参数,再将其应用于新冠肺炎患者(416例RT-PCR检测阳性和191例RT-PCR检测阴性)的模型训练,最后使用外部验证(994张新冠肺炎患者的图像,其中40张用于检验),较前所述文献报告提高了结果的可信度。
四、医学影像学的人工智能技术需结合临床及实验室检查
影像学表现与临床表现、实验室检查的改变往往具有不一致性,出现“症征不符”。一般来说,影像学改变晚于外周血淋巴细胞的降低。随着患者的增加,越来越多的无症状感染者也被发现[31]。系统回顾研究发现,年龄、多脏器功能综合评价指数、高血压及心血管慢性病、低淋巴细胞计数、高D-二聚体等都是新冠肺炎患者预后不良的危险因素[32]。将影像学特征与临床表现、实验室检查结果相结合有助于对新冠肺炎患者进行早期诊断及预后评估。
总之,目前医学影像学在逐步进入大数据研究时代。而大数据的应用具有厚积薄发的特点,往往需要我们经过长期大量的基础准备工作后,才能使数据更好地发挥其潜在价值,将其应用于医师的临床工作中。