心血管影像人工智能的研究进展
2019-02-15李睿赵世华
李睿,赵世华
人工智能(artificial intelligence,AI)泛指用于模拟人类智慧的方法、技术及应用的一门技术学科,其应用目前已逐渐地从自动驾驶、人脸识别、文本处理等传统领域渗透到医学等专业领域。人工智能的引入对医学特别是医学影像学意义重大,斯坦福大学与Google公司先后公布了医学领域的里程碑式研究成果,发现人工智能对皮肤癌的诊断以及糖尿病视网膜病变和相关眼病的识别有极高的精准度[1-2]。在心血管影像领域,得益于扫描技术的迅速发展并由此产生的大量影像数据,人工智能的研究飞速发展[3]。有了医疗人工智能的帮助,可提高医师诊断效率及诊断精度,缓解医疗人力资源紧张状况。进一步结合基因和病理信息能够更加有针对性实施精准医疗[4]。笔者将人工智能在心血管影像方面的应用与发展的初概进行综述。
1 人工智能的要素及其分类
人工智能主要包括如下三个要素:数据、算法及计算力。数据是人工智能的第一要素,也是人工智能的基石。医院的绝大部分的数字化数据都为医学影像数据,诸如源于CT和MRI图像的海量数据等,给人工智能提供了巨大的支持。算法是人工智能的第二个要素,决定了人工智能的上限,没有算法,就无法把影像图像转换成可供分析的数据。此外,人工智能还需要强大的物理硬件支持,即第三个要素计算力。计算力越强,越能处理更复杂的数据、更先进的算法。一般情况下的人工智能模型是基于核心处理器(CPU)或者图形处理器(GPU)开展的训练[5]。
1.1 数据
人工智能的数据可分为结构化数据与非结构化数据[6]。结构化数据一般指的是存储在数据库里的、可用表格结构进行逻辑表达的数据;而非结构化数据就是不适合用数据库逻辑来表达的数据。从心血管影像角度出发,结构化数据可以是平时的各类试验及临床数据,如血压、心率、实验室指标等,而非结构化数据则是以DICOM格式保存的影像数据,可以是心脏磁共振(cardiac magnetic resonance,CMR)及CT断面图像,包括CMR电影序列动态视频,或者是类似心电图样的波谱数据,或者是超声心动图动态视频数据等,数据维度非常惊人且信息量极大。因此,要把非结构化的数据转化处理为可供分析的资料,需要不同的算法和超一流的计算能力。
1.2 算法
人工智能的算法多样,目前从复杂程度可大致分为机器学习(machine learning)和深度学习(deep learning)两类。机器学习算法根据目的大致可分为四类:分类、回归、聚类和降维[7-10]。对于医学数据来说,分类和回归算法是最常见的算法,属于监督式学习,主要用于有明确标签的数据,例如疾病分类、预后判断等有明确诊断和结局的这一类数据。这两类算法通过已有数据集中包含的特征与标签进行学习,得到一个目标模型,将输入映射到合适的输出,差异在于分类算法得到的是离散值,而回归算法得到的是连续值。聚类和降维属于无监督式学习,聚类主要用于无明确标签的数据,比如图像的纹理、灰度等。降维主要用于数据特征预处理阶段,比如对图像特征的提取与选择等。
深度学习按照应用领域可分为图像检测和自然语言处理,前者在医学领域应用更广泛[11-12]。图像检测领域的深度学习按照目的又可分为识别、分割和定位,例如左心室容积的分割、识别并从中计算射血分数,心肌肥厚病灶的定位与识别等。卷积神经网络(convolutional neural networks,CNNs)是目前医学图像领域应用最为广泛的深度学习模型,最早AlexNet由Hiton及其学生Alex提出,随后大量更快速更准确的卷积神经网络结构如googlenet、resnet和VGG等相继出现,用以处理提取更复杂、更抽象的图像属性特征。
2 人工智能在心血管影像中的应用
近年来,随着心血管影像尤其是CMR技术的飞速发展,各类数据呈指数增长,其中蕴含的大量信息都可以通过人工智能技术加以分析利用。目前心血管影像领域人工智能研究尚在起步阶段,而据现有的研究结果显示,AI在心血管影像的一系列研究方向中,包括图像采集重建、图像自动分割识别、疾病识别分类及预后判断等方面已表现出巨大的潜能。
2.1 减少心脏影像图像重建时间
如何缩短心脏磁共振检查时间一直是困扰医工领域的难题。临床常利用压缩感知方法,从低采样数据中精确重构出信号,从而有效减少成像时间。而通过AI深度学习可有效减少磁共振成像时间。目前,Qin等[13]提出了一个新的递归卷积神经网络架构,利用数据时间序列关系,优化迭代算法性质,从欠采样K空间重建并得到高质量心脏MRI图像,从而大大地缩短了成像时间。该方法通过学习时间依赖和迭代来进行有效的重建,其过程只利用极少数的参数,在重建精度和速度方面优于当前传统的MRI重建方法。此外,Schlemper等[14]使用深度多层卷积神经网络,利用欠采样数据,加速数据的采集过程重建二维MRI图像,也能够减少成像时间。在控制重建误差及重建速度方面均优于最先进的二维压缩感知方法。该模型重建每个完整的动态序列的时间少于10 s,其中每帧二维图像的重建可以在23 ms内完成,从而达到实时成像的要求。
2.2 准确快速地进行心血管图像分割、计算与识别
目前临床中常通过手动方法勾勒图像上心内膜壁的位置用以计算射血分数和心肌壁运动,但该方法分割精度不足,并存在较大的组间观察者差异。AI的引入可显著提升心内膜分割精度。AI通过全自动分割2D和3D电影图像中的心内膜,实现心脏影像的自动测量,同时进行射血分数计算和区域运动的评估。Knackstedt等[15]发现AI可对左心室射血分数和平均双平面纵向应变(longitudinal strain,LS)进行全自动、快速及可重复性的评估。该试验纳入了4个中心255名窦性心律的测试对象,使用视觉估计和手动追踪评估超声心动图的心尖四腔和两腔心视图,随后将数据集保存在集中式数据库中,利用机器学习软件(AutoLV,TomTec-Arena 1.2,TomTec Imaging Systems,Unterschleissheim,Germany)全自动测量射血分数及LS。结果显示该自动测量方法时间明显缩短,大约只需8 s,且在98%的患者中是可行的。Avendi等[16]联合深度学习算法及形变模型,在心脏MR短轴位图像中全自动分割左心室。研究首先利用卷积神经网络自动探测左室腔,随后采用整合了形变模型的栈式自编码器勾勒左室形状,以此提高分割的准确性及稳定性。该模型与数据库中的左心室分割结果对比,Dice系数高达0.94。Lekadir等[17]利用深度学习自动识别超声颈动脉超声成像的斑块成分。该研究使用卷积神经网络构建模型,训练并验证90 000例超声颈动脉图像。该模型能自动评价斑块的脂质核心,纤维帽以及钙化组织的成分,结果与临床专家评价的一致性达到0.90。此外,Wolterink等[18]利用CT冠状动脉动脉造影自动定量评价冠状动脉积分,该研究纳入了250例同时接受了冠脉CTA及心脏钙化积分(cardiac calcium scoring CT,CSCT)扫描的患者,采用配对卷积神经网络识别CT冠脉动脉造影钙化积分。与CSCT结果相比,钙化斑块的质量积分一致性为0.944,且83%患者的Agatston积分风险评估一致。提示CT冠脉造影能准确、定量评价钙化斑块积分,有望在将来减少不必要辐射剂量。
2.3 心血管疾病诊断
AI模型还可通过提取心脏影像特征实现疾病的诊断与鉴别诊断。Narula等[19]使用集成算法框架,尝试从运动员生理性肥大心脏中自动识别肥厚型心肌病(hypertrophic cardiomyopathy,HCM)。该试验纳入了77例心脏生理性肥大运动员和62例HCM患者,集合了支持向量机、随机森林和人工神经网络等三种不同的机器学习模型用以识别运动员及HCM心肌。与舒张早期-末期经二尖瓣流速比,平均舒张早期二尖瓣环运动速度及应变等传统超声心动图参数相比,机器学习模型有着更高的诊断灵敏度和特异度。Sengupta等[20]纳入了50例缩窄性心包炎和44例限制性心肌病患者的临床和斑点追踪超声心动图数据,采用基于联想记忆分类器的机器学习算法模型进行疾病的诊断,并通过10折交叉验证评估模型诊断效能。结果发现仅单独使用斑点追踪超声心动图的变量,该模型的诊断AUC值即可达到89.2%;再增加额外的4个超声心动图变量后, AUC值提高到96.2%,明显高于舒张早期二尖瓣环速度(82.1%)和左心室纵向应变(63.7%)两个传统参数。在CT及CMR领域,Baessler等[21]利用纹理分析在常规非增强的磁共振扫描序列上识别心肌梗死。该试验纳入了120例心肌梗死患者和60名正常人,通过影像组学软件(MaZda,version 4.6; Institute of Electronics,Technical University of Lodz,Lodz,Poland),利用特征选择分析方法,在CMR电影序列上进行降维和纹理特征选择,判断心肌梗死情况,最后再与延迟强化序列进行对照。模型筛选出如下五个独立的纹理特征能区分缺血性瘢痕和正常心肌:Teta1,Perc.01,Variance,WavEnHH.s-3和S (5,5) SumEntrp。对比多个逻辑回归模型结果后发现,基于Teta1和Perc.01的模型在MR电影图像上诊断心肌梗死可达到较高的准确性。Zreik等[22]利用深度学习方法自动识别患者冠脉CT血管造影(coronary computed tomography angiography,CCTA)图像中局部心肌异常,从而推断出支配该区域的冠状动脉病变。该研究纳入了166例同时接受了侵入性血流储备分数(fractional flow reserve,FFR)检查及静息状态下CCTA扫描的患者。研究首先利用多尺度卷积神经网络对患者CCTA图像中的左心室心肌进行整体分割,然后将左室心肌进一步分成许多有着空间连接关系的簇,并利用无监督自动编码统计数据计算提取每簇心肌的特征;接下来根据提取出的特征使用SVM分类器对这些心肌进行分类,从而判断患者是否有冠状动脉功能性狭窄。该研究分别使用了20张CCTA图像训练左室心肌的分割及左室心肌自动编码器,结果显示20张图像中左室心肌分割的定量评估Dice系数平均为0.91;接下来进行10折交叉验证试验,在剩余的126个CCTA扫描中进行患者分类,其诊断的AUC值为0.74±0.02。该研究结果表明,AI在未观察患者冠脉解剖结构的情况下,通过静息CCTA图像中心肌的自动分析即可判断冠状动脉的功能性狭窄,将来有望减少不必要的侵入性FFR检查。
2.4 心血管疾病预后评估及危险分层
现阶段临床判断患者的远期预后大部分基于有限的临床及影像学参数,而通过训练与学习,AI可同时提供更多、更复杂的变量。Motwani等[23]通过机器学习模型提高预测发生心脏事件的能力。该试验纳入了10 030例疑似冠状动脉疾病患者临床资料及其5年随访记录,共评估了25个临床指标和44个CCTA参数。研究选择信息增益排名的自动特征选择方法提取高危因素,采用具有集成算法框架的模型构建算法,并利用10折分层交叉验证评估结论。与单独的弗雷明汉风险评分(framingham risk score,FRS)或CCTA严重性评分相比,机器学习表现出更准确的全因死亡率预测能力。Van Rosendael等[24]利用机器学习分析源自CCTA的16段冠状动脉树信息,发现与目前的CCTA的风险评分相比,基于机器学习算法创建的风险评分有着更高的预后准确性。
Dawes等[25]通过监督式机器学习模型预测肺动脉高压患者的远期生存率。该试验纳入了256例接受CMR检查的肺动脉高压患者,将CMR短轴电影图像半自动分割为30 000个运动节点,创建右心室运动的三维模型,并利用右心室心肌运动幅度预测患者远期预后。在加入常规成像和血流动力学,功能和临床标志物等指标后,该模型的生存预测性能得到进一步改善,明显优于右室射血分数。
Arsanjani等[26]利用机器学习方法预测冠心病患者的早期血运重建。该研究纳入了713例冠心病患者,其中372例接受血运重建。模型从SPECT心肌灌注(myocardial perfusion SPECT,MPS)图像中得到定量特征,随即通过自动特征选择算法,从提取的SPECT信息及临床指标中选择可用的特征;然后通过增强的集成机器学习算法(LogitBoost)预测血运重建事件,最后使用交叉验证的方法评估和比较模型预测性能。结果提示机器学习的预测准确性(AUC,0.81±0.02)与其中一名诊断医师(0.81±0.02)相似,优于第二名诊断医师(0.72±0.02)和缺血灌注参数(0.77±0.02)。
3 人工智能的不足及完善
3.1 数据质量控制有待提高
首先,受到医疗水平及病人地区分布差异的影响,影像数据尤其是心血管方面的数据很难达到可分析水平。事实上,心血管影像特别是CMR图像,扫描层面多、序列复杂,不可避免地存在部分低质量的图像,因此心血管图像质控势在必行。此外,不同产家不同型号的机器,不同扫描参数对影像人工智能也有着非常大的影响。
3.2 数据标注
影像人工智能目前主要以监督式学习为主,数据标签必不可少。现在主要的标注方式多为手工标注,不仅工作量大,准确性也高度依赖标注者的水平。为了提高标签的可信度,往往会采取多个不同水平层次的标注者同时标注,会进一步加大工作量。因此,可采用半监督式学习,对一部分带标签的数据进行监督式学习,再对剩下的未带标签的数据进行分类。而对于一些分割任务可基于以往的标注,通过AI模型对数据进行预处理,然后由标注人员在此基础上做一些校正。除此以外,标注者大多数是在ITK-snap、Labelimage等第三方软件软件上标注,不利于标注者之间数据的流通,开发基于内网的数据标注工具,不仅方便管理,还可兼顾患者隐私保护。
3.3 影像人工智能的可解释性
当前基于深度学习的人工智能系统普遍存在可解释性不足的问题。因为深度学习模型学习的是大量神经网络结构的参数,预测过程是相应参数下的计算过程,这个学习和预测的过程是不透明的,和用户也缺乏交互性。深度学习的模型某种程度上只“知其然”而不知其“所以然”。例如,模型接受了大量训练后能根据图像诊断心肌病,但它究竟学到了什么有效特征使得它做出这样一个判断,模型不能给出合理的解释,这就好比中医看病是根据以往的经验做出的诊断。因此可解释性也是医学人工智能重要研究方向[27-28]。
3.4 小样本学习
深度学习需要庞大的数据来进行训练保证模型的稳定性及准确性。与其他系统相比,心血管系统尤其是心脏磁共振影像数据的获取成本高,时间长,且可用于分析数据量一般相对较小,能从小样本中学习最优解决方法的模型十分重要。迁移学习能把之前机器学习模型知识转移到新的模型上,有望显著地降低深度学习所需的大量数据资源。
总之,随着社会老龄化和城市化进程加快,居民不健康生活方式流行,心血管病患病人数将快速增长,心血管病的诊治已成为重大的公共卫生问题,其中心血管影像在疾病的诊断、治疗以及预后判断中起着至关重要的作用。尽管目前心血管影像人工智能研究仍处于起步的阶段,但潜力巨大,将是未来发展的热点与重点。随着人工智能的不断提升,能对大量心血管患者的病情进行有效的评估,不仅能有效提升医师的诊疗效率,优化看病流程,而且能在疾病预后判断和危险分层中发挥更大的作用,促使心血管疾病诊治的快速进步。
利益冲突:无。