人工智能+健康医疗的研究和应用
2019-06-20胡守兴
胡守兴
当今,由大数据和深度学习技术开启了新一波人工智能热潮,大数据、人工智能技术在疾病预防筛查和诊断方面的应用日趋成熟。本文围绕医疗和体检行业,提出双驱动的“人工智能+健康医疗”的平台,同时,从影像诊断的角度以肺结节检测的案例出发,研究有关的技术现状。最后对双驱动平台技术和应用进行展望,并提出一些建议。
一、人工智能概述
早在1950年,Alan Turing在《计算机器与智能》中就阐述了对人工智能的思考。1956年,“人工智能”这个词首次出现在达特茅斯会议上,标志着其作为一个研究领域的正式诞生。之后人工智能的发展经历过一次一次的低谷期。随着大数据的积聚、理论算法的革新、计算能力的提升,人工智能在很多应用领域取得了突破性进展,尤其是深度学习作为机器学习研究中的一个新兴领域,起初由Hinton等人于2006年提出。2012年,杰弗里·辛顿的学生IIya Sutskever和Alex Krizhevsky在图片分类比赛ImageNet中,使用深度学习打败了Google团队,深度学习的应用,使得图片识别错误率下降了14%。同年,谷歌首席架构师Jeff Dean和斯坦福大学教授AndrewNg主导著名的GoogleBrain项目,采用16万CPU来构建一个深层神经网络,并将其应用于图像和语音的识别,并获成功。
二、人工智能+健康医疗
人工智能是一种很好的工具,能够缓解大健康产业医生资源紧缺的问题,缓解漏诊误诊的问题,提高医生工作效率,医院可以利用人工智能进行范围内居民健康管理。通过人工智能还可以模拟医生诊疗过程并给出诊疗建议,比如服用日常药物,挂什么科,或者就近联系医生等,满足常见病咨询需求。这也给患者和医生节省了大量的时间,也保证了生命的安全。随着社会的高速发展,人们越来越认识到“防患于未然”,日常保健、定期体检的重要性。对于健康的重要性,“预防优先”的健康观念日益深入人心,个人体检的意愿及频次必将进一步提升。
三、双驱动“人工智能+健康医疗”平台
医疗人工智能平台的建设辅助医疗机构提升服务水平,平衡医疗资源,缓解就医压力,特别是医疗资源匮乏的区域。医疗机构根据自身信息化水平选择不同的建设模式,帮助提升自身的医疗服务水平。人工智能平台由数据、算力、开源框架和算法以及各种技术构成,计算能力为人工智能平台的运算速度提供保障。其中算法、数据和算力、深度学习是带动本轮人工智能产业发展的“三驾马车”。开源框架是算法的工程体现。
数据驱动在辅助医疗影像诊断技术,其应用包括而不限于脑瘤分割、肺结节检测、阿兹海默症检测、淋巴结检测、肺支气管扩张检测、X光胸片疾病检测、肝超声检测。以肺结节医疗影像数据为例,每位患者平均拥有20~30张片子,在自动识别肺结节时常用的计算机视觉模型如残差神经网络,它可以使数十层甚至上百层的神经网络的训练成为可能,这对计算能力提出了很高的要求。庞大的数据量致使计算机的运算时间变得漫长,因此搭建一个超算平台不仅能缩短运算时间,也能提升医疗的效率,降低患者的等待时间,可谓至关重要。
知识驱动的构建,构建了医疗诊断图谱,医疗诊断图谱的落地是非常有价值的。知识图谱是典型的大数据时代产物,大规模语义网络与大数据技术、深度学习技术相结合,正在成为推动人工智能发展的核心驱动力,医学知识图谱中具备了知识表示、知识抽取、知识融合和知识推理这4个模块的关键技术和研究进展进行综述。
开源的Neo4j、Twitter的FlockD、sones的GraphDB等。模式层构建在数据层之上,是知识图谱的核心。比如业界的百度的医疗大脑和IBM Watson提供了行业解决方案。
四、人工智能影像辅助诊断
人工智能已经在肺结节、甲状腺结节、乳腺癌、冠状动脉斑块、皮肤癌、眼底病、病理等领域取得了诸多成果。早期的肺癌是没有任何症状的,中国70%~80%的肺癌病人一发现就是晚期,失去了手术治疗的机会,越来越多的肺结节在检查中被发现,虽然大部分肺结节为良性病变,但仍有较高比例的早期肺癌,因此需高度重视肺结节的筛查。
肺结节筛查工作量大,易漏诊误诊,早在人工智能技术出现之前,人们已经尝试通过各种方式提高影像诊断效率,其中以CAD(计算机辅助决策系统)应用最为广泛,它通过专家提取特征,制定分类规则,建立各种复杂严密的数学模型,实现了对影像的自动分析。公开的有代表性的系统有:ISICAD、SubsolidCAD、LargeCAD、ETROCAD,它们仅能处理和识别非常有限的影像表现,鲁棒性差,无法自动深层次学习和优化。
1.任务目标
基于深度学习的人工智能影像分析技术解决了传统CAD的不足,通过广泛的影像大数据训练,从底层提取特征,能够实现对更加多样化的影像表现识别并不断自动优化。基于人工智能新的解决方案给医学影像分析带来诸多益处:
·高效的处理和分析影像速度,快速给出辅助判断结果。
·良好的灵敏度(或召回率),降低筛检中的漏诊率。
2.数据集
LIDC-IDRI是由美国国家癌症研究所(National Cancer Institute)发起收集的,目的是为了研究高危人群早期癌症检测。该数据集中,共收录了1018个研究实例。对于每个实例中的图像,都由4位经验丰富的胸部放射科医师进行两阶段的诊断标注,会标注三种类别:① >=3mm的結节,②<3mm的结节,③>=3mm的非结节。
LUNA16发布于2016年,是肺部肿瘤检测最常用的数据集之一,它包含888个CT图像,1084个肿瘤,图像质量和肿瘤大小的范围比较理想。数据分为10个subsets,subset包含89/88个CT scan。LUNA16的CT图像取自LIDC/IDRI数据集,选取了三个以上放射。
Kaggle数据集中有1000张来自高危患者的低剂量肺部CT图像(dicom格式),每张图像包含多个胸部的轴向切片;该比赛的任务是建立一种自动化方法以确定患者是否会在1年内被诊断出恶性肿瘤。
3.候选结节检测
将高维CT图降维到一些感兴趣的区域, 比较高概率的召回/提取出候选区域ROI/region proposal,可以通过3D RPN或语义分割出来。
语义分割是一个活跃的研究领域,DCNN用于对图像中的每个像素进行单独分类,这是由计算机视觉和医学成像领域中不同的具有挑战性的数据集所推动。在深度学习革命之前,传统的机器学习方法主要依靠手工设计的特征来独立地对像素进行分类。在过去的几年里,人们提出了许多模型,证明基于FCN的CNN分割方法为自然图像分割提供了优越的性能。这种方法的主要缺点是多次执行大量的像素重叠和相同的卷积。通过在非常大的数据集上对递归神经网络(RNN)进行微调,FCN的性能得到了改善。SegNet和DeepLab也是通用领域语义分割常用的方法。
然而,针对医学图像分割中存在的数据不足和类间不平衡等问题,提出了一些针对医学图像分割的深度学习模型。语义医学图像分割最早也是最流行的方法之一被称为U-NET。基本的U-NET模型是根据结构,网络主要由卷积编码和译码两部分组成。在网络的两个部分中,基本的卷积操作在relu激活之后执行。对于编码单元中的向下采样,执行2×2最大池操作。在解码阶段,执行卷积转置(表示上卷积或去卷积)操作,对特征图进行上采样。U-NET的第一个版本被用于从编码单元crop and copy特征映射到解码单元。U-NET模型为分割任务提供了几个优势。首先,该模型允许同时使用全局位置和上下文。
其次,它使用很少的培训样本,并为分段任务提供更好的性能。最后,端到端的管道在前向通道中处理整个图像,并直接生成分割图。这样可以确保U-NET保留输入图像的完整上下文。
深度学习方法提出基于U-NET的可用于3D医学图像分割任务3D UNET体系结构,从稀疏标注的体素图像中学习。三维医学图像分割网络另有研究V-NET,它由一个具有残差连接的FCN组成。医学图像自动分割方法res3dnet是基于残差网络的voxresnet在2016年提出,其中使用深voxewise残留网络进行大脑分割。2017年Kaggle数据科学竞赛第一名获奖团队的则基于3D U-net模型提出了N-Net。
前馈路径:由两层卷积层和四个融合单元构成。反馈路径:由两层反卷积(装置卷积)层和两个融合单元构成。Location crop:位置信息可能影响是否为结节和是否为恶性的判断,因而引入输入数据。输入数据大小,并随机选择两种patch:一种为70%的输入数据至少包含一个结节,另一种为30%的输入数据不含结节。其中,patch超出图像部分用灰度值为170填充。
对于一些易误诊为结节的反例数据,通过使用hard negative mining方法解决。将不同的patch输入至网络得到不同置信度的输出映射;随机选择N个反例数据构成候选池;侯选池中的数据以置信度值大小排序,且选出top-n的数据作为反例数据。输出数据且使用非极大值抑制操作来重叠的proposal。损失函数为交叉熵函数。为了避免过拟合采用了数据增强和正则化操作。
4.置信检测
由于第一阶段产生的假阳性区域,最终将肺结节的识别结果提供给医生作为诊断的参考,明确区分出结节与非结节,以及确定结节的性质(阳性或阴性肿瘤)。
置信检测可以基于3D-NET(NET), 可对更丰富的空间信息进行编码,通过分层提取更有代表性的特征。可以应用深度残差网络或堆叠google inception来增强网络的表达能力。
MV-CNN:使用多视角卷积神经网络(multiple view-convolution neural network)-MV-CNN对肺结节进行分类。在传统的图像识别神经网络中,输入通道的数量取决于图像的颜色通道的数量。一般来说,用于分析CT的神经网络只有一个输入通道,因为一个CT扫描片是只有一个颜色通道的灰度图像。肺部结节只是整个肺部CT图像的一小部分,因此可以裁剪多個结节视图,不同的视图将提供不同的信息。具有小视场的斑块可以提供结节的细节,而具有大视场的斑块可以提供肿瘤组织周围的信息。
置信检测模型一般采用3D深度卷积网络且往往融合多尺度进行集成训练提升分类的效果。集成学习(Ensemble learning)通过组合几种模型来提高机器学习的效果。与单一模型相比,在许多著名的机器学习比赛(如 Netflix、KDD 2009 和 Kaggle比赛)中能够取得很好的名次。LUNA16第二名组采用了多尺度的模型组合学习xgboost的思路,提高了学习的效果。训练过程还通过数据增强来防止过拟合。
5.性能评价
通过测量算法的检测灵敏度和对应的每次扫描的假阳性率来进行评估。
五、行业和技术的发展期望
基于数据规模小、标注质量差、懂算法的不懂医疗的研发现状,以及结合人工智能本身的特点,谈几点个人的想法和建议:
1)目前数据是行业发展的瓶颈,数据积累与数据共通,是解决问题的关键;
2)人工智能模型和模式核心创新,降低对数据和人工标注的依赖;
3)建设人才队伍,包括科研人才、医疗专业性人才和工程化人才;
4)双驱动平台建设,打通业务和数据壁垒,构建以知识驱动和数据驱动的优势互补的预防诊断系统,并整合对接原有的HIS、PACS系统;
5)从应用看,医疗机器人、虚拟助手、风险预测、智能辅助诊断、细胞分析是未来的热点,但需要深耕细作,确保质量和创新两不误。