APP下载

人工智能在临床医学中的应用与展望*

2020-11-19姚泽阳邱海龙黄美萍袁海云

医学信息学杂志 2020年3期
关键词:准确率医学深度

姚泽阳 谢 稳 邱海龙 黄美萍 袁海云 庄 建

(广东省人民医院 广州 050081)

1 引言

人们对医疗健康的需求日益增长的同时海量医学数据不断产生。数据来源包括高分辨率医学成像、连续输出生理指标的生物传感器、基因组测序和电子病历,这些海量数据有必要利用机器来处理。与此同时,人们越来越依赖于医疗系统的卫生保健服务,亟需新的技术来提供帮助。 人工智能(Artificial Intelligence, AI)尤其是深度学习的使用已经通过大量标记的数据、显著增强的计算能力和云存储支持大多数领域的发展。在医学上其在3个层面产生影响:对于临床医生,主要是提供快速、准确的图像解释;对于卫生系统,改进工作流程和减少医疗差错;对于患者,使其处理个人数据来促进健康。本文综述人工智能在医学领域的现有研究,在此基础上进行分析并展望该领域未来发展。

2 人工智能简介

人工智能的根源可以追溯到80多年前艾伦·图灵(Alan Turing)、沃伦·麦卡洛克(Warren McCulloch)和沃尔特(Walter)提出的概念[1-2]。历史上人工智能曾被不同的研究架构所影响,直到2012年深度学习才被广泛接受为AI的一种可行形式[3]。深度学习神经网络由数字化输入(如图像或语音)和输出组成。它通过多层连接的神经元不断检测输入特征,最终提供输出。深度神经网络(Deep Neural Network,DNN)架构,见图1。其由1个输入层、若干个隐藏层(范围5~1 000)和1个输出层构成,每个隐藏层响应输入的不同特征。与其他类型的人工智能相比,深度学习的关键特征是其自学能力。神经网络不是由人类设计的,而是由数据本身决定层数。图像和语音识别主要使用监督学习,从已知模式和标记输入数据(通常称为基本事实)进行训练。从未知的模式学习且没有标记输入数据称为无监督学习,目前很少被应用。DNN和深度学习有很多种类型,包括卷积、递归、生成对抗性、转移、强化、表示等[4-5]。

图1 深度神经网络架构

3 人工智能在临床医学中的应用

3.1 人工智能与临床医生

3.1.1 概述 几乎所有类型的临床医生,从专科医生到护理人员都将在未来使用人工智能技术,尤其是深度学习。主要涉及使用DNN进行模式识别,帮助解释医学扫描、病理切片、皮肤损伤、视网膜图像、心电图、内镜、面部和生命体征。神经网络预估通常与医生评估相比较。使用真实阳性与假阳性比率的曲线图称为接受者操作特征(Receiver Operating Characteristic, ROC),曲线下的面积(Area Under the Curve, AUC)用来表示准确度水平。

3.1.2 放射学 人工智能应用中特别受到关注的一个领域[6]。胸部X光是最常见的医学扫描方式,全球每年进行X光检查超过20亿次。研究人员将基于121层卷积神经网络的一种算法与4名放射科医生在112 000多张标记的胸部X线图像中诊断出肺炎的准确率进行对比,结果表明该算法的AUC为0.76,准确率优于放射科医生。谷歌的一个研究小组使用一种不同算法分析与之前研究相同的图像集,得到的AUC评分从肺炎的0.63到心脏肿大或肺塌陷的0.87不等[7]。

3.1.3 病理学 数字化病理切片的深度学习有可能提高解释的准确性和速度。在一项乳腺癌的WSI研究中无论有无淋巴结转移,将11名病理学家的表现与多种算法解释的表现进行比较,结果各不相同,在一定程度上受到病理学家审阅幻灯片时间长短的影响[8]。

3.1.4 皮肤病学 对于利用图像对皮肤癌进行分类分析的算法,将深度学习网络与皮肤科医生的诊断精度进行广泛比较。在一项使用近13万张摄影和数字化图像的大型训练数据集的研究中,21名皮肤科医生的表现至少与一种算法相匹配,该算法对肉瘤患者诊断的AUC为0.96,对黑色素瘤患者诊断的AUC为0.94[9]。

3.1.5 眼科学 目前有很多比较算法和眼科医生对于特定眼科疾病诊断效率的案例。在一项用视网膜眼底照片来诊断老年性黄斑变性的研究中DNN算法准确率在88%~92%之间,几乎和眼科专家的准确率一样高[10]。虽然对视网膜OCT和眼底图像的研究主要集中在眼科疾病方面,但最近的研究表明视网膜照片的潜在用途不仅仅在于眼科疾病。已有研究利用这些图像对阿尔茨海默病[11]进行早期诊断。

3.1.6 心血管病学 在包含549个心电图的小型回顾性数据集中使用深度学习诊断心脏病发作,报告的敏感性为93%,特异性为90%,与心脏病学家的诊断表现相当[12]。对于超声心动图,DNN和心脏病学家将267例患者研究(包括83万多张静态图像)按照15种标准分类,该算法对单一静止图像的总体准确率为92%,而4名专业超声心动图医师的准确率为79%[13]。

3.1.7 胃肠科学 在结肠镜检查中发现小的(<5毫米)腺瘤性息肉或无柄息肉对胃肠科医生来说较为困难。在325例共466个小息肉的患者中首次对人工智能进行前瞻性临床验证,在常规结肠镜检查中其准确率为94%,阴性预测值为96%。人工智能光学诊断的速度为35秒,该算法在无需注射染料的情况下对新手和胃肠病学专家都同样有效[14-15]。

3.1.8 精神健康 全世界有3.5亿人在与抑郁症抗争[16],人工智能有潜力向受影响的患者和临床医生提供支持。通过键盘交互、语音、面部识别、传感器和交互式聊天机器人[17-22]对抑郁和情绪进行数字跟踪。

3.1.9 临床其他环节 在临床许多其他环节也有使用人工智能算法的案例,如促进中风、自闭症或脑电图仪的诊断[23-24]等。

3.2 人工智能与卫生系统

从理论上讲,临床关键结果的成功预测可以使医院卫生治疗资源的使用更加有效和精确。例如使用一种算法来评估患者重新入院的风险,而根据通常的出院临床标准,这种风险是无法检测到的,可以采取相应措施避免患者出院,合理协调安排将资源。对于危重患者,极有可能在短期内存活下来,用于患者、家属和医生进行复苏、气管内机械通气管的插入和其他抢救措施。而通过人工智能预测工具来决定哪些患者可能从姑息治疗中受益,以及确定哪些患者有发展为脓毒症或脓毒性休克的风险,将发挥极为重要的作用。利用电子健康记录数据和深度学习算法已能够预测许多诸如老年痴呆症、死亡等[25-30]重要的临床事件。

3.3 人工智能与患者

开发深度学习算法使公众能够掌握个人健康情况。如2017年底美国食品药品管理局通过一种智能手表算法检测房颤[31],随后2018年苹果公司获得批准将该算法应用于Apple Watch系列[32-33]。

3.4 局限性和展望

人工智能技术仍存在很大的局限性。一个有缺陷的算法可能对患者造成重大伤害,医疗算法的医源性风险巨大。人工智能算法应用于临床实践中需要系统调试、审查、广泛的模拟以及前瞻性的真实世界验证[34]。在使用DNN的情况下可能无法理解算法的输出结果。欧盟一般数据保护规定要求在算法用于患者护理之前对算法的黑盒进行透明性解释[35]。关于在患者护理中使用非透明算法是否可以接受的争论尚未解决,但是医学实践的许多方面都无法解释,例如没有已知作用机制的药物处方。人工智能在医学领域发展最重要的问题在于数据隐私和安全保障。鉴于黑客攻击和数据泄露等问题,使用有可能泄露患者病史细节的算法将十分危险[36]。

4 结语

人工智能与医学的融合才刚刚开始。对于机器算法能够帮助临床医生预测临床结局的研究,目前还没有显著的前瞻性验证来证实其对卫生系统是有价值的,对以患者为中心的算法来说更是如此。该领域前景很好,但数据和证据却相对不足。人工智能算法能够快速、准确、低成本地处理大量数据,助力医学发展。

猜你喜欢

准确率医学深度
本刊可直接使用的医学缩略语(二)
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
深度理解一元一次方程
医学的进步
预防新型冠状病毒, 你必须知道的事
深度观察
深度观察
深度观察