基于深度学习的人工智能医疗应用与存在的问题
2019-05-09王海洲
王海洲, 王 冠
(解放军北部战区总医院 骨科, 辽宁 沈阳 110003)
深度学习(Deep Learning)概念于2006年被提出,最初源于人工神经网络的相关研究,其后经研究者不断努力和持续完善,已发展成机器学习领域具有良好发展前景的分支学科[1].可以认为,深度学习是机器学习研究中的一个新的领域,是机器学习基础上对数据进行表征学习以获得属性类别或特征的方法,其动机是模拟人脑分析和学习的神经网络,通过解释数据(例如图像、声音和文本等)获得内在规律和理论,进而加以改进并提升自身能力.
深度学习技术现已应用于多个领域,并逐渐由静态图像处理、文字信息补全等早期简单应用向视频、音频资料处理等高维应用发展,从不完整信息补全向创造性工作转变.在大数据的支撑下,人工智能可通过对以往数据的分析迅速提炼低层数据的普遍规律和以往处理方法,并在此基础上消化、融合,掌握处理原则,进而按照原则创造新作品.浅层次的创造性工作包括绘画、写作、语音输出、作曲等,高层次的工作则可以包括智能驾驶、局势判断并制定策略等.2016年3月,基于深度学习,谷歌DeepMind公司开发的围棋人工智能机器人AlphaGo与世界职业冠军棋手李世石九段对战,4比1获胜.之后,它在中国棋类网站注册帐号----Master(“大师”),与数十位中日韩围棋高手进行快棋对决,连胜60局;在中国乌镇围棋峰会上,3比0战胜当时世界排名第一的中国棋手柯洁.AlphaGo的棋力被围棋界公认已经超过人类职业围棋顶尖水平.
深度学习通过组合低层次特征形成高层次的抽象属性类别或特征,因此,数据的处理是学习质量的关键,而海量数据处理本身就是计算机特有的长处.近年来,数据和网络技术的进展,可获取的数据呈几何级数增长,为计算机深度学习创造了条件.人工智能棋手战胜人类围棋顶级选手这一事例,可视为深度学习技术的卓越成果.
1 深度学习的发展历史及其优势
1986年,多伦多大学教授、机器学习泰斗、神经网络之父----Geoffrey Hinton 发明了适用于多层感知器(MLP)的BP(backpropagation)算法,并采用Sigmoid进行非线性映射,有效解决了非线性分类和学习的问题.但是在1991年,BP算法被指出存在梯度消失问题,该问题直接阻碍了深度学习的进一步发展.此外,20世纪90年代中期,支持向量机(SVM)算法诞生,各种浅层机器学习模型被提出.SVM是一种有监督的学习模型,应用于模式识别、分类及回归分析等.支持向量机以统计学为基础,与神经网络有明显的差异.支持向量机等算法的提出阻碍了深度学习的发展.
为此,Geoffrey Hinton和他的学生2006年在Science上发表文章,提出了深层网络训练中梯度消失问题的解决方案:无监督预训练对权值进行初始化+有监督训练微调.在深度学习研究方面,美国的斯坦福大学、纽约大学,加拿大的蒙特利尔大学等都给予了极大的关注,使得深度学习在学术界和工业界掀起浪潮.
2011年,能够有效抑制梯度消失问题的ReLU激活函数被提出.此后,微软在语音识别上首次应用DL,取得了重大突破.世界顶尖的语音识别研究人员们采用DNN技术,将语音识别错误率降低了20%~30%,这是十多年来语音识别领域最大的进展.2012年,DNN技术在图像识别领域又取得了惊人的成就,使ImageNet评测的错误率从26%降低到15%.同年,DNN还被应用于制药公司的DrugeActivity预测,并获得世界最好成绩.
几乎与此同时,为了证明深度学习的潜力,Hinton课题组于2012年首度参加ImageNet图像识别比赛,构建的CNN网络AlexNet夺得冠军,进而吸引了众多研究者的注意.接着,伴随DL的网络结构、训练方法、GPU硬件的不断进步,深度学习也在其他领域不断地展开.
2 深度学习在医疗领域的应用现状
深度学习被用于解决许多大数据问题,如计算机视觉/语音识别和自然语言处理[1].在医疗领域,基于深度学习的人工智能技术也在逐渐融入临床.目前,其应用范围较广的是医学影像的自动分析和辅助诊断[2],如肺结节良恶性分类研究、乳腺病灶良恶性鉴别等[3];在肌肉骨骼系统,对骨骼、软骨等结构的分析也有相关尝试[4];通过对多种检查手段的联合分析,可提高诊断的准确性[5];甚至通过对心电图、MRI的分析,可完成心律失常、认知障碍等内科功能性疾病的诊断[6-7].
深度学习作为机器学习中一种对数据进行表征学习的算法,它的观测值可以用多种方式来表示,而使用某些特定的表示方法更容易从实例中实现学习任务,例如对于一幅图像----人脸或面部表情的识别,采纳其每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等.深度学习的优势即在于,它是利用非监督式或半监督式的特征学习和分层特征提取的高效算法替代传统手工对特征的获取.
特征的提取非常关键,从某种程度上说比算法还重要.比如,在骨科临床中对一些患者的数据分类,结果若是想要得到骨骼的结构,如果提取的特征是肌肉,那么不管采用何种分类算法,效果都不会好;如果提取的特征是骨骼的长短,尽管还是会有错误,但与肌肉相比会好很多;而如果提取的是一个超强的特征,比如骨细胞染色体,则分类基本就不会错了.也就是说,提取什么特征能最准确地匹配分类算法,这需要具有丰富临床经验的医师和人工智能专家共同去设计.
以骨科脊柱侧弯支具制作为例.脊柱侧弯的物理矫形是非常复杂的体系,针对侧弯脊柱的三维矫正需要关注于多个参数的改善,任何只关注单一参数或个别几个参数的矫形都难获取理想的三维矫形效果. 传统的方法是将正常人体的X光或CT透视片(如图1、图2)与患者进行比对,使其对自己的病症具有清晰的认识,再利用人工石膏模型制作矫正器.
图1 人体正位与侧位透视效果
图2正常脊柱结构透视
Fig.2Perspectiveofnormalspinestructure
现阶段除传统的影像学评估以外,通过多种设备联合使用,全面评估患者,以获取全面客观的脊柱侧弯实际数据,进而提升脊柱侧弯病人物理矫形的三维矫形效果,已在临床测试中得到验证.这就是将传统生产工艺中的取模、修模两个核心技术环节升级为3D技术代替手工, 即将粗略的修型工艺升级为精准矫形,加之不断的细节关注,改进和增强矫形效果,提升产品品质(如图3).本研究选取2位脊柱侧弯患者,在深度学习的人工智能技术帮助下,他们的矫正效果非常理想.其矫正前后的X光片如图4所示.
脊柱侧弯矫正的力学原则,是用三点矫正原则在三个面上加以矫正,即在额状面最高椎上施以主要矫正力,并在对侧上端、下端施以反作用力达到矫正侧弯的目的.此原则需要注意在侧弯严重的一侧尽可能寻找杠杆臂较长的反作用力,否则很难达到矫正效果.随着矫正要求精度的提高,需要的数据量越来越大,以传统人工方法获取这些数据变得越来越困难.
图3 3D脊柱侧弯矫正器制作Fig.3 Manufacture of 3D scoliosis orthosis
图4侧弯脊柱矫正前后Fig.4 Before and after correction of scoliosis(a)—病例1; (b)—病例2.
而发展了的深度学习中,非端到端的数据输入端发出的不是直接的原始数据,而是在原始数据中提取的特征,为解决这一问题带来了希望.
3 深度学习在医疗应用中存在的问题
尽管深度学习技术已取得很多进展,但其持续发展仍面临较多问题,尤其是在医疗领域,尚有很多需解决的实际问题.一些著名期刊比如Science、NEJM等,在频频发出关于人工智能和深度学习的研究和社论,有的报告新成果,有的谈未来谈希望,也有的提出“期望值不要太高”的警示.
(1) 深度学习的前提是大数据的积累,数据是其“食物”.深度学习系统要吞下足够的数据,直到它发现数据中的模式,或者说规律,才能输出有意义的结果.它的食物来源有可能是专门设计课题,招募大量受试者,生成新的数据,也有可能是整合好几个已发表的研究数据,还可能利用日常真实的医疗活动中产生的数据,医生每天写的病历都会成为它的“食物”.而医疗领域的数据积累一直是个难题,患者的依从性往往存在很大变数,尤其是治疗后的随访,很容易出现失访或数据不准确的情况.如何能便捷有效地确保数据准确、快速、全面地获取是亟待解决的问题.
曾听说国内有企业在跟医院对接,获取电子病历数据进行分析,但暂时没有听到有成果汇报的消息.也许最大的障碍就是它所使用的数据是否恰当,以及它们的质量如何.如果在训练过程中使用了不完整、不恰当、有偏倚、不稳定的数据,甚至错误的数据,那么最好的结果可能是做出来的分析毫无意义,最糟的则可能导致误导性甚至有害的分析结果.什么样的数据才是“正确”的数据,多少才算足够,获取数据的成本多大,又该怎样检测、理解数据中可能存在的偏倚或错误,以及那些关键但又“不可量化”的信息(包括社会与文化因素等)怎么整合,都是面临的严峻问题.
当然类似的许多问题,也广泛存在于常规医学研究中.深度学习中更为突出的问题是:怎样验证它的新的发现;与“最优秀的”医生比较,还是另设计实验;如果人们无法理解它得出结果的机制,那怎样能将它的发现转化到临床实践中;甚至,怎么才能信任它.还有伦理和法律上的问题没讨论清楚,即出错了谁负责,怎样制定有效的质控方案,等等.
再者,能从自变量预测结果,却没能鉴定有实际意义的原因(有相关性不等于有因果关系),也就无法采取有针对性的行动.目前机器学习还没法回答疾病是如何、为什么产生的.Science杂志近期发表的一篇报道,介绍各路科学家如何解开AI的黑箱,理解它的“思维”,以及怎样克服数据本身缺陷的问题,这也许会给问题的解决带来希望.
(2) 人工智能在医疗领域的定位仍是敏感问题,患者的生命权和健康权是至关重要的,在技术进步到何种情况下可以完全信赖其诊断或依赖其进行治疗是需要审慎、全面考量的.
(3) 临床治疗是复杂的整体思维过程,对疾病的诊断和治疗是整体诊疗过程的重要部分,但不是全部,患者的一般情况、依从性、经济水平、家庭承受能力等均是决定治疗方式的重要因素,以往,这部分判断可由作为理性人的医师完成,人工智能是否能胜任此工作尚存疑问.
4 结 论
通过对深度学习概念提出及发展状况的梳理,目的是研究其在医疗应用中的优势与存在的问题.目前,还处于上升发展阶段的深度学习,不论是在理论还是在实践方面,都还存在诸多问题需要去解决.随着“大数据”时代的来临,以及计算资源、人工智能技术的大幅度提升,新模型、新理论的验证周期将大大缩短,这一切都必然在很大程度上改变世界,不仅仅是医疗,还有一切涉及人类发展的领域.
任何事物都有两面性,未来无法预知,但不管怎样,都应该抱着乐观的态度迎接这个第三次工业革命.基于深度学习的人工智能技术已逐渐融入医疗临床工作,但仍需解决较多问题,这些问题的妥善解决必将使全社会的医疗水平大大进步,使广大患者受益.