APP下载

人工智能医疗的三个逻辑

2020-04-03王程韡

医学与哲学 2020年5期
关键词:错误率病患医生

王程韡

人工智能(artificial intelligence,AI)在医疗中的应用似乎已经成为一个世界性的趋势。大量的研究显示,AI在发现肿瘤、预测老年痴呆、监测心率失常、评估(体外受精)胚胎质量,以及缩短药物研发周期等方面存在着不可比拟的优势[1-2]。甚至在图像学、病理学等常规临床场景以外,AI还可以提供区分长期幸存者/短期幸存者预后的相关信息[3];辅助治疗毒瘾、儿童孤独谱系症等精神疾病[4]——有人以此乐观地认为:作为一系列连锁作用的结果,家长式的(paternalistic)医疗模式必将逐渐被以病患为中心的医疗民主化所淘汰[5]。

与普遍的乐观态度形成鲜明对照的是,还是有学者对AI医疗数据共享的困难、隐私泄露的可能性以及算法歧视/偏见等表示了谨慎的担心[1,6-8]。需要承认,医疗行业的一大不容忽视的特点是拥有丰富的数据集。这被看作是AI“学习”的理想条件[9]。但以数据为核心的技术实施模式也决定了,AI医疗必然会面临数据和算法相关的一系列共性问题。

本文试图跳出这个以数据为核心的视角,转而探究支撑AI与医疗相结合背后的主导逻辑。进而针对中国,更有的放矢地指出这些主导逻辑可能导致AI医疗在未来发展上的风险。

1 当医疗遇上AI

AI的存在最初只是人类的一个美好愿景。如早在1942年,美国作家阿西莫夫(Isaac Asimov)就在其短篇小说《环舞》(Runaround)中以“机器人三定律”的方式提出了AI的初步设想[10]。

真正将设想变为现实的,是战后两大阵营之间的意识形态的对抗。20世纪五六十年代,苏联在考虑使用AI来管理宏观经济的办法。这一点也引起了美国人的注意。可惜那个时候的科学家至多只能拿出伊莉莎(Eliza)这样的简单人机对话程序,两国之间在AI上的竞赛远不如太空竞赛一样红火。直到AI被应用到下棋这个场景下,电脑程序对电脑程序的棋艺竞争才与此前棋手之间的对战一样,变成了冷战不可或缺的组成部分[11-12]。最负盛名的首场电脑国际象棋比赛由《每日电讯报》举办,从1967年11月22日开始,一直持续了一年。结果,使用了对所有可能策略遍历搜索的A型算法的苏联人取得了胜利[13]。在美国,大量的研究经费涌入AI领域。

毫无意外,当意识形态的对抗弱化的时候,AI的发展也一度进入了严冬。1973年,石油危机的爆发迫使美苏两国把重心放回到经济上来。美国国会也随即开始了对AI研究经费上高额支出的批评。同年,英国数学家莱特希尔(James Lighthill)受英国科学研究理事会(British Science Research Council)委托,发表报告指出:AI机器在国际象棋等游戏中永远只能达到“有经验的业余爱好者”的水平,而常识推理永远超出它们的能力。作为对报告的回应,英国政府终止了除爱丁堡、苏塞克斯和埃塞克斯三所大学外的所有大学对AI研究的支持,美国政府很快也效仿了英国的做法[10]。25年后,尽管美国IBM公司的AI计算机深蓝终于打败了俄罗斯国际象棋的世界冠军卡斯帕罗夫(Gary Kasparov),从而打破了莱特希尔的预言。但此后AI的发展依然不温不火。

进入到21世纪,依然是政治的力量让AI重回焦点。美国政府从AlphaGo对战围棋职业选手的成功中看到了AI在棋艺竞赛以外的其他场景中应用的希望。仅在2016年10月,美国白宫先后发布《国家人工智能研究发展战略计划》(TheNationalArtificialIntelligenceResearchandDevelopmentStrategicPlan)和《为人工智能的未来做好准备》(PreparingfortheFutureofArtificialIntelligence)战略报告等两个官方文献为AI技术鼓呼。尤其在战略报告中,美国描画了通过AI医疗创造美好生活的场景。

在对给定的淋巴癌细胞是否罹患癌症的判断中,基于AI的分析方式的错误率为7.5%,人类病理学家的错误率是3.5%,人机合作的错误率仅有0.5%,错误率降低了85%[14]。

报告所引述的这篇文章发表在电子预印本上,当然这本身并没有什么问题(尽管后来这篇文章也一直没有正式发表)。但在报告引述的过程中,却刻意忽略了研究本身竞赛(而非实际应用场景)的本质。而且原文中92.5%的接收者操作特征曲线(receiver operating characteristic curve,ROC),也在报告中被表述成更容易理解的“错误率”。相比之下,计算系统本身的肿瘤定位率只有70.51%的事实从未被提及[15]。而且,报告以一种极为巧妙的方式来避免“机器换人”恐慌:在这里,AI技术被表述成病理学家专家知识的有益补充;而大大降低的错误率,暗示着技术真正的受益者只可能是普通民众。为了抢占这一未来战略的制高点,报告还明确建议“政府需审视各国AI发展情形,并对各国重要发展予以重视”[14]。结果在一种近乎新冷战思维的激励下,AI的第二春来临了。

以数字病理学为代表的数字医疗技术的发展,却一直在一个相对独立的技术轨道上进行,见图1。20世纪60年代,科学家已经开始尝试将显微镜成像的光学数据转换成矩阵化的光密度值,并在保留空间和灰度短息的基础上重建数字化图像[16],图中数字医疗和人工智能技术分列横轴的上、下方。到了20世纪90年代,受到了分析、可视化及查询卫星遥测获得的基础和应用地球科学相关的超大规模数据方法的启发,全切片成像(whole-slide images,WSI)扫描仪终于被设计出来[17]。从而,困扰了人类许久的显微镜的视野与放大倍数之间的矛盾得以有效解决。后来,全切片成像扫描仪的发展一头扎在了光学模块的技术轨道上。从自动显微镜单光轴连续扫描,到渐进式光耦合装置(charge coupled device,CCD)扫描系统,再到阵列显微镜,都是旨在以一种光学的手段来缩短虚拟切片时间[18]。直到AI技术的相对成熟,计算模块(如图像拼接和可视化)才有了进一步提高效率的可能,AI也才具备了与医疗相结合的基本条件。

图1 AI医疗(数字病理学)发展的里程碑

尽管也被称作AI,AI医疗在本质上只是数字医疗技术(诸如影像学、病理学的光学模块所产生)的数据部分与20世纪80年代相继提出的深度学习、卷积神经网络等概念和方法的简单拼接。不具备任何影像学、病理学或是其他医疗方面的知识,AI医疗依然是仅能满足图灵测试的基本要求的,“看起来像智能”的弱AI。但为了吸引眼球,AI医疗还是被笼统地称为AI,而不是更为拗口的蒙特卡洛算法或是卷积神经网络医疗。

政治推动的一个似乎不可避免的结果是很多“技术细节”,如AI医疗的预测结果并不等同于医学知识的事实,在政府报告或是媒体宣传中被巧妙地隐去。取而代之的,是对其低错误率的大肆宣扬——和当初在棋艺竞赛场景下对胜率的强调一模一样。而且,这种低错误率通常被表述成一种“不可替代但合作更优”的叙事模式。如在德国的一项实验中,针对皮肤镜黑瘤识别任务,包括30名专家在内的58位皮肤科医生中,大部分医生的表现均优于卷积神经网络。但是无论医生的经验如何,他们均能从AI辅助图像分类设备中受益[19]。

无论如何在科学与政治联姻的技术逻辑的主导下,病患的声音和诉求被无情遮蔽了。他们甚至根本就不在场:既有的AI医疗研究,几乎无一例外地不报告、不讨论模型的使用是否导致了病患照护上的有益改变[1]。通过对“客观”的错误率的强调,AI医疗实际上变成了没有主体的、纯数据生产的过程。

2 市场力量的加入

单纯的数据生产并不总是一件坏事情,起码市场的逻辑是这么看的。

对于市场逻辑而言,愿景本身就可能带来增长。特别是对于长久低迷的IT市场而言,AlphaGo在技术上的成功和以美国政府为首的高调政治反应,无疑为资本市场打了一剂强心针。高盛公司早在2016年发布的报告《创新概览:AI、机器学习和数据驱动未来的生产力》中就大胆坦言,“近年来受制于经济大衰退,股票市场和投资市场都不景气”。但他们有理由相信,AI技术的成熟,无疑会引领如20世纪90年代一般的“技术(如半导体和计算机)驱动的生产力繁荣”[20]。于是,甚至无关于错误率,一种以市场估值为核心的话语悄然兴起。2020年AI市场规模预计达183 亿美元[20]。

人类学家早就发现,市场估值不过是华尔街所开发出来的一套号称可以保证公司利润和个人财产神圣结合的金融工具(但实际上却是金融危机的罪魁祸首)。不过资本市场却乐此不疲。而且据说,提高市场估值最好的方法,莫过于“廉价且轻松”的收购[21]。深谙此道的高盛报告自然不会忘记特别提到。

近两年IBM已经花费超过40亿美金来获得大量的医疗技术和收购数据公司。这些收购的结果是大量的医疗数据(IBM在其“健康云”有超过3亿病患的医疗记录)。用这些医疗数据(包括通过合伙企业所采集的其他数据)和他的沃森技术相结合,IBM正在向肿瘤学、临床试验、基因组等用例(场景)提供服务。在医疗垂直领域,其他的初创公司也正在遵循类似的方法来解决医疗影像、药物发现、诊断等方面的疑难问题[22]。

需要承认,面对世界主要国家人口老龄化的趋势,医疗显然是AI未来应用诸多场景中最具发展潜力的一个。也的确早在2011年,AI的先行者IBM就将这种“新技术”应用于美国安德森癌症医院进行肿瘤循证诊断,诊断准确率甚至达到了70%~80%[23]。但真正吸引创业者和风险投资的并不是竞争,而是被IBM这样的巨头收购的机会。于是,收购金额和频次的叙事也悄然加入。

2014年,医疗领域AI初创企业的收购金额约为6亿美元;到2021年,预计将达到66亿美元,年复合增长率为40%[9]。

尽管与火热的AI医疗影像相比还略逊一筹,但据不完全统计,AI-数字病理的收购在最近3年间就有33起,其中仅2019年(截至2019年11月)就有14起[24]。

那么,市场力量的加入,是否可以让病患真正受益呢?原本在理论上是具备这样的可能性的。如早就有研究发现,在线医学咨询和支持的网络模糊了正统医学知识、消费者知识以及替代医学知识之间的界限[25-26]。换言之,病患可以以一种市场环境下的消费者身份挑战医学专业人士对信息和资源的控制。但很可惜,对于AI医疗而言,这种赋权方式起码在现阶段还无法奏效。一个重要原因便是算法知识对于有着医学专业知识的医生而言都是“黑箱化”的,更不用说是普通公众,真正对它们形成垄断权的只有“电子工程界”的同仁们。而且在对AI医疗“无知”的这个问题上,医生和病患竟然奇迹般地站在一起了——他们也被去主体化了。

和技术逻辑一样,市场逻辑也在试图消减医生被AI医疗“去技能化”的担心。但并不侧重在知识上的损益,市场逻辑的叙事通常在以一种近乎戏谑的方式在质问医生:谁愿意一天8小时都盯着显微镜看病理呢?在一项乳腺癌是否存有淋巴结转移的检测中,文章这样写道:尽管AI还不能完全代替病理学家,但却大大提高了诊断速度,减轻了病理学家的负担[9]。

在病理科医生大量匮乏的中国,更是有人呼吁:影像科和病理科医生总共才8万多名,医生数量增长非常慢,而影像数据每年增长率是63%左右,这一定会促使AI扮演越来越重要的角色,帮助医生做疾病的筛查,从而降低医生的工作量……我们电子工程界同仁发展医疗AI不仅是帮助医生,其实也是帮助我们自己[27]。

的确,相对于人力而言,AI的优势在于处理更大规模的样本。但“减轻负担”的后果是什么,一个针对成年糖尿病患者的128 000多张视网膜眼底图像的测试道出了真谛。

AI算法对糖尿病视网膜病变和黄斑水肿的检测具有很高的敏感性和特异性……特别擅长识别那些需要转诊到专业处理的高危病患,以及视网膜临床表现为无病变或稳定的潜在病患方面,具有高成本效益的普遍应用优势[28]。

成本收益,显然是医院管理层(而不是医生自身)所关心的问题。可以预想,在AI医疗技术尚不成熟的情况下,院方一般会先把专业医生稳定在各自工作岗位上,假以时日再以观后效。但事实上2018年,美国食品药物监督管理局(Food and Drug Administration,FDA)已经批准了首个使用AI检测成人糖尿病视网膜病变的医疗设备,见图1。是否会发生“机器换人”,我们只能拭目以待。

有趣的是,在有着强烈的科学主义传统的中国,AI医疗竟然还有着节约人力成本以外的“开源”的功效。随着社会达尔文主义的兴起,特别是“科学的春天”以后,科学技术在中国已经俨然成为几乎一切社会变革的合法性依据,甚至是成为人们崇拜的新偶像,成为一种意识形态[29]。于是引入AI本身,就可以成为吸引病患前来就诊的噱头。一项研究就严厉指出了我国某三级医院利用AI医疗贩卖病患焦虑的本质。

根据某城市某三级医院院网站公开报道,自医院引入肺结节影像识别AI技术后,肺结节筛查人次三年中增长73%,筛查直接带来的收益增长81%,加上手术治疗,医院总收益增长100%。随着效率的提升,医院业务水平得到极大的提高。从公开的数字看,AI给医院带来丰富的经济回报。但从所在地区的卫生统计年鉴来看,所在地区的非传染性疾病的疾病谱分布情况未发生明显改变[7]。

总之,无论是宏观市场规模、收购金额的增长,还是医院成本收益的提升,本质上都在强调和强化一种资源配置的市场效率。在这种效率之下,“客观”的错误率都无关紧要,甚至也无法通过事实证明一种解决方案,比如“先进”的AI医疗,会优于另外一种更为“传统”(如引进优质医生资源)的解决方案。结果在主体被遮蔽的基础上,AI医疗又变成了一个没有客体的纯“主观”价值的生产过程。

3 被忽视的社会逻辑及其危害

不难发现,AI医疗的火热离不开政治与科学联姻的技术逻辑,以及大衰退后亟需寻找新的经济增长点的市场逻辑的双重推动。在此过程中,不是仅有外行知识的病患的真实诉求被最大程度地忽略,就连传统意义上拥有专家知识的医生都被排除在外。究其本质,是因为本不可或缺的社会逻辑被无情忽略所致。大量的历史案例证明,新技术的出现只能成为改变社会的一个脚本,但还是要受到社会力量的约束;以至于即便是相同或者相似的技术,也可以不同的方式被使用[30]。因此若想实现AI医疗在我国的良性发展,不仅要打开技术的黑箱明确其弱AI的本质,更要对称地打开社会的黑箱。

首先,AI的确“会消灭部分旧的体力和脑力劳动岗位,也能创造新的工作岗位”[20]。但也确实存在一种可能,AI和医疗的结合会以一种非预期的方式淘汰了最值得宝贵的人才。以影像学为例,影像科(放射科)医生的数量偏低,的确是制约我国医疗事业发展的一个问题。特别是7万人的队伍,和中国庞大的人口基数极不相匹配[27]。而其中一个重要原因在于我国医学影像学专业本身起步就比较晚。直到1985年前后,天津医科大学、中国医科大学、哈尔滨医科大学、原泰山医学院、原第一军医大学等院校才相继开办了医学影像学专业。医学影像学专业总体以五年制本科教育为主,但也有两年中等专业卫生学校毕业的医士,至协和医科大学八年制博士。毕业生水平本来就参差不齐,加之“培训机会不均等,人才不能流动,管理体制滞后,缺乏竞争机制”,以及“专科医生待遇低,甚至支撑生活都有一定困难,无法调动培养的积极性”等原因,严重制约了医生队伍整体水平的提高[31]。在这种情况下,引入AI影像学的一个必然的结果,并不会像自动血压计的引入一样,把临床医生从繁重的任务中解救出来[32]。而是在此之前,在高等教育专业的选择阶段,就会有越来越少的考生选择成本收益并不高的医学影像方向。甚至可以预期,“机器换人”和“去技能化”并不会发生在本来收入水平就很低的医士身上。相反,是那些苦读了五年、七年、八年的高学历医生,在可能成为医生之前就被有着同样甚至更低错误率,但实际上不具备任何专业知识的弱AI医疗所逆向淘汰。

其次,即便不考虑技术本身所带来的医生队伍的不稳定,医疗产业的市场逻辑也决定了目前尚很昂贵的AI医疗设备必然优先在医疗资源本来就很丰富的大型医院集中。截至2019年11月底,我国共有医院33 972家,其中三级医院仅有2 681家,占7.89%[33]。然而,三级医院就诊人数却达到17.65亿人次,占全国总人次的51.84%[34]。病患之所以蜂拥至北京、上海等大城市的三级医院,主要还是看中了这些地方医生和医疗设备的专业水平。AI医疗设备的引入,正如某三级医院“肺结节影像识别AI”[7]引入后“贸然接受”的情况一样,会进一步加剧这种“马太效应”——和某些专家所预测的“患者及公众对AI技术的认知不足,信任缺失,甚至可能有负面体验”[35]截然相反。基层“看病难”问题,还是得不到有效解决。即便是基层医院在社会资本的助推下,同样引入了AI医疗设备,也可能由于医生专业知识的不匹配,引发误诊、漏诊后导致患者健康受损后的责任主体划分难题[20]。

最后,“鉴于现有医疗条件的不平衡分配,仅少部分人能受益于AI的先进诊疗技术”似乎成为了一个必然[20]。普林斯顿大学的医学人类学家Biehl[36]曾深刻指出,那些被遮蔽的无法获得病患身份的人口才是最脆弱的,也最值得被照护的。但现代性公共卫生体制的讽刺之处便在于,几乎所有疾病的诊断和治疗都严重依赖于自愿登记(self-registered)的人口。不可见即不存在。在这种情况下,贫困(财力可获得性)和信息鸿沟(信息可获得性)等诸多因素始终会将本来就缺医少药的那部分人排除在AI医疗所描绘的美好蓝图之外。

4 结论

技术是无法脱嵌于社会存在的,这似乎是老生常谈。但事实上,AI医疗发展的现行逻辑却对此构成了挑战。部分脱胎于冷战竞赛,AI技术本是科学与政治联姻而非社会需求滋生的产物。而几乎同时,数字医疗技术也在截然不同的轨道上独立发展。直到AlphaGo再次引爆人们眼球,无需对专业知识有任何了解的新一代的AI技术才在美国等政府的强力推动下成为了开启未来的金钥匙。此时在数据模块上已经成熟的数字医疗技术,也顺理成章地与之发生了结合。但早在棋类游戏的时代就已经决定了,“客观”的结果性数据是衡量AI好坏的唯一标准。AI医疗的“客观”的错误率,也毫无意外地成为了技术发展的重点,以至于在病患照护上是否发生了有益的改变都可有可无。

市场力量的加入也丝毫没有改变这一错配的情况。相反,AI在医疗等领域的应用被看作是重现20世纪90年代半导体、计算机技术奇迹的又一契机。以影像学、病理学为代表的AI医疗企业受到了资本市场的强烈追逐,并购案频频发生,也创造了市场规模、收购金额/频次等新的叙事模式。在一种成本收益的考量之下,AI医疗甚至还成了医院开源节流的工具。但这种强调资源配置效率的市场逻辑的本质,却始终是没有客观标准可以衡量的“主观”价值——如AI技术和宏微观增长之间的必然联系,被夸大到了极致。

但本文却旨在提醒读者:一个黑箱模型得以实现技术和市场逻辑的重要前提,是将其放置在本不可或缺的社会逻辑当中,通过人类智慧本身的循环予以保障。为此,除了彻底地打开我们所身处的社会的黑箱,别无他法。而不是亦步亦趋地强调“客观”结果或是“主观”价值,从而成为科学或是商业霸权体系的附庸[37]。在西方成熟的医疗体制当中,他们可以去担心的是AI应用可能会危及医生之间以及医患之间的关键社交互动,从而影响两类人的服务体验[32]。但对于专业医师尚很缺乏、医疗资源分布尚不均衡、部分人口仍缺医少药的中国而言,在这些前提下去发展人工智能医疗,才会走出引导其走向真正的“善”。

猜你喜欢

错误率病患医生
限制性随机试验中选择偏倚导致的一类错误率膨胀*
最美医生
老年冠心病无痛性心肌缺血患者的临床护理效果观察
氨磺必利与喹硫平对老年精神分裂症的诊疗效果比较
分析严重创伤患者并发精神障碍的心理疏导及护理体会
医生
望着路,不想走
正视错误,寻求策略
解析小学高段学生英语单词抄写作业错误原因
制度变迁与明代官员病患叙事的演变