AI医疗的中国式困境
2017-10-18沈玉姗
沈玉姗
沉寂一时的医疗健康再度回归科技界热门话题。
9月13日,苹果发布搭载心率监测和体能训练功能的新款Apple Watch 3,健康管理成为此次手表设备更新的最大亮点。不过,这只是苹果近期在医疗领域的“小动作”之一。
据外媒报道,进入6月,苹果一边与安泰保险商讨,向其健康保险用户推销Apple Watch,一边内部成立秘密小组,推进与全美多家医院的病人信息共享计划。外界猜测,硬件设备作为未来健康服务的中枢载体,将在苹果的医疗战略规划中扮演重要角色。
而谷歌则因涉足医疗再次站上舆论的风口浪尖。7月,旗下人工智能公司Deep Mind的医疗项目由于违规使用160万病人信息,合作方英国伦敦皇家自由医院被当局勒令整改。微软则在年初宣布发起医疗项目“Healthcare NExT”,对标名声在外的IBM旗下医疗业务Watson Health,试图凭借云服务和人工智能优势再战医疗市场。
国内玩家也不甘落后。9月,腾讯“觅影”食管癌早期筛查系统落地广西壮族自治区人民医院。7月,阿里健康也发布了医疗AI系统“Doctor You”,提供医疗影像检测、医生能力培训等多项能力。百度方面人士则称正在推进AI医疗,“不久将会有大动作”。
BAT的智慧医疗项目纷纷冒头,背后是相关利好政策的出台。7月20日,国务院发布《新一代人工智能发展规划》,明确指出探索智慧医院建设,推广应用人工智能治疗新模式新手段,建立快速精准的智能医疗体系。喊了多年的智慧医疗,这次真的来了吗?
机会来了
2013年,马可加入北极光创投医疗健康组,担任投资经理。研究生毕业于北京协和医学院的他,早期关注新药研发、健康服务和精准医疗等领域。近一年来,很多创业者开始带着人工智能医疗项目的商业计划书上门自荐。
不过,在马可看来,其中大部分项目都属于“蹭热点”,“放在一两年前或许就和人工智能无关,创始团队也无相应的技术背景。一旦风停了,吹起来的猪还是会掉下来。”
即使是在应用门槛最高的医疗领域,人工智能也正在加速风口形成。鲸准数据中心的研究结果显示,2013-2017年间,国内AI医疗领域共发生融资事件241起,仅2017上半年就宣布46起融资事件。其中,医疗影像成为资本集中布局的高地,占比高达31%,虚拟助手、健康管理仅随其后。
探路者中,谷歌、苹果自带明星光环,不过这次老牌IT巨头跑在了前面。2015年7月,基于超级计算机IBM Watson研发的Watson for Oncology(沃森肿瘤)成为全球首款投入商用的医疗人工智能产品;错失移动互联网的英特尔则在2016年适时转向数据中心业务,并在6月的国际超级计算大会上发布了专为机器学习定制的72核至强融合处理器Xeon Phi(芯片代号Knights Landing)。
爆发点源于技术和数据的多年累积。90年代,人们已经尝试研发计算机辅助诊断、影像病灶标记等技术应用。2012年,深度学习技术开始应用于全球最大的图像识别数据集Image Net,并很快在多个领域的识别率创下新高。此前,斯坦福大学的研究人员利用卷积神经网络技术(CNN)诊断皮肤癌,系统精确度与21位皮肤科医生对比结果相当(91%以上)。斯坦福大学邢磊教授向媒体表示,深度学习将医疗AI推向了新的高峰。
由于国内的医疗资源供需不平衡、地域差距巨大等因素,医疗改革深化急需新动力,人工智能也被寄望能改善整个医疗体系的运行性能。科大讯飞智慧医疗事业部总经理陶晓东对此形容,“省一级三甲医院和欧美先进医院相比,从设备到医疗水平都不相上下。但从市区开出50公里外,情况就大不一样。”马可向《21CBR》记者表示。
科大讯飞、依图等专注于人工智能的公司,已率先深入医疗行业,纷纷落地语音电子病历、肺部影像辅助筛查等临床应用。不过,目前大部分项目仍处于科研阶段,一旦走向商用,数据采集困难、算法模型难度和政策法规空白都将成为障碍。事实上,现阶段国内尚未对人工智能的医疗应用制定行业标准和定价体系,传统医疗对于新技术也存在天然排斥,AI从业者们仍需小心探路,尊重医疗体系的游戏规则。
2017上半年,卫计委连发两份文件叫停互联网医疗。鼎沸一时的线上诊疗加大了监管难度,却未能触及医疗行业的核心痛点。
这一波AI医疗创业者也面临着相似的挑战。以当下最热的智能阅片辅助筛查为例,“医院拍片由各地政府部门统一定价,且现阶段机器读片只作为辅助工具,最终诊断报告仍由医生出具。免费给医院用,医生当然愿意。问题是怎么收费?”马可认为,AI医疗属于典型的长线投资领域,现阶段国内尚未跑出成熟清晰的商业模式。
单点突破
医疗行业知识门槛高,业务体系复杂,历来是块难啃的骨头。人工智能如何单点突破?
7月28日,英特尔中国与爱尔眼科、极视互联(爱尔眼科旗下子公司)和技术提供商晋弘科技四方签署协议,共同推出针对糖尿病视网膜病变(DR)和老年性黄斑变性(AMD)的人工智能识别解决方案。爱尔眼科的各级医师扮演机器的“老师”,将经过脱敏处理后的10万张眼科图片标注好病灶,再交由晋弘科技和极视互联完成机器学习和产品化运营,整个方案基于英特尔的硬件和深度学习平台。
谈及为何从上述病症切入,爱尔眼科医院集团副总裁、总院长唐仕波教授向《21CBR》记者表示,糖尿病性视网膜病變属于高发病种,约三分之一的糖尿病人后期会因这一并发症失明,国内现阶段只有3万名眼科医生,而服务人群数量庞大,加上患者初期并没有症状,早期筛查更为重要。endprint
英特爾提供了支撑10万张图片训练的软硬件方案。整个大规模训练过程在本地完成,相比云端环境对功耗的容忍度更低,正适合专门针对人工智能场景、兼具扩展性和兼容性的CPU+FPGA硬件组合。
目前,系统识别上述两类眼科疾病的准确率达到93%,单张诊断时长在10秒以内,已在全国20多家爱尔眼科社区网点部署。上述合作希望借助爱尔眼科在全国的医院网络将模式铺开。不过,极视互联认为,眼下更重要的是提升各站点的服务和聚客能力。晋弘科技董事长郑竹明博士也称,“临床医疗服务讲求高效准确,图片一周才能读出来也就失去了实际意义。”
数据、算法和算力构成了人工智能发展的三个元素。借助三大芯片厂商英特尔、英伟达和AMD过去十多年对算力的持续提升,以卷积神经网络技术(CNN)为代表的深度学习在算法界得以流行,数据采集成为最后一道关卡。事实上,多家公司之所以“扎堆”影像筛查,很大原因也是病样获取相对容易。谷歌在2016年就公开了包含12.8万张眼科图片的数据库,肺部影像则由于具备天然对照,机器更容易对此训练。
在语音赛道方面,占据70%市场份额的科大讯飞率先落地了医疗领域的首个项目——语音电子病历。今年初,将医生语音自动转换成文字的门诊病历采集系统在北京大学口腔医院开始试点。
科大讯飞智慧医疗总经理陶晓东介绍,口腔医生在诊断治疗过程中常常两只手被占用,通过佩戴领夹式麦克风对其收音,系统能够自动识别专业术语、药品名称、各种医学单位、化学式等常见难点,并通过语义理解生成结构化病历,准确率在95%以上,稍作修改后生成一份标准化电子病历,总共用时1-2分钟。
移动App“云医声”则是为医生进行病人查房时设计的移动医护助手,以语音能力对病人进行全景数据收集,也针对病例情况向医生推送相关的医疗文献和疾病指南。自2016年在安徽省立医院投入使用以来,后台活跃度非常高。目前,科大讯飞的智能语音服务已落地安徽省立医院等20多家国内大型医院,并且面向全院所有科室。
2月22日,基于原卫生部2010年发布的《电子病历基本规范(试行)》,国家卫计委再度出台电子病历书写规范的通知文件。一直以来,历史病历缺失和信息共享难的问题,容易导致不必要的诊断和治疗错误。陶晓东向《21CBR》记者表示,科大讯飞的业务决策逻辑是“刚需+代差”,“技术上要有代差,产品则面向用户刚需,关键是要解决临床问题。”
专家的力量
除了数据、算法和算力等三大要素,在医疗领域,还有一项因素也尤为重要:领域知识(domain knowledge)。更多时候,机器学习需要“接收”到来自主治大夫、医学专家们的知识传授。
2016年8月11日,在IBM Watson全球发布会上,IBM沃森肿瘤(Watson for Oncology)宣布进入中国,由本地运营商杭州认知关怀负责与国内20多家合作三甲医院的落地对接工作。当年12月26日,全国首家沃森联合会诊中心在浙江省中医院正式运营。认知关怀总经理华松鸳告诉《21CBR》记者,如果考虑医联体下属医院,目前沃森肿瘤方案已进入全国200多家医院。
沃森肿瘤(WFO)是沃森健康(Watson Health)家族产品线中最成熟的代表,基于IBM研发的超级计算机系统Watson,运用信息分析、自然语言处理等技术,具备一定的认知推理和自我学习能力,提供符合循证医学原理的临床肿瘤治疗方案。今年9月初的一次行业会议上,上海瑞金医院副院长胡伟国教授介绍,WFO与瑞金专家针对148例肠癌患者的治疗方案比对一致率达到90%以上。
WFO如何取得对诊疗方案的学习能力?从2011年开始,WFO就开始在美国历史最长、规模最大的癌症中心——纪念斯隆凯特琳肿瘤中心(MSKCC)接受训练,其间共学习了超过300种医学专业期刊、200本以上肿瘤专著和不少于1500万页的资料和临床研究。2012年,Watson Health甚至通过了美国执业医师资格评定标准的相关考试。
另一边,北极光创投参与投资的翼展科技在今年初陆续拿到了几个省的独立影像诊断中心牌照。翼展曾是多年的PACS(医学影像信息系统)服务商,与国内数百家医院有业务往来,因而在数据和专家资源获取上具备不小的优势。
2016年底,翼展开始着手推进肺部影像智能阅片的技术方案,并为此请来省一级三甲医院的数十名影像科医师组成外脑团队,业余时间对肺癌、肺结节等疾病的胸片进行前期标注,再将脱敏、交叉验证后的图像数据交由科研合作方——美国卡耐基梅隆大学邢波教授的团队进行模型训练。
当前,已经商用的计算机辅助诊断方案都担任着“第二读者”的角色,即仍由医生对图像采集和诊断结果负全部责任,算法仅作为辅助工具。这一做法符合各国目前对新技术应用医疗业的法律规定。不过,即便政策放开,现阶段在流程上也无法刨除专家确认环节,因为没有机构能够给出算法犯错后的风控方案并对此负责。
曾任飞利浦医疗放射科解决方案首席架构师的陶晓东,不认可业内将深度学习视为黑盒子的做法,“系统能找到肺结节,却说不出为什么是结节。实际上,阅片的放射科医生不仅仅根据影像作出判断,还需要参考病人的其他临床信息,例如病史、家族史等,背后是最基础的医学知识和对成像原理的理解。这些know-how(经验知识)往往被机器学习算法所忽略。”
陶晓东表示,虽然近几年机器学习的门槛逐渐降低,“很多开源的东西,但若知其然而不知其所以然,出现问题的时候就不知道怎样去解决。”
中国式困境
华松鸳介绍,肿瘤病种由于成因复杂,对生命构成较大威胁,国内医院流行采用多学科会诊的方式,由多个学科的医生专家一起对疑难病患做出多方位评估。不过,每个医生从各自的学科角度出发,不可避免带有倾向性,“比如外科医生提倡手术,放疗科则建议做放疗。”一些医院为此还会以背对背投票机制给出会诊结果。
沃森肿瘤(WFO)本身可视为一个多学科会诊系统。鉴于WFO前期学习的海量知识以及循证医学的产品逻辑,WFO得出的推荐治疗方案相对更综合全面,并能给出相应的文献支撑,一定程度上能与经验诊断形成对照,减少误诊情况,缓解临床压力。“很多肿瘤医生一天要看几十个患者,毕竟不是机器,很难保证一直都在最佳状态。”华松鸳称。
此前,IBM方面公布,WFO与美国纪念斯隆凯特琳肿瘤中心的顶级专家组给出的治疗方案符合度超过90%,其中肺癌治療建议的一致性达到了96%。由于焦虑感驱使、安全感降低等心理原因,国内很多肿瘤患者在得知病情后会在多家医院反复就诊。“可能今天在杭州的医院看,明天就去上海看,后天则去北京看。”方案结果得到WFO验证,能够在一定程度上缓解患者的盲目就医行为。
那么,当二者方案出现不一致时,是否会因此干扰医生的治疗过程,甚至影响基层医生的诊断自信?
华松鸳表示,医学差异本属正常,针对同一个病患,不同医院、不同医生给出的方案可能都不一样。同时,不一致也是临床医学的价值体现之一,能够促使医生去思考哪个才是最佳方案,甚至激发产生新思路。“如果对各类疾病诊断都达到100%一致性,人类医生就真的可以被代替了,而这恰是我们认为沃森肿瘤不应呈现的方式。”
目前,WFO尚未针对国内病例数据进行训练,10%的不一致也大多来自中美在患者体质、治疗习惯和文化思维上的差异。比如,部分胃癌治疗方案不适合国内患者,或是国内对高龄患者不倾向使用放疗等,WFO的本地化之路依旧漫长。3月,IBM先后与万达网络、百洋医药集团签订合作协议,允许其在中国市场推广IBM Watson服务。
今年两会上,“分级诊疗”被列为中国特色基本医疗制度之首,政府工作报告指出,2017年要将分级诊疗试点和家庭医生签约服务扩大到全国85%以上地市。
9月,英特尔中国与爱尔眼科等合作伙伴对外展示国内首个针对眼部疾病的远程智能阅片平台,表示将推动分级诊疗,改善眼科医生稀缺、医疗资源集中的现状痛点。
科大讯飞则在开发有别于IBM沃森肿瘤的临床辅助诊断系统。在安徽省立医院、中国医学科学院等机构专家的帮助下,人工智能系统已经学习了53本人民卫生出版社的5年制医学本科教材、百万级电子病历和医学影像资料,以我国基层缺乏的家庭全科医生作为培养目标。
陶晓东表示,“要让60分的医生能干80分的事情,让90分的医生少干60分的事情,但最终治疗仍交由医生来主导,人工智能只是医生的得力助手。”endprint