IBM沃森健康发展失利折射AI应用四大误区
2019-11-20李雅琪
李雅琪
2019年4月,一篇刊发于IEEE Spectrum名为《IBM沃森在人工智能医疗方面的妄言与食言》的特别报告,再次引起社会对人工智能医疗应用前景的质疑。此前,分布在中国22个省份的67家医疗机构曾耗费巨资引进IBM沃森也被爆出存在导致患者死亡的风险。此次IBM沃森的受挫并非偶然,代表了众多人工智能企业从技术研发到应用落地的四大误区。基于此,赛迪智库电子信息研究所提出筑根基、促应用、强监管三点建议。
IEEE Spectrum于2019年4月发表的特别报告《IBM沃森在人工智能医疗方面的妄言与食言》一文中,细数了沃森健康曾经设立的目标与现实难以兑现的窘境。此文一经发表,再次引发了产业界对人工智能高速发展背后所面临一系列问题的忧虑与反思。因此,有必要全面审视人工智能应用发展过程中出现的问题与思维误区,为后续高质量健康有序发展提供借鉴。
IBM沃森面临的三大困境
一是发展后劲不足。IBM沃森成立之初前景看好。IBM早在2011年开始布局人工智能医疗,同时承诺将在2年内推出首批医疗保健产品。2015年4月IBM成立独立的沃森健康部门,并于一年后投入约40亿美元收购包括Explorys、Phytel以及Merge Healthcare等在内的四家医疗数据公司。短短4年间,IBM汇聚了人工智能医疗保健领域应用所需的技术、资源与人才,在智能诊断、临床决策等领域技术布局方面一路高歌猛进,成为媒体宣传和企业争相效仿的标杆。然而截至今天,IBM曾经的承诺并未兑现,市场推广阻碍重重,面临治疗方案致死、营收下滑、相关业务快速收缩、高管离职以及大幅度裁员70%等诸多负面新闻,唱衰之声不断。
二是深度学习与医疗护理现实之间存在鸿沟,产品落地困难。IBM沃森广泛开展项目合作,成果却十分有限。自2011年起,沃森已经发布了近50份关于智能医疗的合作研发公告,涉猎领域十分广泛,包括面向医生的临床决策支持工具研发以及面向消费者的健康管理工具研发等,旨在打造全面的新一代医疗保健产品。这些项目多为人工智能技术与医疗行业融合应用的首次尝试,雖具有重要价值与意义,但是多数项目至今尚未拿出可实现商用的医疗健康产品。2016年安德森癌症中心在花了6200万美元之后,依旧选择终止与沃森健康的合作,只因深层次合作研究之后发现,深度学习与医疗护理的现实之间有着根本性的不匹配,深度学习无法独立地从医学文献的最新进展与患者的电子健康档案中提取有效信息。
三是样本数据不足,数据获取渠道尚未打通。沃森用于技术研发的医疗数据资源十分有限,一方面由于癌症的病历数量相对其他常见临床病症来说本身就十分有限,可用于深度学习模型训练的成功的案例就更为罕见。另一方面由于企业与医疗机构之间的有效沟通渠道尚未打通,获取病人真实病历面临多重阻碍以及高额的资本与时间投入。因此沃森智能癌症诊断工具的大量训练时间用于掌握肿瘤学家设计出的理想化病历与治疗方案,即便是仅有的635例真实病历数据也多集中于肺癌,不具备普适性。通过将沃森的癌症治疗建议与医院肿瘤专家的建议进行比较发现,沃森的智能诊断方案差强人意。尤其是在韩国加钦大学吉尔医疗中心为656名结肠癌患者提供的诊断建议与医生的医疗方案一致率不足一半,仅有49%。
IBM沃森项目折射出人工智能应用发展四大误区
夸大宣传,名实难副。不仅是以沃森为代表的智能医疗行业,其他领域人工智能企业多曾夸下海口。以无人驾驶为例,2018年无人驾驶企业纷纷提出年内实现无人驾驶商业化运营的计划,然而看似是无人驾驶元年的2018年,却成为了无人驾驶商用的平台期,所谓的“无人驾驶”实则L2、L3级别的有条件自动驾驶,“商业化运营”也多为短期封闭园区内的应用示范,众多商业计划纷纷“跳票”,甚至还有几项在世人的瞩目下以失败告终。目前,业界尚缺乏统一的人工智能测试标准,其产品无法被量化评价,企业通过媒体、广告等手段对人工智能产品进行过分夸大宣传,不利于行业的长远健康发展。人工智能的确未来可期,只是目前应用落地尚处探索阶段,终端产品的性能与用户体验仍需提高,过多的夸大宣传与造势炒作,一方面会给公众以不切实际的想象与期望,另一方面易引发资本界的无序跟风投机,进而激发行业泡沫。
急功近利,根基不稳。人工智能的技术能效很大程度取决于用于模型训练的数据数量与质量。然而很多情况下,高质量的数据样本都非常稀缺,且获取数据的过程面临重重阻碍,相关企业对此类基础环节不够重视,在投入与积淀严重不足的情况下,急切地将尚不成熟的产品推向市场,引发一系列“质量”问题,为人工智能技术商业化落地平添阻碍。截至2018年5月8日,全国人工智能企业4040家,其中拿到风险投资的人工智能企业仅有1237家,仅占30%,仍有70%的公司拿不到风险投资。全球新增人工智能企业数量自2016年达到2733家巅峰后,便开始逐年下降。随着人工智能创业热潮趋于理性,未来市场将会更加注重核心技术与落地能力,急功近利的布局策略终难以在市场立足。
研产脱节,落地困难。目前除计算机视觉、深度学习等相对成熟的人工智能技术所催生出的智慧安防、智慧交通、精准营销等垂直应用场景外,医疗、制造业等大多数传统行业的业务需求与人工智能的前沿科技成果之间尚存在较大鸿沟,人工智能技术的全流程应用尚未实现。据统计,目前人工智能技术多聚焦于计算机视觉,其中68%的计算机视觉技术集中应用于智慧安防、智慧交通等场景。多数人工智能创新成果与实体经济融合尚在起步,应用环境有待打造,人工智能创新成果在行业推广应用时,仍面临数据、标准、资质、安全评估等多种壁垒。
迷信深度学习,以偏概全。深度学习仅是实现人工智能的路径之一,也并非一项完美的技术路径。一方面,当前的深度学习本质上是一项黑盒技术,其训练过程具有难以解释、不可控制的特点,且随着人工智能的应用复杂度、需求数据量的指数式增长,机器学习,尤其是基于多层神经网络的深度学习的复杂程度愈发超出人类理解和控制范畴,在快速进化过程中极易偏离人类为其预设的轨迹。另一方面,基于深度学习的人工智能技术过度依赖数据,而数据建模与真实生活之间却很难直接划上等号,数据采集时也很难保证完全合理。如亚马逊智能简历筛选工具歧视女性,就是由于过去10年中,男性在科技行业从业人数占主导地位,用于训练的样本数据中大部分简历来自男性,导致其误以为女性简历不具备竞争力,在抓取关键词时更偏向男性。
对策建议
筑根基。人工智能发展要一步一个脚印地走,强化人工智能基础性研究,切勿急功近利。一是以技术基础理论、算法为核心,系统谋划和组织攻关,促进共性技术研发和应用推广,夯实发展基础。二是开发构建人工智能算法开发所需的数据资源、基础设施等关键环节,推动人工智能软硬件平台及生态建设。三是前瞻布局脑科学、计算机科学等领域的基础理论研究,探索人工智能发展的最优路径与根本目标。
促应用。积极培育人工智能创新产品和服务,推进人工智能技术产业化,形成科技创新和产业应用互相促进的良好发展局面。一是聚焦智慧交通、智能家居、智慧安防等需求明、范围广、基础好,可形成示范带动效应的领域,积极推广人工智能技术应用。二是结合重大活动等契机,提供更多有代表性的应用场景,为人工智能创新成果提供展示与示范应用平台,推动其实用化、产业化。
强监管。一是建立涵盖包括智能医疗、智能金融等多种人工智能应用在内的市场准入量化标准,避免出现“伪人工智能”等违规应用。二是建立健全法律法规,确保人工智能技术在转换为商业化产品的过程中始终安全可靠,规范人工智能产品宣传,避免以次充好,误导消费者。