AI辅助药物创新,浪潮正涌
2023-05-08知平
知平
1950年,人工智能之父,英国计算机科学家阿兰·图灵,发表了一篇里程碑式的论文《机器能思考吗》,为人类带来了一个新学科:人工智能(AI);1956年,“人工智能”首次在达特茅斯会议中被提出,紧接着人工智能开始酝酿其第一次浪潮,人工智能实验室在全球各地扎根。
到了上世纪90年代后期,由于计算机计算能力的不断提高,人工智能再次成为热潮。以数据挖掘和商业诊断为主要代表的应用非常成功,使人工智能重回人们的视野。随后,人们意识到,限制人工智能发展的不仅仅是硬件问题,而是软件以及算法层面的挑战没有形成突破。
于是,2006年,以杰佛瑞·辛顿为代表的研究人员发现了训练高层神经网络的有效算法。互联网的兴起,为计算机训练提供了更多的场景和海量的数据,从而让计算机视觉训练更加全面,准确率也更高。
人工智能与药物研发,至此也有了新的故事可讲。
早在上世纪60至70年代,国外AI在医药领域的应用研究就开始了:1968年,美国斯坦福大学计算机科学家爱德华·费根鲍姆研制了世界上第一个用于推断化学分子结构的AI系统DENDRAL;20世纪70年代,斯坦福大学的爱德华·索尔特夫等人开发了第一个用于血液感染病的诊断、治疗和咨询服务的AI医疗系统MYCIN。
一款药物从研发到批准生产,并投入临床使用,一般要花费10年或者更长的时间,研发金额也高达十亿美元及其以上。但投入时间、精力、资本,未必就一定能走向成功。新药研发失败率很高,美国密歇根大学一位学者曾指出,90%的研制药物都在临床试验阶段遭遇失败。
这些因素致使一些正版药物在专利期售出“天价”,加之一部分药物尚未被纳入医保范畴,很多患者会面临“救命药吃不起”的窘境。因此,新药研发亟须一场变革。
2007年6月12日,一个名叫Adam的机器人,发现了一种酵母基因的功能。通过搜索公共数据库,Adam提出了一个假设,认为存在某些基因编码的酿酒酵母反应催化酶。在实验室中,这个假设得到了机械技术的验证—英国亚伯大学和剑桥大学的研究人员各自检验了Adam关于19种基因有何功能的假设,其中9个假设是新的和正确的,只有1个假设是错误的。
这是AI干涉人类科学发现的历史性一步,更让人们意识到,AI在药物研发领域的优势。AI制药技术不是替代传统药物研发,是把人类的生产力从传统的、低效的工作中解脱出来,让人类去做需要更多智慧和创造力的事情,为人类创造更多的、新的生命科学研究方法。
在药物研发路线设计速度方面,AI算法比化学家快10倍。
利用AI技术,人类可以快速、精确地锁定各方面条件理想的候选化合物,然后高效合成目标分子,提升整体的研发速度、降低药物研发成本。
根据设计药物研发合成路线的速度来评定结果数据,人类化学家平均所花时间为1.5小时左右;而AI计算平均时长为8.7分钟,找到第一条路所需的时间平均为2分钟。
AI还会给出多条路线,并能够按照合成路线难易和总步数排序。在药物研发路线设计速度方面,AI算法比化学家快10倍。
在进行化合物筛选时,AI也可以更快地发现新的分子化合物或者有潜力的新靶点,从而加快药物研发过程。它们还能更加准确地预测新药后续的实验结果,从而尽可能提高药物开发过程中,每个环节的成功率。
一般来说,制药分为3个阶段,第一阶段是“靶点发现”。因为人体实在是太复杂了,某一个疾病,可能是由一堆蛋白质的变化引起的。那么,选择具体的蛋白质作为靶点,就是一个非常重要的问题—而大部分AI制药公司都不会投入过多:原因比较简单,因为这个领域研究周期特别长(十年甚至更长),而且很难受到有效的商业化保护。
第二个阶段是“药物发现”(Drug Discovery),大部分AI制药公司的重心集中在这里。在该阶段,核心有3步:找hit(苗头化合物);优化hit从而找到lead(先导化合物);继续优化,直到从lead优化到pcc(临床前候选化合物)。
这基本上就是一个“先生成,再筛选”的过程。简单而言,即为通过各种生成算法生成一些分子,然后通过各种筛选方式找到合适的。
第三个阶段是临床试验。当有了pcc之后,可以考虑放在市场上去卖,也可以考虑推动临床试验。这一阶段的工作就变成了招募患者、给药、收集数据等。目前基本上,AI制药也不会涉足这个阶段,主要是因为这个阶段太花钱,而且在实践中,尚未进展到这个阶段。
是故,关于AI在新药研发领域的主要应用,集中在靶点发现、化合物合成、化合物筛选、晶型预测、患者招募、优化临床试验设计和药物重定向等7大场景。
具体来看,AI可以帮助寻找、确定和制备药物靶点。对于大型企业的AI系统,完成新药候选的时间和资金成本,只需传统方法的四分之一。
同时,AI还可以利用大量的化合物和分子数据,来预测新药的疗效和副作用,帮助科学家快速发现新药,预测药物的副作用,进而在药物研发过程中提前识别和解决问题。
如英国公司Benevolent Bio,就利用技术平台JACS,从100个可用于治疗肌萎缩性侧索硬化症(ALS)的潜在化合物中,筛选出5个化合物;再经过试验,证实4个化合物在治愈运动神经衰退方面确有疗效。
并且,AI可以帮助优化临床试验的设计,从而减少成本和时间。
从2020年至今,行业进入高速发展期,伴随着技术的不断成熟,AI新药企业与药企的合作频次、合作范围、合作深度不断拓宽拓深。另外,包括谷歌等在内的多家科技互联网巨头,亦相继进场AI制药:谷歌旗下Deepmind团队开发的两代AlphaFold算法,解决了生物学界长达50年的蛋白质空间结构预测难题—这在为AI新药领域吸引更多目光的同时,也为该领域带来更多资源和人才。
可以说,AI在辅助药物研发上,目前正推动着新一波创新潮的到来。但与此同时,AI制药现阶段在实际应用中还有不少阻碍。就AI医疗赛道而言,现在最大的瓶颈不完全在于算法和模型,而在于数据的积累及标注、对医疗场景的理解(医生或者生物医药出身)、大量的资金以及三類医疗器械审批证书。
换句话说,计算机模拟得再好,没有实验室数据支撑,相关机构也不会让其上临床。独立的AI制药公司可以帮助大药企做辅助设计,提高筛选效率,但是药企并不一定愿意把自家积累的核心数据交出来。
数据问题之外,老一代的合成生物学专家的接受度也是阻碍之一,要知道,他们很多时候是有一票否决权的。并且,医药行业的容错率比互联网行业低得多,对算法和数据的要求高好几个档次。所以,现在很多AI制药公司都开始自己建实验室,自己做药了。
所以,如果AI制药想要真正大规模发展开来,我们还是要等算法再成熟一点,数据积累得再多一点,医药圈的接受程度再高一点,监管再与时俱进点。新老交替快完成的时候,就是AI在药物研发中的腾飞之时。
责任编辑吴阳煜 wyy@nfcmag.com