APP下载

AI破解蛋白质结构密码

2024-11-01

科学大观园 2024年21期

2024年诺贝尔化学奖日前揭晓。大卫·贝克(David Baker)、戴密斯·哈萨比斯(Demis Hassabis)和约翰·M·江珀(John M. Jumper)共享这一奖项,戴维·贝克在“计算蛋白质设计”领域贡献突出,其余两人则在“蛋白质结构预测”方面成就斐然。这也是继物理学奖之后,今年诺贝尔奖再一次授予人工智能的相关成果及科学家。

诺贝尔奖官方表示,2024年诺贝尔化学奖的主题是蛋白质——生命中巧妙的化学工具。大卫·贝克成功完成了几乎不可能的任务,构建了大量全新的蛋白质。戴密斯·哈萨比斯和约翰·M·江珀开发了一种人工智能模型,解决了一个50年来的难题:预测蛋白质的复杂结构。这些发现具有巨大的潜力。

蛋白质是一切生命活动的体现者。大脑传递信息,靠的是蛋白质搬运电荷;肌肉收缩,靠的是蛋白质互相拔河;细胞需要能量,靠的是蛋白质运输氧气。癌症、阿茨海默病、艾滋病、糖尿病……几乎任何疾病都与蛋白质有着千丝万缕的联系。

蛋白质是维持生命的重要大分子,它们如同生命体内的“能工巧匠”,以其独特的化学能力,编织出生命的多样性与复杂性。它们掌控并驱动生命体内所有的化学反应,这些反应共同构筑了生命的宏伟蓝图。同时,还扮演着激素、信号物质、抗体以及身体组织构建者等多种角色。

自然界中的蛋白质种类有限,研究人员希望创建出新的蛋白质种类,使其执行诸如分解有害物质或作为化学制造业工具等功能。2003年,贝克开发的名为Rosetta的软件成功构建出不是天然存在的全新蛋白质,开启了构建全新蛋白质的大门。

贝克的研究团队首先提出一个全新结构的蛋白质,然后利用Rosetta计算哪种氨基酸序列可以生成所需的蛋白质。为了验证该软件的成功率,贝克的研究小组将软件建议的氨基酸序列基因引入细菌,这些细菌生产了所需的蛋白质。然后,他们利用X射线晶体学确认了蛋白质结构与他们的设计几乎完全符合。该成果于2003年发表。

此后,他的研究小组不断创造出一个又一个具有新功能的蛋白质,可用于催生新的纳米材料、靶向药物、疫苗研发、微型传感器以及更环保的化学工业等,为实现人类福祉开辟了无限可能。

蛋白质虽然形态结构千变万化,但是它们大部分都是由20种不同的氨基酸组成。在蛋白质中,氨基酸以长链连接在一起4b87460c1dcf8800f2345fef3b97ed5d1ee513fd0aab2ab0ecd127cf88fdba95,折叠起来形成独特的三维结构,这对蛋白质的功能至关重要。要了解生命如何运作,首先就需要了解蛋白质的形状和结构。

自20世纪70年代以来,科学家一直致力于根据氨基酸序列预测蛋白质结构,但这是一项极其艰巨的任务。因为有些氨基酸和其他氨基酸相互吸引、相互作用;有些氨基酸则具有疏水性。而且氨基酸链形成了复杂的形状,使精准确定蛋白质结构难上加难。根据已知的氨基酸序列预测蛋白质三维结构,一度被认为是不可能实现的梦想。

2020年,谷歌旗下“深层思维”公司的哈萨比斯和江珀提出名为“阿尔法折叠2”的人工智能模型,这是一个惊人的突破。

“阿尔法折叠2”模型曾赢得有着生物计算领域“奥运会”之称的“蛋白质结构预测关键评估(CASP)”比赛,并成为第一个能准确预测蛋白质三维结构的机器学习模型。

“阿尔法折叠2”模型成功解决了科学家苦苦思索了数十年的难题——从氨基酸序列预测蛋白质结构,它能够预测几乎所有已知的2亿种蛋白质的结构。

自问世以来,“阿尔法折叠2”已被用于海量科学应用中,例如人们用它应对抗生素耐药性、寻找疟疾等疾病的新疗法等。“阿尔法折叠2”极大缩短了人工确定蛋白质结构的时间,展示了人工智能对于科学发现的影响。此外,这项研究将有助于人们更好地了解疾病,并能加速新靶向药物开发。到今年10月,已有来自大约190个国家的200多万人使用了“阿尔法折叠2”程序。可以说,贝克、哈萨比斯和江珀的工作开辟了生化和生物学研究的新时代,我们现在可以用以前无法想象的方式预测和设计蛋白质结构。

当然,如果没有结构生物学家的努力,上述进展不可能实现。他们为蛋白质数据库提供了大量实验确定的蛋白质结构。这些数据是数十年蛋白质结构测定研究的结果,为今年获奖者在蛋白质设计和结构预测方面取得的决定性突破奠定了基础。

近年来,AI在如火如荼地快速发展,取得一系列重大突破,如ChatGPT、Sora等,其智能程度逐渐提升,正在改变着人类的生活方式和科研的研究模式。“阿尔法折叠2”无疑是优秀代表之一,可看作是AI发展的一个缩影。

“阿尔法折叠2”解决了困扰生命科学多年的一个重大难题,并有望为其他生物学问题解决提供借鉴。大数据已成为当前科学发展的重要特征,如基因组测序结果和海量论文等,借助AI工具解决生命科学问题已成为一个重要方向。

有人也许会问:“人工智能这么强大了,结构生物学家是否会失业?”其实,就像ChatGPT没有让写手失业一样,人工智能在蛋白质设计和结构预测方面还有很多问题有待解决(比如对复合体、柔性区的预测等)。对于结构生物学家来说,“获得结构”只是研究的手段,理解生命,做出生物学发现才是目的。正如颜宁院士所说,“如何能够理解我们细胞里各个分子的动态变化,是我们目前面临的最大挑战之一”。

◎ 来源|综合中国新闻网、诺贝尔奖官网

拓展阅读:近十年诺贝尔化学奖得主