DeepMind和David Baker开发的软件突破了蛋白质结构预测和设计,助力获得诺贝尔化学奖。

一位学者与两位来自DeepMind的研究人员获得了诺贝尔奖。

周三,诺贝尔委员会宣布将化学奖授予在计算化学领域取得重大突破的研究者。其中包括谷歌DeepMind的两位研究员,表彰他们开发了能从蛋白质序列预测其在细胞中形成的三维结构的AI软件。另一个获奖者是华盛顿大学的David Baker,他开发的软件能够设计全新、具有特定结构的蛋白质。

今年的诺贝尔奖有着明显的主题,前一天的物理奖也表彰了AI技术的突破。虽然物理奖与AI的联系有些牵强,但在化学领域,这一技术显然解决了重大生物化学问题。

理解蛋白质结构

DeepMind的Demis Hassabis和John Jumper开发了AI,之前他们的AI曾成功掌握过国际象棋和星际争霸等游戏。但他们一直在同时攻克更具挑战性的问题。2020年,他们宣布解决了一个最具挑战的计算问题之一:蛋白质结构预测。

从化学角度看,蛋白质是由氨基酸链组成,生物体通常可以在20种不同的氨基酸中选择。这些氨基酸的化学性质各异,例如酸性、碱性或带电等,使得链上的不同区域相互作用,形成复杂的三维结构,而这种结构对蛋白质功能至关重要。

传统上,研究蛋白质结构需要繁琐的实验步骤,包括纯化蛋白质和使用多种成像技术来确定每个原子的具体位置。然而,从理论上讲,这些结构应该可以通过化学和物理定律预测出来。但由于氨基酸之间可能的相互作用非常复杂,随着蛋白质长度增加,预测难度也急剧上升,甚至超越了最强大的超级计算机。

尽管多年来科学家们尝试了许多计算方法来简化这一过程,DeepMind则做了它最擅长的事情:让AI来解决问题。他们的AI基于两个大型数据集训练:一个包含实验室解析出的所有蛋白质结构,另一个是已知的所有蛋白质序列。通过这些数据,AI能够提炼出氨基酸相互作用的规律,并识别进化相关的蛋白质,预测结构的灵活性。

最终的结果是,该软件在蛋白质结构预测的竞赛中遥遥领先于其他所有软件包。DeepMind随后用它生成了现有基因数据库中大部分蛋白质的预测结构,尽管对于特别长的蛋白质仍有一些困难。虽然预测并不完美,有时会出错,但相比于仅有氨基酸序列的局限性,这已是重大进展。

设计新蛋白质

华盛顿大学的David Baker多年来也致力于解决蛋白质折叠问题。他开发的Rosetta软件被改编成了一个分布式计算项目(Rosetta@home),后来还衍生出一款名为Foldit的蛋白质折叠游戏。当DeepMind推出AlphaFold软件时,他的团队迅速吸收了其中的部分原理,开发了他们的RosettaFold。

然而,他的团队还面临另一个问题:我们是否可以利用预测蛋白质结构的能力来设计自然界不存在的蛋白质,并使它们折叠成特定的结构?

近年来,这个问题的答案已经明确为“可以”。Baker实验室不断发布新的突破成果,例如,他们开发了系统,能够根据目标蛋白质设计出能结合它们的抗体序列。他们还开发了能设计其他蛋白质与已知结构的蛋白质相互作用并抑制其功能的软件。

这些针对特定目标的抑制剂有潜力用于治疗因基因突变导致的疾病,或快速应对新出现的病原体。虽然这些方法可能并不是解决所有问题的最佳或最快手段,但多一个选择总是好的。而这只是实验室众多项目中的一个小部分。

科学研究是一项大量合作的工作,而诺贝尔奖每年只能奖励三位个人,争议在所难免。但在这一案例中,这些成就值得得到这样的关注。

本文译自 Ars Technica,由 BALI 编辑发布。

[ 广告 ]
赞一个 (6)

PREV :
NEXT :