带来变革的想法必定处于研究的前沿。日本最大的公共研究机构之一 AIST 的官方网络杂志。

2024 年诺贝尔化学奖“蛋白质设计和三维结构预测”是什么?

2024年诺贝尔化学奖“蛋白质设计和三维结构预测”是什么?

2024/12/11

#热门〇〇解说

2024 年诺贝尔化学奖
“蛋白质设计和 3D 结构预测”

―利用人工智能带来巨大改变的科学研究―

用科学的眼光来看,
社会关注的真正原因

    30 秒内解释

    什么是蛋白质设计和 3D 结构预测?

    蛋白质是由约20种氨基酸连接而成的分子,具有复杂的折叠三维结构。自然界中蛋白质种类繁多,其功能由其三维结构决定。三维结构的解析依赖于结晶和 X 射线分析等耗时的方法。今年的诺贝尔化学奖旨在表彰通过计算设计人工创造新蛋白质的技术,以及预测蛋白质结构的人工智能模型。这些研究开辟了设计和制造具有所需功能的蛋白质的可能性,并使快速准确地预测许多蛋白质的三维结构成为可能。

    2024 年诺贝尔化学奖授予华盛顿大学的 David Baker,他使用计算机设计并合成了一种全新的蛋白质;Google DeepMind 的 Demis Hassabis 和 John M Jumper,他们开发了一种突破性的 AI 模型来预测蛋白质的三维结构。这些研究开启了定制和新合成蛋白质的可能性,并有望在药物开发等方面得到应用。此外,由于使用AI模型准确预测蛋白质的3D结构已经成为可能,许多研究人员现在能够利用该程序快速获得高度准确的预测蛋白质3D结构和功能信息。这一结果为生命科学提供了新知识,并为药物发现和其他领域的应用提供了必要的基础信息。我们向人工智能研究中心的研究团队负责人富井健太郎(Kentaro Tomii)询问了获奖研究的意义和可能的应用,他为提高利用人工智能的蛋白质三维结构预测的准确性做出了贡献。

    目录

    获得诺贝尔奖的要点

    蛋白质 3D 结构预测半个世纪以来一直是一个挑战

     蛋白质是理解生命现象的重要物质,其结构的研究自 20 世纪中叶以来一直在取得进展。基本结构也已为人所知,包括氨基酸连接的一级结构、氨基酸以螺旋或片状连接的二级结构、链连接二级结构的组合的三级结构以及这些结构聚集的四级结构。结构生物学也随之诞生,它试图从蛋白质的三维结构来理解生命现象。

    蛋白质3D结构图

     然而,蛋白质由多种氨基酸组成,其三维结构非常复杂,预测并不容易。尽管计算机很早就被引入,但所需的计算量巨大且难以预测。自20世纪60年代以来,通过X射线晶体分析、NMR(核磁共振)和冷冻电子显微镜逐渐阐明了蛋白质的三维结构,并将这些信息收集在蛋白质数据库(PDB)中。自1994年以来,蛋白质结构预测批判性评估(CASP)这一验证蛋白质结构预测技术准确性的全球实验每两年举办一次,并将于2024年举办第16届。来自世界各地的许多新锐研究人员都参加了,包括我本人和今年的三位获奖者。

     许多研究人员一直致力于蛋白质3D结构分析,但尽管已知编码蛋白质的氨基酸序列超过2亿个,但到2022年,PDB中注册的3D结构数量仍不足20万个。

    人工蛋白质设计和合成的进展

     人工设计蛋白质的尝试在20世纪90年代末开始迅速增长,并于1997年报道了一种结构相对简单的新蛋白质的设计。

    2003年,华盛顿大学的贝克博士因其在“计算蛋白质设计”方面的工作而获得该奖项,他成功地通过计算设计了一种由93个氨基酸组成的更复杂结构的人工蛋白质。这是一种全新的蛋白质,未在 PDB 中注册。当将合成这种蛋白质的基因插入细菌中时,就会产生具有设计结构的蛋白质。

     2008年,我们设计并合成了一种新的酶,还设计了仅与特定物质结合的蛋白质和靶向并结合流感病毒表面蛋白的小蛋白质。这项成果作为一项开启了设计和创造具有所需功能的酶以及创造新的抗病毒药物等可能性的成果而受到关注。如果蛋白质设计技术进步,未来创造分子机器将不再是梦想。

     Baker 博士及其同事于 1999 年开发的计算机软件“Rosetta”有助于蛋白质的结构设计。该软件假设可以通过组合已知的子结构来创建具有未知折叠结构的蛋白质,并从大量预测的候选结构中选择最佳结构。该软件程序被公开,并为后续的研究进展做出了贡献。

     另一方面,自2010年左右以来,深度学习技术发展迅速,很快就会利用它进行结构预测。

    使用深度学习高精度预测 3D 结构

    AlphaFold 简介

     第二位获奖者哈萨比斯博士自幼被誉为国际象棋神童,也擅长创建游戏程序。主修计算机科学后,他创立了 DeepMind。 2015年,他开发了围棋软件“AlphaGo”,首次以毫无障碍的方式战胜了世界顶级围棋棋手,震惊了世界。围棋软件是采用人工智能随机生成棋步并选择获胜棋步的方法开发的。该软件就是将其与深度学习相结合来学习高手的比赛记录而创建的。

    后来,生物学家加入了 DeepMind,开始研究蛋白质结构预测的主题。 2018年,“AlphaFold”在结构预测技术大赛CASP13上公布,并以优异的预测精度引起关注,但仍缺乏广泛应用的动力。

    高精度预测模型诞生

     第三位获奖者Jumper博士也在场。 Jumper 博士是一位研究物理和数学的研究员,并获得了理论化学博士学位,长期以来对预测蛋白质的结构感兴趣。

     加入 DeepMind 后,我们将在 2020 年结构预测技术大赛 CASP14 上公布“AlphaFold2”。该软件预测的许多蛋白质结构与实验确定的蛋白质结构非常相似,比以前的方法实现了显着更高的预测精度。通过巧妙地应用一种名为 Transformer 的深度学习模型,该模型在自然语言处理领域显示出了其有效性,被称赞为蛋白质结构预测开辟了新视野。由于该源代码已公开,因此任何人现在都可以在短时间内获得高度准确的预测三维结构。

     2024年,我们将宣布进一步升级的版本,称为“AlphaFold3”。这是一个扩展模型,不仅可以预测蛋白质,还可以预测蛋白质与核酸等其他生物分子之间的复合物和相互作用。人们对其在药物发现中的应用的期望也越来越高,例如预测药物将与蛋白质的哪一部分结合。

    未来展望

     即使有如此高精度的结构预测模型,也无法完全阐明所有蛋白质的结构。据估计,自然界中存在最多数千种主要的蛋白质三维结构模式。为了使用 AlphaFold 准确预测蛋白质的结构,需要获得与目标蛋白质具有相似氨基酸序列的多种类型蛋白质的序列信息。我们不擅长预测尚未发现相似序列的蛋白质结构。

     今年的化学奖与物理奖一起颁发给与人工智能相关的研究,新的研究方法在多个奖项中脱颖而出,引起关注。该奖项凸显了人们对酶和药物等有用蛋白质的出现以及人工智能越来越多地被用作科学研究工具的期望。 (AIST杂志2024年诺贝尔物理学奖“使用人工神经网络进行机器学习?)

     这个奖项可以说是基于许多实验和计算科学前辈的努力和成就。不用说,处理海量计算的技术进步以及计算资源的易用性也提供了巨大的支持。我们预计,将揭示三维结构的蛋白质数量将继续增加,人工智能模型将继续发展。

     目前,AIST人工智能研究中心正在利用AlphaFold的人类蛋白质预测结构模型建立一个数据库,全面估计底物可以结合的位点,旨在为药物发现和生命科学研究做出贡献。

    对本文的反应

    •  

    •  

    •  

    分享这篇文章

    • 与 X 分享
    • 在 Facebook 上分享
    • 在 LINE 上分享

    对于那些对发表的文章、与 AIST 的合作、介绍的技术、研究成果等感兴趣的人

    AIST 杂志中介绍的案例、结果和主题是 AIST 进行的研究和合作成果的一部分。
    如果您对已发表的文章有任何疑问或对 AIST 的研究内容、技术支持、合作等感兴趣,请联系我们
    请随时使用查询表与我们联系。

    国立产业技术综合研究所

    版权所有 © 米乐m6官方网站 (AIST)
    (日本公司编号 7010005005425)。保留所有权利。