米乐m6官方网站[理事长中钵良二](以下简称“AIST”)人工智能研究中心[研究中心主任 Junichi Tsujii] 机器学习研究小组 Jun Seze 研究小组负责人 Masashi Tsubaki AIST 特别研究员是智能生物信息学研究小组 Kentaro Tomii 与研究小组负责人合作,开发了一种通过结合两种类型的深度神经网络来预测药物和蛋白质之间相互作用的方法,并通过使用大规模数据的演示实验证明,可以高速、准确地进行预测和识别候选相互作用位点。
近年来,人工智能技术在药物发现领域的应用有望加速新药研发,实现创新型新药。然而,由于药物及其靶蛋白具有不同类型的结构,因此很难快速且高精度地预测对疾病治疗有效的药物和蛋白质的组合。因此,基于化学和生物学知识,深度学习我们通过组合方法开发了一种快速、高精度的药物和蛋白质相互作用预测方法。此外,在不使用药物或蛋白质的三维结构的传统方法中,据说无法从预测结果中识别相互作用位点,并且在解释结果时存在问题,但通过新开发的方法,可以识别相互作用位点并将其可视化。这项技术有望加速从大量候选药物中筛选出新候选药物的过程。此外,通过计算机大规模搜索候选药物有望导致仅靠人类知识和经验无法实现的创新新药的开发。新开发方法的详细信息于2018年7月6日发表在学术期刊上生物信息学
 |
| 使用此方法预测的药物-蛋白质相互作用位点的可视化示例 |
9472_9638自然557,S55-S57(2018); doi:101038/d41586-018-05267-x)。然而,由于药物和蛋白质具有不同类型的结构,因此一个主要问题是如何使用深度学习以统一的方式处理两者的数据。此外,深度学习的预测结果难以解释,这也成为其在化学和生物学领域应用的障碍。
AIST 的目标是将机器学习不仅应用于图像和语言等数据,还应用于化学和生物数据。特别是近年来,他一直致力于深度学习技术在药物发现中的应用。
这项研究与开发得到了国家研究开发机构新能源和产业技术开发组织 (NEDO)“下一代人工智能/机器人核心技术开发/下一代人工智能技术领域/与人类可以相互理解的下一代人工智能技术”和日本学术振兴会 (JSPS) 的支持。这项工作得到了科学研究补助金 JP15H01717 和JP17H07392、日本医学研究开发机构 (AMED)、药物发现先进技术支持平台 (BINDS)、“利用蛋白质高阶结构信息加速药物发现研究的生物信息学研究”、日本科学技术振兴机构 (JST)、CREST 和 JPMJCR1689。
药物具有原子和键图结构数据,蛋白质具有氨基酸序列数组结构数据然而,到目前为止,还没有一种对这两种不同类型的数据普遍有效的深度学习方法。这次开发的方法是适合每种药物数据的深度学习方法。图神经网络and是一种适合蛋白质数据的深度学习方法卷积神经网络每个数据以适当捕获每种药物和蛋白质的特性特征向量通过使用大规模药物和蛋白质数据学习此特征向量,可以预测相互作用的存在或不存在(图 1)。使用超过 35,000 种药物-蛋白质相互作用的数据进行演示评估实验研究表明,即使使用比传统使用的特征向量低维度(约 10 维)的特征向量,也可以正确预测交互的存在或不存在。通过使用低维特征向量,减少了计算量,实现了高速预测。另外,准确度为对接模拟相比与近年来发展的其他深度学习方法相比,它表现出很高的预测精度(比现有方法提高了3%至10%)(图2)。此外,这些模拟和其他深度学习方法需要输入药物和蛋白质的3D结构数据,这些数据很难获得并且需要大规模计算,导致计算成本很高。另一方面,该方法可以仅根据药物图和蛋白质序列信息进行预测,因此可以应用于大量三维结构未知的蛋白质。
 |
| 图1:新开发的药物-蛋白质相互作用预测方法 |
 |
| 图2:现有方法与新开发方法的预测精度比较 |
虽然深度学习可以进行高速且高精度的预测,但预测结果很难解释。在处理化学和生物数据时,需要通过与人类已有的化学和生物知识进行比较来判断计算机自动预测结果的有效性。因此,能够轻松解释结果的机器学习技术非常重要。因此,除了粗略预测是否存在相互作用(图1中的(1))之外,我们还使用两个特征向量进行预测,同时考虑了更详细的信息(图1中的(2)),例如药物可能与之相互作用的蛋白质部分,并将结果可视化。通过可视化预测的相互作用位点,可以更轻松地根据化学和生物学知识验证它们。
未来,我们将开发一种更详细地考虑药物和蛋白质三维结构的方法,利用各种药物和蛋白质全面验证其相互作用位点的三维结构,旨在提高预测结果的可靠性,通过支持新药开发为药物发现领域做出贡献。