国家研究开发机构产业技术综合研究所(以下简称“AIST”)生物医学研究部首席研究员 Yuji Sekiguchi 与岛津制作所(以下简称“岛津”)合作质谱利用技术创造各种以前不可能的事物原核微生物我们开发了一种能够快速识别物种的技术。
该技术利用原核微生物基因组信息估算的大规模理论蛋白量数据库的构建以及质谱结果分析算法的开发。未培养的微生物基质辅助激光解吸电离飞行时间质谱MALDI-TOF MS(MALDI-TOF MS)是一个前所未有的基于细菌成分质谱的快速微生物鉴定方法的分析平台,与传统使用培养细菌的测量质量数据库相比,可鉴定的微生物种类数量增加了10倍以上。它还能够快速识别未培养的微生物,这在以前是不可能的。由于该技术可用于快速鉴定多种微生物,因此它不仅有助于鉴定引起人类和动物传染病的微生物、食品领域微生物检测的复杂性和速度、以及环境微生物的分析,而且有助于筛选有用微生物等研发的复杂性和速度。
该技术的详细信息将于 2023 年 12 月 5 日(英国时间)公布。基因组生物学''杂志上。
环境中存在着多种原核微生物(细菌和古菌),它们与人类和动物的健康、食品的质量、环境的净化、地球上的物质循环极其密切相关。为此,在传染病的临床诊断、食品卫生管理、环境卫生评价等中,对这些微生物进行培养、分离后,进行测试以进行分类鉴定。基于MALDI-TOF MS的分离培养微生物鉴定技术核酸检测等相比,该技术由于最少的样品预处理和快速的质谱分析,可以在极短的时间内进行微生物鉴定。由于其速度快,MALDI-TOF MS 广泛应用于传染病的临床检测领域。
另一方面,这项技术的应用在检测病原菌以外的多种微生物的领域,例如食品和环境中,却显得滞后。原因是MALDI-TOF MS微生物鉴定需要基于已知微生物的质谱信息的数据库(文库)。使用培养的分离株通过实验确定实际质谱信息参考信息通常仅限于数千种微生物物种,不可能识别库中未列出的微生物物种。此外,地球上存在的原核微生物物种有一半以上是未在实验室培养的未培养微生物。微生物培养困难,而且也不可能捕获这些微生物群。
此外,由多种微生物组成的生态系统微生物组,它的重要性正在引起人们的关注。特别是,人类肠道微生物组、疾病和健康之间的关系变得越来越清晰,识别有用的微生物菌株对于治疗疾病具有重要意义。活菌制备将其用作药物(药物)的研究和开发正变得更加活跃。该领域的研发需要培养和分离参与疾病发病和治疗的微生物,但这需要快速鉴定数千至数万种分离菌株并筛选目标微生物。为了加速“培养”人类微生物组的努力,需要一种技术来快速识别各种原核微生物,包括未培养的微生物。
AIST 一直在研究和开发构成微生物组的微生物类型和数量的测量(微生物组分析)及其精确控制技术(2016 年 12 月 14 日 AIST 新闻稿、2021 年 4 月 29 日 AIST 新闻稿)。此外,为了了解日本健康人的肠道微生物组并将其应用于工业,我们对其组成微生物群进行了大规模分析、组成微生物群的分离培养和基因组分析。
岛津制作所以田中光一纪念质谱研究所为中心,推动利用质谱法进行微生物鉴定技术的研究和开发,并开发、制造和销售 MALDI-TOF MS 等质谱仪器。
这次,我们将AIST的大规模原核微生物基因组信息分析技术和培养技术与岛津的质谱技术和分析仪器开发能力相结合,开发了基于MALDI-TOF MS的快速微生物鉴定方法的分析平台。
此项研发的一部分得到了日本医学研究开发机构 (AMED) 的支持,这是日本医学研究开发机构 (AMED) 委托的项目“开发基础药物发现技术以实现下一代治疗和诊断(通过控制肠道微生物群开发下一代药物发现技术)”(2021-2026 年)(项目编号: 22ae0121035h0002)。”
这项技术的实现是通过设计一种新方法,利用微生物基因组信息,利用 MALDI-TOF MS 识别各种微生物物种,建立原核微生物的大规模理论蛋白质丰度数据库,并使用它开发分析算法。在构建大规模理论蛋白量数据库(该技术的核心)时,公共核苷酸序列数据库获得了原核微生物基因组信息,总共使用了大约20万个细菌和古菌基因组信息。这些代表了大约 31,000 个物种级的系统发育类群。基于这些基因组信息,我们构建了独特的信息分析方法来预测基因组中基因编码的蛋白质数量,并从理论上从每种微生物的基因组序列中预测了所有蛋白质的分子量。理论分子量列表对应于使用培养微生物细胞通过传统 MALDI-TOF MS 测量的质谱(峰列表)(图 1)。该技术根据基因组信息预测的理论蛋白质质量数据库称为GPMsDB(基因组预测蛋白质质量数据库)。该数据库的使用方式与根据测量的质谱构建的质量数据库相同,并且有可能取代它们。

图1 与传统方法的比较
根据基因组信息预测的理论蛋白质丰度数据库 (GPMsDB) 使得使用质谱法快速识别各种原核微生物成为可能,这在以前是不可能的
同时,我们基于大量的理论蛋白质丰度信息,开发了一种准确快速鉴定的新分析算法,并将其实现为软件(https://githubcom/ysekig/GPMsDB-tk)。我们还添加了通过输入用户独立获得的微生物基因组信息向 GPMsDB 添加新的微生物理论蛋白量信息的功能 (https://githubcom/ysekig/GPMsDB-dbtk)。 GPMsDB 和相关软件是公开可用的。
为了验证该技术的分析有效性,我们使用代表 15 个不同门级分类群的 94 株菌株(84 种细菌和 10 种古细菌)的培养菌株评估了识别准确性。此外,我们还使用本研究之外获得的MALDI-TOF MS数据集(例如来自独立管理机构国家技术评估研究所的公开信息)评估了识别准确性。结果,在属和种层面获得了超过90%的高正确答案率。此外,在菌株和亚种水平上获得了较高的正确率(超过70%),表明该技术能够在种或亚种水平上识别微生物。
此外,结合宏基因组分析和开发的微生物鉴定技术的新型综合培养(文化组学) 方法(图 2)已被设计并验证。这种方法可以培养微生物组样本鸟枪法宏基因组分析通过将从此类宏基因组信息获得的基因组(宏基因组组装基因组,MAG)添加到GPMsDB中,我们将扩展GPMsDB,以便可以使用MALDI-TOF MS检测和识别生态系统中存在的微生物菌株。在这种方法中,从同一样品中培养和分离微生物,并使用 MALDI-TOF MS 和扩展的 GPMsDB 来鉴定微生物。在这项研究中,我们使用小鼠粪便样本来模拟通过人类肠道微生物组的培养组学筛选有用微生物。当我们对该样本进行鸟枪法宏基因组分析并重建组成基因组时,我们获得了84个物种的基因组序列信息,具有较高的重复性。通过从同一样品中培养厌氧微生物并选择100多个菌落,总共获得103个分离培养物。我们使用 MALDI-TOF MS 和 GPMsDB 识别了它们。结果,103 个菌落中有 94 个在属水平上得到了正确鉴定。其中,12个分离株被鉴定为与本研究通过宏基因组分析获得的相同的MAG。此外,还检测到了属或种水平上的未培养微生物,这表明正在获得新的微生物物种。这些结果表明,该技术可用于文化组学,根据目标生态系统宏基因组信息(例如MAG和其他基因组信息)预测的功能基因和代谢能力来筛选培养分离株,并筛选目标生态系统中存在但尚未在公共核苷酸序列数据库中注册的新的未培养微生物群。

图2 结合宏基因组分析和大规模理论蛋白质丰度信息的新型微生物培养(culturemics)筛选和鉴定方法
通过将从宏基因组信息获得的 MAG 添加到理论蛋白质丰度数据库 (GPMsDB),我们将扩大该数据库并提高同一生态系统的文化组学筛选和鉴定的准确性
在这项研究中,90% 以上的测量质谱都实现了正确的微生物鉴定。本研究开发的技术组可广泛应用于临床检测、食品安全评价、环境诊断等微生物检测,也可在人类微生物组研发领域进行文化组学中数千种分离株的快速筛选。
未来,我们将开发算法以实现更准确的识别,并进行研发以实现真菌等不同微生物群的识别。此外,我们将继续增强数据库,以便能够根据每天添加到公共碱基序列数据库的微生物基因组信息来检测广泛的原核微生物物种。此外,我们还将利用这一成熟的技术,对人体微生物组,特别是肠道微生物组中的有用微生物进行综合培养,以获得对人类健康和工业用途有用的微生物。
已出版的杂志:基因组生物学
论文标题:大规模基因组预测蛋白质质量数据库能够通过质谱法快速、广谱地鉴定细菌和古细菌分离株
作者:Yuji Sekiguchi、Kanae Teramoto、Dieter M Tourlouusse、Akiko Ohashi、Mayu Hamajima、Daisuke Miura、Yoshihiro Yamada、Shinichi Iwamoto、Koichi Tanaka
DOI:101186/s13059-023-03096-4