国立产业技术综合研究所(注1)AIST(以下简称AIST)运营的超级计算机系统“AI Bridging Cloud Infrastructure”(以下简称“ABCI”)规模的大约一半,以及理化学研究所(注2)(以下简称RIKEN)富士通有限公司(注3)(以下简称富士通)在目前正在开发的超级计算机“富岳”约十分之一的规模上测量了结果,是需要超级计算机规模处理的大规模机器学习处理的基准MLPerf HPC(注4)在各个类别中均取得了最高水平的表现,并占据了最高排名。
“ABCI”使用了大约一半的规模,并在配置了专门用于深度学习的运算单元的GPU型超级计算机中实现了最高的处理速度,比其他GPU型系统快20倍。同样,Fugaku 在由通用运算单元构成的 CPU 型超级计算机中创下了新高,其处理速度比其他 CPU 型系统快 14 倍,而系统尺寸约为其他 CPU 型系统的 1/10。
该成果于 11 月 18 日(日本时间 11 月 19 日)在 HPC(高性能计算)国际会议 SC20(目前在线举行)上公布为 MLPerf HPC v07。
MLPerf HPC 预测宇宙学参数“CosmoFlow”识别(注5)和异常天气现象“DeepCAM”(注6)的基准程序的性能。关于“CosmoFlow”,以整个“ABCI”大约一半的系统规模进行测量(注7),在本次注册的所有系统的测量值中排名第一,Measurement on a system scale of about 1/10 of the entire "Fugaku"(注8)中排名第二。与其他系统针对每种类型的 GPU 和 CPU 的性能值相比,“ABCI”具有 20 倍的性能,“Fugaku”具有 14 倍的性能。关于“DeepCAM”,使用“ABCI”大约一半比例的测量在本次注册的所有系统的测量值中排名第一。就这样,“ABCI”和“Fugaku”以压倒性的优势占据了榜首,表明日本超级计算机在机器学习领域拥有较高的技术能力。
富士通、AIST、RIKEN 和,富士通研究所有限公司(注 9)将向公众发布为此测量开发的软件堆栈,包括加速大规模机器学习处理的库和 AI 框架。这将有助于在超级计算机上使用大规模机器学习,并有望通过分析模拟结果应用于异常天气的检测和天体物理学的新发现。此外,它有望扩展到需要巨大计算性能的通用语言模型的实现等应用,并将作为实现社会50的核心平台为解决社会和科学问题做出贡献。
MLPerf 是一个机器学习基准社区,成立于 2018 年 5 月,旨在创建运行机器学习应用的系统的性能列表。 MLPerf 开发了 MLPerf HPC 作为新的机器学习基准,用于评估超级计算机在执行以前需要大量时间的规模的机器学习计算时的性能。它被用于世界各地的超级计算机,并有望成为新的行业标准。
这次,在 MLPerf HPC v07 中,使用“CosmoFlow”和“DeepCAM”这两个实际应用程序进行了性能评估,目的是测量需要使用超级计算机的大规模机器学习性能。
所有测量数据均发布在以下网站上。
相关链接:https://mlperforg/
列出的产品名称等专有名词是各公司的商标或注册商标。