通知

通知文章2021/06/29

大规模AI云计算系统“ABCI 20”登顶超级计算机性能排行榜
-产官学联动,加速人工智能研发、示范和社会落地-

2021 年 6 月 29 日
国立产业技术综合研究所

积分

  • ``ABCI 20'' 将于 2021 年 5 月 10 日全面发布
  • ABCI 20 在超级计算机性能排名中排名全球第 12 位(此前排名第 14 位)、日本第 2 位
  • 加速先进人工智能研发、应用示范以及国内大型数据控股公司对ABCI的利用

摘要

米乐m6官方网站[会长:石村和彦](以下简称“AIST”)信息与工效领域[所长:关口聪]于5月10日公开的大规模AI云计算系统“ABCI 20”已跻身世界超级计算机性能排行榜TOP500 名单第12名这些结果于6月28日(欧洲中部时间)在线举办的国际超级计算会议“ISC HIGH PERFORMANCE(ISC 2021)”上公布。
传统系统“AI桥接云基础设施(以下简称“ABCI”)”是AIST为了加速日本人工智能技术的发展而设计和开发的计算系统。它安装在AIST柏中心的AI数据中心大楼内,并于2018年8月开始运营。ABCI于2021年5月GPU我们增强了配备最新 GPU 的计算服务器,具有更高的性能和更低的功耗,并已开始以 ABCI 20 的形式全面发布。 ABCI 20配备了5312个高性能、省电的GPU(其中960个是最新的GPU),充分利用这些GPU,计算性能为2220千万亿次浮点运算8139_8333千兆浮点运算,绿色 500 强名单世界第14位
凭借其高算力和能效的优势,有望加速先进人工智能研发、应用示范以及国内数据控股公司对ABCI的利用。

背景故事

自2018年8月开始运营以来,国内一家公司使用ABCI在深度学习方面实现了全球最快的计算速度,多家机构使用它取得了显着的效果。此外,人们对独特的省电操作也很感兴趣。另一方面,开通两年多以来,由于需求高于预期,用户开始使用服务需要等待很长时间等问题。此外,需要大规模数据处理的先进人工智能研究、开发和应用演示需要更高的计算能力。
为了应对这些挑战,ABCI 20 扩展了其存储系统和计算服务器,配备了 960 个最新 GPU,这些 GPU 比 ABCI GPU 具有更高的性能和更低的功耗。

ABCI 20 的功能

1) 配备5312个高性能、省电GPU
配备4352个高性能、节能的GPU“NVIDIA V100 SXM2”和960个最新GPU“NVIDIA A100 SXM4”,总计5312个。至此,ABCI 20 的峰值性能为双精度,单精度,半精度是 8515 petaflops。

2) 世界一流的节能运行
服务器和散热系统均具有世界一流的节能性能。计算服务器配备了最新的GPU,具有高性能的单位功率。散热系统对CPU、GPU、内存等发热核心部件采用直接水冷,并采用空气冷却余热。我们使用人工智能数据中心大楼冷却塔专门生产的冷冻水来冷却所有这些区域,从而实现了节能。得益于这些创新,即使具有高性能,它消耗的电量也更少。

ABCI 20 计算资源列表发布如下。
ABCI 计算资源:https://abciai/ja/about_abci/computing_resourcehtml

未来计划

AIST将利用以其优异的计算能力和省电特性而得到认可的ABCI 20,推动其在工业界、学术界、政府和各种企业中的使用,加速利用其高计算能力的人工智能技术的研究、开发和示范,并促进社会实施。在AIST,我们正在构建高度通用的大规模机器学习模型并开发其使用技术,目的是开发易于构建的人工智能技术。 ABCI 20也将用于该技术开发。此外,我们还将研发利用大数据的系统协调技术和大规模数据分析技术,识别操作问题,提高包括下一代ABCI施工技术在内的数字建筑核心技术的成熟度。

此事的联系信息

国立产业技术综合研究所
信息与人体工程学领域数字建筑研究中心
研究总监小川弘隆
国立先进产业科学技术研究所海滨城市中心别馆,东京都江东区青海 2-4-7 135-0064
电子邮件:abci-application-ml*aistgojp(使用前请将 * 更改为 @。)

术语解释

◆TOP500榜单
每六个月对超级计算机的基准性能值进行一次排名的列表,从全球第 1 名到第 500 名。
https://top500org/lists/top500/[返回来源]
◆GPU(图形处理单元)
它最初是专用于计算机图形的处理器,但随着图形处理变得更加复杂,其性能和多功能性随之提高,现在已发展成为用于高性能计算的通用矢量/矩阵处理器。它也被广泛用于加速深度学习。[返回来源]
◆千万亿次浮点运算、千兆次浮点运算
FLOPS(每秒浮点运算)是一秒内可以执行的浮点运算数。 Peta 表示(10 的 15 次方),giga 表示(10 的 9 次方)。[返回来源]
◆绿色500强名单
针对最近的绿色趋势,这是一份对 TOP500 榜单中超级计算机的功耗性能值(速度性能值/功耗)进行排名的榜单,从第 1 名到第 500 名。
https://top500org/lists/green500/[返回来源]
◆双精度、单精度、半精度
如何在计算机中表示数值(实数)。双精度以 8 个字节(约 16 个有效位)表示,单精度以 4 个字节(约 7 个有效位)表示,半精度以 2 个字节(约 33 个有效位)表示。使用最新的GPU,半精度/单精度算术处理比双精度快得多,并且其在机器学习和人工智能领域的使用正在取得进展。[返回来源]

相关文章

  1. 大规模AI云计算系统“ABCI”超级计算机性能排名全球第5位
    https://wwwaistgojp/aist_j/press_release/pr2018/pr20180626/pr20180626html
  2. AI云计算系统“ABCI”实现了全球最快的深度学习学习速度
    https://wwwaistgojp/aist_j/press_release/pr2018/pr20181113/pr20181113html
  3. 在机器学习处理基准 MLPerf HPC 中实现了最高速度水平
    https://wwwaistgojp/aist_j/press_release/pr2020/pr20201119_2/pr20201119_2html
  4. 大规模AI云计算系统“ABCI”升级为“ABCI 20”
    https://wwwaistgojp/aist_j/news/au20210510_2html