打印

[资讯] AMD 宣布 CDNA 架构的Radeon MI100 全球最快的 HPC 加速器

0

AMD 宣布 CDNA 架构的Radeon MI100 全球最快的 HPC 加速器

AMD 今天宣布了新的 AMD Instinct MI100 加速器 - 全球最快的 HPC GPU 和首台 x86 服务器 GPU,超越 10 万亿级 (FP64) 性能屏障。MI100 由戴尔、千兆字节、HPE 和超微新加速计算平台支持,结合 AMD EPYC CPU 和 ROCm 4.0 开放软件平台,旨在推动新发现超越前视时代。
AMD Instinct MI100 GPU 基于新的 AMD CDNA 架构构建,可与第二代 AMD EPYC 处理器配对,为 HPC 和 AI 提供新型加速
系统。MI100 为 HPC 提供高达 11.5 TFLOPS 的峰值 FP64 性能,为 AI 和机器学习工作负载提供高达 46.1 TFLOPS 峰值 FP32 矩阵性能。MI100 使用新的 AMD 矩阵核心技术,与 AMD 上一代加速器相比,为 AI 培训工作负载提供了近 7 倍的 FP16 理论峰值浮点性能提升。如今,AMD 在实现大规模计算方面迈出了一大步,我们推出了 AMD Instinct MI100,这是全球最快的 HPC GPU,"AMD 数据中心 GPU 和加速处理公司副总裁 Brad McCredie 说。"针对科学计算中重要的工作负载,我们最新的加速器与 AMD ROCm 开放软件平台相结合,旨在为科学家和研究人员在 HPC 中的工作提供卓越的基础。为 Exascale 时代开放软件
平台 AMD ROCm 开发人员软件为 Exascale 计算提供了基础。作为由编译器、编程 API 和库组成的开源工具集,EXascale 软件开发人员使用 ROCm 创建高性能应用程序。ROCm 4.0 经过优化,可大规模为基于 MI100 的系统提供性能。ROCm 4.0 已将编译器升级为开源和统一,以支持 OpenMP 5.0 和 HIP。使用 ROCm 4.0 优化的 PyTorch 和 Tensorflow 框架现在可以通过 MI100 实现更高的性能。ROCm 4.0 是 HPC、ML 和 AI 应用程序开发人员的最新产品,允许他们创建性能上的便携式软件。
"我们很早就获得了 MI100 加速器的访问权限,初步结果非常
令人鼓舞。我们通常看到性能显著提升,与其他 GPU 相比,高达 2-3 倍,"橡树岭领导力计算设施科学总监 Bronson Messer 说。"同样重要的是要认识到软件对性能的影响。事实上,ROCm 开放软件平台和 HIP 开发人员工具是开源的,在各种平台上工作,这是我们自部署第一个混合 CPU/GPU 系统以来几乎一直痴迷着的东西。
AMD 本能 MI100 加速器的主要功能和功能

全新的 AMD CDNA 架构 - 专为超大规模时代和 MI100 加速器的核心提供 AMD GPU 动力,AMD CDNA 架构提供卓越的性能和电源效率
领先的 FP64 和 FP32 HPC 工作负载性能 - 提供业界领先的 11.5 TFLOPS 峰值 FP64 性能和 23.1 TFLOPS 峰值 FP32 性能,使全球科学家和研究人员能够加速生命科学、能源、金融、学术、政府、国防等行业的发现。
全新矩阵核心技术用于 HPC 和 AI - 全系列单精度和混合精密矩阵操作的增压性能,如 FP32、FP16、bFloat16、Int8 和 Int4,旨在促进 HPC 和 AI 的融合。
第二代 AMD 无限交换矩阵技术 - Instinct MI100 通过 PCIe 4.0 提供 ±2 倍的点对点 (P2P) 峰值 I/O 带宽,每张卡的聚合带宽高达 340 GB/s,具有三个 AMD 无限交换矩阵链接。 MI100 GPU 可配置多达两个完全连接的四 GPU 配置单元,每个配置单元提供高达 552 GB/s 的 P2P I/O 带宽,实现快速数据共享。
超快 HBM2 内存 - 具有 32 GB 高带宽 HBM2 内存,时钟速率为 1.2 GHz,并提供超高 1.23 TB/s 的内存带宽,以支持大型数据集,并帮助消除数据进入和离开内存的瓶颈。
支持行业最新的 PCIe Gen 4.0 - 采用最新的 PCIe Gen 4.0 技术支持设计,提供高达 64 GB/s 的峰值理论传输数据带宽,从 CPU 到 GPU。
可用的服务器
解决方案 AMD Instinct MI100 加速器预计将在今年年底在企业市场的主要 OEM 和 ODM 合作伙伴的系统中运行,包括:

戴尔
"Dell EMC PowerEdge 服务器将支持新的 AMD Instinct MI100,这将加快数据洞察。这将有助于我们的客户快速实现更稳健、更高效的 HPC 和 AI 结果,"戴尔技术公司 PowerEdge 服务器高级副总裁 Ravi Pendekanti 说。"AMD 一直是我们支持数据中心创新的重要合作伙伴。AMD Instinct 加速器的高性能功能非常适合我们的 PowerEdge 服务器 AI 和 HPC 产品组合。


GIGABYTE NCBU 助理副总裁 Alan Chen 表示:"我们很高兴再次与 AMD 合作,成为为客户提供高性能计算服务器硬件的战略合作伙伴。
"AMD Instinct MI100 加速器代表了数据中心中高性能计算的新级别,为能源研究、分子动力学和深度学习培训带来了更大的连接性和数据带宽。作为GIGIABYTE产品组合中的新加速器,我们的客户可以从一系列科学和工业 HPC 工作负载中改进的性能中获益。惠普企业(HPE)

"客户使用 HPE Apollo 系统进行专门构建的功能和性能,以应对高性能计算 (HPC)、深度学习和分析等一系列复杂、数据密集型工作负载,"HPE HPC 副总裁兼总经理 Bill Mannel 说。

"随着新 HPE Apollo 6500 Gen10 Plus 系统的推出,我们进一步推进我们的产品组合,通过支持新的 AMD Instinct MI100 加速器来提高工作负载性能,该加速器可增强连接性和数据处理能力,以及第二代 AMD EPYC 处理器和我们期待继续与 AMD 合作,通过最新的 CPU 和加速器扩展我们的产品。

超微"我们很高兴AMD已经生产出世界上最快的HPC GPU加速器。
MI100 带来的高内存和 GPU 点对点带宽相结合,结合了新的 AMD CDNA 架构,我们的客户将获得满足其加速计算要求的伟大解决方案。加入开放的 AMD ROCm 软件堆栈,他们将获得一个开放、灵活和便携的环境,以满足他们对关键企业工作负载出色的应用支持的需求,"Supermicro 现场应用工程和业务开发高级副总裁 Vik Malyala 说。"AMD Instinct MI100 将是我们多 GPU 服务器和高性能系统套件的一大补充。完整的幻灯片甲板如下。有关详细信息,请访问产品页面。







本帖最近评分记录
  • 神影 金币 +6 感谢分享,论坛有您更精彩! 2021-1-1 19:57

TOP

0
CDNA架构下来应该是矿老板的挚爱了,高算力适合挖矿等需要大规模并行计算的场合

TOP

当前时区 GMT+8, 现在时间是 2025-3-13 18:16