AMD 公司在演讲过程中,对比英伟达的 H100 加速卡,分享了 MI300X 的性能参数情况,
附上数值如下:
内存容量是 H100 的 2.4 倍
内存带宽是 H100 的 1.6 倍
FP8 TFLOPS 精度是 H100 的 1.3 倍
FP16 TFLOPS 精度是 H100 的 1.3 倍
在 1v1 比较中,训练 Llama 2 70B 模型速度比 H100 快 20%
在 1v1 比较中,训练 FlashAttention 2 模型速度比 H100 快 20%
在 8v8 Server 比较中,训练 Llama 2 70B 模型速度比 H100 快 40%
在 8v8 Server 比较中,训练 Bloom 176B 模型速度比 H100 快 60%
设计方面,主中介层采用无源芯片布局,该芯片使用第 4 代 Infinity Fabric 解决方案容纳互连层。中介层总共包括 28 个芯片,其中包括 8 个 HBM3 封装、16 个 HBM 封装之间的虚拟芯片和 4 个有源芯片,每个有源芯片都有 2 个计算芯片。
内存方面,MI300X 采用 HBM3 内存,容量最高 192GB,比前代 MI250X(128 GB)高 50%。该内存将提供高达 5.3 TB / s 的带宽和 896 GB/s 的 Infinity Fabric 带宽S亚威股份(sz002559)S