AMD Instinct MI300は、CDNA3アーキテクチャに基づくクアッドMCMGPUを搭載

(Source:wccftech)

AMDは、MCMグラフィックアーキテクチャを搭載した最初のチップとなるInstinct MI200 GPUアクセラレータを発売しようとしていますが、CDNA3アーキテクチャを搭載した次世代のInstinct MI300は、クアッドMCM設計でそれを吹き飛ばそうとしているようです。

AMD Instinct MI300は、CDNA3グラフィックスアーキテクチャに基づく4つのMCMGPUを搭載すると噂

CDNA2アーキテクチャを備えたAMD Instinct MI200アクセラレータは、同じパッケージに2つのGPUダイを搭載することが期待されています。これらはInfinity Fabric相互接続によって接続され、2つのGPU間の多層キャッシュとして機能する別個のダイも備えています。各グラフィックスダイはGCDと呼ばれ、キャッシュダイはMCDと呼ばれます。


Instinct MI200パッケージには2つのCDNA2 GPUが搭載されますが、次世代のHPCアクセラレータはそれを2倍にするという噂があります。Kepler_L2によると、Instinct MI300は、まったく新しいCDNA3アーキテクチャに基づく4-GCD設計を特徴としています。今後のInstinctMI200は、ダイごとに128の計算ユニットを搭載する予定でしたが、先週の噂から110の計算ユニットに変更されました。合計220のコンピューティングユニットは14,080コアをネットし、正確な数を取得して4(Instinct MI300のGCDの数)を掛けると、440のコンピューティングユニットまたは非常識な28,160コアになります。

Komachiによって発見された最近のAMD ROCm Developer Toolsアップデートでは、最大4つのMCM GPUが確認されましたが、これらは単にAldebaran SKUです。以下にリストされているそれぞれの(一意のID)を持つ少なくとも4つのCDNA2を利用したInstinctアクセラレータが存在すると予想されます。この数は、各デバイスのダイの数ではなく、デバイス自体を表すことに注意してください。

  • 0x7408
  • 0x740C
  • 0x740F
  • 0x7410

これは、AMDがCDNA2からCDNA3に移行するときに何も変更を加えない場合に当てはまりますが、そんな事は考えにくいです。CDNA 3は、ArcturusやAldebaranのような別のVega派生物ではない改訂された新しいアーキテクチャが提供される事が濃厚です。GPUアーキテクチャは、新しいRDNA3チップ上の新しいWGP / SE配置、またはHPCセグメント向けに調整されたまったく新しい設計に似たレイアウトを使用する場合もあります。しかし、1つ確かなことは、これらのクアッドMCM GPUは間違いなく、実際に動作するのを待ちきれないものです。

AMD Radeon Instinct Accelerators 2020

Accelerator NameAMD Radeon Instinct MI6AMD Radeon Instinct MI8AMD Radeon Instinct MI25AMD Radeon Instinct MI50AMD Radeon Instinct MI60AMD Instinct MI100AMD Instinct MI200AMD Instinct MI300
GPU ArchitecturePolaris 10Fiji XTVega 10Vega 20Vega 20Arcturus (CDNA 1)Aldebaran (CDNA 2)TBA (CDNA 3)
GPU Process Node14nm FinFET28nm14nm FinFET7nm FinFET7nm FinFET7nm FinFETAdvanced Process NodeAdvanced Process Node
GPU Dies1 (Monolithic)1 (Monolithic)1 (Monolithic)1 (Monolithic)1 (Monolithic)1 (Monolithic)2 (MCM)4 (MCM)?
GPU Cores23044096409638404096768014,080?28,160?
GPU Clock Speed1237 MHz1000 MHz1500 MHz1725 MHz1800 MHz~1500 MHzTBATBA
FP16 Compute5.7 TFLOPs8.2 TFLOPs24.6 TFLOPs26.5 TFLOPs29.5 TFLOPs185 TFLOPsTBATBA
FP32 Compute5.7 TFLOPs8.2 TFLOPs12.3 TFLOPs13.3 TFLOPs14.7 TFLOPs23.1 TFLOPsTBATBA
FP64 Compute384 GFLOPs512 GFLOPs768 GFLOPs6.6 TFLOPs7.4 TFLOPs11.5 TFLOPsTBATBA
VRAM16 GB GDDR54 GB HBM116 GB HBM216 GB HBM232 GB HBM232 GB HBM264/128 GB HBM2e?TBA
Memory Clock1750 MHz500 MHz945 MHz1000 MHz1000 MHz1200 MHzTBATBA
Memory Bus256-bit bus4096-bit bus2048-bit bus4096-bit bus4096-bit bus4096-bit bus8192-bitTBA
Memory Bandwidth224 GB/s512 GB/s484 GB/s1 TB/s1 TB/s1.23 TB/s~2 TB/s?TBA
Form FactorSingle Slot, Full LengthDual Slot, Half LengthDual Slot, Full LengthDual Slot, Full LengthDual Slot, Full LengthDual Slot, Full LengthDual Slot, Full Length / OAMTBA
CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingTBA
TDP150W175W300W300W300W300WTBATBA