AMD CDNAアーキテクチャベースのArcturus GPU「Radeon Instinct」テストボードが発見される

今年後半に発表される予定のAmpere GPUのリークに基づいて、NVIDIAは、FP32のほぼ36 TFLOPとFP64の18 TFLOPに到達すると推測されているため、次世代テスラ7nm GPUラインナップは、コンピューティングパフォーマンスの面で優位に立つ可能性があるようです。

AMD Radeon Instinct Accelerators 2020

Accelerator Name	AMD Radeon Instinct MI6	AMD Radeon Instinct MI8	AMD Radeon Instinct MI25	AMD Radeon Instinct MI60	AMD Radeon Instinct MI60	AMD Radeon Instinct MI100
GPU Architecture	Polaris 10	Fiji XT	Vega 10	Vega 20	Vega 20	Arcturus
GPU Process Node	14nm FinFET	28nm	14nm FinFET	7nm FinFET	7nm FinFET	7nm FinFET
GPU Cores	2304	4096	4096	3840	4096	8192?
GPU Clock Speed	1237 MHz	1000 MHz	1500 MHz	1746 MHz	1800 MHz	1334 MHz?
FP16 Compute	5.7 TFLOPs	8.2 TFLOPs	24.6 TFLOPs	26.8 TFLOPs	29.6 TFLOPs	~50 TFLOPs
FP32 Compute	5.7 TFLOPs	8.2 TFLOPs	12.3 TFLOPs	13.4 TFLOPs	14.8 TFLOPs	~25 TFLOPs
FP64 Compute	384 GFLOPs	512 GFLOPs	768 GFLOPs	6.7 TFLOPs	7.4 TFLOPs	~12.5 TFLOPs
VRAM	16 GB GDDR5	4 GB HBM1	16 GB HBM2	16 GB HBM2	32 GB HBM2	32 GB HBM2
Memory Clock	1750 MHz	500 MHz	472 MHz	500 MHz	500 MHz	TBD
Memory Bus	256-bit bus	4096-bit bus	2048-bit bus	4096-bit bus	4096-bit bus	4096-bit bus
Memory Bandwidth	224 GB/s	512 GB/s	484 GB/s	1 TB/s	1 TB/s	TBD
Form Factor	Single Slot, Full Length	Dual Slot, Half Length	Dual Slot, Full Length	Dual Slot, Full Length	Dual Slot, Full Length	Dual Slot, Full Length
Cooling	Passive Cooling	Passive Cooling	Passive Cooling	Passive Cooling	Passive Cooling	Passive Cooling?
TDP	150W	175W	300W	300W	300W	200W?

Accelerator Name

AMD Radeon Instinct MI6

AMD Radeon Instinct MI8

AMD Radeon Instinct MI25

AMD Radeon Instinct MI60

AMD Radeon Instinct MI100

GPU Architecture

Polaris 10

Fiji XT

Vega 10

Vega 20

Arcturus

GPU Process Node

14nm FinFET

28nm

14nm FinFET

7nm FinFET

GPU Cores

2304

4096

3840

4096

8192?

GPU Clock Speed

1237 MHz

1000 MHz

1500 MHz

1746 MHz

1800 MHz

1334 MHz?

FP16 Compute

5.7 TFLOPs

8.2 TFLOPs

24.6 TFLOPs

26.8 TFLOPs

29.6 TFLOPs

~50 TFLOPs

FP32 Compute

5.7 TFLOPs

8.2 TFLOPs

12.3 TFLOPs

13.4 TFLOPs

14.8 TFLOPs

~25 TFLOPs

FP64 Compute

384 GFLOPs

512 GFLOPs

768 GFLOPs

6.7 TFLOPs

7.4 TFLOPs

~12.5 TFLOPs

VRAM

16 GB GDDR5

4 GB HBM1

16 GB HBM2

32 GB HBM2

Memory Clock

1750 MHz

500 MHz

472 MHz

500 MHz

TBD

Memory Bus

256-bit bus

4096-bit bus

2048-bit bus

4096-bit bus

Memory Bandwidth

224 GB/s

512 GB/s

484 GB/s

1 TB/s

TBD

Form Factor

Single Slot, Full Length

Dual Slot, Half Length

Dual Slot, Full Length

Cooling

Passive Cooling

Passive Cooling?

TDP

150W

175W

300W

200W?

AMDはこれまで、CDNAの主な焦点は、データセンター市場におけるパフォーマンス、効率、機能、スケーラビリティであることを明らかにしました。現在、AMDのGCNアーキテクチャがこのセグメントに対応していますが、CDNAを使用して、AMDは高性能コンピューティング、機械学習、およびHPC用に特別に最適化されたGPUを作成します。第1世代のCDNA GPUは、第2世代のInfinityアーキテクチャを特徴とし、ROCm（Radeon Open Compute Platform）を利用して、主要な最適化と拡張されたスケーラビリティでデータセンターを強化します。第2世代インフィニティアーキテクチャは、単一ノードで4-8ウェイGPU接続を可能にし、新しいRadeon Instinctボードが調和して動作できるようにします。AMDは、彼らが競争力のある価格でより多くのFLOPを提供できることを証明しました。Arcturusがいつ市場に登場するかについては何も発表されていませんが、AMDは今年後半に、第1世代のCDNAアーキテクチャを特徴とするRadeon Instinct製品を示唆しています。