VGA

AMD CDNAアーキテクチャベースのArcturus GPU「Radeon Instinct」テストボードが発見される

(Source:wccftech)

AMDのRadeon Instinct Arcturus GPUは、CDNAアーキテクチャーを特徴とし、サーバー市場を狙いとするもので、Rogameによって発見されました。CDNAアーキテクチャは、次世代のRadeon Instinctグラフィックスカードに搭載され、計算に最適化されたGPU設計を活用して、データセンターに最高のパフォーマンスの計算機能を提供します。

AMDのCDNAアーキテクチャベースのArcturus GPUテストボードがリーク-次世代のRadeon Instinct、120 CU、合計7680コア

AMD Arcturus GPUは AMDの前にした2018年バックがどの7nmでGPUを導入しているすべての方法を漏洩し。Radeon VIIとNaviのラインナップは2019年にリリースされ、7nm GPUが特徴で、Naviは一般消費者市場向けです。AMDの次世代HPCおよびAI GPUは、コンシューマエンドチップとは別に設計されることが後で明らかになりました。これは、Arcturus GPUがデータセンター市場に独占的に維持されることを意味しました。AMDは最近、Radeon CDNAアーキテクチャロードマップで、すべてのCDNAベースのGPUがHPCおよびデータセンター市場向けに独占的に設計され、Radeon RDNA GPUがコンシューマーセグメントを強化することを確認しました。

仕様に関しては、以前に AMDのArcturus GPUがキャッシュを増やし、CUをVegaの2倍にすることを明らかにしました。これは、XDLOP、Rapid Packed Math、New Vector ALU&BFloat16などのデータセンター固有の機能のリストとともに、新しいCDNAアーキテクチャを備えたRadeon Instinctカードで期待されています。前のRadeon本能MI100プロト型「D34303」ボードは定格200WのTDPと32GB HBM2 VRAMは約1000から1200 MHzでクロックされるとArcturus -XLダイを装備しました。

この部分の情報はプロトタイプに基づいているため、最終的な仕様は同じではない可能性がありますが、ここに重要なポイントがあります。

  • Arcturus XL GPUベース
  • テストボードのTDPは200W
  • 最大32 GBのHBM2メモリ
  • 1000〜1200 MHzで報告されるHBM2メモリクロック

もう一度、Arcturus CDNA GPUに基づくRogameによってテストボードが発見されました。外観から、この製品は合計7680ストリームプロセッサ用の120 CUと878 MHz(750 MHz SOC)のGPUクロック速度を提供します時計)。この製品は1200 MHzでクロックされる未定義の量のHBM2メモリも備えているため、4096ビットのバスを見ると、Aquaboltが提供できる約1.2 TB / sの帯域幅が得られるはずです。しかし、NVIDIAとAMDの両方が、今年生産され、最大1.8 TB / sの帯域幅を提供できる、より高速なHBM2E ‘Flashbolt’標準を利用することになる可能性は非常に高いです。

クロック速度について言えば、テストボードの878 MHzは、過去に1334 MHzまで変化するバリエーションを見たので、かなり低速です。上記の速度では、チップは約13.5 TFLOPのFP32計算能力を誇り、Radeon Instinct MI60よりも低く、前のプロトタイプサンプルで得られた21 TFLOPも備えています。CDNA GPUの最初の反復は、最終的に25 TFLOP FP32のどこかで終了する可能性があります。

今年後半に発表される予定のAmpere GPUのリークに基づいて、NVIDIAは、FP32のほぼ36 TFLOPとFP64の18 TFLOPに到達すると推測されているため、次世代テスラ7nm GPUラインナップは、コンピューティングパフォーマンスの面で優位に立つ可能性があるようです。

AMD Radeon Instinct Accelerators 2020

Accelerator NameAMD Radeon Instinct MI6AMD Radeon Instinct MI8AMD Radeon Instinct MI25AMD Radeon Instinct MI60AMD Radeon Instinct MI60AMD Radeon Instinct MI100
GPU ArchitecturePolaris 10Fiji XTVega 10Vega 20Vega 20Arcturus
GPU Process Node14nm FinFET28nm14nm FinFET7nm FinFET7nm FinFET7nm FinFET
GPU Cores230440964096384040968192?
GPU Clock Speed1237 MHz1000 MHz1500 MHz1746 MHz1800 MHz1334 MHz?
FP16 Compute5.7 TFLOPs8.2 TFLOPs24.6 TFLOPs26.8 TFLOPs29.6 TFLOPs~50 TFLOPs
FP32 Compute5.7 TFLOPs8.2 TFLOPs12.3 TFLOPs13.4 TFLOPs14.8 TFLOPs~25 TFLOPs
FP64 Compute384 GFLOPs512 GFLOPs768 GFLOPs6.7 TFLOPs7.4 TFLOPs~12.5 TFLOPs
VRAM16 GB GDDR54 GB HBM116 GB HBM216 GB HBM232 GB HBM232 GB HBM2
Memory Clock1750 MHz500 MHz472 MHz500 MHz500 MHzTBD
Memory Bus256-bit bus4096-bit bus2048-bit bus4096-bit bus4096-bit bus4096-bit bus
Memory Bandwidth224 GB/s512 GB/s484 GB/s1 TB/s1 TB/sTBD
Form FactorSingle Slot, Full LengthDual Slot, Half LengthDual Slot, Full LengthDual Slot, Full LengthDual Slot, Full LengthDual Slot, Full Length
CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive Cooling?
TDP150W175W300W300W300W200W?







AMDはこれまで、CDNAの主な焦点は、データセンター市場におけるパフォーマンス、効率、機能、スケーラビリティであることを明らかにしました。現在、AMDのGCNアーキテクチャがこのセグメントに対応していますが、CDNAを使用して、AMDは高性能コンピューティング、機械学習、およびHPC用に特別に最適化されたGPUを作成します。第1世代のCDNA GPUは、第2世代のInfinityアーキテクチャを特徴とし、ROCm(Radeon Open Compute Platform)を利用して、主要な最適化と拡張されたスケーラビリティでデータセンターを強化します。第2世代インフィニティアーキテクチャは、単一ノードで4-8ウェイGPU接続を可能にし、新しいRadeon Instinctボードが調和して動作できるようにします。AMDは、彼らが競争力のある価格でより多くのFLOPを提供できることを証明しました。Arcturusがいつ市場に登場するかについては何も発表されていませんが、AMDは今年後半に、第1世代のCDNAアーキテクチャを特徴とするRadeon Instinct製品を示唆しています。

関連記事

  1. GeForce RTX 20シリーズとGTX 10シリーズ、しばらく併…

  2. NVIDIA 次世代 AdaLovelace GPU搭載のフラッグシッ…

  3. IntelのXe HP MCM GPUは非常に大きな3696mm²パッ…

  4. AMD RDNA3 Radeon RX 7000 GPUは、AV1エン…

  5. NVIDIA GeForce RTX 3060 Ti 8GB GDD…

  6. NVIDIA GeForce RTX 3060 Ti 3DMarkベン…

  7. NVIDIA Tesla T4 Tensore Core GPUを発表…

  8. NVIDIA GeForce RTX 2060の価格を299ドルに引き…

  9. AMD RDNA2よりも次世代のRDNA3で、W/パフォーマンスを大幅…

  10. NVIDIA GeForce RTX 4060 Ti 8 GB は 5…

  11. NVIDIA GeForce RTX2080Ti / RTX2080 …

  12. AMD Radeon RX 6700 XT’Navi 22…

PAGE TOP