NVIDIAがGTC 2020に先駆けて世界最大のグラフィックスカードAmpere GPU搭載のDGX A100スーパーコンピューティングシステムを発表

(Source:wccftech)

NVIDIAは、2020年5月14日のGTC 2020で発表される予定の次世代のAmpere GPU搭載DGX A100システムのティーザーを投稿しました。システムへの最初の参照は1週間前に発見されましたが、今週、NVIDIAからHPCが発表されました。

NVIDIAのCEOであるJensen Huangが、HPC向けの次世代Ampere GPU搭載DGX A100システムを紹介

DGXシステムの特定の名前は、言うべきことがたくさんあるDGX A100です。DGXシステムは、ディープラーニングとHPCコミュニティ専用に設計されており、ワークステーションフォームファクター内でスーパーコンピューティング機能を提供します。NVIDIAは、PascalおよびVolta GPUをベースにしたDGXソリューションをリリースしましたが、差し迫ったAmpere GPUのリリースに伴い、新しいDGXソリューションを設計する必要があります。

以下に示すティーザービデオでは、NVIDIAのCEOであるJensen Huangが、オーブンから取り出したばかりの巨大なDGX A100メインボードを取り出しているのを見ることができます。「What’s Jensen been cooking」というタイトルのビデオの後には、「オーブンから取り出したばかりの世界最大のグラフィックスカード」という説明が続きます。


DGXシステムのVoltaラインは合理化され、HPCユーザーにより多くのオプションを提供しました。合計4つのTesla V100 GPUを特徴とするDGXステーションから、NVIDIAが「世界最大のGPU」と呼んだ16 Tesla V100ハウジングのDGX-2モンスターまで、さまざまなバリエーションがありました。Ampere GPUにより、NVIDIAは最新のDGX A100システムをリリースします。その名前は、システムがGA100 GPUに基づいていることを明確にしています。GA100 GPUは、Ampereラインナップの中で最大のチップであり、NVIDIA GA100チップで見られると予想されるフラグシップ128 SM構成の1つを備えています。Jensenが調理したばかりの特定のDGX A100メインボードには、合計8つ、AmpereのGPUが搭載されており、大規模なヒートシンクが装備されています。DGX A100システムはサーバー/ HPC環境向けに設計されているため、パッシブ冷却されることになります。GPUに隣接する6つのヒートシンクがあり、GPUからGPUおよびGPUからCPUへの通信用の相互接続スイッチを備えている可能性があります。明らかにすべきことはたくさんあるので、 Jensenが自身で詳細を明らかにするまであと2日待ちましょう。NVIDIAは、より伝統的な方法で、DGXシステムのAmpereシリーズを開始し、最初に8 Tesla GPU構成を提供し、新しいAmpereチップの歩留まりが向上するにつれて、より大きく高密度な部品に移行する可能性があります。

NVIDIA Tesla Graphics Cards Comparison

Tesla Graphics Card NameNVIDIA Tesla M2090NVIDIA Tesla K40NVIDIA Telsa K80NVIDIA Tesla P100NVIDIA Tesla V100NVIDIA Tesla Next-Gen #1NVIDIA Tesla Next-Gen #2NVIDIA Tesla Next-Gen #3
GPU ArchitectureFermiKeplerMaxwellPascalVoltaAmpere?Ampere?Ampere?
GPU Process40nm28nm28nm16nm12nm7nm?7nm?7nm?
GPU NameGF110GK110GK210 x 2GP100GV100GA100?GA100?GA100?
Die Size520mm2561mm2561mm2610mm2815mm2TBDTBDTBD
Transistor Count3.00 Billion7.08 Billion7.08 Billion15 Billion21.1 BillionTBDTBDTBD
CUDA Cores512 CCs (16 CUs)2880 CCs (15 CUs)2496 CCs (13 CUs) x 23840 CCs5120 CCs6912 CCs7552 CCs7936 CCs
Core ClockUp To 650 MHzUp To 875 MHzUp To 875 MHzUp To 1480 MHzUp To 1455 MHz1.08 GHz (Preliminary)1.11 GHz (Preliminary)1.11 GHz (Preliminary)
FP32 Compute1.33 TFLOPs4.29 TFLOPs8.74 TFLOPs10.6 TFLOPs15.0 TFLOPs~15 TFLOPs (Preliminary)~17 TFLOPs (Preliminary)~18 TFLOPs (Preliminary)
FP64 Compute0.66 TFLOPs1.43 TFLOPs2.91 TFLOPs5.30 TFLOPs7.50 TFLOPsTBDTBDTBD
VRAM Size6 GB12 GB12 GB x 216 GB16 GB48 GB24 GB32 GB
VRAM TypeGDDR5GDDR5GDDR5HBM2HBM2HBM2eHBM2eHBM2e
VRAM Bus384-bit384-bit384-bit x 24096-bit4096-bit4096-bit?3072-bit?4096-bit?
VRAM Speed3.7 GHz6 GHz5 GHz737 MHz878 MHz1200 MHz1200 MHz1200 MHz
Memory Bandwidth177.6 GB/s288 GB/s240 GB/s720 GB/s900 GB/s1.2 TB/s?1.2 TB/s?1.2 TB/s?
Maximum TDP250W300W235W300W300WTBDTBDTBD

NVIDIAのAmpere GPUは間違いなくHPC市場に大きな変化をもたらし、パフォーマンスは約30 TFLOP(FP32)と評価されています。