125%のパフォーマンスの飛躍は非常に大きいように見えますが、NVIDIAはすでにAmpereを使用してこの世代のFP32数を大幅に飛躍させたことを覚えておく必要があります。AmpereGA102GPU(RTX3090)は36TFLOPを提供し、TuringTU102GPU(RTX2080Ti)は13TFLOPを提供しました。これはFP32フロップスで150%以上の増加ですが、RTX3090の実際のゲームパフォーマンスの向上は、RTX2080Tiよりも平均して約50〜60%速くなっています。したがって、忘れてはならないことの1つは、Flopsは最近のGPUゲームのパフォーマンスと同等ではないということです。さらに、2.2GHzが平均ブーストなのかピークブーストなのかはわかりません。前者は、AD102の計算能力がさらに高くなる可能性があることを意味します。
それとは別に、リーカーは、NVIDIAGeForceRTX40フラッグシップがRTX3090と同様に384ビットバスインターフェイスを保持すると述べています。興味深いのは、リーカーがG6Xについて言及していることです。これは、NVIDIAがAdaLovelaceの後まで新しいメモリ標準であり、新しい標準(GDDR7など)が登場する前に、次世代カードにG6X(20Gbps+)のより高いピン速度を利用します。
| GPU | TU102 | GA102 | AD102 |
|---|---|---|---|
| Architecture | Turing | Ampere | Ada Lovelace |
| Process | TSMC 12nm NFF | Samsung 8nm | 5nm |
| Graphics Processing Clusters (GPC) | 6 | 7 | 12 |
| Texture Processing Clusters (TPC) | 36 | 42 | 72 |
| Streaming Multiprocessors (SM) | 72 | 84 | 144 |
| CUDA Cores | 4608 | 10752 | 18432 |
| Theoretical TFLOPs | 16.1 | 37.6 | 64.5 |
| Flagship SKU | RTX 2080 Ti | RTX 3090 | RTX 4090? |
| TGP | 250W | 350W | 400-500W |
| Release | Mar. 2017 | Sept. 19 | 2022 (TBC) |
NVIDIAAdaLovelaceGPUは、AMDのRDNA3ベースのRadeonRX7000シリーズグラフィックスカードと正面から連携する次世代のGeForceRTX40グラフィックスカードに電力を供給します。NVIDIAによるMCMの使用に関してはまだいくつかの憶測があります。ホッパーGPUは、主にデータセンターとAIセグメントを対象としており、間もなくテープアウトされるとされており、MCMアーキテクチャを備えています。NVIDIAはAdaLovelaceGPUでMCMデザインを使用しないため、従来のモノリシックデザインを維持します。
一方、AMDは、RDNA3およびCDNA2ファミリでMCMチップとモノリシックチップの両方を提供することを目指しています。CDNA2GPUはMCMのみになりますが、RDNA3は、ここで詳しく説明するように、MCMとモノリシックデザインを組み合わせたものになります。各企業がどのプロセスノードに依存するかは確認されていませんが、推測に基づいて、AMDのRDNA3およびCDNA2ファミリは、新しいGPUと更新されたGPUを備えた6nmノードと5nmノードの組み合わせになり、NVIDIAはTSMCの5nmを利用する予定です。AdaLovelaceGPUのプロセスノードですが、N5またはN5Pノードで製造されるかどうかは確認されていません。一方、Intelは、独自のARCAlchemistGPUラインナップをTSMCの6nmプロセスノードに依存している可能性もあります。今年後半に量産に入り、2022年第1四半期に発売されます。