NVIDIA GeForce RTX 4090TiおよびRTX4090グラフィックスカードは、グリーンチームの次世代フラッグシップとなり、PCゲームセグメントではこれまでにないパフォーマンスレベルをもたらします。必要なスペック、価格、パフォーマンスの情報がここにあります。
NVIDIA GeForce RTX 4090TiとRTX4090は、究極のゲーマー向けの次世代BFGPU「更新まとめ」
NVIDIA GeForce RTX 3090シリーズは、グリーンチームがPCグラフィックスセグメントでのリードを確保するために極限の努力をすることができることを証明しました。新種の愛好家であり究極のグラフィックカードである「BFGPU」というラベルが付いたこれらのカードは、他に類を見ないパッケージで、可能な限り最高のPCゲーム機能を備えた最高のパフォーマンスを提供します。
BFGPUでのNVIDIAの方向性は、究極のゲーマーだけでなく、優れたビジュアルと非常識な流動性を備えた次世代のAAAゲームタイトルを強化するために手元に最高のグラフィックパフォーマンスを持ちたいプロのコンテンツクリエーターのためにもグラフィックカードを設計することでした。最近重要なのはFPSだけではなく、ビジュアルであり、フレームレートもスムーズです。これこそが、GeForce RTX 30シリーズが優れている点です。
次世代のフラッグシップでも同様のことを期待する必要がありますが、考慮すべき重要な要素は、GPUがより電力を消費し、より高価になっていることです。これは、より良い製品が得られるにつれて将来も続く可能性がある傾向ですが、その見返りとして、最終消費者が支払うコストは常にあります。したがって、まず、次世代のGeForceRTX40シリーズカードに電力を供給する新しいAda LovelaceまたはAD10*クラスのGPUを確認していきます。
NVIDIAのAD102 Ada Lovelace GPUは、次世代のパワーハウス
まずGPUの構成から、Kopite7kimiはトップのAD102GPUをグリーンチームの他のさまざまなGPUと比較します。これらには、ゲームに焦点を合わせたAmpereGA102とTuringTU102が含まれ、HPCに焦点を合わせたHopperGH100とAmpereGA100もリストに追加されています。HPCに焦点を当てた設計は消費者中心の製品とは大きく異なるため、AD102をその前身のゲームとのみ比較します。GPUは約600mm2を測定すると言われており、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードの最適化バージョンであるTSMC4Nプロセスノードを利用します。
NVIDIA Ada Lovelace AD102 GPUは、最大12個のGPC(グラフィックスプロセッシングクラスター)を備えています。これは、7つのGPCのみを備えたGA102と比較して70%の増加です。各GPUは、既存のチップと同じ構成である6つのTPCと2つのSMで構成されます。各SM(ストリーミングマルチプロセッサ)は、GA102GPUと同じ4つのサブコアを収容します。変更されたのは、FP32とINT32のコア構成です。各サブコアには128個のFP32ユニットが含まれますが、FP32 + INT32ユニットの合計は192個になります。これは、FP32ユニットがIN32ユニットと同じサブコアを共有していないためです。128個のFP32コアは、64個のINT32コアとは別のものです。
なので、合計で、各サブコアは128FP32と64INT32ユニットで構成され、合計192ユニットになります。各SMには、合計512のFP32ユニットと256のINT32ユニット、合計768のユニットがあります。また、合計24個のSMユニット(GPCごとに2個)があるため、12,288個のFP32ユニットと6,144個のINT32ユニット、合計18,432個のコアを検討しています。各SMには、SMごとに64ラップするための2つのラップスケジュール(32スレッド/ CLK)も含まれます。これは、コア(FP32 + INT32)で50%の増加であり、GA102 GPUと比較してラップ/スレッドで33%の増加です。
NVIDIA Ada Lovelace GPU Specs 'Preliminary'
GPU Name | AD102 | GA102 | TU102 | GA100 | GH100 |
---|---|---|---|---|---|
GPC | 12 (Per GPU) | 1.7x | 2x | 1.5x | 1.5x |
TPC | 6 (Per GPC) | Same | Same | 0.75x | 0.67x |
SM | 2 (Per TPC) | Same | Same | Same | Same |
Sub-Core | 4 (Per SM) | Same | Same | Same | Same |
FP32 | 128 (Per SM) | Same | 2x | 2x | Same |
FP32+INT32 | 192 (Per SM) | 1.5x | 1.5x | 1.5x | Same |
Warps | 64 (Per SM) | 1.33x | 2x | Same | Same |
Threads | 2048 (Per SM) | 1.33x | 2x | Same | Same |
L1 Cache | 192 KB (Per SM) | 1.5x | 2x | Same | 0.75x |
L2 Cache | 96 MB (Per GPU) | 16x | 16x | 2.4x | 1.6x |
ROPs | 32 (Per GPC) | 2x | 2x | 2x | 2x |
キャッシュに移ると、これはNVIDIAが既存のAmpere GPUを大幅に強化したもう1つのセグメントです。Ada Lovelace GPUは、SMごとに192 KBのL1キャッシュをパックします。これは、Ampereよりも50%増加します。これは、最上位のAD102GPUに合計4.5MBのL1キャッシュがあります。リークに記載されているように、L2キャッシュは96MBに増加します。これは、わずか6MBのL2キャッシュをホストするAmpere GPUの16倍の増加です。キャッシュはGPU全体で共有されます。
最後に、ROPもGPCあたり32に増加し、Ampereの2倍に増加します。次世代のフラッグシップで最大384ROPを見ているのに対し、最速のAmpere GPUであるRTX 3090Tiではわずか112ROPです。また、最新の第4世代Tensorおよび第3世代RT(レイトレーシング)コアがAda Lovelace GPUに注入され、DLSSおよびレイトレーシングのパフォーマンスを次のレベルに引き上げます。全体として、Ada Lovelace AD102 GPUは以下を提供します。
- 2x GPC(対Ampere)
- コアが50%多い(対Ampere)
- L1キャッシュが50%増加(対Ampere)
- 16倍以上のL2キャッシュ(対Ampere)
- ROPを2倍にする(対Ampere)
- 第4世代Tensorと第3世代RTコア
2〜3 GHzの範囲と言われるクロック速度は方程式に含まれないため、Ampereと比較してコアあたりのパフォーマンスを向上させる上でも主要な役割を果たします。
NVIDIA GeForce RTX 40 Series Graphics Card Lineup Rumored
Graphics Card | GPU | PCB Variant | SM Units / Cores | Memory / Bus | Memory Clock / Bandwidth | TGP | Power Connectors |
---|---|---|---|---|---|---|---|
NVIDIA GeForce RTX 4090 Ti | AD102-350? | TBD | 144 / 18432? | 48 GB / 384-bit | 24 Gbps / 1.15 TB/s | ~900W | 2x 16-pin |
NVIDIA GeForce RTX 4090 | AD102-300? | PG137/139 SKU330 | >144 / 18432? | 24 GB / 384-bit | 21 Gbps / 1.00 TB/s | ~600W | 1x 16-pin |
NVIDIA GeForce RTX 4080 | AD103-300? | TBD | >84 / 10752? | 16 GB / 256-bit | 21 Gbps / 672 GB/s | ~350W | 1x 16-pin |
NVIDIA GeForce RTX 4070 | AD104-400? | PG141-310 | >60 / 7680 | 12 GB / 192-bit | 18 Gbps / 432 GB/s | ~300W | 1x 16-pin |
NVIDIA GeForce RTX4090TiとRTX4090グラフィックスカードの仕様
NVIDIA GeForce RTX 4090TiおよびRTX4090は、上記で詳述したトップAD102GPUを搭載した唯一の2つのチップであると予想されます。RTX 3090TiとRTX3090で見たように、どちらも同じチップの異なるSKUを備えています。
NVIDIA GeForce RTX4090Tiに期待される仕様
NVIDIA GeForce RTX 4090Tiは、144個のSMすべてが合計18432個のCUDAコアに対して有効になっているフルファット構成になります。GPUには、96MBのL2キャッシュと合計384のROPが搭載されています。クロック速度はまだ確認されていませんが、TSMC 4Nプロセスが使用されていることを考慮すると、2.0〜3.0GHzの範囲のクロックが予想されます。
メモリ仕様に関しては、GeForce RTX 4090Tiは、384ビットバスインターフェイス全体で24Gbpsの高速で実現する可能性のある24GB GDDR6X容量を搭載されることが期待されています。これにより、最大1.152 TB/sの帯域幅が提供されます。現在、これらのブーストされた仕様はすべて、より高い消費電力をもたらし、フラッグシップは約600WのTBPで動作することになります。600Wの場合、16ピンのGen 5コネクタは1つで十分ですが、AIBは必ずしも仕様の範囲内に収まらず、工場でのわずかなオーバークロックでもTBPをプッシュするため、カスタムバリアントのほとんどは間違いなくデュアルGen5コネクタを使用することになります。 1つのGen5電源コネクタの制限である600Wを超えます。
また、NVIDIA GeForce RTX 4090Tiヒートシンクとクーラーシュラウドも見られました。これは、GPUとメモリダイの両方をカバーし、全体的に大きな構造を提供する、より強力なコールドプレートの使用を示唆しています。リークされたクーラーはFounders Editionのデザインであり、その大きさから判断すると、AIBモデルは非常に大きくなり、すべてのパートナーのクアッドスロットデザインになる可能性もあります。
NVIDIA GeForce RTX4090Tiに期待する仕様
NVIDIA GeForce RTX 4090は、合計16128のCUDAコアに対して126のSMが有効になっているカットダウン構成になります。GPUはL2キャッシュを少し削減する可能性もありますが、GPCの数が少ないため、ROPカウントは確実に少なくなります。クロックに関しては、非Tiモデルの速度はわずかに低下しますが、RTX3090Tiと比較すると十分に高速であると予想されます。
メモリ仕様に関しては、GeForce RTX 4090も24GB GDDR6Xを搭載すると予想されますが、384ビットバスインターフェイス全体で21Gbpsです。これにより、最大1.008 TB/sの帯域幅が提供されます。Tiモデルと比較すると、非Tiには、既存のRTX 3090Tiグラフィックカードと同じ450WのTGPになります。RTX 3090 Tiは、GeForceRTX4090グラフィックスカード用のクーラーとPCBを設計する際のAIBの学習曲線だったようです。
機能セットに関しては、NVIDIA GeForce RTX 4090TiおよびRTX4090グラフィックスカードは、最新の第4世代Tensorコア、第3世代RTコア、最新のNVENCエンコーダー、NVCDECデコーダーなど、すべての最新のNV機能セットと搭載します。また、最新のAPIの場合には、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCサポートなどの最新のRTX機能もすべて搭載されています。
NVIDIA GeForce RTX 4090Ti & RTX 4090 Preliminary Specs
Graphics Card Name | NVIDIA GeForce RTX 4090 Ti | NVIDIA GeForce RTX 4090 | NVIDIA GeForce RTX 3090 Ti | NVIDIA GeForce RTX 3090 |
---|---|---|---|---|
GPU Name | Ada Lovelace AD102-350? | Ada Lovelace AD102-300? | Ampere GA102-350 | Ampere GA102-300 |
Process Node | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
Die Size | ~600mm2 | ~600mm2 | 628.4mm2 | 628.4mm2 |
Transistors | TBD | TBD | 28 Billion | 28 Billion |
CUDA Cores | 18432 | 16128 | 10752 | 10496 |
TMUs / ROPs | TBD / 384 | TBD / 384 | 336 / 112 | 328 / 112 |
Tensor / RT Cores | TBD / TBD | TBD / TBD | 336 / 84 | 328 / 82 |
Base Clock | TBD | TBD | 1560 MHz | 1400 MHz |
Boost Clock | ~2800 MHz | ~2600 MHz | 1860 MHz | 1700 MHz |
FP32 Compute | ~103 TFLOPs | ~90 TFLOPs | 40 TFLOPs | 36 TFLOPs |
RT TFLOPs | TBD | TBD | 74 TFLOPs | 69 TFLOPs |
Tensor-TOPs | TBD | TBD | 320 TOPs | 285 TOPs |
Memory Capacity | 24 GB GDDR6X | 24 GB GDDR6X | 24 GB GDDR6X | 24 GB GDDR6X |
Memory Bus | 384-bit | 384-bit | 384-bit | 384-bit |
Memory Speed | 24.0 Gbps | 21.0 Gbps | 21.0 Gbps | 19.5 Gbps |
Bandwidth | 1152 GB/s | 1008 GB/s | 1008 GB/s | 936 Gbps |
TGP | 600W | 450W | 450W | 350W |
Price (MSRP / FE) | $1999 US? | $1499 US? | $1999 US | $1499 US |
Launch (Availability) | July 2022? | July 2022? | 29th March 2022 | 24th September 2020 |
NVIDIA GeForce RTX4090TiおよびRTX4090グラフィックスカードのパフォーマンス
これらのモンスターGPUのパフォーマンスについては、発売が少し先のため、ここでは理論上の数値のみになります。私たちが知っていることに基づいて、RTX4090シリーズカードは100TFLOPの計算馬力制限に達する最初のゲームカードである可能性があります。
- NVIDIA GeForce RTX 4090Ti:〜103 TFLOP(FP32)(2.8 GHzクロックを想定)
- NVIDIA GeForce RTX 4090:〜90 TFLOP(FP32)(2.8 GHzクロックを想定)
- NVIDIA GeForce RTX 3090Ti: 40 TFLOP(FP32)(1.86 GHzブーストクロック)
- NVIDIA GeForce RTX 3090: 36 TFLOP(FP32)(1.69 GHzブーストクロック)
2.8 GHzの理論上のクロック速度に基づくと、最大103 TFLOPのコンピューティングパフォーマンスが得られ、噂ではさらに高いブーストクロックが示唆されています。さて、これらは間違いなくピーククロックのように聞こえます。これは、平均的な「ゲーム」クロックよりも高いAMDのピーク周波数に似ています。100以上のTFLOPS計算パフォーマンスは、3090Tiフラッグシップの2倍以上の馬力を意味します。ただし、コンピューティングパフォーマンスは必ずしも全体的なゲームパフォーマンスを示すわけではありませんが、それにもかかわらず、ゲーミングPCの大幅なアップグレードであり、現在の最速のコンソールであるXbox SeriesXの8.5倍になります。
これは、各グラフィックカードとその前身の2倍のコンピューティングパフォーマンスの向上になります。これは、それぞれの部門でも大幅な向上が見込まれるRTおよびTensorコアのパフォーマンスを考慮に入れていません。現在、FLOPは必ずしもグラフィックスやゲームのパフォーマンスを反映しているわけではありませんが、比較に使用できるメトリックを提供します。RTX3090とRTX3090Tiの2〜2.5倍のゲインは非常に破壊的であり、NVIDIAがカードの電力制限を高くして非常に困難になっている理由は理にかなっています。
ゲーマーは、4Kゲームがこれらのグラフィックカードで非常にスムーズであることを期待する必要があります。DLSSを使用すると、8K解像度で再生可能な60 FPSが表示される場合があります。これは、NVIDIAがRTX3090シリーズBFGPUでしばらくの間、達成しようとしてきたことです。
NVIDIA GeForce RTX4090TIとRTX4090グラフィックスカードの価格と入手可能性
NVIDIA GeForce RTX 3090TiとRTX3090グラフィックスカードは、間違いなくこれまでで最も高価なシングルチップGPUです。それぞれUSD$1999とUSD$1499から、価格設定は超愛好家とプロセグメントに対応しています。繰り返しになりますが、非常に高い価格が考えられますが、あちこちで少し値上がりすることも予想されます。グリーンチームにとっては、現在の価格を維持するのが賢明であり、ばかげているかもしれませんが、パフォーマンスがあれば多額の現金を喜んで支払う人々がいます。
RTX 4090TiとRTX4090の違いは、今回もはるかに大きくなっています。NVIDIAはRTX3090Tiから期待したほど多くの肯定的な反応を得られなかったようで、GPUセグメントからカードを完全に削除する代わりに、非Tiの仕様を削減することを決定できた可能性がありますもっと。スペックのダウングレードにより、RTX 4090とRTX 4090TiのパフォーマンスにRTX 3090とRTX 3090Tiのパフォーマンスの差が大きくなるため、代わりに15〜20%のパフォーマンス向上のためにハイエンドのバリアントを入手する価値があるかもしれません。
NVIDIA GeForce RTX 40シリーズグラフィックスカードは7月中旬に発売されると噂されており、RTX 4090Tiのより排熱性能の高いヒートシンクがリークされているのを見てきましたが、NVIDIAはRTX 4090Tiより先に非Tiをリリースする可能性があります。それもかなりの期間を空けて市場に出ます。しかし、NVIDIAが次世代の最初の段階でハイエンドSKUをリリースするのはこれが初めてではありません。RTX 2080Tiのフラッグシップは、その前身であるGTX 1080Tiが最初のラインナップの発売から数か月後に登場したにもかかわらず、残りのラインナップとともに発売されました。RTX 3090はRTX 30シリーズカードの最初のラインで発売されましたが、3090Tiは1年以上遅れて発売されました。今回、NVIDIAは最初からファミリ全体をラウンチし、後でサイクルの途中で更新することができますが、それはまだわかりません。
NVIDIA GeForce GPU Segment / Tier Prices
Graphics Segment | 2014-2016 | 2016-2017 | 2017-2018 | 2018-2019 | 2019-2020 | 2020-2021 |
---|---|---|---|---|---|---|
Titan Tier | Titan X (Maxwell) | Titan X (Pascal) | Titan Xp (Pascal) | Titan V (Volta) | Titan RTX (Turing) | GeForce RTX 3090 |
Price | $999 US | $1199 US | $1199 US | $2999 US | $2499 US | $1499 US |
Ultra Enthusiast Tier | GeForce GTX 980 Ti | GeForce GTX 980 Ti | GeForce GTX 1080 Ti | GeForce RTX 2080 Ti | GeForce RTX 2080 Ti | GeForce RTX 3080 Ti |
Price | $649 US | $649 US | $699 US | $999 US | $999 US | $1199 US |
Enthusiast Tier | GeForce GTX 980 | GeForce GTX 1080 | GeForce GTX 1080 | GeForce RTX 2080 | GeForce RTX 2080 SUPER | GeForce RTX 3080 |
Price | $549 US | $549 US | $549 US | $699 US | $699 US | $699 US |
High-End Tier | GeForce GTX 970 | GeForce GTX 1070 | GeForce GTX 1070 | GeForce RTX 2070 | GeForce RTX 2070 SUPER | GeForce RTX 3070 Ti GeForce RTX 3070 |
Price | $329 US | $379 US | $379 US | $499 US | $499 US | 599 499 |
Mainstream Tier | GeForce GTX 960 | GeForce GTX 1060 | GeForce GTX 1060 | GeForce GTX 1060 | GeForce RTX 2060 SUPER GeForce RTX 2060 GeForce GTX 1660 Ti GeForce GTX 1660 SUPER GeForce GTX 1660 | GeForce RTX 3060 Ti GeForce RTX 3060 12 GB |
Price | $199 US | $249 US | $249 US | $249 US | $399 US $349 US $279 US $229 US $219 US | $399 US $329 US |
Entry Tier | GTX 750 Ti | GTX 950 | GTX 1050 Ti | GTX 1050 Ti | GTX 1650 SUPER | TBA |
GTX 750 | GTX 1050 | GTX 1050 | GTX 1650 | |||
Price | $149 US | $149 US | $139 US | $139 US | $159 US | TBA |
$119 US | $109 US | $109 US | $149 US |
今のところ、噂では7月中旬の発売が指摘されているので、それがどれほどうまくいくかを確認するには、あと2か月待つ必要があります。
(Source:wccftech)
この記事へのコメントはありません。