VGA

NVIDIA GeForce RTX 4090TiおよびRTX4090グラフィックスカードの仕様、パフォーマンス、価格、可用性について

NVIDIA GeForce RTX 4090TiおよびRTX4090グラフィックスカードは、グリーンチームの次世代フラッグシップとなり、PCゲームセグメントではこれまでにないパフォーマンスレベルをもたらします。必要なスペック、価格、パフォーマンスの情報がここにあります。

NVIDIA GeForce RTX 4090TiとRTX4090は、究極のゲーマー向けの次世代BFGPU「更新まとめ」

NVIDIA GeForce RTX 3090シリーズは、グリーンチームがPCグラフィックスセグメントでのリードを確保するために極限の努力をすることができることを証明しました。新種の愛好家であり究極のグラフィックカードである「BFGPU」というラベルが付いたこれらのカードは、他に類を見ないパッケージで、可能な限り最高のPCゲーム機能を備えた最高のパフォーマンスを提供します。

BFGPUでのNVIDIAの方向性は、究極のゲーマーだけでなく、優れたビジュアルと非常識な流動性を備えた次世代のAAAゲームタイトルを強化するために手元に最高のグラフィックパフォーマンスを持ちたいプロのコンテンツクリエーターのためにもグラフィックカードを設計することでした。最近重要なのはFPSだけではなく、ビジュアルであり、フレームレートもスムーズです。これこそが、GeForce RTX 30シリーズが優れている点です。

次世代のフラッグシップでも同様のことを期待する必要がありますが、考慮すべき重要な要素は、GPUがより電力を消費し、より高価になっていることです。これは、より良い製品が得られるにつれて将来も続く可能性がある傾向ですが、その見返りとして、最終消費者が支払うコストは常にあります。したがって、まず、次世代のGeForceRTX40シリーズカードに電力を供給する新しいAda LovelaceまたはAD10*クラスのGPUを確認していきます。

NVIDIAのAD102 Ada Lovelace GPUは、次世代のパワーハウス

まずGPUの構成から、Kopite7kimiはトップのAD102GPUをグリーンチームの他のさまざまなGPUと比較します。これらには、ゲームに焦点を合わせたAmpereGA102とTuringTU102が含まれ、HPCに焦点を合わせたHopperGH100とAmpereGA100もリストに追加されています。HPCに焦点を当てた設計は消費者中心の製品とは大きく異なるため、AD102をその前身のゲームとのみ比較します。GPUは約600mm2を測定すると言われており、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードの最適化バージョンであるTSMC4Nプロセスノードを利用します。

NVIDIA Ada Lovelace AD102 GPUは、最大12個のGPC(グラフィックスプロセッシングクラスター)を備えています。これは、7つのGPCのみを備えたGA102と比較して70%の増加です。各GPUは、既存のチップと同じ構成である6つのTPCと2つのSMで構成されます。各SM(ストリーミングマルチプロセッサ)は、GA102GPUと同じ4つのサブコアを収容します。変更されたのは、FP32とINT32のコア構成です。各サブコアには128個のFP32ユニットが含まれますが、FP32 + INT32ユニットの合計は192個になります。これは、FP32ユニットがIN32ユニットと同じサブコアを共有していないためです。128個のFP32コアは、64個のINT32コアとは別のものです。

なので、合計で、各サブコアは128FP32と64INT32ユニットで構成され、合計192ユニットになります。各SMには、合計512のFP32ユニットと256のINT32ユニット、合計768のユニットがあります。また、合計24個のSMユニット(GPCごとに2個)があるため、12,288個のFP32ユニットと6,144個のINT32ユニット、合計18,432個のコアを検討しています。各SMには、SMごとに64ラップするための2つのラップスケジュール(32スレッド/ CLK)も含まれます。これは、コア(FP32 + INT32)で50%の増加であり、GA102 GPUと比較してラップ/スレッドで33%の増加です。

NVIDIA AD102 ‘Ada Lovelace’ Gaming GPU ‘SM’ Block Diagram (Image Credits: Kopite7kimi)

NVIDIA Ada Lovelace GPU Specs 'Preliminary'

GPU NameAD102GA102TU102GA100GH100
GPC12 (Per GPU)1.7x2x1.5x1.5x
TPC6 (Per GPC)SameSame0.75x0.67x
SM2 (Per TPC)SameSameSameSame
Sub-Core4 (Per SM)SameSameSameSame
FP32128 (Per SM)Same2x2xSame
FP32+INT32192 (Per SM)1.5x1.5x1.5xSame
Warps64 (Per SM)1.33x2xSameSame
Threads2048 (Per SM)1.33x2xSameSame
L1 Cache192 KB (Per SM)1.5x2xSame0.75x
L2 Cache96 MB (Per GPU)16x16x2.4x1.6x
ROPs32 (Per GPC)2x2x2x2x

キャッシュに移ると、これはNVIDIAが既存のAmpere GPUを大幅に強化したもう1つのセグメントです。Ada Lovelace GPUは、SMごとに192 KBのL1キャッシュをパックします。これは、Ampereよりも50%増加します。これは、最上位のAD102GPUに合計4.5MBのL1キャッシュがあります。リークに記載されているように、L2キャッシュは96MBに増加します。これは、わずか6MBのL2キャッシュをホストするAmpere GPUの16倍の増加です。キャッシュはGPU全体で共有されます。

最後に、ROPもGPCあたり32に増加し、Ampereの2倍に増加します。次世代のフラッグシップで最大384ROPを見ているのに対し、最速のAmpere GPUであるRTX 3090Tiではわずか112ROPです。また、最新の第4世代Tensorおよび第3世代RT(レイトレーシング)コアがAda Lovelace GPUに注入され、DLSSおよびレイトレーシングのパフォーマンスを次のレベルに引き上げます。全体として、Ada Lovelace AD102 GPUは以下を提供します。

  • 2x GPC(対Ampere)
  • コアが50%多い(対Ampere)
  • L1キャッシュが50%増加(対Ampere)
  • 16倍以上のL2キャッシュ(対Ampere)
  • ROPを2倍にする(対Ampere)
  • 第4世代Tensorと第3世代RTコア

2〜3 GHzの範囲と言われるクロック速度は方程式に含まれないため、Ampereと比較してコアあたりのパフォーマンスを向上させる上でも主要な役割を果たします。

NVIDIA AD103 ‘Ada Lovelace’ Gaming GPU Block Diagram Mock-Up (Image Credits: SemiAnalysis)

NVIDIA GeForce RTX 40 Series Graphics Card Lineup Rumored

Graphics CardGPUPCB VariantSM Units / CoresMemory / BusMemory Clock / BandwidthTGPPower Connectors
NVIDIA GeForce RTX 4090 TiAD102-350?TBD144 / 18432?48 GB / 384-bit24 Gbps / 1.15 TB/s~900W2x 16-pin
NVIDIA GeForce RTX 4090AD102-300?PG137/139 SKU330>144 / 18432?24 GB / 384-bit21 Gbps / 1.00 TB/s~600W1x 16-pin
NVIDIA GeForce RTX 4080AD103-300?TBD>84 / 10752?16 GB / 256-bit21 Gbps / 672 GB/s~350W1x 16-pin
NVIDIA GeForce RTX 4070AD104-400?PG141-310>60 / 768012 GB / 192-bit18 Gbps / 432 GB/s~300W1x 16-pin

NVIDIA GeForce RTX4090TiとRTX4090グラフィックスカードの仕様

NVIDIA GeForce RTX 4090TiおよびRTX4090は、上記で詳述したトップAD102GPUを搭載した唯一の2つのチップであると予想されます。RTX 3090TiとRTX3090で見たように、どちらも同じチップの異なるSKUを備えています。

NVIDIA GeForce RTX4090Tiに期待される仕様

NVIDIA GeForce RTX 4090Tiは、144個のSMすべてが合計18432個のCUDAコアに対して有効になっているフルファット構成になります。GPUには、96MBのL2キャッシュと合計384のROPが搭載されています。クロック速度はまだ確認されていませんが、TSMC 4Nプロセスが使用されていることを考慮すると、2.0〜3.0GHzの範囲のクロックが予想されます。

メモリ仕様に関しては、GeForce RTX 4090Tiは、384ビットバスインターフェイス全体で24Gbpsの高速で実現する可能性のある24GB GDDR6X容量を搭載されることが期待されています。これにより、最大1.152 TB/sの帯域幅が提供されます。現在、これらのブーストされた仕様はすべて、より高い消費電力をもたらし、フラッグシップは約600WのTBPで動作することになります。600Wの場合、16ピンのGen 5コネクタは1つで十分ですが、AIBは必ずしも仕様の範囲内に収まらず、工場でのわずかなオーバークロックでもTBPをプッシュするため、カスタムバリアントのほとんどは間違いなくデュアルGen5コネクタを使用することになります。 1つのGen5電源コネクタの制限である600Wを超えます。

また、NVIDIA GeForce RTX 4090Tiヒートシンクとクーラーシュラウドも見られました。これは、GPUとメモリダイの両方をカバーし、全体的に大きな構造を提供する、より強力なコールドプレートの使用を示唆しています。リークされたクーラーはFounders Editionのデザインであり、その大きさから判断すると、AIBモデルは非常に大きくなり、すべてのパートナーのクアッドスロットデザインになる可能性もあります。

NVIDIA GeForce RTX4090Tiに期待する仕様

NVIDIA GeForce RTX 4090は、合計16128のCUDAコアに対して126のSMが有効になっているカットダウン構成になります。GPUはL2キャッシュを少し削減する可能性もありますが、GPCの数が少ないため、ROPカウントは確実に少なくなります。クロックに関しては、非Tiモデルの速度はわずかに低下しますが、RTX3090Tiと比較すると十分に高速であると予想されます。

メモリ仕様に関しては、GeForce RTX 4090も24GB GDDR6Xを搭載すると予想されますが、384ビットバスインターフェイス全体で21Gbpsです。これにより、最大1.008 TB/sの帯域幅が提供されます。Tiモデルと比較すると、非Tiには、既存のRTX 3090Tiグラフィックカードと同じ450WのTGPになります。RTX 3090 Tiは、GeForceRTX4090グラフィックスカード用のクーラーとPCBを設計する際のAIBの学習曲線だったようです。

機能セットに関しては、NVIDIA GeForce RTX 4090TiおよびRTX4090グラフィックスカードは、最新の第4世代Tensorコア、第3世代RTコア、最新のNVENCエンコーダー、NVCDECデコーダーなど、すべての最新のNV機能セットと搭載します。また、最新のAPIの場合には、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCサポートなどの最新のRTX機能もすべて搭載されています。

NVIDIA GeForce RTX 4090Ti & RTX 4090 Preliminary Specs

Graphics Card NameNVIDIA GeForce RTX 4090 TiNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 3090 TiNVIDIA GeForce RTX 3090
GPU NameAda Lovelace AD102-350?Ada Lovelace AD102-300?Ampere GA102-350Ampere GA102-300
Process NodeTSMC 4NTSMC 4NSamsung 8nmSamsung 8nm
Die Size~600mm2~600mm2628.4mm2628.4mm2
TransistorsTBDTBD28 Billion28 Billion
CUDA Cores18432161281075210496
TMUs / ROPsTBD / 384TBD / 384336 / 112328 / 112
Tensor / RT CoresTBD / TBDTBD / TBD336 / 84328 / 82
Base ClockTBDTBD1560 MHz1400 MHz
Boost Clock~2800 MHz~2600 MHz1860 MHz1700 MHz
FP32 Compute~103 TFLOPs~90 TFLOPs40 TFLOPs36 TFLOPs
RT TFLOPsTBDTBD74 TFLOPs69 TFLOPs
Tensor-TOPsTBDTBD320 TOPs285 TOPs
Memory Capacity24 GB GDDR6X24 GB GDDR6X24 GB GDDR6X24 GB GDDR6X
Memory Bus384-bit384-bit384-bit384-bit
Memory Speed24.0 Gbps21.0 Gbps21.0 Gbps19.5 Gbps
Bandwidth1152 GB/s1008 GB/s1008 GB/s936 Gbps
TGP600W450W450W350W
Price (MSRP / FE)$1999 US?$1499 US?$1999 US$1499 US
Launch (Availability)July 2022?July 2022?29th March 202224th September 2020

NVIDIA GeForce RTX4090TiおよびRTX4090グラフィックスカードのパフォーマンス

これらのモンスターGPUのパフォーマンスについては、発売が少し先のため、ここでは理論上の数値のみになります。私たちが知っていることに基づいて、RTX4090シリーズカードは100TFLOPの計算馬力制限に達する最初のゲームカードである可能性があります。

  • NVIDIA GeForce RTX 4090Ti:〜103 TFLOP(FP32)(2.8 GHzクロックを想定)
  • NVIDIA GeForce RTX 4090:〜90 TFLOP(FP32)(2.8 GHzクロックを想定)
  • NVIDIA GeForce RTX 3090Ti: 40 TFLOP(FP32)(1.86 GHzブーストクロック)
  • NVIDIA GeForce RTX 3090: 36 TFLOP(FP32)(1.69 GHzブーストクロック)

2.8 GHzの理論上のクロック速度に基づくと、最大103 TFLOPのコンピューティングパフォーマンスが得られ、噂ではさらに高いブーストクロックが示唆されています。さて、これらは間違いなくピーククロックのように聞こえます。これは、平均的な「ゲーム」クロックよりも高いAMDのピーク周波数に似ています。100以上のTFLOPS計算パフォーマンスは、3090Tiフラッグシップの2倍以上の馬力を意味します。ただし、コンピューティングパフォーマンスは必ずしも全体的なゲームパフォーマンスを示すわけではありませんが、それにもかかわらず、ゲーミングPCの大幅なアップグレードであり、現在の最速のコンソールであるXbox SeriesXの8.5倍になります。

これは、各グラフィックカードとその前身の2倍のコンピューティングパフォーマンスの向上になります。これは、それぞれの部門でも大幅な向上が見込まれるRTおよびTensorコアのパフォーマンスを考慮に入れていません。現在、FLOPは必ずしもグラフィックスやゲームのパフォーマンスを反映しているわけではありませんが、比較に使用できるメトリックを提供します。RTX3090とRTX3090Tiの2〜2.5倍のゲインは非常に破壊的であり、NVIDIAがカードの電力制限を高くして非常に困難になっている理由は理にかなっています。

ゲーマーは、4Kゲームがこれらのグラフィックカードで非常にスムーズであることを期待する必要があります。DLSSを使用すると、8K解像度で再生可能な60 FPSが表示される場合があります。これは、NVIDIAがRTX3090シリーズBFGPUでしばらくの間、達成しようとしてきたことです。

NVIDIA GeForce RTX4090TIとRTX4090グラフィックスカードの価格と入手可能性

NVIDIA GeForce RTX 3090TiとRTX3090グラフィックスカードは、間違いなくこれまでで最も高価なシングルチップGPUです。それぞれUSD$1999とUSD$1499から、価格設定は超愛好家とプロセグメントに対応しています。繰り返しになりますが、非常に高い価格が考えられますが、あちこちで少し値上がりすることも予想されます。グリーンチームにとっては、現在の価格を維持するのが賢明であり、ばかげているかもしれませんが、パフォーマンスがあれば多額の現金を喜んで支払う人々がいます。

RTX 4090TiとRTX4090の違いは、今回もはるかに大きくなっています。NVIDIAはRTX3090Tiから期待したほど多くの肯定的な反応を得られなかったようで、GPUセグメントからカードを完全に削除する代わりに、非Tiの仕様を削減することを決定できた可能性がありますもっと。スペックのダウングレードにより、RTX 4090とRTX 4090TiのパフォーマンスにRTX 3090とRTX 3090Tiのパフォーマンスの差が大きくなるため、代わりに15〜20%のパフォーマンス向上のためにハイエンドのバリアントを入手する価値があるかもしれません。

NVIDIA GeForce RTX 40シリーズグラフィックスカードは7月中旬に発売されると噂されており、RTX 4090Tiのより排熱性能の高いヒートシンクがリークされているのを見てきましたが、NVIDIAはRTX 4090Tiより先に非Tiをリリースする可能性があります。それもかなりの期間を空けて市場に出ます。しかし、NVIDIAが次世代の最初の段階でハイエンドSKUをリリースするのはこれが初めてではありません。RTX  2080Tiのフラッグシップは、その前身であるGTX 1080Tiが最初のラインナップの発売から数か月後に登場したにもかかわらず、残りのラインナップとともに発売されました。RTX 3090はRTX 30シリーズカードの最初のラインで発売されましたが、3090Tiは1年以上遅れて発売されました。今回、NVIDIAは最初からファミリ全体をラウンチし、後でサイクルの途中で更新することができますが、それはまだわかりません。

NVIDIA GeForce GPU Segment / Tier Prices

Graphics Segment2014-20162016-20172017-20182018-20192019-20202020-2021
Titan TierTitan X (Maxwell)Titan X (Pascal)Titan Xp (Pascal)Titan V (Volta)Titan RTX (Turing)GeForce RTX 3090
Price$999 US$1199 US$1199 US$2999 US$2499 US$1499 US
Ultra Enthusiast TierGeForce GTX 980 TiGeForce GTX 980 TiGeForce GTX 1080 TiGeForce RTX 2080 TiGeForce RTX 2080 TiGeForce RTX 3080 Ti
Price$649 US$649 US$699 US$999 US$999 US$1199 US
Enthusiast TierGeForce GTX 980GeForce GTX 1080GeForce GTX 1080GeForce RTX 2080GeForce RTX 2080 SUPERGeForce RTX 3080
Price$549 US$549 US$549 US$699 US$699 US$699 US
High-End TierGeForce GTX 970GeForce GTX 1070GeForce GTX 1070GeForce RTX 2070GeForce RTX 2070 SUPERGeForce RTX 3070 Ti
GeForce RTX 3070
Price$329 US$379 US$379 US$499 US$499 US599
499
Mainstream TierGeForce GTX 960GeForce GTX 1060GeForce GTX 1060GeForce GTX 1060GeForce RTX 2060 SUPER
GeForce RTX 2060
GeForce GTX 1660 Ti
GeForce GTX 1660 SUPER
GeForce GTX 1660
GeForce RTX 3060 Ti
GeForce RTX 3060 12 GB
Price$199 US$249 US$249 US$249 US$399 US
$349 US
$279 US
$229 US
$219 US
$399 US
$329 US
Entry TierGTX 750 TiGTX 950GTX 1050 TiGTX 1050 TiGTX 1650 SUPERTBA
GTX 750GTX 1050GTX 1050GTX 1650
Price$149 US$149 US$139 US$139 US$159 USTBA
$119 US$109 US$109 US$149 US

今のところ、噂では7月中旬の発売が指摘されているので、それがどれほどうまくいくかを確認するには、あと2か月待つ必要があります。

(Source:wccftech)

関連記事

  1. ASUSとASRockのAMD Radeon RX 7600 8 GB…

  2. AMD Radeon RX 5500 XT 1408コアのNavi 1…

  3. NVIDIA A100 80GB PCIeアクセラレーターの発売!!F…

  4. NVIDIA RTX 50 シリーズ Blackwell GPUは、N…

  5. NVIDIA GeForce RTX 3060ハッシュレートリミッター…

  6. Futuremarkが3DMarkDirectXレイトレーシングベンチ…

  7. NVIDIAがGeForceRTX 3080 12GBグラフィックスカ…

  8. NVIDIA RTX TITANを近日発表?!

  9. NVIDIA GeForce RTX3060が新しいGA106-302…

  10. AMD Navi 24 RDNA2が最初の6nmGPUになり、エントリ…

  11. AIDA64にNVIDIA Ampere GA102F GPUサポート…

  12. AMD Radeon RX 6950 XT、RX 6750 XT、RX…

コメント

  • コメント (0)

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。

PAGE TOP