NVIDIA GeForce RTX 4070は、Ada Lovelace GPUに基づく最新のグラフィックスアーキテクチャを提供する次世代のハイエンドゲーミンググラフィックスカードになります。グラフィックカードは、USD$500~600で非常に人気のあるゲーミンググラフィックカードであるRTX3070に代わるものです。
NVIDIA GeForce RTX4070グラフィックスカードは、愛好家のゲーマー向けに設計
最高のゲームパフォーマンスを提供するハイエンドのGeForce RTX 4090およびGeForce RTX 4080シリーズグラフィックスカードに対する熱意を否定することはしませんが、RTX 4070シリーズグラフィックスカードは、高額なUSD$500を中心に設計されます。シンプルに、RTX 4090シリーズは、支出額を気にせずに最高のものを求めているユーザーを対象としていますが、RTX 4080シリーズは、可能な限り最高の価格で最高のゲームパフォーマンスを求めているユーザーを対象としています。RTX 4070は、ハイエンドゲームのスイートスポットとなり、バタフライでスムーズな2Kゲーム体験を提供します。
以前のGeForce RTX 3070は、RTX 2070に比べて大幅な改善を提供すると宣伝され、RTX 2080Tiよりも高速なパフォーマンスを提供すると言われていましたが、最終的には、RTX 3070Ti以上が以前のパフォーマンスを上回りました。RTX 4070は、RTX 3080 Tiと同等またはそれに近いグラフィックスパフォーマンスを提供する可能性がある同様の位置に配置されるようです。
次世代のゲームソリューションでも同様のことを期待する必要がありますが、考慮すべき重要な要素は、GPUがより電力を消費し、より高価になっていることです。これは、より良い製品が得られるにつれて将来も続く可能性がある傾向ですが、その見返りとして、最終消費者に支払うコストは常にあります。まず、次世代のGeForceRTX40シリーズカードに電力を供給する新しいAda LovelaceまたはAD10*クラスのGPUを確認する必要があります。
NVIDIA AD104 Ada Lovelace GPUの消費電力について
GPU構成から始めて、NVIDIA GeForceRTX4070シリーズグラフィックスカードはAD 104 GPUコアを利用すると言われています。GPUは約300mm2を測定すると言われており、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードの最適化バージョンであるTSMC 4Nプロセスノードを利用します。
NVIDIA Ada Lovelace AD104 GPUは、最大5つのGPC(グラフィックスプロセッシングクラスター)を搭載することが期待されています。これは、GA104 GPUよりも1つ少ないGPCです。各GPUは、既存のチップと同じ構成である6つのTPCと2つのSMで構成されます。各SM(ストリーミングマルチプロセッサ)は、GA102 GPUと同じ4つのサブコアを収容します。変更されたのは、FP32とINT32のコア構成です。各サブコアには128個のFP32ユニットが含まれますが、FP32 + INT32ユニットの合計は192個になります。これは、FP32ユニットがIN32ユニットと同じサブコアを共有していないためです。128個のFP32コアは、64個のINT32コアとは別のものです。
したがって、合計で、各サブコアは32個のFP32と16個のINT32ユニットで構成され、合計で48ユニットになります。各SMには、合計128個のFP32ユニットと64個のINT32ユニット、合計192個のユニットがあります。また、合計60個のSMユニット(GPCあたり12個)があるため、7,680個のFP32ユニットと3,840個のINT32ユニット、合計11,520個のコアを検討しています。各SMには、SMごとに64ラップするための2つのラップスケジュール(32スレッド/ CLK)も含まれます。これは、コア(FP32 + INT32)で50%の増加であり、GA102 GPUと比較してラップ/スレッドで33%の増加です。
キャッシュに移ると、これはNVIDIAが既存のAmpere GPUを大幅に強化したもう1つのセグメントです。Ada Lovelace GPUは、SMごとに192 KBのL1キャッシュをパックします。これは、Ampereよりも50%増加します。これは、最上位のAD104 GPUに合計2MBのL1キャッシュがあります。リークに記載されているように、L2キャッシュは48MBに増加します。これは、わずか4MBのL2キャッシュをホストするAmpere GA104 GPUの12倍の増加です。キャッシュはGPU全体で共有されます。
最後に、ROPもGPCあたり32に増加し、Ampereの2倍に増加します。GA104 Ampere GPUではわずか96であるのに対し、最大160のROPを見ています。また、最新の第4世代Tensorおよび第3世代RT(レイトレーシング)コアがAda Lovelace GPUに注入され、DLSSおよびレイトレーシングのパフォーマンスを次のレベルに引き上げるのに役立ちます。全体として、Ada Lovelace AD103GPUは以下を提供します。
- 5 GPCs vs 6 GPCs on GA104
- +25% Cores vs GA104 GPU
- 50% More L1 Cache (Versus Ampere GA104)
- Twice More L2 Cache (Versus Ampere GA104)
- +66% ROPs (Versus Ampere GA104)
- 4th Gen Tensor & 3rd Gen RT Cores
2〜3 GHzの範囲と言われるクロック速度は方程式に含まれないため、Ampereと比較してコアあたりのパフォーマンスを向上させる上でも主要な役割を果たします。
NVIDIA GeForce RTX 4070 Series Preliminary Specs
Graphics Card Name | NVIDIA GeForce RTX 4070 Ti | NVIDIA GeForce RTX 4070 | NVIDIA GeForce RTX 3070 Ti | NVIDIA GeForce RTX 3070 |
---|---|---|---|---|
GPU Name | AD104-400? | AD104-300? | Ampere GA104-400 | Ampere GA104-300 |
Process Node | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
Die Size | ~300mm2 | ~300mm2 | 395.2mm2 | 395.2mm2 |
Transistors | TBD | TBD | 17.4 Billion | 17.4 Billion |
CUDA Cores | ~7680 | ~7040 | 6144 | 5888 |
TMUs / ROPs | TBD / 160 | TBD / 144 | 192/ 96 | 184 / 96 |
Tensor / RT Cores | TBD / TBD | TBD / TBD | 192/ 48 | 184 / 46 |
Base Clock | TBD | TBD | 1575 MHz | 1500 MHz |
Boost Clock | TBD | TBD | 1770 MHz | 1730 MHz |
FP32 Compute | ~38 TFLOPs | ~36 TFLOPs | 22 TFLOPs | 20 TFLOPs |
RT TFLOPs | TBD | TBD | 42 TFLOPs | 40 TFLOPs |
Tensor-TOPs | TBD | TBD | 174 TOPs | 163 TOPs |
Memory Capacity | 12 GB GDDR6X? | 12 GB GDDR6 | 8 GB GDDR6X | 8 GB GDDR6 |
Memory Bus | 192-bit | 192-bit | 256-bit | 256-bit |
Memory Speed | 21 Gbps | 18 Gbps | 19 Gbps | 14 Gbps |
Bandwidth | 504 GB/s | 432 GB/s | 608 Gbps | 448 Gbps |
TGP | ~330W | ~300W | 290W | 220W |
Price (MSRP / FE) | $599 US? | $499 US? | $599 US | $499 US |
Launch (Availability) | 2022 | 2022 | 10th June 2021 | 29th October 2020 |
NVIDIA GeForce RTX4070グラフィックカードの仕様
GA104 GPUで見たように、NVIDIAはGeForce RTX4070シリーズのラインナップのためにAD104 GPUのさまざまな構成を持つことができます。現実的には、RTX4070とRTX 4070Tiの2つのバリエーションがあると予想されます。前者は最初のラインナップの一部となり、後者はサイクル半ばのリフレッシュとして発売されます。最もエントリーレベルのGeForce RTX30は、フルチップと比較してコアが23%少なくなっていますが、今回は、「80クラス」のグラフィックカードは、フラッグシップが使用するAD102 GPUに依存するのではなく、独自のチップを搭載する予定です。そのため、6144から完全な7680コア構成までのどこでも期待できます。
NVIDIA GeForce RTX 4070の期待される仕様
NVIDIA GeForce RTX 4070は、RTX 3070 Ti(6144コア)よりもコア数がわずかに多いカットダウン構成になり、将来的にはフルファット構成で「Ti」製品の余地ができます。GPUには、48MBのL2キャッシュと最大160のROPが搭載されています。
クロック速度はまだ確認されていませんが、TSMC 4Nプロセスが使用されていることを考慮すると、2.0〜3.0GHzの範囲のクロックが予想されます。通常よりも高いクロック速度の上昇は、Samsung 8nmノードを備えたAmpere GPUが実際にはいくつかの最適化を備えた10nmプロセスノードであったことを考慮して、NVIDIAが2ノードジャンプを行っているという事実に起因します。NVIDIAは7nmをスキップし、5nmノードを直進し、バニラ製品ではなく、その最適化バージョンを採用しています。TSMC 16nmノードでPascalを使用すると、NVIDIAは大幅な周波数の飛躍を実現し、今回も同様の飛躍が期待できます。
メモリ仕様に関しては、GeForce RTX 4070は、192ビットバスインターフェイス全体で18Gbpsの高速で実現する可能性のある12GB GDDR6容量を搭載すると予想されています。これにより、最大432 GB/sの帯域幅が提供されます。現在、これらのブーストされた仕様はすべて、より高い消費電力をもたらし、フラッグシップは約300WのTBPで動作することが期待されています。300Wの場合、リファレンスモデルとカスタムモデルの両方で、1つの16ピンGen5コネクタで十分です。
機能セットに関しては、NVIDIA GeForce RTX 4070グラフィックスカードは、最新の第4世代Tensorコア、第3世代RTコア、最新のNVENCエンコーダー、NVCDECデコーダーなど、最新のNV機能セットAPIすべてを搭載します。DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCサポートなどの最新のRTX機能もすべて搭載されています。
NVIDIA GeForce RTX 4080 Series Preliminary Specs
Graphics Card Name | NVIDIA GeForce RTX 4080 Ti | NVIDIA GeForce RTX 4080 | NVIDIA GeForce RTX 3090 Ti | NVIDIA GeForce RTX 3080 |
---|---|---|---|---|
GPU Name | Ada Lovelace AD103-350? | Ada Lovelace AD103-300? | Ampere GA102-225 | Ampere GA102-200 |
Process Node | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
Die Size | ~450mm2 | ~450mm2 | 628.4mm2 | 628.4mm2 |
Transistors | TBD | TBD | 28 Billion | 28 Billion |
CUDA Cores | 10752? | 9216? | 10240 | 8704 |
TMUs / ROPs | TBD / 224? | TBD / 214? | 320 / 112 | 272 / 96 |
Tensor / RT Cores | TBD / TBD | TBD / TBD | 320 / 80 | 272 / 68 |
Base Clock | TBD | TBD | 1365 MHz | 1440 MHz |
Boost Clock | ~2600 MHz | ~2500 MHz | 1665 MHz | 1710 MHz |
FP32 Compute | ~55TFLOPs | ~50 TFLOPs | 34 TFLOPs | 30 TFLOPs |
RT TFLOPs | TBD | TBD | 67 TFLOPs | 58 TFLOPs |
Tensor-TOPs | TBD | TBD | 273 TOPs | 238 TOPs |
Memory Capacity | 16 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X |
Memory Bus | 256-bit | 256-bit | 384-bit | 320-bit |
Memory Speed | 24.0 Gbps? | 21.0 Gbps? | 19 Gbps | 19 Gbps |
Bandwidth | 768 GB/s | 672 2GB/s | 912 Gbps | 760 Gbps |
TGP | 400W | 350W | 350W | 320W |
Price (MSRP / FE) | $1199 US? | $699 US? | 1199 | $699 US |
Launch (Availability) | 2022? | July 2022? | 3rd June 2021 | 17th September 2020 |
NVIDIA GeForce RTX4070グラフィックスカードのパフォーマンス
ゲーミングGPUのパフォーマンスについては、発売が少し先のため、ここでは理論上の数値のみを使用できますが、RTX40シリーズカードは100TFLOPの計算馬力制限に達する最初のゲーミングカードである可能性があります。
比較情報として:
- NVIDIA GeForce RTX 4090 Ti:〜103 TFLOP(FP32)(2.8 GHzクロックを想定)
- NVIDIA GeForce RTX 4090:〜90 TFLOP(FP32)(2.8 GHzクロックを想定)
- NVIDIA GeForce RTX 4080:〜50 TFLOP(FP32)(2.5 GHzクロックを想定)
- NVIDIA GeForce RTX 3090 Ti: 40 TFLOP(FP32)(1.86 GHzブーストクロック)
- NVIDIA GeForce RTX 4070 Ti:〜38 TFLOPs(FP32)(2.5 GHzクロックを想定)
- NVIDIA GeForce RTX 4070:〜36 TFLOP(FP32)(2.5 GHzクロックを想定)
- NVIDIA GeForce RTX 3090: 36 TFLOP(FP32)(1.69 GHzブーストクロック)
- NVIDIA GeForce RTX 3080: 30 TFLOP(FP32)(1.71 GHzブーストクロック)
- NVIDIA GeForce RTX 3070 Ti: 22 TFLOP(FP32)(1.77 GHzブーストクロック)
- NVIDIA GeForce RTX 3070: 20 TFLOP(FP32)(1.72 GHzブーストクロック)
2.5 GHzの理論上のクロック速度に基づくと、最大36 TFLOPのコンピューティングパフォーマンスが得られ、噂ではさらに高いブーストクロックが示唆されています。
これらは間違いなくピーククロックのように聞こえます。これは、平均的な「ゲーム」クロックよりも高いAMDのピーク周波数に似ています。36以上のTFLOP計算パフォーマンスは、「80クラスのフラッグシップ」よりも「70クラス」のGPUでのパフォーマンスが高いことを意味します。ただし、コンピューティングパフォーマンスが必ずしも全体的なゲームパフォーマンスを示すわけではないことに注意してください。
これは、GeForce RTX 4070グラフィックスカードのコンピューティングパフォーマンスが前モデルと比較して約80%向上します。これは、それぞれの部門でも大幅な向上が見込まれるRTおよびTensorコアパフォーマンスを考慮に入れていません。現在、FLOPは必ずしもグラフィックスやゲームのパフォーマンスを反映しているわけではありませんが、比較に使用できるメトリックを提供します。
ゲーマーは、これらのグラフィックカードで2Kゲームが非常にスムーズになることを期待する必要があります。また、DLSSを使用すると、DLSSを有効にした4K解像度で60FPSを再生できる場合もあります。しかし現実的には、1440pのゲームタイトルがこのグラフィックカードのスイートスポットになります。
NVIDIA GeForce RTX 4070グラフィックスカードの価格と入手可能性
NVIDIA GeForce RTX 3070はUSD$499で発売されましたが、その更新により価格がめちゃくちゃになりました。RTX 3070TiはUSD$599で発売されました。これは、標準モデルよりもUSD$100高いプレミアムですが、追加の価格に見合うだけの十分なパフォーマンスの向上はありません。
NVIDIAは、実際にはUSD$500でより多くのゲーマーを確保する必要がありますが、価格に見合う製品を提供する必要があります。RTX2070とRTX3070は少し圧倒的で、前世代のフラッグシップとのギャップを埋めることができましたが、それでも前のフラッグシップのTitanよりもかなり進んだGTX1070の栄光を取り戻すことはできませんでした。Ada Lovelaceアーキテクチャから期待されるパフォーマンスの飛躍により、RTX 4070は、USD$500の価格帯で1つの優れたグラフィックスカードオプションになる可能性があります。また、NVIDIAが単に更新を無視して、USD$500でフルファットなGA104構成を提供できる場合、それは非常識な価値であり、今後しばらくの間、このクラスで最高のグラフィックカードの1つになります。
NVIDIA GeForce RTX 40シリーズグラフィックスカードは7月中旬に発表されると噂されており、2022年第3四半期に発売が予定されているため、NVIDIAが今後数か月で何をするかを確実に知ることができます。
NVIDIA GeForce GPU Segment / Tier Prices
Graphics Segment | 2014-2016 | 2016-2017 | 2017-2018 | 2018-2019 | 2019-2020 | 2020-2021 |
---|---|---|---|---|---|---|
Titan Tier | Titan X (Maxwell) | Titan X (Pascal) | Titan Xp (Pascal) | Titan V (Volta) | Titan RTX (Turing) | GeForce RTX 3090 |
Price | $999 US | $1199 US | $1199 US | $2999 US | $2499 US | $1499 US |
Ultra Enthusiast Tier | GeForce GTX 980 Ti | GeForce GTX 980 Ti | GeForce GTX 1080 Ti | GeForce RTX 2080 Ti | GeForce RTX 2080 Ti | GeForce RTX 3080 Ti |
Price | $649 US | $649 US | $699 US | $999 US | $999 US | $1199 US |
Enthusiast Tier | GeForce GTX 980 | GeForce GTX 1080 | GeForce GTX 1080 | GeForce RTX 2080 | GeForce RTX 2080 SUPER | GeForce RTX 3080 |
Price | $549 US | $549 US | $549 US | $699 US | $699 US | $699 US |
High-End Tier | GeForce GTX 970 | GeForce GTX 1070 | GeForce GTX 1070 | GeForce RTX 2070 | GeForce RTX 2070 SUPER | GeForce RTX 3070 Ti GeForce RTX 3070 |
Price | $329 US | $379 US | $379 US | $499 US | $499 US | 599 499 |
Mainstream Tier | GeForce GTX 960 | GeForce GTX 1060 | GeForce GTX 1060 | GeForce GTX 1060 | GeForce RTX 2060 SUPER GeForce RTX 2060 GeForce GTX 1660 Ti GeForce GTX 1660 SUPER GeForce GTX 1660 | GeForce RTX 3060 Ti GeForce RTX 3060 12 GB |
Price | $199 US | $249 US | $249 US | $249 US | $399 US $349 US $279 US $229 US $219 US | $399 US $329 US |
Entry Tier | GTX 750 Ti | GTX 950 | GTX 1050 Ti | GTX 1050 Ti | GTX 1650 SUPER | TBA |
GTX 750 | GTX 1050 | GTX 1050 | GTX 1650 | |||
Price | $149 US | $149 US | $139 US | $139 US | $159 US | TBA |
$119 US | $109 US | $109 US | $149 US |
(Source:wccftech)
この記事へのコメントはありません。