この特定のGPUは、OpenCLとCUDA Computeの両方のベンチマークでテストされました。OpenCLベンチマークでは、チップは184096ポイントを獲得しましたが、CUDAベンチマークでは169368ポイントを獲得しました。124パーツと118パーツの両方のSMパーツはCUDA 8.0上で実行されていましたが、Geekbench 5ベンチマークに対してこれらのGPUがまだ完全に最適化されていないことがわかります。コア数にわずか5%の違いがあるにもかかわらず、両方の部分のスコアに大きな違いがあります。

NVIDIAの次世代GPU#3仕様とパフォーマンス

最後に、108 SMまたは6912 CUDAコアバリアントがあり、報告されているクロック速度は1.01 GHzであるか、3つのGPUの中で最も低速です。GPUにより、Tesla V100よりもCUDAコア数が35%増加し、46.8 GBのHBM2eメモリを搭載しているようです。これは、Geekbenchベンチマークが合計メモリをどのように認識するかに関するエラーである可能性があり、実際には48 GBである可能性があり、これはより理にかなっています。このGPU はGeekbench 5(CUDA)ベンチマークで141654ポイントを獲得しますが、これもまたクロック速度が遅いために最終スコアではありません。

NVIDIA Tesla Graphics Cards Comparison

Tesla Graphics Card NameNVIDIA Tesla M2090NVIDIA Tesla K40NVIDIA Telsa K80NVIDIA Tesla P100NVIDIA Tesla V100NVIDIA Tesla Next-Gen #1NVIDIA Tesla Next-Gen #2NVIDIA Tesla Next-Gen #3
GPU ArchitectureFermiKeplerMaxwellPascalVoltaAmpere?Ampere?Ampere?
GPU Process40nm28nm28nm16nm12nm7nm?7nm?7nm?
GPU NameGF110GK110GK210 x 2GP100GV100GA100?GA100?GA100?
Die Size520mm2561mm2561mm2610mm2815mm2TBDTBDTBD
Transistor Count3.00 Billion7.08 Billion7.08 Billion15 Billion21.1 BillionTBDTBDTBD
CUDA Cores512 CCs (16 CUs)2880 CCs (15 CUs)2496 CCs (13 CUs) x 23840 CCs5120 CCs6912 CCs7552 CCs7936 CCs
Core ClockUp To 650 MHzUp To 875 MHzUp To 875 MHzUp To 1480 MHzUp To 1455 MHz1.08 GHz (Preliminary)1.11 GHz (Preliminary)1.11 GHz (Preliminary)
FP32 Compute1.33 TFLOPs4.29 TFLOPs8.74 TFLOPs10.6 TFLOPs15.0 TFLOPs~15 TFLOPs (Preliminary)~17 TFLOPs (Preliminary)~18 TFLOPs (Preliminary)
FP64 Compute0.66 TFLOPs1.43 TFLOPs2.91 TFLOPs5.30 TFLOPs7.50 TFLOPsTBDTBDTBD
VRAM Size6 GB12 GB12 GB x 216 GB16 GB48 GB24 GB32 GB
VRAM TypeGDDR5GDDR5GDDR5HBM2HBM2HBM2eHBM2eHBM2e
VRAM Bus384-bit384-bit384-bit x 24096-bit4096-bit4096-bit?3072-bit?4096-bit?
VRAM Speed3.7 GHz6 GHz5 GHz737 MHz878 MHz1200 MHz1200 MHz1200 MHz
Memory Bandwidth177.6 GB/s288 GB/s240 GB/s720 GB/s900 GB/s1.2 TB/s?1.2 TB/s?1.2 TB/s?
Maximum TDP250W300W235W300W300WTBDTBDTBD

しかし興味深いのは、ローエンドGPUがより多くのメモリ容量を備えていることです。これは、NVIDIAが特定のワークロードに対してより高いメモリ容量を備えたローエンドGPUを備えているか、各GPUが異なるメモリ構成を持ち、48GB HBM2eがこの特定のGPU SKUの最高のメモリ構成。この仕様リークからわかるもう1つの最も興味深い点は、次世代のTeslaラインナップにはさまざまなGPU SKUがありますが、完全なGPUは、128 SMにパックされた8192 CUDAコアで間違いなくピークになるはずです。Volta GV100 GPUと同様に、5376 CCまたは84 SMを含むフルチップにもかかわらず、Tesla V100は5120 CUDAコア(80 SM)でピークに達したため、完全なファット(次世代)GPUは決して公開されません。では  、前のインタビューで、  NVIDIAのCEO、Jensen黄は、小さな部分は生産のためにサムスンに送信されますしながら、彼らの次の世代の7nmでのGPUの受注の大半はTSMCによって処理されることを確認していました。最後に、Jensenは次世代7nm GPUの発売時期について尋ねられましたが、彼は現時点で日付を開示するのに都合のよい時間ではないと答えました。 NVIDIAのCFOであるColette Kressとの最近のインタビューから、  7nm GPUの発表でみんなを驚かせたいと思っていることがわかっていますが、そうするための適切なタイミングを待っています。一方、AMDは、Arcturus GPUをベースとするRadeon Instinct Mi100 HPCアクセラレーターの発表も予定されています。ArcturusGPUも8192 SPを搭載しており、最新の7nm GPUアーキテクチャに基づいています。ただし、NVIDIAが過去に証明したように、より高度なノード(16nm対12nmおよび12nm対7nm)に基づく競合他社のGPUに対して超効率的かつ競争力のあるポイントまでアーキテクチャを最適化できることを証明しています。NVIDIAは、次世代GPUとまったく新しいアーキテクチャを備えたAMDと同等のプロセスであるため、実際の破壊的なパフォーマンスが確認できます。これらは間違いなくNVIDIAの次世代GPUの大きな仕様であり、3月22日に開催されるGTC 2020オンラインキーノートで、NVIDIAによる本格的な発表が期待できます。

関連記事

  1. NVIDIA GeForce RTX 3080Tiグラフィックスカード…

  2. パソコン工房 NVIDIA GeForce GTX1660 SUPER…

  3. NVIDIA GeForce RTX 3080 Tiは5月26日に発売…

  4. NVIDIA は、GeForce RTX 4070 GPU で 12V…

  5. AMD Radeon RX 6950 XT、RX 6750 XT、RX…

  6. NVIDIA GeForce RTX 3090 Tiフラッグシップグラ…

  7. 最初のIntel Arc A350M GPUベンチマークは、韓国のTe…

  8. AMD Radeon RX 6700 XTが2つのバリエーションで発売…

  9. NVIDIA Jen-Hsun Huang氏の発言

  10. NVIDIA GeForce RTX3050は、2304CUDAコアを…

  11. ドスパラ、Coffee Lake世代の6コアCPUを載せたゲーミングP…

  12. NVIDIA GeForce RTX 4090 グラフィックス カード…

AMAZON広告

最近の記事

  1. CPU

  2. 新製品情報

  3. CPU

  4. CPU

  5. その他

PAGE TOP