パソコンに関する情報をお伝え

menu

BTOパソコン-Fan

NVIDIAの次世代GPUのパフォーマンスと仕様、最大8Kコアと48 GB HBM2eメモリを備えた究極のHPCパワーハウスのリーク

(Source:wccftech)

NVIDIAの次世代GPUはまもなく公開される予定です。残念な事に月末のGTCはオンラインのみのイベントに変更となりました。このためこれまでで最大のGPUを発表する事に対して悲観する必要はありません。数日前に2つの未リリースGPUの仕様がリークされていましたが、さらにTwitterで新しいSKUが発見されました。

NVIDIAの次世代GPUのパフォーマンスと仕様、最大8Kコアと48 GB HBM2eメモリを備えた究極のHPCパワーハウスのリーク

Ampereとコードネームが付けられたとされるNVIDIA次世代GPUアーキテクチャは、しばらくの間知られています。HPCおよびクラウドデータセンターのトップ組織で使用される予定の同社の最新Tesla GPUをさらに強化します。情報技術担当バイスプレジデントおよびインディアナ大学の最高情報責任者によると、今年の夏にビッグレッドスーパーコンピューターを導入すると、NVIDIAの次世代GPUが既存のVoltaベースのGPUに比べて75%のパフォーマンスを大幅に向上させることが明らかになりました。過去に聞いたこともありますが、GPUが最大50%のパフォーマンス向上と2倍の効率性を提供するという報告です。そこで、Geekbenchで発見された最新のGPUの仕様について説明します。また、以前にリークされたパーツと比較して、すべてのバリアントから期待されるパフォーマンスの向上を確認します。これらのGPUは2019年10月と11月にずっとテストされたため、数か月間Geekbenchデータベースに隠れていましたが、これらはまだ初期のサンプルであるため、仕様に大きな変化が見られたことに注意してください。ここで注意すべきもう1つの点は、クロック速度が遅いことです。これは、前述したように初期の設計を示しています。

NVIDIAの次世代GPU#1の仕様とパフォーマンス

最初に話したGPUは、最近発見されたGPUです。NVIDIAのプロフェッショナルGPUアーキテクチャには、ストリーミングマルチプロセッサごとに64 CUDAコア設計が付属しているため、このGPUは7936 CUDAコアに等しい124の合計SMカウントを備えています。これは、Tesla V100の5120コアを超えるCUDAコアの55%の増加です。GPUの最大クロック速度は1.1 GHzであり、この最終化されていないクロックで、約17.5〜18 TFLOPのFP32馬力を供給します。1200 MHzで32 GBのHBM2eメモリクロッキングを搭載し、4096ビットのバスインターフェイスで動作します。私がHBM2eに言及する理由は、それが最新の標準であり、NVIDIAが発売時にHPCパーツで最も高度なメモリ標準を利用していることが知られているためです。

コアおよびメモリの仕様に加えて、GPUは32 MBのL2キャッシュをパックします。これは、わずか6 MBのL2キャッシュをパックするVolta GV100 GPUの5.33倍の増加です。膨大な量のキャッシュを考えると、長年の開発が続いているNVIDIAの次世代GPUでのパフォーマンスの大幅な向上とアーキテクチャの大幅な変更が期待できます。パフォーマンスに関しては、Geekbench 5のOpenCLベンチマーク(CUDA)でGPUが222377ポイントを獲得しています。プラットフォームはCUDA 8.0を実行しており、テスト時にGPUが完全に最適化されていなかった可能性が高いです。そうは言っても、このカードの仕様は文字通り非常識に見えるので、他の2つのバリエーションに取り掛かりましょう。

NVIDIAの次世代GPU#2仕様とパフォーマンス

2番目のGPUには、合計118個のSMまたは7552 CUDAコアが搭載されています。これは、80個のSMと合計24 MBのL2キャッシュに5120個のCUDAコアが詰め込まれたTesla V100よりもCUDAコアが47.5%増加したことです。また、このGPUは1.10 GHzの最大速度でクロックされ、1200 MHzのクロック速度で3072ビットのバスに沿って実行される24 GBのHBM2eメモリを備えています。これらの速度では、このチップは合計で約16.7 TFLOPの理論上の計算馬力を提供するはずですが、再び、クロック速度は間違いなく最終的に見えず、それより高くなる可能性があります。

この特定のGPUは、OpenCLとCUDA Computeの両方のベンチマークでテストされました。OpenCLベンチマークでは、チップは184096ポイントを獲得しましたが、CUDAベンチマークでは169368ポイントを獲得しました。124パーツと118パーツの両方のSMパーツはCUDA 8.0上で実行されていましたが、Geekbench 5ベンチマークに対してこれらのGPUがまだ完全に最適化されていないことがわかります。コア数にわずか5%の違いがあるにもかかわらず、両方の部分のスコアに大きな違いがあります。

NVIDIAの次世代GPU#3仕様とパフォーマンス

最後に、108 SMまたは6912 CUDAコアバリアントがあり、報告されているクロック速度は1.01 GHzであるか、3つのGPUの中で最も低速です。GPUにより、Tesla V100よりもCUDAコア数が35%増加し、46.8 GBのHBM2eメモリを搭載しているようです。これは、Geekbenchベンチマークが合計メモリをどのように認識するかに関するエラーである可能性があり、実際には48 GBである可能性があり、これはより理にかなっています。このGPU はGeekbench 5(CUDA)ベンチマークで141654ポイントを獲得しますが、これもまたクロック速度が遅いために最終スコアではありません。

NVIDIA Tesla Graphics Cards Comparison

Tesla Graphics Card NameNVIDIA Tesla M2090NVIDIA Tesla K40NVIDIA Telsa K80NVIDIA Tesla P100NVIDIA Tesla V100NVIDIA Tesla Next-Gen #1NVIDIA Tesla Next-Gen #2NVIDIA Tesla Next-Gen #3
GPU ArchitectureFermiKeplerMaxwellPascalVoltaAmpere?Ampere?Ampere?
GPU Process40nm28nm28nm16nm12nm7nm?7nm?7nm?
GPU NameGF110GK110GK210 x 2GP100GV100GA100?GA100?GA100?
Die Size520mm2561mm2561mm2610mm2815mm2TBDTBDTBD
Transistor Count3.00 Billion7.08 Billion7.08 Billion15 Billion21.1 BillionTBDTBDTBD
CUDA Cores512 CCs (16 CUs)2880 CCs (15 CUs)2496 CCs (13 CUs) x 23840 CCs5120 CCs6912 CCs7552 CCs7936 CCs
Core ClockUp To 650 MHzUp To 875 MHzUp To 875 MHzUp To 1480 MHzUp To 1455 MHz1.08 GHz (Preliminary)1.11 GHz (Preliminary)1.11 GHz (Preliminary)
FP32 Compute1.33 TFLOPs4.29 TFLOPs8.74 TFLOPs10.6 TFLOPs15.0 TFLOPs~15 TFLOPs (Preliminary)~17 TFLOPs (Preliminary)~18 TFLOPs (Preliminary)
FP64 Compute0.66 TFLOPs1.43 TFLOPs2.91 TFLOPs5.30 TFLOPs7.50 TFLOPsTBDTBDTBD
VRAM Size6 GB12 GB12 GB x 216 GB16 GB48 GB24 GB32 GB
VRAM TypeGDDR5GDDR5GDDR5HBM2HBM2HBM2eHBM2eHBM2e
VRAM Bus384-bit384-bit384-bit x 24096-bit4096-bit4096-bit?3072-bit?4096-bit?
VRAM Speed3.7 GHz6 GHz5 GHz737 MHz878 MHz1200 MHz1200 MHz1200 MHz
Memory Bandwidth177.6 GB/s288 GB/s240 GB/s720 GB/s900 GB/s1.2 TB/s?1.2 TB/s?1.2 TB/s?
Maximum TDP250W300W235W300W300WTBDTBDTBD

しかし興味深いのは、ローエンドGPUがより多くのメモリ容量を備えていることです。これは、NVIDIAが特定のワークロードに対してより高いメモリ容量を備えたローエンドGPUを備えているか、各GPUが異なるメモリ構成を持ち、48GB HBM2eがこの特定のGPU SKUの最高のメモリ構成。この仕様リークからわかるもう1つの最も興味深い点は、次世代のTeslaラインナップにはさまざまなGPU SKUがありますが、完全なGPUは、128 SMにパックされた8192 CUDAコアで間違いなくピークになるはずです。Volta GV100 GPUと同様に、5376 CCまたは84 SMを含むフルチップにもかかわらず、Tesla V100は5120 CUDAコア(80 SM)でピークに達したため、完全なファット(次世代)GPUは決して公開されません。では  、前のインタビューで、  NVIDIAのCEO、Jensen黄は、小さな部分は生産のためにサムスンに送信されますしながら、彼らの次の世代の7nmでのGPUの受注の大半はTSMCによって処理されることを確認していました。最後に、Jensenは次世代7nm GPUの発売時期について尋ねられましたが、彼は現時点で日付を開示するのに都合のよい時間ではないと答えました。 NVIDIAのCFOであるColette Kressとの最近のインタビューから、  7nm GPUの発表でみんなを驚かせたいと思っていることがわかっていますが、そうするための適切なタイミングを待っています。一方、AMDは、Arcturus GPUをベースとするRadeon Instinct Mi100 HPCアクセラレーターの発表も予定されています。ArcturusGPUも8192 SPを搭載しており、最新の7nm GPUアーキテクチャに基づいています。ただし、NVIDIAが過去に証明したように、より高度なノード(16nm対12nmおよび12nm対7nm)に基づく競合他社のGPUに対して超効率的かつ競争力のあるポイントまでアーキテクチャを最適化できることを証明しています。NVIDIAは、次世代GPUとまったく新しいアーキテクチャを備えたAMDと同等のプロセスであるため、実際の破壊的なパフォーマンスが確認できます。これらは間違いなくNVIDIAの次世代GPUの大きな仕様であり、3月22日に開催されるGTC 2020オンラインキーノートで、NVIDIAによる本格的な発表が期待できます。

ASUS NVIDIA GeForce GTX 1660 搭載 デュアルボールベアリングファンモデル 6G PH-GTX1660-O6G
AmazonRakuten
ASUS NVIDIA GeForce GTX 1660S 搭載 シングルファンモデル 6G PH-GTX1660S-O6G
AmazonRakuten
ASUS NVIDIA RTX 2060 SUPER 搭載 デュアルファンモデル 8G RTX2060S-O8G-EVO
AmazonRakuten
MSI GeForce GTX 1650 AERO ITX 4G OC グラフィックスボード VD6936
AmazonRakuten
MSI GeForce GTX 1660 AERO ITX 6G OC グラフィックスボード VD6919
AmazonRakuten
MSI GeForce GTX 1660 SUPER AERO ITX OC グラフィックスボード VD7112
AmazonRakuten
MSI GeForce RTX 2060 SUPER VENTUS XS J OC グラフィックスボード VD7099
AmazonRakuten
ZOTAC GAMING GeForce GTX 1650 OC グラフィックスボード VD6937 ZTGTX1650-4GBOC
AmazonRakuten
ZOTAC GAMING GeForce GTX 1660 SUPER Twin Fan グラフィックスボード ZTGTX1660S-6GBTWIN/ZT-T16620F-10L VD7109
AmazonRakuten
玄人志向 NVIDIA GeForce GTX 1650 搭載 グラフィックボード 4GB デュアルファン GF-GTX1650-E4GB/OC/DF
AmazonRakuten
玄人志向 NVIDIA GeForce GTX 1660 搭載 グラフィックボード 6GB デュアルファン GALAKURO GAMINGシリーズ GG-GTX1660-E6GB/DF
AmazonRakuten
玄人志向 NVIDIA GeForce GTX 1660Super 搭載 グラフィックボード 6GB デュアルファン GALAKURO GAMINGシリーズ GG-GTX1660SP-E6GB/DF
AmazonRakuten
玄人志向 NVIDIA GeForce RTX 2060 SUPER 搭載 グラフィックボード 8GB デュアルファン GALAKURO GAMINGシリーズ GG-RTX2060SP-E8GB/DF
AmazonRakuten

ASUS TUF Gaming ゲーミングモニター VG259Q 24.5インチ フルHD IPS 144Hz 1ms
AmazonRakuten
ASUS TUF Gaming ゲーミングモニター VG27AQ 27インチ WQHD HDR IPS 165Hz 1ms
AmazonRakuten
ASUS ゲーミングトライバンド WiFi ルーター GT-AX11000
AmazonRakuten
BUFFALO WiFi 無線LAN ルーター WXR-5950AX12 Wi-Fi6
AmazonRakuten
CFD販売 内蔵SSD M.2 2280 NVMe PCI-E Gen.4 x 4(NVMe 1.3) PG3VNFシリーズ 1TB CSSD-M2B1TPG3VNF
AmazonRakuten
CFD販売 内蔵SSD M.2 2280 NVMe PCI-E Gen.4 x 4(NVMe 1.3) PG3VNFシリーズ 2TB CSSD-M2B2TPG3VNF
AmazonRakuten
CFD販売 内蔵SSD M.2 2280 NVMe PCI-E Gen.4 x 4(NVMe 1.3) PG3VNFシリーズ 500GB CSSD-M2B5GPG3VNF
AmazonRakuten
MSI 27インチ 16:9 フルHD 165Hz eスポーツ アンチフリッカー FreeSync Premium Optix MAG271R
AmazonRakuten
MSI 31.5インチ 16:9 WQHD 144Hz 湾曲パネル アンチフリッカー FreeSync Premium Optix MAG321CQR
AmazonRakuten
Samsung SSD 1TB 970 EVO Plus M.2 Type2280 PCIe3.0×4 NVMe1.3 (MZ-V7S1T0B/EC)
AmazonRakuten
Samsung SSD 250GB 970 EVO Plus M.2 Type2280 PCIe3.0×4 NVMe1.3 (MZ-V7S250B/EC)
AmazonRakuten
Samsung SSD 2TB 970 EVO Plus M.2 Type2280 PCIe3.0×4 NVMe1.3 (MZ-V7S2T0B/EC)
AmazonRakuten
Samsung SSD 500GB 970 EVO Plus M.2 Type2280 PCIe3.0×4 NVMe1.3 (MZ-V7S500B/EC)
AmazonRakuten
SilverStone 1000W 80PLUS PLATINUM ATX電源 SST-ST1000-PTS
AmazonRakuten
SilverStone 1200W 80PLUS PLATINUM ATX電源 SST-ST1200-PT
AmazonRakuten
SilverStone 550W 80PLUS PLATINUM ATX電源 SST-ST55F-PT
AmazonRakuten
SilverStone 650W 80PLUS PLATINUM ATX電源 SST-ST65F-PT
AmazonRakuten
SilverStone 750W 80PLUS PLATINUM ATX電源 SST-ST75F-PT
AmazonRakuten
Western Digital SSD 1TB WD Blue SN550 PC M.2-2280 NVMe WDS100T2B0C-EC
AmazonRakuten
Western Digital SSD 250GB WD Blue SN550 PC M.2-2280 NVMe WDS250G2B0C-EC
AmazonRakuten
Western Digital SSD 500GB WD Blue SN550 PC M.2-2280 NVMe WDS500G2B0C-EC
AmazonRakuten

このサイトについて

最新BTOパソコンや最新パーツの情報を発信するつもりのブログです。

アーカイブ