(Source:wccftech)
AMDは、2023年までに稼働する米国エネルギー省(DOE)の2つのExaflop El Capitanスーパーコンピューターに次世代のEPYCおよびRadeonアクセラレーターを搭載し、HPCセクターでの大勝利を発表しました。
AMDのEPYCジェノアとRadeon Instinct HPCアクセラレーターが2つのExaflop「El Capitan」スーパーコンピューターを駆動
Intel、AMD、およびNVIDIAを含む3つの企業はすべて、DOEの最新のスーパーコンピューターの契約を勝ち取るために競争していましたが、CPUとGPUの両方でAMDが勝ったようです。El Capitanスーパーコンピューターは、HPのCrayスーパーコンピューティング部門によって構築され、2023年までにAMDの次世代アクセラレーターを使用してこのエクサフロップモンスターを蘇らせます。スーパーコンピューターは、Lawrence Livermore National Laboratoryに配置され、1秒あたり2キンテリオンの計算まで実行可能になります。システム全体の組み立てには6億ドルの費用がかかり、現在LLNLに展開されているSierra(IBM Power 9 + NVIDIA Volta)スーパーコンピューターよりも少なくとも16倍高速です。システム自体の仕様については、EPYC GenoaがCPU側に電力を供給し、次世代Radeon InstinctアクセラレーターがGPU側に電力を供給することを知っています。システム全体が稼働すると、システム全体の消費電力は40MW未満になります。
以下は、El Capitanスーパーコンピューターに含まれるAMDテクノロジーのリストです。
- 「Zen 4」プロセッサコアを搭載した「Genoa」というコードネームの次世代AMD EPYCプロセッサ。これらのプロセッサは、AIおよびHPCワークロード用の次世代メモリおよびI / Oサブシステムをサポートします。
- HPCやAIを含むワークロード向けの新しいコンピューティング最適化アーキテクチャに基づく次世代Radeon Instinct GPU。これらのGPUは、次世代の高帯域幅メモリを使用し、最適な深層学習パフォーマンスのために設計されています。
- 3 番目の 高帯域幅を提供する世代AMD無限アーキテクチャは、4つのRadeon本能のGPU一AMD EPYC CPUとの間の低レイテンシ接続はエルキャピタンの各ノードに含まれます。同様に、図3は、RD 、世代AMD無限アーキテクチャ加速コンピューティングへのプログラマへのアクセスを容易に、CPUとGPUを横切ってユニファイドメモリを含みます
- AMD CPUとGPUのパフォーマンスを組み合わせて最大限のパフォーマンスを引き出すために開発された、オープンソースROCm異種プログラミング環境の拡張バージョン。
AMD EPYC Genoa-7nm以降のZen 4コア、SP5ソケットプラットフォーム、DDR5メモリ、PCIe 5.0プロトコル
Zen 4コアアーキテクチャに基づくAMD EPYC Genoaプロセッサーは、AMDがEPYC Romeの発売時に最新のロードマップで公式に発表するまで謎でした。現在、2021年に計画された発売を予定しているジェノアのラインナップは、サーバーランドスケープに新しい機能セットをもたらします。
AMDは、EPYC Genoaは新しいソケットをもたらす新しいSP5プラットフォームと互換性があると発表したため、SP3互換性はEPYC Milanまで存在します。EPYC Genoaプロセッサは、新しいメモリと新しい機能のサポートも備えています。AMDは間違いなく2021年にDDR5の時流に乗っているようです。また、新しい機能がEPYC Genoaに導入され、PCIe 4.0の帯域幅を2倍にする新しいPCIe 5.0プロトコルのヒントのように聞こえます。 x16インターフェイスで128 Gbpsのリンク速度。
EPYC Genoaのすべてをまとめると、次の主な機能を検討しています。
- 7nm以降のZen 4コア
- 新しいソケットを備えたSP5プラットフォーム
- PCIe 5.0のサポート
- DDR5メモリのサポート
- 2021年に発売
Radeon Instinct側では、非常に強力で、おそらく7nm未満のGPUベースのグラフィックアクセラレータを検討しています。AMDは現在、コードネーム「Arcturus」で、伝えられるところによると最大8192個のストリームプロセッサと32GBのHBM2eメモリを搭載したRadeon Instinct Mi100アクセラレータを発売する準備を進めています
GPUはそれ自体が間違いなく獣ですが、2020年の発売が計画されており、将来の保証を維持するために、El CapitanスーパーコンピューターはRadeon Instinct Mi100よりも新しいものを確実に展開します。正確なグラフィックスカードまたはアクセラレータについては言及されていませんが、新しいGPUは次のような新しいコンピューティングアーキテクチャを提供すると述べられています。
- HPCおよびAI向けに最適化
- 深層学習のパフォーマンスを最適化するための広範な混合精度Ops
- 次世代の高帯域幅メモリ
- マルチGPUスケーリングでパフォーマンスを最大化
機能セットに基づいて、2021年までにすぐに利用可能になるHBM2eおよびPCIe Gen 4を超えたものを間違いなく探していますが、エルキャピタンは2023年に運用を開始します。これは、NVIDIAのHPCアクセラレータのように、消費者空間で目にするチップではなく、そのセグメントのカスタムデザインになることを意味します。また、El Capitanの3番目の主要な機能は、各AMD CPU / GPUアクセラレーターに第3世代のInfinity Fabricインターコネクトが装備されることです。Infinity Fabric 3.0と呼ばれる新しい相互接続により、CPUとGPU間の高帯域幅と低遅延の接続が可能になり、CPUとGPU全体で統一されたメモリが可能になり、プラットフォームの一貫した性質により全体的なパフォーマンスが向上し、プログラミングが簡素化されます。
AMDが投稿したスライドでは、各ノードに4つのRadeonアクセラレータがあり、Infinity Fabric 3.0を介してAMD EPYC Genoaプロセッサに直接リンクされているようです。現在200 Gb / sの帯域幅をプッシュしているCray独自のSlingshotファブリックに加えて使用されますが、将来のバージョンではEl Capitanインフラストラクチャにより多くの相互接続帯域幅を提供する可能性があります。ここでの違いは、Slingshotはよりノード間チャネルであり、Infinity FabricはCPU-GPU相互接続に近いことです。
At #oghpc, @BradleyMccredie of @AMD (presenting virtually) makes the argument not only for heterogeneous computing, but additionally cache coherency between CPU and GPU. #HPC pic.twitter.com/Nuut23grk4
— Addison Snell (@addisonsnell) March 2, 2020
また、メモリだけでなく、CPUとGPUの間にキャッシュの一貫性があり、これは将来のHPCプラットフォームにとって大きな問題になると言われています。異種プラットフォームの利点を示すスライドがAMDによって紹介され、Addison SnellがTwitterフィードで共有しました。これにより、将来のコンピューティングおよびアクセラレーションプラットフォームに何が期待できるかがわかります。そうは言っても、AMDは明日、ファイナンシャルアナリストデーを開催するので、プレゼンテーション中にZen 4と前述のRadeon Instinctアクセラレータの詳細を確実に期待できます。