新しいAMDCPU特許により、3Dスタックの機械学習アクセラレータの設計が明らかに

2022.04.9

2020年9月25日、AMDは、I / Oダイ（IOD）に垂直に積み重ねられた機械学習（ML）アクセラレータを提供する独自のプロセッサの特許を発行しました。AMDは、FPGA（フィールドプログラマブルゲートアレイ）または特殊なGPU用の機械学習アクセラレータを組み込んだデータセンターベースのシステムオンチップ（SoC）を準備している可能性があります。AMDは、最新のプロセッサに専用キャッシュを追加するのと同様に、プロセッサI/Oダイの上にFPGAまたはGPUを追加する可能性があります。

AMDは、最新の特許イノベーションにおいて3Dスタック型機械学習アクセラレータに焦点を合わせ始めている

このテクノロジは、企業が今後のプロセッサSoCにアクセラレータのクラスを追加できるようにするために不可欠です。AMDの特許は、消費者が新しく設計されたプロセッサが市場に登場することを保証するものではありません。同社の最新のベンチャーは、ユーザーが最前線で適切な研究開発を行うことで将来がどうなるかを知ることを可能にします。AMDは最近の特許に関する情報を何も表明していません。つまり、会社が新しい設計について何を計画しているのかを見積もることしかできません。

AMDに発行された「直接接続された機械学習アクセラレータ」の特許は、付属のIODを備えたプロセッサにMLアクセラレータをスタックして会社が開始できる可能性のある使用法を説明しています。このテクノロジは、FPGAまたはコンピューティングGPUで構成され、専用のアクセラレータコネクタを使用してIODにスタックされたMLワークロードを処理します。AMDは、IODにリンクされたメモリ、またはIODのヘッドに接続されていない別のセクションを使用して、ローカルメモリ内に一意のアクセラレータを追加することでこの設計を開始できます。

「機械学習」について説明する場合、通常はデータセンターと同義です。それでも、AMDはこの新しいテクノロジでチップのワークロードを増やす必要があります。AMDの特許により、システムチップで使用される高価でカスタマイズされたシリコンを組み合わせることなく、ワークロードの速度を上げることができます。利点には、電力、データ送信、およびより多くの機能の効率も含まれます。

AMD ザイリンクスの買収に近い出願のため、特許のタイミングは戦略的であるように思われます。出願から1年半余りが経過し、2022年3月末に最終的に公開された特許を確認した今、2023年には、新しい意匠が実現すれば、それが実現する可能性があります。特許はAMDのフェローであるMaxim V. Kazakovです。

AMDは、I / Oダイとアクセラレータを組み合わせた設計を利用した、コードネームGenoaおよびBergamoという新しいEPYCプロセッサを開発中です。AMDは、機械学習アクセラレータを備えたGenoaおよびBergamoシリーズでAIベースのプロセッサを作成できる可能性があります。

AMDのEPYCラインと言えば、同社は第5世代EPYC Turinプロセッサライン用の優れた600W cTDPまたは構成可能な熱設計電力を探しています。EPYC Turin CPUは、現在のEPYC 7003 Milanシリーズの2倍のcTDPを提供します。また、同社のEPYCプロセッサのSP5第4世代および第5世代プラットフォームは、短時間で700Wもの消費電力を提供します。GenoaおよびBergamoプロセッサでは、MLアクセラレータをプロセッサに追加すると、消費電力が増加します。将来のサーバーチップセットは、AMDが最近特許を取得したMLアクセラレーションプロセッサ設計など、垂直に積み重ねられたアクセラレータの恩恵を受けるでしょう。

本明細書の開示に基づいて多くの変形が可能であることを理解されたい[…]

適切なプロセッサには、例として、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、グラフィックプロセッサ、機械学習プロセッサ、［ＤＳＰ、ＡＳＩＣ、ＦＰＧＡ］、および他のタイプの統合されたプロセッサが含まれる。回路（IC）。

[…]このようなプロセッサは、処理されたハードウェア記述言語（HDL）命令と、ネットリスト（コンピュータで読み取り可能なメディアに保存できる命令）を含むその他の中間データの結果を使用して製造プロセスを構成することで製造できます。

—「直接接続された機械学習アクセラレータ」AMD特許からの抜粋

ザイリンクスのテクノロジの支援により、同社はコンピューティングに焦点を合わせたGPUデザイン、堅牢なFPGAデザイン、Pensandoのプログラム可能なプロセッサシリーズ、および堅牢なx86マイクロアーキテクチャを提供できるようになりました。AMD Infinity Fabric相互接続テクノロジに見られるテクノロジと同様のマルチチップレット設計は、現在、同社にとって現実のものとなっています。垂直スタッキングを備えたデータセンタープロセッサは、データセンター用のマルチタイルAPUと、TSMCのN4Xパフォーマンスノードで構築されたプロセッサを組み合わせ、グラフィックプロセッサまたは最適に強化されたN3Eプロセス技術を備えたFPGAアクセラレータで仕上げることにより、企業により多くのオプションを提供します。

AMDから公開された特許からの重要なポイントは、機械学習アクセラレータテクノロジ自体と、コンシューマーベースのCPUの将来におけるその位置です。AMDは、将来の製品ラインに沿ってアクセラレータをより普遍的に組み込み、データセンターアプリケーションとクライアント固有の利用の最前線にそれらを配置するより多様なポートフォリオを可能にします。

(Source:wccftech)