世界のスーパーコンピュータとそれを動かす人々


4月 18, 2022

AMD Milan-X CPU、3D V-Cache搭載、最大64コアの4つのSKUを販売開始

HPCwire Japan

Tiffany Trader

11月に発表された3D V-Cacheテクノロジー搭載のAMD Epycプロセッサ(コードネーム:Milan-X)は、現在、主要システムメーカーおよびクラウドプロバイダのMicrosoft Azureから一般に販売されている。16コアから64コアまでの4つのSKUで提供されるこの新しいプロセッサは、768メガバイトのL3キャッシュを搭載し、BIOSアップグレードにより既存のプラットフォームと互換性がある。

新しいMilan-Xプロセッサは、AMDの言う「真の3Dダイ・スタッキング」を実現する3Dチップレット・テクノロジーを搭載したAMD初のサーバ用CPUである。Milanと同じTSMC 7nm Zen 3コアをベースに構築されたMilan-Xプロセッサは、標準のMilanパーツと比較して3倍のL3キャッシュを搭載している。Milanでは、各複合コアダイ(CCD)に32Mバイトのキャッシュが搭載されていたが、Milan-Xでは64Mバイトの3Dスタックキャッシュを追加し、CCDあたり合計96Mバイトのキャッシュを搭載している。8個のCCDを搭載した場合、L3キャッシュは768メガバイトとなる。L2キャッシュとL1キャッシュを加えると、1ソケットあたり合計804メガバイトのキャッシュを搭載することになる。

ソース:AMD

 

Milan-X with 3D V-Cacheは、2Dチップ設計の物理的制約を克服するために、ハイブリッドボンド+シリコンビアを 採用した。ダイからダイへのインタフェースは、はんだバンプのない銅-銅ダイレクトボンドを使用してZen 3コアとキャッシュモジュールを接続し、熱、トランジスタ密度、インターコネクトピッチを向上させている。

Epyc 7003Xシリーズファミリーは、16コア、240ワットの7373Xが4,185ドル、24コア、240ワットの7473Xが3,900ドル、7573Xが5,590ドル、トップバイの64コア、280ワットの7773Xが8,800ドル(1,000台ベースの価格)の、4種類の標準SKUが用意されている。64コアのMilan-Xは、周波数やTDPがほぼ同等で、標準の64コアのMilan 7763とプロファイルが似ている–ただし、3D V-Cache技術により、新CPUではキャッシュが3倍になっている。

 

AMDは、Milan-Xプロセッサは、既存のMilan高周波部品の電力および熱フレームワークに適合するように設計されており、同じサーバプラットフォーム内で顧客に選択肢を提供することができると述べている。AMDによると、Milan-X製品の価格は、同等のMilan高周波部品に比べて約20%上昇するという。

HPCwire に提供された事前説明資料の中で、AMD は、すべてのワークロードが V-Cache テクノロジーの恩恵を受けるわけではないことを明らかにし、それが最も理にかなっている場合の例(代表的なベンチマークを含む)を示した上で、次のように述べている。

「Milan-Xに適合すると思われるワークロードは、L3キャッシュのサイズに敏感で、L3キャッシュの容量ミスが多く、つまりデータセットがL3キャッシュに対して大きすぎる場合が多く、L3キャッシュの競合ミスが多く、つまりキャッシュに取り込まれたデータの連想性が低い場合です」と同社は述べている。

「Milan-Xの恩恵を受けないであろうワークロードは、すでにL3キャッシュミスレートがゼロに近く、L3キャッシュコヒーレンシーミスが高い、つまりデータがコア間で高度に共有されており、CPU負荷は高いがデータを”ストリーム”するだけ、つまり繰り返し操作するのではなく、一度しか使用しない可能性があります」ともAMDは述べている。

AMDは、計算流体力学(CFD)、有限要素解析(FEA)、電子設計自動化(EDA)、天気予報などの領域にまたがる、対象となる技術計算ワークロード全体でMilan-Xの性能が向上していると報告している。

AMDが実施した社内テストでは、16コアMilan-X CPUは、標準の16コアMilan CPUと比較して、シノプシスVCS上でのシミュレーションを66%高速化した。これは、3D V-Cacheを使用しない場合は1時間あたり平均24.4ジョブ、3D V-Cacheを使用した場合は1時間あたり40.6ジョブという結果であった。EDAワークロードであるVCSは、世界のトップクラスの半導体企業の多くで、チップがシリコンにコミットされる前の開発プロセスの初期段階で不具合を検出するために使用されている。

シノプシスのエンジニアリング担当副社長Sandeep Mehrotraは、「最新の第3世代AMD Epycプロセッサで実行されるVCSのコア数は膨大な量です。今日の計算負荷の高いEDAワークロードには大量のメモリとキャッシュが必要ですが、VCSのランタイムにおけるメモリ効率は群を抜いており、大きな競争力を与えてくれます」と述べている。「AMDとの緊密なコラボレーションにより、お客様が明日のSoCの検証上の課題や複雑さに取り組む力を与え、技術の進歩を加速させ続けます。」

AMDは、64コアのMilan-X(7773X)プロセッサと40コアのIntel Platinum 8380プロセッサを比較したところ、最大44パーセント(Altair Radioss)、最大47パーセント(Ansys Fluent)、最大69パーセント(Ansys LS-Dyna)、最大96パーセント(Ansys CFX)というワークロード速度アップを示したという。

同じアプリケーションセットについて、32コアのMilan-X(7573X)と32コアのXeon Platinum 8362プロセッサの平均コア間比較では、Milan-Xの性能が、最大37パーセント(Altair Radioss)、最大23パーセント(Ansys Fluent)、最大47パーセント(Ansys LS-Dyna)、最大88パーセント(Ansys CFX)向上していることが確認さ れたほか、32コアプロセッサの平均コア間比較では、Milan-Xが最大20パーセント向上していることも確認された。

AMDの競合比較は、IntelのIce Lakeプラットフォームに対して行われた。Intelの次期Sapphire Rapidsプラットフォームは、Intelによると、今四半期に一部の顧客に向けて出荷の準備を進めているという。今後、ベンチマーク比較のカウンターが登場すると予想するのが妥当だろう。

ソース:AMD

 

より少ないハードウェアでより多くのワークロードを実行できることは、データセンターにおける消費電力の削減につながるのが理想的だ。AMDは、32コアのEpyc 7573Xと32コアのXeon 8362という上記と同じ競合テストのシナリオを使用して、4,600のAnsys cfx-50ジョブの実行に使用するサーバーの数を20から10に削減し、49%の電力削減と3年間で51%のTCO削減を予測できたと発表している。

ローンチパートナー

クラウドプロバイダのMicrosoft Azureは、11月にHBv3インスタンスをすべてMilan-Xに切り替える意向を表明しており、そのアップグレードが完了したと述べている。

「Azure HBv3仮想マシンは、AMD 3D V-Cacheテクノロジーを搭載した第3世代AMD Epycプロセッサーに完全にアップグレードされており、…主要なHPCワークロードで最大80パーセントのパフォーマンス向上を実現した、Azure HPCプラットフォームへの最速採用品です」と、Azure HPC、AI、SAP、Confidential Computing部門のゼネラルマネージャー、Nidhi Chappellは声明で述べている。

メモリ企業のマイクロンもローンチパートナーであり、アーリーアダプターでもある。

マイクロンでコンピュート&ネットワーキング事業部のシニアバイスプレジデント兼ゼネラルマネージャーを務めるRaj Hazraは声明で、「マイクロンとAMDは、高性能データセンター・プラットフォームに主要DDR5メモリーのフル能力を提供するというビジョンを共有しています」と述べている。「AMDとの深い協力関係には、マイクロンの最新のDDR5ソリューションに対応したAMDプラットフォームの準備や、AMD 3D V-Cache技術を搭載した第3世代AMD Epycプロセッサーの自社データセンターへの導入が含まれます。」

Hazraは、一部のEDAワークロードについて、3D V-Cacheテクノロジー搭載のAMD Eypcプロセッサーの採用により、3D V-Cacheなしの同等のEpycプロセッサーと比較して40%の性能向上が見られると報告している。

その他、システムビルダーのAtos、Cisco、Dell Technologies、Gigabyte、HPE、Lenovo、QCT、Supermicroなどがサポートを表明しており、その多くが現在Milan-Xプラットフォームを持っている。ISVパートナーには、Altair、Ansys、Cadence、Dassault Systèmes、Siemens、Synopsysが含まれている。