世界のスーパーコンピュータとそれを動かす人々


7月 3, 2023

AMDがチップレットの利点を活かしてGPU「MI300X」とCPU「Bergamo」を設計した理由

HPCwire Japan

Agam Shah オリジナル記事

いくつかのシリコンパーツを交換するだけで、設計にそれほど手間のかからない、まったく新しいチップができあがる。

AMDのリサ・スー最高経営責任者(CEO)は、新しいGPU「MI300X」と、高密度サーバー環境をターゲットにしたコードネーム「Bergamo」と呼ばれる128コアCPU「Epyc」の製造について、このように説明した。

スーCEOは、これらのチップの製造に、同社が何年も前から使用しているチップレットをどのように使用したかについて、予想外に深く掘り下げて説明した。すべてのチップは、チップレットとパッケージング技術を提供するTSMCを使って製造された。

AMDにとっては、PCやサーバー用チップにチップレットを実装するという広範な戦略を大々的に打ち出しているインテルに先んじたことを自慢する手段でもある。インテルのPonte Vecchio GPUはチップレット・アプローチに基づいており、インテル流に言えば47個の「タイル」を採用している。

 
  AMD Instinct MI300X GPU (出典:AMD)
   

AIアプリケーションをターゲットにしたGPUのみのMI300Xは、GPUとCPUを搭載した同社のスーパーコンピューティング・チップMI300AからCPUチップレットを廃棄し、GPUチップレットに置き換えたものだ。

MI300Xは、NvidiaのH100 GPUに対抗する製品である。MI300Aは、2エクサフロップスを超えるパフォーマンスが期待される次期スーパーコンピュータ「El Capitan」に採用される予定だ。

「私たちは製品にチップレットを使用することで業界をリードしてきましたが、この製品にチップレットを使用することは、実は非常に戦略的です。私共は製品ファミリーを作り上げたのです」とスー氏は語った。

AMDはスーパーコンピューティング・チップMI300Aから3つのZen 4 CPUチップレットを取り除き、GPUチップレットを残した。そして、MI300Aから引き継いだGPUチップに、さらに2つのCDNA 3 GPUチップを追加してMI300Xが誕生した。

MI300Xのトランジスタ数は1,530億個で、新たに追加された2つのGPUチップレットを含め、5ナノメートルと6ナノメートルのチップレットが12個搭載されている。スーパーコンピューティング・チップのMI300Aは13個のチップレットを持ち、3個のZen 4 CPUコアを搭載している。AMDはMI300XにさらにHBM3メモリーを積み、合計192GBとした。

「MI300Xでは、大規模言語モデルのより大きなメモリー要件に対応するため、64ギガバイトのHBM3メモリーを追加しました」とスー氏は述べた。

AMDはまた、アマゾンとアンペア・コンピューティングが開発した低消費電力Armベースチップのx86版ともいえる128コアのBergamoチップも発表した。クラウド経由でウェブアプリケーションを提供するアプリケーション向けに設計された同社初のチップだ。

AMDは(Zen 4アーキテクチャをベースとする)Genoaチップレットを取り除き、Bergamoチップレットに入れ替えた。Bergamoチップは、Zen 4アーキテクチャの電力最適化バージョンであるZen 4cコアをベースにしている。

 

 

Bergamoは820億トランジスタを持ち、ソケットあたり128コアをサポートする。これは、消費電力と性能を最適化したZen 4の亜種であるZen 4cコアを16個搭載した8個のコンピュート・ダイを備えている。

Zen 4cコアの設計では、Genoaチップとのソケット互換性を確保するために本格的な作業が行われた。

チップ設計はZen 4と同じRTL設計からスタートし、ソケットとソフトウェアの互換性を実現した。その後、消費電力と面積のためにZen 4cの物理的実装を最適化し、より高いスループットのためにL3キャッシュの階層を再設計した。

「これらすべてを合わせると、面積が35%小さく、ワットあたりの性能が大幅に向上する設計になります」とスー氏は言う。

メタ社はデータセンターにBergamoを導入し、WhatsApp、Instagram、Facebookなどのウェブアプリケーションにサービスを提供する。ソーシャルメディア企業は、AIやウェブアプリケーションに対応するためにデータセンターの再設計を進めており、Bergamoのデザインに大きな影響を与えたようだ。

メタ社のインフラ担当副社長であるアレクシス・ブラック・ビョーリン氏は、「高密度のコンピュート・チップレット、コアとキャッシュの比率、電力管理、製造の最適化など、メタ社のワークロード向けにBergamoを最適化するためにAMDと提携しました」と語った。

「Bergamoのチップレット戦略の柔軟性により、HDDやフラッシュ・ストレージ・プラットフォームに活用できるIO集中型サーバー・オプションを手に入れることができました。」

Epyc 9754と呼ばれる最上位のBergamoチップは、128コア、256スレッドで動作し、最大360Wの電力を消費する。このチップは256MBのL3キャッシュを持ち、最大3.10GHzの周波数で動作する。中位の9754Sは1コードにつき1スレッドしか実行しない。ファミリーの3番目のチップであるEpyc 9734は112コアで、1コアあたり2スレッド動作し、320Wの電力を消費する。

Bergamoは、来年登場するインテルの高密度サーバーチップ「Sierra Forest」との競争に直面することになる。Sierra Forestは、インテルのeコア(効率コアとも呼ばれる)を搭載している。