世界のスーパーコンピュータとそれを動かす人々


6月 10, 2024

Computex 2024:エヌビディアとAMDがGPUをプッシュ、インテルがx86の電力効率を向上

HPCwire Japan

Agam Shah オリジナル記事「Computex 2024: Nvidia, AMD Push GPUs; Intel Revs Up x86 Power Efficiency

「数百万のGPUデータセンターの時代が到来する」と、エヌビディアのCEOジェンセン・フアン氏はComputexの基調講演で述べた。フアン氏の予測はますます大胆さを増しており、最近ではAIによりプログラマーはコーディングを学ぶ必要がなくなるだろうと述べた。しかし、フアン氏は数兆ドル規模の企業を率いる人物であることから、大胆な推測をいくつか行う余裕がある。

一方、弱小企業のインテル社パット・ゲルシンガー氏とAMD社リサ・スー氏は、Computexの基調講演でより現実的な見通しを語った。両社はエヌビディア社に追いつくべく、追い上げモードに入っている。

スー氏は、エヌビディアの王国を破壊する新製品に焦点を当てた。ゲルシンガー氏は、思いがけなくも x86 の電力効率と、PC やサーバーにおけるインテルの優位性を脅かす ARM を撃退する製品に焦点を当てた。

エヌビディアとAMDにとってAIは金鉱であり、両社は2026年までの製品投入により、GPUとCPUのロードマップを拡大した。インテルのGPUロードマップは延命措置が取られており、Ponte Vecchio GPUは正式に廃止され、Falcon Shores GPUは再設計されて復活した。

インテルは、その代わりに新しい Xeon 6 E-core チップに焦点を当てた。このチップは、予想外の電力効率の向上により、絶賛の嵐を呼んでいる。

エヌビディアGPU

エヌビディアは、2026年のロードマップに新しいGPU、CPU、ネットワークチップを追加した。2026年の「Rubin」プラットフォームのGPUは、高密度メモリ構成を必要とするHBM4メモリをサポートする。2027年には、HBM4を搭載した段階的なアップグレード版「Rubin Ultra」を計画している。

Rubin GPUは、現在8ソケットサーバーであるのに対し、12ソケットサーバーをサポートする。

「我々は、TSMCのプロセスであれ、メモリ技術であれ、SERDES技術であれ、光学技術であれ、あらゆるものを技術の限界まで推し進めていきます」と、エヌビディアのCEO、ジェンセン・フアン氏は基調講演で述べた。

フアン氏は、Rubinとともにチップスタック全体をアップグレードしている。2026年には、エヌビディアはRubinとペアを組む新しいCPU「Vera」を発表する予定だ。Veraは、HopperとBlackwell GPUとペアを組む現行のGrace CPUの後継となる。

<td “> 

 
  エヌビディアの創業者兼CEOであるジェンセン・フアン氏が、Blackwellの量産版を披露している。 (出典:エヌビディア)
 

エヌビディアは、GPUをラックやデータセンターで接続するNVLink 6相互接続も導入した。ロードマップによると、その速度は3600GB/秒で、Blackwellに搭載されているNVLink 5の速度1800GB/秒の約2倍となる。NVLinkは、チップ間相互接続用の独自チップである。

Rubinプラットフォームは、データセンター間のGPU通信を1600GB/秒に拡張し、ネットワーク速度を2倍にする。CX9 SuperNICネットワークインターフェースとx1600イーサネット/Infinibandネットワークインターフェースにより、数百万のGPU間の通信が可能になる。

Rubinは、2025年にBlackwell Ultra GPUに続く。Blackwell Ultraは、今年発売予定のBlackwell GPUのアップグレード版となる。Blackwell UltraはHBM3eをサポートし、800GB/秒のX800ネットワークインターフェースをサポートする。

「X800 Ultraは数十万のGPU向けに設計されており、X1600は数百万のGPU向けに設計されている。数百万のGPUデータセンターの時代が到来しようとしている」とHuang氏は述べた。

Blackwellはまもなく利用可能になり、エヌビディアの空冷および水冷システム「DGX」で利用できるようになる。空冷システムではx86 CPUが利用可能になる。

主要なクラウドプロバイダーは、すでにBlackwell GPUとシステムの利用可能を発表している。Microsoftは、AzureクラウドにおけるBlackwellの最初のインスタンスが今年後半に稼働開始する予定だと述べた。

AMD GPU

AMDのCEO、リサ・スー氏は、新しいGPUを発表する際にエヌビディアを痛烈に批判した。AMDは、マイクロソフト、Meta、オラクルクラウドが採用しているMI300で成功を収めた。マイクロソフトのCEO、サトヤ・ナデラ氏は、MI300XはGPT-4ワークロードに最高の価格性能比を提供すると述べた。

次の主要GPUは、MI300Xのアップグレード版であるMI325Xで、今年末までに発売される予定だ。この製品には、エヌビディアがH200に搭載したHBM3Eメモリ288GBと、毎秒6テラバイトのメモリ帯域幅が含まれる。

「8つのMI325アクセラレータを搭載した1台のサーバーで、最大1兆個のパラメータを持つ高度なモデルを実行できる。これは、H200サーバーがサポートするサイズの2倍だ」とAMDのCEOスー氏は述べた。

2025年には、AMDはMI350シリーズをリリースする予定である。このシリーズもHBM3eをベースとする。3nmプロセスで製造される予定である。GPUは、AI向けに調整された新しいCDNA-4アーキテクチャをベースとする。

「CDNA-3 を発売した際、前世代製品と比較して 8 倍の AI 性能を実現しました。そして CDNA-4 では、35 倍の向上を実現できる見込みです」とスー氏は述べた。

MI325XおよびMI350Xシリーズは、汎用ベースボードOCPサーバー設計をサポートし、「つまり、当社の顧客は、この新技術を非常に迅速に導入できる」とスー氏は述べた。

2025年に発売予定の3ナノメートルAMD Instinct MI325X AIアクセラレータは、HBM3Eメモリを搭載している。 (出典: AMD)

 

一方、エヌビディアのGPUは、一般顧客が店頭で簡単に購入できるものではない。

2026年には、AMDがMI400 GPUを発売する予定だが、スー氏はそれについて多くを語らず、CDNA-Nextアーキテクチャをベースにするということ以外には言及しなかった。

AMDは、コードネーム「Turin」の新世代第5世代Epyc CPUも発売した。3nmと6nmのチップレットを搭載し、今年後半に発売予定。最大192コア、384スレッドを搭載する。

インテル製チップ

基調講演で、インテルCEOのパット・ゲルシンガー氏はいつものように率直な姿勢で、コードネーム「Sierra Forest」のXeon 6 Eサーバーチップと「Lunar Lake」PCチップの紹介に重点を置いた。GPUや大げさな宣言はなかった。

ゲルシンガー氏は、インテルが新世代のサーバーおよび PC チップで CPU 市場に復帰しつつあることを示唆した。これらのチップは、パフォーマンスリーダーとしての地位を維持しながら、消費電力の削減を実現している。

Xeon 6 Eコアチップは、CPUコアを多数搭載した省電力サーバーを対象としており、ARMの得意とする市場である。Microsoft、Google、AmazonはすでにARMアーキテクチャに基づく省電力CPUを導入している。

 
  インテルは、消費電力が少なく、ラックスペースも少ないEfficient-cores(E-cores)を搭載したXeon 6プロセッサを発売した。 (クレジット: Intel Corporation)
   

 

Xeon 6 E-coreチップは、最大288コアまで、さまざまな構成で利用可能だ。このチップは、Serve The HomeとPhoronixで高い評価を得ている。両サイトとも、複数のワークロードやOSでハードウェアをテストした経験が豊富な、経験豊富で信頼のおけるレビューアーが在籍している。

レビューの一般的な評価は驚きに満ちていた。x86チップが、ARMの得意分野であった電力効率を損なうことなくパフォーマンスを発揮できるということに、皆が驚いていたのだ。

「これは、コア数、密度、ワットあたりの性能が極めて高い、現代のデータセンターにとって不可欠なアップグレードです。また、これはインテル3上で動作する最初の製品であり、インテル3は4年間で5つのノードのうち3つ目であることも重要です」とゲルシンガー氏は述べた。

また、P-core(パフォーマンスコア)を搭載したXeon 3チップ(コードネーム:Granite Rapids)も間もなく発売される予定だとゲルシンガー氏は述べた。

また、ゲルシンガー氏は、インテルがLunar Lake PCチップで、x86が電力を大量に消費するという神話を打ち破ったと述べた。Lunar Lake PCチップは、前世代のMeteor Lake PCチップよりも40%も電力効率が高い。

ARM テクノロジーを採用した Apple の Mac は、x86 チップを搭載した Windows PC の約 2 倍のバッテリー寿命を実現している。Qualcomm は最近、Snapdragon X Elite チップを発表したが、これも Windows PC のバッテリー寿命を数日間に延長するとうたっている。

「x86は電力効率で勝てないという人もいます。Lunar Lakeはこの神話も打ち破るのです。この画期的な新しいSOCアーキテクチャと設計により、これまでにない電力効率を実現し、すでに非常に優れていたMeteor LakeよりもSOC性能を最大40%も低下させます」とゲルシンガー氏は述べた。