世界のスーパーコンピュータとそれを動かす人々


6月 27, 2022

AMD、「ポスト・エクサフロップス」の未来を見据え、代替チップをラインアップ

HPCwire Japan

Agam Shah オリジナル記事

10年近く前、AMDは混乱に陥っていた。同社はPCやデータセンターでインテルの二の舞を演じており、黒字化への道は、マイクロソフトのXbox Oneやソニーのプレイステーション4に搭載される同社のチップにほぼかかっていたのだ。

同じ頃、AMDはチップメーカーとして初めてエクサフロップス演算の基準をクリアすることを目標に掲げていたが、これはスーパーコンピュータ「Frontier」が直近のスーパーコンピュータチャートTop500でトップに立つことで達成したと、先日開かれた財務アナリストデーで同社の過去を振り返り、リサ・スーCEOは述べた。

AMDは軌道修正し黒字化したが、アナリストデーのプレゼンテーションでは、同社が荒れた過去から学んでいることがうかがわれた。また、CPUやGPUだけでなく、より幅広いチップ群に投資することでリスク分散を図るという意欲的なロードマップを打ち出した。

 
リサ・スー  
   

黒字化までの道のりには、x86のZen CPU設計に賭けたこと、Opteronサーバ製品で失敗し、Armアーキテクチャを放棄した後にサーバ市場に再挑戦したこと、すでに利益を上げているザイリンクスとPensandoを買収したこと、などが含まれる。

スー氏は、スーパーコンピュータ「Frontier」は、同社がコンピュータ技術のリーダーとしてのイメージを再構築するために行った努力の結晶であり、ライバルと互角に渡り合うことができると指摘した。

「エクサフロップ以上の性能を実現したのは、私たちが初めてです。決して簡単なことではありませんでした。しかし、それは長期的なビジョンで実現したものです。エクサフロップの壁を破るために、約10年前にその道を歩み始めたのです。」

スー氏は、2020年3月に開催された前回の対面式アナリストミーティングとは、同社の様子が大きく変わっていると指摘した。同社は今年、ザイリンクス社のプログラマブルチップと、Pensando社のネットワークとデータ処理のためのビルディングブロックを追加したのである。

「我々はデータセンターで1つの製品からスタートしました。しかし、世界はより複雑になり、すべてのワークロードがより広くなりました」とスー氏は言い添えた。

同社の汎用コンピューティング用GPUであるEpyc GPUとInstinct GPUは、スーパーコンピュータFrontierの中核であり、同社のデータセンターロードマップの目玉であり続けている。しかし、AIやクラウドワークロードをターゲットにしたXDNAファミリーの一部であるザリンクスのAIエンジンとFPGAによって、代替チップのリストが増えつつある。

「ザリンクスを買収したことで、AMDはデータセンターとエッジインフラにサービスを提供するインフラ企業としての性格を強めています。コンシューマーやPC市場よりもはるかに利益率の高いビジネスであり、OEMにとってより戦略的である」と、Moor Insights and Strategyの主席アナリスト、パトリック・ムーアヘッド氏は述べている。

AMD は、データセンターとインフラストラクチャエッジを機能させるために必要なスケールを提供しながら、消費者市場と PC にサービスを提供し続けるだろうとムーアヘッド氏は述べている。

AMDはすでにすべてのデータセンター企業と良好な関係を築いており、Pensadoや一部のザイリンクスのデータセンター製品を取り込むことで、販売チャネルを増やすことができると、TechInsightsの主席アナリスト、リンレイ・グウェナップ氏は話している。

「AMDは、顧客に対して、CPU、GPU、ネットワークDPUを含むデータセンター・コンポーネントの完全なパッケージを提供することができます、と言っています。そうすることで、顧客は、より多くのものをバンドルし、より多くのものを一挙に購入することができます」とグウェナップ氏は述べている。

スー氏は、カスタムチップ市場も、特定の組織の要求に応えるためにコンピューティングのニーズが多様化するにつれて成長するだろうと述べた。AMDの幹部は、顧客がハイブリッドコンピューティングのためにカスタムチップパッケージに異なるタイプのプロセッサを混ぜて組み合わせることができる、同社のモジュラーチップの未来について説明することに時間を費やした。

カスタムチップ戦略は、新たに発表されたInfinity Architecture 4.0を軸に、異なる種類のチップ(チップレットとも呼ばれる)をパッケージに統合するためのインターコネクトを実現する予定だ。

AMD独自の技術で構築されたInfinityファブリックは、CXL(Compute Express Link)2.0のラックレベルインターコネクトと互換性があり、チップレットレベルのインターコネクトであるUCIe(Universal Chiplet Interconnect Express)にも対応できるよう拡張される予定であるという。UCIeは、Intel、AMD、Arm、Google、Metaなどがバックアップしている。MetaはAMD Epycチップでメタバースを提供する計画であり、Google CloudはAMDのチップでより多くのインスタンスを提供している。

AMDはアーキテクチャにとらわれず、チップレットパッケージ内でx86とArmの設計を統合できるようにする予定だ。AMDは、RISC-V命令セットアーキテクチャに基づく統合チップを認めるかどうかについてのコメントを求めているが、これには応じていない。

AMDの最高技術責任者であるマーク・ペーパーマスター氏は、プレゼンテーションの中で、「我々は、AMD独自のCPU、GPU、高性能I/O、ネットワークギア、アクセラレータを含む、より柔軟性のあるチップを簡単に実装することに集中しています」と語った。

チップレット戦略とInfinityアーキテクチャは、AMDのハイパフォーマンスコンピューティング向けCDNAアーキテクチャの一部である。AMDによると、最初のCDNA 3アーキテクチャベースの製品は2023年に計画されており、CDNA 2の5倍の性能を実現するという。

AMDの最上位層データセンターのロードマップは、今後登場するZen 4(GenoaおよびGenoa-X)のCPUとInstinct GPUをベースに、XilinxのAIチップや、ソフトウェアアップデートだけでAIやネットワークなどの機能への改造が容易にできるFPGAを搭載しています。FPGAの機能を定義するのは、RTL(Register-Transfer Level)ソフトウェアコードである。

アダプティブ&エンベデッドコンピューティンググループのプレジデントで、元ザイリンクスCEOのビクター・ペン氏は、ニューラルネットワークのモデルや規模が急速に拡大しているAIなどのアプリケーション向けに、スケールアップやスケールダウンが可能な統合チップ「AIエンジン」を中心にプレゼンテーションを行なった。AIエンジンは、ネットワーク、メモリ、CPUといった他のコンポーネントとともに、プログラマブル・コンピュート・エンジンを含んでいる。

「AIエンジンは、ネットワーク、メモリ、CPUなどのコンポーネントとともに、プログラマブルなコンピュートエンジンを搭載しています。そして、このアーキテクチャは拡張性に優れており、性能、消費電力、コストなどのポイントに応じて拡張することができます」とペン氏は述べた。

同社は、AI、通信、自動車、ハイパフォーマンスコンピューティングなどの市場向けに、一部の7nm VersalアダプティブチップにおいてAIエンジンを展開した。ペン氏のプレゼンテーションで示された製品ロードマップによると、次の適応型システムオンチップは3ナノメートルプロセスで製造され、2025年に予定されているとのことだ。

「能力と価値を提供し続ける限り、絶対的な最先端ノードにすぐに移行することはそれほど重要ではありません」とペン氏は述べた。

ザイリンクスとPensandoの買収は、Solarflare NIC、Alveo FPGAベースのネットワークアクセラレータ、その他のPensandoのハードウェアおよびソフトウェア機器を含む多くのネットワーク資産も購入したと、AMDのデータセンターソリューション事業グループ担当上級副社長兼ゼネラルマネージャのフォレスト・ノロッド氏は述べている。

 
  Elba DPU   ソース: AMD
   

PensandoでAMDは、ノロッド氏が “世界で最もインテリジェントなDPU “と呼ぶElbaというデータ処理ユニットを追加した。

Elbaは、P4プログラミング言語をベースにしたネットワークパケットプロセッシングエンジンで、ストレージ、ネットワーキング、ファイアウォール、ネットワークセキュリティ、テレメトリに関連する特定のマイクロサービスを定義することができる。第2世代で144個のP4パケット処理ユニットを持つこのDPUは、大部分がP4言語を使ってチップにプログラムされたソフトウェア機能で動作している。

P4言語は、セキュリティを処理し、データパケットの行き先を追跡しながら、高周波のデータパケットを処理し、ルーティングすることができる。P4は、高帯域幅スイッチングと高度にプログラマブルなルーティングハードウェアに分かれていた従来のネットワークチップ市場に代わるソフトウェア定義型とみなされている。P4をベースとしたソフトウェア定義の導入により、より迅速な導入、容易な機能追加、迅速なバグフィックスが可能となり、また固定機能のネットワークハードウェアの開発にかかる時間やコストを削減することができる。

また、P4は並列性が高く、複数のサービスを同時に実行できるため、ヘテロジニアスなコンピューティング環境にも適している。

Elbaは、「中断することなく、その場で更新することができる」とノーロッド氏は述べた。また、Pensandoチームは、データセンターのあらゆる最新のワークロードに対応する完全なソフトウェアスタックを作成し、顧客が独自の機能を追加できるように調整することができると、ノーロッド氏は述べている。

出典 AMD