世界のスーパーコンピュータとそれを動かす人々


5月 7, 2024

インテルのビジョンの優位性: チップは既製品で入手できる

HPCwire Japan

Agam Shah オリジナル記事「Intel’s Vision Advantage: Chips Are Available Off-the-Shelf

チップ市場は危機に直面している:チップ開発は今や少数の手に集中している。

最近の多くのスーパーコンピューティングの記者会見で懸念された、既製品のチップの少なさを思い知らされる出来事が重なった。インテルは、自社のチップが依然として重要である理由を強調したが、同時に官僚的な不利も露呈した。

インテルは図らずも、より重要な半導体の発表が多い週に、フェニックスでVision会議を開催した。他の発表がインテルの轟音を静めたことで、レガシー・チップ・プロバイダーがいかに無関係の瀬戸際に立たされているかを思い知らされることにもなった。

一言で言えば、インテルは、その歴史的アプローチ(オープンアプローチ)がいかに最大の長所のひとつであり続けているかを聴衆に思い出させた。同社のチップは、ARMのCPUやGPU、Ampere ComputingのARMベースのCPUと並んで、既製品として入手可能なままだ。

ハイテク企業以外の大企業が、セキュリティやコストへの懸念から(エクイニクスのようなデータセンター・プロバイダーを経由して)社内にハードウェアを引き揚げる中、チップを大量に消費する世界では、インテルのハードウェアは再び重要性を増すかもしれない。しかし、その苦闘はIBMのように、あまりにも官僚的で層が厚く、新興企業や国産チップがその扉を叩いていることに変わりはない。

インテルのカンファレンスでの主な発表には、Xeon 6チップ、AIチップGaudi 3、そしてMeteor Lakeの後継となるLunar Lake PCチップの詳細が含まれる。

 
  Gaudi 3は、オープン・コミュニティー・ベースのソフトウェアとイーサネット・ネットワーキングを顧客に提供し、システムをより柔軟に拡張できるようにする (出典:インテル)
   

しかし、3日連続で他社から主要な半導体が発表されたため、インテルは輝きを失ってしまった。

インテルCEOのパット・ゲルシンガー氏がVisionで基調講演を行ったのは、GoogleがAxion CPUを発表したのと同じ日であり、TSMCがフェニックスに2nmチップ工場を設立するために米国政府から最大66億ドルの資金提供を受けると発表した翌日だった。

メタは水曜日、オリジナルのMTIAチップの「コンピュートとメモリ帯域幅を2倍にした」MTIAと呼ばれるAIチップの新バージョンを発表し、インテルに最後の切り札を突きつけた。この新しいチップは、エヌビディアのGPUに頼ることなく、メタが自社開発のAIモデルを訓練するために必要なハードウェアを提供する。オリジナルのMTIAチップは、メタ社がフェイスブック、インスタグラム、WhatsAppのサービスを実行するための推論ハードウェアという性格が強かった。

新しいXeon 6 CPUには、現行のEmerald RapidsやSapphire Rapidsと同様の高性能(Pコア)チップであるGranite Rapidsが含まれている。インテルはGranite Rapidsについて、新しいアーキテクチャーを特徴とすることから期待を寄せている。Emerald Rapidsは、成功を収めているSapphire Rapidsのインクリメンタル・アップグレードであり、それほどエキサイティングなものではない。

 
  インテルXeon 6は、Granite Rapids(Pコア)とSierra Forest(Eコア)プロセッサーの新しい名称である (出典:インテル)
   

GoogleのAxion CPUは同社初のもので、クラウドにおいてインテルのXeonチップの代替品として提供される。Axion は、インテルのx86チップの代替品として独自のARMベース・チップを提供するトップ・クラウド・プロバイダーの三重奏を完成させる。

x86クラウドの最大の利点は、依然としてGPUへのアクセスだ。インテルのチップは、すべての主要クラウドプロバイダーでエヌビディアGPUとパッケージ化されている。サーバーにおけるARMの最大の課題はソフトウェアの互換性であり、AmazonはGravitonチップでGPUアクセスを提供していない。

メタの独自AIチップは、なぜインテルのGaudi 3チップが必要なのかという疑問を投げかける。マイクロソフト、OpenAI、アマゾンを含む主要なAIおよびクラウドプロバイダーは、独自のチップを構築している。しかし問題は、顧客がクラウドサービスを通じてそのハードウェアにアクセスできることだ。

Gaudi 3には、時代遅れのテクノロジーが搭載されている。要約すると、HBM2Eメモリーを搭載し、FP8とBF16をサポートしているが、これはエヌビディアのGPUからほぼ1世代遅れている。

もちろん、圧倒的なシェアを持つエヌビディアが大きな象であることに変わりはない。

インテルはやることがたくさんある。同社は、コードネームIDC(アナリスト会社と混同しないように)と呼ばれていたIntel Developer Cloudのリパッケージ版であるTiberと名付けられた新しいクラウドサービスを導入した。インテル・デベロッパー・クラウドの初期バージョンは、ほとんど使い物にならないものだった。インテルの幹部は、これは進行中の作業だと断言した。

インテル・デベロッパー・クラウドは、このモデルをテストするためのインテル製チップを多数提供している。DevCloudは、あなたが選んだハードウェアを搭載したオンライン・ラップトップを持っているようなものだと考えてほしい。DevCloudは使いやすいとは言えなかった。価格設定が分かりづらく、利用可能なメモリやストレージも明確に伝えられていなかった。モデルをコンパイルしてチャットボットのクエリを実行する前に、ラップトップの完全な構成を事前に計算できないようなものだ。

インテルTiber開発環境は、ユーザーがOneAPIのフックを知っていることを要求し、ニューラルネットワークをロードしてコードを実行させるために複数のフープがある。エヌビディアは、CUDAが10年間テストされてきたこともあり、はるかにシンプルである。インテルの焦点は、開発者にCUDAコードを削除してもらうことにある。

インテルは、自社のx86アーキテクチャを崩壊させる可能性のある競争の激化を認識しており、それに応じて、競争がはるかに少なく、収益機会が多く、競合他社と協力する機会が多いファウンドリ・モデルに事業を再調整している。