HPEとDell、次世代スーパーコンピュータの基盤を構築
Agam Shah オリジナル記事「HPE and Dell Lay the Groundwork for Next-gen Supercomputers」
HPEは、世界最速のスーパーコンピュータ3台を構築した実績に甘んじているわけではない。それらの技術をアップグレードしている。
デルは、10万台のエヌビディアGPUを搭載したX.AIのColossusを構築し、これは世界最速のAIアクセラレーションシステムとされている。同社は、エヌビディアのBlackwell GPUを搭載した新しいサーバーを発表した。
両社は、SC2024に先立ち、また同イベントで、新たなサーバーを発表した。
HPEの新しいCrayスーパーコンピュータEX4252 Gen 2 Compute Bladeには、次世代エクサスケールシステムの一部となる新技術が搭載されている。このブレードには第5世代AMD EPYCプロセッサが8基搭載され、2025年春に出荷される予定である。
最大64台のEX4252 Gen 2 Compute Bladeを1つのキャビネットに収納でき、最大98,304コアを実現する。Compute Bladeは液冷式である。
また、HPEは帯域幅が毎秒400ギガビットのネットワーキング技術を搭載したSlingshot Interconnect 400も発表した。このシステムは2025年秋に出荷される予定である。
これは、El Capitan、Frontier、Auroraのスーパーコンピュータのトップ3に入るHPE Slingshot-11よりも約2倍高速である。
Slingshot Interconnect 400はキャビネットの背面に取り付けられる。64ポートに400Gbpsのスイッチブレードを搭載し、1つのキャビネットに最大32台まで搭載でき、双方向の帯域幅は51.2Tb/sである。
新しい「Slingshot」は2025年秋に出荷される予定である。HPEのHPCおよびAIカスタマーソリューション担当副社長であるジェラルド・クライン氏は、記者会見で次のように述べた。「この技術は研究室で開発中であり、良好な成果を上げています。」
通常、研究ラボや専用のコンピューティングセンターが、従来型およびAIコンピューティング用のスーパーコンピュータのブレード、インターコネクト、ラックを選択する。
Blackwell Systems
HPEとDellは、エヌビディアのBlackwell GPUを搭載し、AI向けに構成可能な新しい高性能サーバーシステムを発表した。
HPEのCray Supercomputing EX154nアクセラレータブレードには、Blackwell GPU 224基とGrace CPU 112基を搭載できる。GPUとCPUはNVLinkインターコネクトで通信する。このシステムは2025年後半に出荷される予定である。
HPEのProLiant Compute XD685は、液冷システムにエヌビディアBlackwell GPUを8基搭載している。GPUはx86 CPUとペアになっている。液冷システムは来年初頭に発売予定である。
デルは、50U標準ラックに最大144基のGPUを搭載する予定のIR7000サーバーを発表した。これは、72基のGPUを搭載するエヌビディアのNVL72のほぼ2倍の規模である。デルのシステムにはGrace CPUが搭載され、液冷方式が採用されている。おそらく来年には出荷されるだろう。
2025年第1四半期に出荷されるPowerEdge XE9685Lは、ブラックウェルGPUとAMDの第5世代CPUを組み合わせた液冷式ラックサーバーである。構成可能なこのシステムは、最大12個のPCIe Gen 5.0スロットを備え、特定のコンピューティングニーズに合わせてカスタマイズできる。1ラックあたり最大96個のエヌビディアGPUをサポートする。
Gaudi3が愛される
HPEは、8つのインテルGaudi 3 AIチップとエメラルドラピッズと呼ばれる第5世代CPUを搭載したProLiant Compute XD680サーバーも発表した。このシステムは2024年12月に出荷される予定である。
デルは空冷式のDell PowerEdge XE7740にGaudi 3チップを搭載し、2025年第2四半期に出荷する予定である。また、Granite RapidsというコードネームのチップであるPコア搭載のXeon 6も搭載している。顧客はGaudi 3チップをエヌビディアのL4またはx86対応のH200 GPUと交換することができる。