世界のスーパーコンピュータとそれを動かす人々


6月 15, 2023

MareNostrum 5がスピードアップ、象徴的なチャペルが量子システムのホストに

HPCwire Japan

Oliver Peckham オリジナル記事

バルセロナ・スーパーコンピューティング・センター(BSC)の次世代スーパーコンピュータであり、EuroHPCを代表するプリ・エクサスケールシステムの1つであるMareNostrum 5は、2020年の発表以来、現実への道のりが険しかった。そのため、ハンブルクで開催されたISCのステージに立ったBSCのオペレーションディレクターであるセルジ・ジローナ氏は、笑いと肩をすくめながら、このシステムの最新の(比較的小さな)遅延を発表した–結局、MareNostrum 5のタイムラインは、これよりもずっと悪い状況を見てきた。(その経緯については、過去の記事を読んでいただきたい)

ちょうど3ヶ月前にジローナ氏に話を聞いたときには、MareNostrum 5の設置が始まり(ストレージシステムだけだが)、6月末の最終検収に向け順調に進んでいたところだった。ISCでのプレゼンテーションでジローナ氏は、1月に予定されていたネットワークとストレージシステム(2月に話を聞いたときにはまもなく到着すると予想されていた)が、今月末にいくつかのコンポーネントが延期されたことを明かした。それでもジローナ氏は、設置が完了した未完成のハードウェアにユーザーデータを移し始めているという。

インテルのCPU「Sapphire Rapids」を搭載した35.4 Linpackペタフロップスの汎用パーティションは、2月末までに完成すると予想されていた。今は ジローナ氏は、「5月末に納品される予定です」と言い、芝居がかった指の振り方をした。「しかし、それはないでしょう」と彼は認めた。「それは来るだろうけど、予定通りにするのは簡単じゃないんです。」

ISCでのセルジ・ジローナ氏

 

そして、より強力なアクセラレーションパーティション: 163 Linpackペタフロップスは、Sapphire Rapids CPUとNvidia Hopper GPUによって実現されている。ジローナ氏は、「6月までに納品される予定でした」と言いながら、またもや指をくわえている。「いや、現時点では、9月頃になるかもしれないという情報が入っています。私たちは、このシステムを運用するために懸命に働いているんです。」

「しかし、良いニュースはこれだけではありません!」 とジローナ氏は冗談を言った。「我々は、異なる技術による追加のサーバーと追加のシステムを提供することも計画していました」 その2つの追加パーティションのうち、NvidiaのGrace CPUを搭載した汎用的なものは、「予定通り、順調に進んでいます!」しかし、もう1つは、インテルのCPU「Emerald Rapids」とGPU「Rialto Bridge」で動作する予定であった。ただ、1つ問題がある: Rialto Bridgeはインテルがキャンセルしてしまったのだ

MareNostrum 5の全パーティションのステータス 画像提供:セルジ・ジローナ氏

 

「このパーティションの我々のクラスタは再分析されており、我々のユーザーが行っている科学の実行に役立つ新しい技術を評価することになるでしょう」とジローナ氏は言う。

少なくとも他のインフラは順調に進んでおり、ジローナ氏はデータセンターの進捗状況を示す画像をいくつか紹介している。「チャペルに対抗するのは難しいん ですよ、いいですか」と、現在MareNostrum 4をホストしているBSCの有名なチャペルデータセンター(ヘッダーの写真)を引き合いに出して、彼は言った。

5月22日に見たMareNostrum 5のデータセンター 画像提供:セルジ・ジローナ氏

 

チャペルといえば 「次は(MareNostrum 5の後)何をするつもりなんだろう」 とジローナ氏は続けた。「礼拝堂の中に量子システムを構築している。つまり、礼拝堂はバルセロナで行う量子システムのホストに再利用されることになります。」

「そして次に、MareNostrum 6を構築するんです」と彼は付け加えた。