世界のスーパーコンピュータとそれを動かす人々


7月 25, 2022

NvidiaとIntel、Atosが開発したスーパーコンピュータ「MareNostrum 5」に搭載

HPCwire Japan

Oliver Peckham オリジナル記事

長い間悩まされていた、注目のスーパーコンピュータ「MareNostrum 5」のベンダーがついに決定した。Atosは、複数のパーティションにNvidiaとIntelの両方のCPUとGPUを搭載したシステムを供給する予定だ。この新しく生まれ変わったシステムは、今年初めに中止された後、2021年後半に入札が再開され、314ピークペタフロップスを実現する。このシステムは、来年に配備される予定だ。

これまでの経緯

2019年6月、BSCはEuroHPCの第1期オクテット・スーパーコンピュータに選ばれた8サイトの1つで、特に数百ペタフロップスの「プリエクサスケール」システムをホストする3サイトの1つに選ばれた。その後、MareNostrum 5の調達や設置のニュースが相次いだが、2021年5月に突然、MareNostrum 5の調達が中止された。

Politicoは、AtosとIBM/Lenovoの入札が競合し、欧州委員会の代表が欧州企業であるAtosの入札を支持し、スペインの代表がIBM/Lenovoの入札を支持して、意思決定者が膠着状態に陥ったと報じていた。また、調達中止の理由は、システムの仕様を更新する必要があったためとする説もある。

2021年12月下旬、MareNostrum 5の調達が再開され、151,410,000ユーロでシステムを募集し、2022年1月31日が締め切りとされた(数週間後、締め切りは2022年2月21日に修正された)。(この1億5,141万ユーロ(約1億6,000万ドル)は、EuroHPC共同事業体とスペイン、ポルトガル、トルコのコンソーシアムが折半で負担することになっている。

仕様

Covid-19 の大流行、サプライチェーンの混乱、地政学的緊張の中で、ヨーロッパのスーパーコンピューティングの主権を強化しようという声と努力が高まっており、Atos は MareNostrum 5 のベンダーとして選択されたわけだが、おそらくこれは容易な予想だっただろう。

NvidiaがHPCwireに語ったところによると、MareNostrum 5はNvidiaのH100 Tensor Core GPUとQuantum-2(別名NDR) InfiniBandネットワーキングを搭載するとのこと。このシステムには、ロスアラモス国立研究所のVenadoシステムでデビューする予定の、緊密にペアリングされたCPUを特徴とするNvidiaのArmベースのGrace CPU Superchipsも搭載される予定である。(NvidiaのGraceとHopper技術についての詳細はこちら)

これはオークリッジ国立研究所で開催された第79回HPCユーザフォーラムフォーラムで確認されたもので、欧州委員会のシニアHPCエキスパートであるレオナード・フローレス氏は、このシステムのより具体的な内訳を披露してくれた。

AtosのBullSequana XH3000アーキテクチャとLenovoのThinkSystemアーキテクチャを組み合わせたMareNostrum 5は、ピーク性能314ペタフロップス、Linpack性能205ペタフロップスの集約的な性能を持つことになるそうだ。4つのパーティションから構成さ れる予定だ。

  • Nvidia Hopper GPUIntel Sapphire Rapids CPUを搭載し、163 Linpackペタフロップスを達成した高速化パーティション。
  • もう1つは、エクサスケール・スーパーコンピュータ「Aurora」に搭載予定の「Ponte Vecchio」GPUの後継となる「Intel Rialto Bridge」GPUと、次世代CPU「Intel Emerald Rapids」を搭載したアクセラレーションパーティション。このパーティションは、4Linpackペタフロップスの規模になる予定。
  • CPUパーティションは、Intel Sapphire Rapids CPUを搭載し、36Linpackペタフロップスを実現する。
  • 最後に、NvidiaのGrace Superchipsを搭載した2つ目のCPUパーティションで、2Linpackペタフロップスの規模になる。
 
  NvidiaのGrace CPU Superchip。画像はNvidiaの提供

EuroHPCのシステムの詳細では、248PBの純容量を持つことを共有し、Nvidiaは、システムが18エクサフロップスのAIパフォーマンスを提供し、欧州連合の最速AIスーパーコンピュータになることが期待されると付け加えている。BSCは、このシステムが 「グリーンエネルギーで完全に駆動し、熱再利用技術を利用する 」と詳しく説明している。

「我々は、2023年6月にランキングに参加できる最初のインストールを見ることができることを望んでいます。できれば、2023年11月に完全なインストールとランキングを見ることができることを望んでいます」とフローレンス氏は述べた。MareNostrum 5 のための新しいデータセンター(MareNostrum 4 を収容するチャペルに隣接する BSC の新しい施設に収容される)は、前回の調達がキャンセルされた昨年の夏、すでに順調に進行していた。EuroHPCによると、このデータセンターの総電力容量は20MW、冷却能力は17MW、PUEは1.08以下とのことだ。

2021年6月時点でMareNostrum 5が設置される部屋。画像提供:Sergio Girona/BSC

 

アプリケーション

MareNostrum 5は、医療研究および医薬品開発に特化しており、調達のやり直しによりシステムの仕様が大きく変更された。また、気候科学や工学などのアプリケーションにも対応する予定だ。Nvidia Omniverseは、これらのアプリケーションのためのデジタルツインの開発を支援する。

「MareNostrum 5の獲得により、気候変動や精密医療の進歩といったグローバルな課題の解決に役立つデジタルツインの作成など、世界を変えるような科学的ブレークスルーが可能になります」とBSCのディレクター、マテオ・バレロ氏は述べている。「さらに、(BSCは)将来世代のスーパーコンピュータに使用されるヨーロッパのハードウェアを開発し、EU加盟国の技術主権の実現に貢献することを約束します。」

EuroHPC

EuroHPC は、最初のプリエクススケールシステム (LUMI) の立ち上げと、5 台の新しいスーパーコンピュータ (EuroHPC 初のエクススケールシステム、ドイツがホスト) のサイト選定で、非常に忙しい数週間を過ごしてきた。EuroHPC の現状については、HPCwire の追加記事をご覧ください。

ヘッダー画像: BSCの新本社。画像はBSC提供