世界のスーパーコンピュータとそれを動かす人々


7月 2, 2021

入札が中止される中、MareNostrum 5の詳細が(ようやく)明らかになる

HPCwire Japan

Oliver Peckham

昨年10月、EuroHPC JUのエグゼクティブディレクターであるAnders Dam Jensenは、MareNostrum 5(最終的なプリエクサスケールのEuroHPCシステム)について、「入札プロセスは最終段階にある」とし、「今後数週間のうちに発表があるだろう」と述べいた。それから8か月が経過したが、システムの状況はいまだに 【複雑である】となっている。しかし、本日開催されたISC21で、バルセロナ・スーパーコンピューティング・センターのオペレーション・ディレクターであるSergio Gironaが発表した内容により、このシステムの詳細が明らかになった。

 
   

まず、簡単な背景を説明しよう(新しい情報を読みたい方は、「ISC21でわかったこと」に進んでください)。EuroHPC JUでは、欧州連合(EU)が世界に向けてスーパーコンピュータを提供するために、8つの初期システムが調達されている。そのうち5つのシステムは明らかにペタスケールである。ブルガリアの「Discoverer」、スロベニアの「Vega」、ポルトガルの「Deucalion」、チェコの「Karolina」、そしてルクセンブルクの「Meluxina」である。これらのうち、「Deucalion」を除くすべてのシステムがTop500にランクインしている。残りの3つのシステムは、EuroHPCのプリ・エクサスケールシステムである。イタリアがホストしている「Leonardo」とフィンランドがホストしている「Lumi」については、すでにホスト側が大々的に詳述している。

MareNostrum 5騒動

最後の(そして最も高価な)プリ・エクサスケールシステムは、バルセロナ・スーパーコンピューティング・センター(BSC)がホストする予定のMareNostrum 5だ。このシステムの開発は、より困難なものであった。Jensenが10月に発言した後、「数週間後」が繰り返され、2021年3月には、JUのプログラムオフィサーであるEvangelos Florosが、MareNostrum 5の入札を「保留中」「まだ進行中のプロセス」と慎重に表現した

しかし、これは、事態が急速に悪化していることを肯定的に捉えているのかもしれない。Politico誌が報じたところによると、AtosとIBM/Lenovoが競って入札したことで、決定権を持つ人々の間で意見が対立していたという。EU全体のアドバイザーは、欧州のコンピュータ・アプリケーション・チェーンを強化するためにAtosを支持し、スペインの関係者は、より良い利益をもたらすと思われるIBM/Lenovoの提案を支持していたのだ。その結果、投票は決着がつかず、プロセスは中断してしまった。

EuroHPC JUの理事会が5月下旬に発表した最新の決定書によると、「投票の結果、選定された入札を採用する合意に達するために必要な過半数に達しなかった」とある。「この決定がなされなかったことにより、スーパーコンピュータ”MareNostrum 5”の購入、納入、設置、保守のための公共調達は中止されることになりました。」

Politico誌によると、Jensenは関係者に手紙を送り、COVID-19がバイオメディカルアプリケーション、医薬品開発、その他の計算生物学のユースケースの必要性を強調していることから、その間に仕様が古くなったために入札が取り消されたのではないかと示唆しているという。しかし、欧州のサプライチェーンの利益と研究の利益との間の政治的緊張が取り下げにつながったのではないかという憶測も残っている。(欧州が自国のコンピューティング・サプライチェーンを構築しようとしていることについては、HPCwireのEuropean Processor Initiativeの議長であるJean-Marc Denisへのインタビューをご参照ください。)

当時、JUの広報担当者は、新たな入札が行われるかどうかについてのコメントを控えていた。しかし、ISCの講演では、少なくともバルセロナ・スーパーコンピューティング・センターは、MareNostrum 5の完成を完全に期待しているというメッセージが明確に伝えられた。

ISC21でわかったこと

MareNostrum 5については、これまでほとんど知られていなかった。BSCは、システムがヘテロジニアスであること、ピーク性能が少なくとも200ペタフロップスに達することを期待していること、5年間のコストが2億2300万ユーロであること、将来のスーパーコンピュータのための新技術を開発するための実験プラットフォームを含むことなどを発表していた。

 

 
MareNostrum 5が設置される部屋(タイムスタンプ付き)。画像提供:Sergio Girona/BSC  
   

今日のGironaの話によると、仕様はほとんど変更されておらず、BSCは新しい大型スーパーコンピュータを搭載するための施設の完成に向けて順調に進んでいるという。Gironaはまず、「MareNostrum 5だけでなく、今後登場する新しいコンポーネント」に対応するために、「合計17メガワットの冷却能力」を持つ冷却塔の画像を公開した。

さらに、「施設用の変圧器はすでに設置されており、生産中です。合計5台、合計20メガワットの容量になります。」と述べ、「低電圧配電盤室は設置の最終段階に入っています。」とし、この容量を2倍にする可能性を考慮して空の列を設けている。

「そして、これが今日現在の計算機室の状況です。」とGironaは続けた。「写真で日付を確認してください。…そして、部屋の中央にサンプルが見えているパイプの配置を待っているところです。このようにして、MareNostrum 5のシステムをインストールするためのコンピュータルームはほぼ完成しました。」

 
  MareNostrum 5の計画図。画像提供:Sergio Girona/BSC.
   

「”MareNostrum 5 “のコンセプトをまだ説明しなければなりません。」とGironaが言うと、早速システムの図を見せた。この図には多くの情報が詰まっている。図によると、MareNostrum 5には、少なくとも2つの汎用パーティション、高速計算パーティション、データの前後処理パーティション、そしてMareNostrum 5が将来のスーパーコンピュータを後押しするという野心に沿って、少なくとも2つの「新興技術」パーティションが用意されている。これらに加えて、BSCのバックアップ・アーカイブシステムに接続された高性能ストレージが搭載される予定だという。

スライドによると、汎用パーティションは「MPI、OpenMPコード(または標準的なHPCコード)を持つすべての研究者に開放されており」、「数千のノード」に対して「高いスケーラビリティ」を持つと説明されている。一方、高速化パーティションは 「数千のGPU 」に対応し、新興技術パーティションは 「エクサスケール時代に向けたワークロードの準備 」と 「エクサスケール技術の評価」を目的としています。」と述べている。

そしてそのまま、画面から消えた。

Gironaは、「我々は入札プロセスを完了していません。ご存知のように、システムの仕様変更に伴い、入札プロセスはキャンセルされました。JUの理事会の決定を待って、入札を再開する予定です。」と述べた。

また、「スケジュールに変更はありません。今年の年末には、いくつかのパーティションにシステムを設置できるようになると考えています。」