世界のスーパーコンピュータとそれを動かす人々


4月 10, 2023

EuroHPCサミット: エクサスケール、エネルギー、産業、そして主権に挑む

HPCwire Japan

Oliver Peckham オリジナル記事

2023年のEuroHPCサミットがヨーテボリで開幕したとき、EuroHPCの運営委員会議長であるハーバート・ザイゼル氏は、このプロジェクトが「10代の頃を脱した」とコメントした。実際、欧州連合(EU)のスーパーコンピューティング事業は、デビュー以来4年半の間、HPCの目覚ましい成長を遂げ、全体的に成熟してきた感がある。現在、6台のスーパーコンピュータ(うち2台はTop500のトップ5にランクイン)を擁し、さらに多くのスーパーコンピュータを導入予定であるEuroHPCは、エクサスケール時代への準備として、スーパーコンピューティングのリーダーにふさわしい課題に直面している。

簡単な復習

EuroHPC Joint Undertaking JU)は、2018年9月にHorizon 2020プログラムから欧州連合のスーパーコンピューティングへの取り組みの組織を引き継いだ。2019年6月、28カ国が支援する新JUは、最初の8台のスーパーコンピューターのサイトを発表した。その後、数カ月にわたって詳細に説明されたこの最初のリストには、5台のペタスケールシステムと3台の大型「プリ・エクサスケール」システムが含まれていた。それから4年弱が経過した現在、5つのペタスケールシステムのうち4つと、3つのプリ・エクスカスケールシステムのうち2つがオンラインになっている。プリ・エクスカスケールシステムには、フィンランドのLUMIスーパーコンピュータ(Top500で3位)や、EuroHPCの最新システムであるイタリアのLeonardoスーパーコンピュータ(Top500で4位)などが含まれるのは言うまでもない。まだ作業中: ポルトガルのペタスケールDeucalionシステムとスペインのプリ・エクスカスケールMareNostrum 5システムについては、後述する。

昨年6月、JUは、現在33カ国が支援し、さらに多くの国が参加する見込みであるが、4つの「ミッドレンジ」システム(ペタスケールまたはプリ・エクサスケール)とドイツのユーリッヒ・スーパーコンピューティングセンター(FZJ)がホストとなる最初のエクサスケールシステム「JUPITER」の計5つの新システムの計画とサイトを発表した。また、JUは2022年10月に、初の量子コンピュータのホストサイトを6カ所選定した

システムはどのような状況にあるのか

EuroHPC Summitでは、とてつもないアップデートや衝撃的な発表が行われたわけでは無い。一般的には、JUが環境的、経済的、政治的に持続可能な方法で前進する方法について、思慮深く探求するものであった。とはいえ、JUのさまざまな事業について、静かなロードマップの更新があった。

Leonardo:Leonardoは前回のTop500に登場したが、174.7Linpackペタフロップスと、まだフルパワーに達していない状態である。今回のサミットでは、EuroHPCが次回のTop500リストで同システムが240Linpackペタフロップスを達成することを期待していることが確認さ れた。

Deucalion: EuroHPCの最初の5つのペタスケールシステムの中で、一人取り残されたDeucalionは、2021年後半に納品される予定になっていた。このシステムのスケジュールは何度かずれ込んでいたが、現在は「最終調整中」で、今年の「初秋」に受理される予定だ。富士通製のスーパーコンピューターは、AMDのCPU、富士通のArm CPU、NvidiaのGPUを使用しているという、このシステムの変則的なアーキテクチャを考えれば、この遅延は、おそらく、それほど驚くべきことではないだろう。

 
  MareNostrum 5のテープが装着される。画像提供:BSC
   

MareNostrum 5:長らく悩まされてきた3番目のプリ・エクスカスケールシステムが、ついにバルセロナ・スーパーコンピューティング・センター(BSC)の新本部に設置されることになった。EuroHPCのエグゼクティブディレクターであるアンダース・イェンセン氏(ヘッダーの写真)は、このシステムが2023年に稼働することを確認し、ピーク性能は300ペタフロップスを超えるだろうと述べ、これは事前に聞いた推定値(314ピークペラフロップス、205リンパックペラフロップス)に一致するものである。

EuroHPCのインフラ責任者であるエヴァンゲロス・フロロス氏は、MareNostrum 5のネットワーク、ストレージ、管理ノードが設置され、BSCは今年6月の汎用パーティションの受け入れを目標としていると詳しく説明した。このパーティションは、IntelのSapphire Rapids CPUを搭載し、90ラック、6,480CPU、36Linpackペタフロップスと、CPUのみのパーティションとしては世界最大級になるとフロロス氏は語る。さらに大規模なメインアクセラレーションパーティション(Nvidia Hopper GPUとSapphire Rapids CPU、163 Linpackペタフロップス)は、Deucalion同様、今年の「初秋」にデビューする予定だ。このうち1つは、Intelが今月初めにRialto Bridge GPU計画を中止したため、宙に浮いた状態になっている。

JUPITER:EuroHPCの最初のエクサスケールスーパーコンピュータは、発表当初2023年の設置を目指していたが、米国のエクサスケールタイムラインと同様に、EuroHPCのエクサスケールタイムラインも遅れている。フロロス氏は、候補となるベンダーが絞られたところで、EuroHPCは今年の第4四半期までにJUPITERの契約を結び、2024年の第1四半期に設置開始することを目指していると説明した。JUは、2024年第4四半期までに少なくとも1つの「大きなパーティション」を受け入れ準備したいとしている。

JUPITERについては、他にもいくつかのソフト的な詳細が発表されている。EuroHPCは、GPUで加速する主要なパーティションで1エクサフロップスの性能を維持することを目標としている。FZJのトーマス・リッパート氏は、システムの一般的な目標として、ピークエクサフロップス1.3(前身のJUWELSの20倍のピーク)を挙げた。JUPITERはコンテナ型のデータセンターでホストされる。フロロス氏は、JUPITERをホストするために「コンクリートの建物は建設しない」と述べた。このシステムには、1エクサバイトを超えるストレージが付随する予定だ。フロロス氏はまた、JUPITERの「モジュールの1つ」のために、ヨーロッパ製のCPUのようなヨーロッパの技術が「潜在的なソリューションの一部」になる可能性はまだあると述べた。欧州委員会の通信ネットワーク・コンテンツ・技術担当副局長であるトーマス・スコルダス氏は、JUPITERへの欧州製プロセッサの統合は、おそらく来年に行われるだろうと述べた。

JUPITERの構造と可能性。画像提供:FZJ

 

新たに登場した4つのミッドレンジシステム: これは不透明なものだ。JUPITERと同時に発表されたミドルレンジシステムは、Daedalus(ギリシャ)、Levente(ハンガリー)、CASPIr(アイルランド)、EHPCPL(ポーランド)の4機種。しかし、この4つのうち、ジェンセン氏はDaedalusについてだけ言及し、「4つの(システムが)控えている」と言及した。ギリシャのDaedalusとポーランドのCYFRONETのEHPCPLの2つある。ハンガリーとアイルランドのシステムについては、プレゼンテーションの中で共有された地図に含まれていたものの、私たちが見た限りでは、議論さ れなかった。

ダイダロスについて:ホスティング契約は締結され、JUは調達を進めたいと考えている。我々の知る限り、性能目標(>20-30ペタフロップス)も新しい情報である。

2台目のエクサスケールシステムと追加のミッドレンジシステム: EuroHPCは、2台のエクサスケールマシンの初期セットを計画しており、2台目のマシンのかなりの部分を自国技術で賄うという野望を抱いている。フロロス氏は、2025年までに2台目のエクサスケールシステムを稼働させ、1台目のシステムを「補完」し、ヨーロッパの技術に依存したシステムにすることが目標であると述べている。EuroHPCの研究・イノベーション責任者であるダニエル・オパルカ氏は、このシステムにEPI(European Processor Initiative)の汎用プロセッサーを搭載したいと述べている。

ジェンセンは、そのシステムと追加のミッドレンジ・システムに関する開示は、今後数ヶ月で期待できると述べている:「遠くない将来に、ミッドレンジと2番目のヨーロッパのエクサスケールシステムの両方を発表できることを望んでいます。」

ポストエクサスケールの時代: 最初のエクサスケールシステムを前にして、EuroHPCは2026年に始まるポストエクサスケールの時代を目標としている。この時代のJUのビジョンの詳細は不明だが、自国産の技術でポストエクサスケールのEuroHPCシステムを動かし、2029年頃に「主権を持つEU HPC」を実現するという言及が繰り返された。BSCのオペレーション・ディレクターであるセルジ・ジローナ氏は、MareNostrum 6を2029年から2030年までの設置・生産を目標とするポストエクサスケールのスーパーコンピュータとして取り上げ、長期的に達成可能なビジョンを持つことの必要性を訴えたことがある。しかし、ポスト・エクサスケールの時代について最も示唆に富む言葉は、リッパートの言葉だった。「お願い:エクサスケールを正しく理解しましょう。」

EuroHPCが現在行っている取り組みと計画の推定年表。画像はEvangelos Florosの提供

 

優先順位と課題

エクサスケールの実現と主権をめぐる動きは以上の通りだが、サミットではそれ以外にもさまざまな問題が提起された。ザイゼル氏は、JUが戦略計画の更新に向けて取り組むべき課題として、開発のスピードアップ(「We need more speed」)、ユーザー代表、PRACEが提供するコミュニティへの配慮、実験システムの確立などを挙げた。特に、産業とエネルギーという2つのテーマが、今回の講演を貫いた。

産業界: スコルダス氏は、EuroHPCを通じて産業界のスーパーコンピュータへのアクセスを拡大する計画について述べ、産業用スーパーコンピュータのホスティングと運用への関心表明の呼びかけを行った。このコンピュータは、安全なアクセス、データの保護、使いやすさの向上など、産業界の要求に応えるために特別に設計される予定だという。「ここでは、産業界のニーズに対応した専用のスーパーコンピューティングインフラを持つことへの民間企業の関心が高まっています。」スコルダス氏は、「大規模なAIモデルに特化した能力も含まれます」と述べている。

サミットでは、「EUにおける産業用スーパーコンピュータへの意欲 」に関する全体会議が行われた。講演や議論の中で、参加者は、そのようなマシンに対する意欲は本物であるが、その成功は価格とセキュリティに大きく依存することを明らかにした。(NCSAのブレンダン・マクギンティ氏は、先日取り上げたデータセキュリティをターゲットにしたNightingaleシステムに言及し、米国の視点について語った。)

エネルギー: ザイゼル氏は、エネルギーと気候に焦点を当てた2つの優先事項、すなわち、第一にEuroHPCのエネルギーコストの削減、第二に二酸化炭素排出量の削減を挙げた。サミット全体を通して、パネリストや講演者は、「Frontier」や「富岳」のようなシステムの驚異的なエネルギー予算を挙げ、現在のトレンドに基づく将来のHPCエネルギー使用について悲惨な予測を立て、今後登場するシステムのエネルギー使用を管理する必要性について非常に強く訴えた。

 
  LUMIのデータセンター。画像提供:CSC
   

 

ロケーションの重要性については、コンセンサスが得られているようだった。「プロセッサーなどの技術的なソリューションも重要です」とザイゼル氏は言う。「しかし、LUMIの例が示すように、包括的なシステムレベルのソリューションが不可欠であり、その鍵になるかもしれません。」フィンランド北部に位置するLUMIは、完全に再生可能な水力発電と併設されており、その排熱で近隣の住宅を温めている。北に位置するため、冷房も少なくて済む。

LUMIのホストであるCSCのオペレーションディレクター、ペッカ・レフトヴオリ氏も当然ながら同意している。「最も重要なのは、グリーンエネルギーの使用を選択することです」とレフトフオリ氏。「その後に続くものはプラスになりますが、最初の選択の効果を補うことはできません」。レフトフオリ氏はプレゼンテーションの中で、立地は “システムや運用レベルの最適化よりも何桁も重要 “であると主張した。

スウェーデン研究所(RISE)のディレクターであるトール・ビョルン・ミンデ氏も、「場所は非常に重要です」と同意し、同じ10MWのデータセンターがヨーロッパの異なる地域で、極めて異なる炭素排出量を生み出していることを説明した。「フィンランド人は正しいことをしたのです」とミンデ氏は言う。

もちろん、レフトヴオリ氏が指摘したように、スーパーコンピューターの設置場所に関する「政治的な選択」は、依然として長期間放置できない大型システムを生み出し、設置された場所で運用する必要があるため、他の戦略も提案さ れた。そのため、さまざまな講演者が、コードの最適化、グリッド価格に対応したロードシェーピング、エネルギー・トゥ・ソリューションの優先順位付けによるユーザーのインセンティブ、データ移動を最小化するインメモリコンピューティングの利用などについて議論した。興味深いことに、フロロス氏は、JUPITERの調達には、ベンダーがエネルギー効率を活用し、期待される運用の節約を取得コストに反映させるためのオプションが含まれていると指摘した。

スーパーコンピューティングのリーダーとしてのEuroHPC

大きな発表がなかったにもかかわらず、EuroHPC Summitは勝利の雰囲気に包まれた。過去数年間の印象的なシステム発表に加え、ジェンセン氏は、JUが昨年スタッフを倍増させ、現在までに15億以上のコアアワーをシステムで稼動させていることを紹介した。ヨーロッパを「HPCの世界的な大国」にしようという呼びかけが、初めて少し奇妙に聞こえました – 結局、そうなったのでは?