El Capitan登場、Frontierを越える
Kevin Jackson オリジナル記事「The Captain Has Crossed the Frontier」
TOP500の第64版によると、El Capitanがトップの座を獲得し、Frontier、Auroraに続いて正式にエクサスケールコンピューティングに到達した3番目のシステムとなった。両システムは、それぞれ2位、3位に後退している。さらに、新しいシステムがトップ10にランクインした。
米国カリフォルニア州ローレンス・リバモア国立研究所の新しいEl Capitanシステムが、HPLスコア1.742 EFlop/sで最強のシステムとしてデビューした。このシステムは、CPUとGPUのコアを合わせて11,039,616個搭載しており、24コア1.8GHzのAMD第4世代EPYCプロセッサとAMD Instinct MI300Aアクセラレータをベースとしている。El Capitanはデータ転送にCray Slingshot 11ネットワークを使用しており、エネルギー効率は58.89 Gigaflops/wattを達成している。この電力効率の評価も、El CapitanがGREEN500リストで18位を獲得するのに貢献した。
米国テネシー州オークリッジ国立研究所のFrontierシステムは、2位にランクアップした。HPLスコアは前回のリストでは1.206 Eflop/sであったが、今回のリストでは1.353 Eflop/sに向上した。また、Frontierの総コア数も前回のリストでは8,699,904コアであったが、今回のリストでは9,066,176コアに増えている。データ転送にはCrayのSlingshot 11ネットワークを使用している。
米国イリノイ州にあるアルゴンヌ・リーダーシップ・コンピューティング・ファシリティのAuroraシステムが、今回のTOP500リストで第3位にランキングされた。このマシンは、前回のリストと同じHPLベンチマークスコアを維持し、1.012エクサフロップスを達成した。Auroraは、インテルがHPE Cray EX – Intel Exascale Compute bladeをベースに構築したもので、インテルXeon CPU MaxシリーズプロセッサーとインテルデータセンターGPU Maxシリーズアクセラレーターを使用し、CrayのSlingshot-11ネットワークインターコネクトを介して通信を行う。
米国のMicrosoft AzureクラウドにインストールされたEagleシステムは4位を獲得し、TOP500で最高ランクのクラウドベースのシステムとなっている。HPLスコアは561.2PFlop/sである
TOP5にランクインした新システムは、5位のHPC6システムのみである。このマシンは、イタリアのフェッラーラ・エルボニョーネにあるEni S.p.A.のセンターに設置されており、2位のシステムFrontierと同じアーキテクチャを採用している。EniのHPC6システムはHPLベンチマークで477.90 PFlop/sを達成し、現在ヨーロッパ最速のシステムとなっている。
トップ10にランクインしたシステムの概要は以下の通りである:
- 米国カリフォルニア州ローレンス・リバモア国立研究所のEl Capitanシステムが、TOP500の新しい第1位のシステムとなった。HPE Cray EX255aシステムは、HPLベンチマークで1.742エクサフロップ/秒を記録した。El Capitanは11,039,616コアを備え、AMD第4世代EPYC™プロセッサー(24コア、1.8GHz)とAMD Instinct™ MI300Aアクセラレーターを搭載している。データ転送にはCray Slingshot 11ネットワークを使用し、エネルギー効率は58.89ギガフロップス/ワットを達成している。
- Frontierは現在、TOP500で2位のシステムとなっている。このHPE Cray EXシステムは、1エクサフロップスを超える性能を達成した初の米国のシステムである。このシステムは米国テネシー州のオークリッジ国立研究所(ORNL)に設置され、エネルギー省(DOE)によって運用されている。現在、8,699,904コアを使用して1.353エクサフロップスを達成している。HPE Cray EXアーキテクチャは、HPCとAIに最適化された第3世代AMD EPYC™ CPUとAMD Instinct™ 250Xアクセラレータ、およびSlingshot-11インターコネクトを組み合わせている。
- Auroraは現在、暫定HPLスコア1.012エクサフロップス/秒で第3位となっている。米国イリノイ州にあるアルゴンヌ・リーダーシップ・コンピューティング・ファシリティに設置されており、エネルギー省(DOE)によって運用されている。この新しいインテルシステムは、HPE Cray EX – Intel Exascale Compute Bladesをベースとしている。Intel Xeon CPU Max シリーズプロセッサ、Intel Data Center GPU Max シリーズアクセラレータ、Slingshot-11インターコネクトを使用している。
- No.4のシステムであるEagleは、マイクロソフトがAzureクラウドに構築した。このマイクロソフトのNDv5システムは、Xeon Platinum 8480CプロセッサとエヌビディアH100アクセラレータをベースとしており、HPLスコアは561ペタフロップ/秒を達成した。
- 新しい5番目のシステムは「HPC6」と呼ばれ、イタリアのフェッラーラ・エルボニョーネにあるEni S.p.Aセンターに設置されている。これは、HPCとAI向けに最適化された第3世代AMD EPYC™ CPU、AMD Instinct™ 250Xアクセラレータ、およびSlingshot-11インターコネクトを搭載した別のHPE Cray EX235aシステムである。このシステムは477.9ペタフロップ/秒を達成した。
- 6位の「富岳」は、神戸の理化学研究所計算科学研究機構(R-CCS)に設置されている。7,630,848コアを搭載しており、HPLベンチマークスコアでは442ペタフロップスを達成した。HPCGベンチマークでは16テラフロップスを記録し、依然として最速のシステムである。
- 最近アップグレードされたスイス国立スーパーコンピュータセンター(CSCS)に設置されたアルプスシステムは、現在7位にランクインしている。これは、エヌビディア・グレース72CとエヌビディアGH200スーパーチップ、およびSlingshot-11インターコネクトを搭載したHPEのCray EX254nシステムである。アップグレード後、434.9ペタフロップ/秒を達成した。
- フィンランドのCSCのEuroHPCセンターに設置されたもう1台のHPE Cray EXシステムであるLUMIシステムは、性能が380ペタフロップ/秒で8位である。欧州ハイパフォーマンスコンピューティング共同事業体(EuroHPC JU)は、ビッグデータの処理に対応する最高水準のエクサスケール・スーパーコンピュータの開発に向けて、欧州の資源を結集している。欧州全域を対象とするエクサスケール・スーパーコンピュータの1つであるLUMIは、フィンランドのカヤーニにあるCSCのデータセンターに設置されている。
- 9番目のシステムであるLeonardoは、イタリアのCINECAにあるEuroHPCの別の拠点に設置されている。これは、Xeon Platinum 8358 32C 2.6GHzをメインプロセッサとし、NVIDIA A100 SXM4 40 GBをアクセラレータ、Quad-rail NVIDIA HDR100 Infinibandを相互接続に採用した、Atos BullSequana XH2000システムである。HPL性能は241.2ペタフロップスを達成した。
- トップ10の最後尾を飾るのは、米国カリフォルニア州ローレンス・リバモア国立研究所にも設置された新しいTuolumneシステムである。これは、新しいNo.1システムEl Capitanの姉妹システムであり、アーキテクチャは同一である。単独で208.1ペタフロップスを達成した。
その他のTOP500ハイライト
TOP500の第64版では、トップ10のシステムにはAMDとIntelのプロセッサが好まれていることが分かった。5つのシステムはAMDプロセッサ(El Capitan、Frontier、HPC6、LUMI、Tuolumne)を使用しており、3つのシステムはIntel(Aurora、Eagle、Leonardo)を使用している。Alpsはエヌビディアのプロセッサを使用しており、「富岳」はARMベースの富士通A65FX 48コア2.2GHzの独自プロセッサを使用している。
トップ10のスーパーコンピューターのうち7台は、Slingshot-11インターコネクトを使用している(「El Capitan」、「Frontier」、「Aurora」、「HPC6」、「Alps」、「LUMI」、および「Tuolumne」)。一方、残りの2台はInfinibandを使用している(「Eagle」および「Leonardo」)。「富岳」は独自のTofuインターコネクトを使用している。
今回も中国と米国がTOP500リストの全エントリー数で最多を占めたが、中国は以前ほど参加していないようだ。米国はリストに4システムを追加し、合計数は168となった。中国は今回もリスト上の代表マシンの数を80から63システムに減らした。前回と同様、中国はTOP500リストに新たなマシンを追加しなかった。ドイツは41台のマシンをリストに追加し、中国に急速に迫っている。
大陸別に見ると、前回リストでヨーロッパがアジアを追い越したという番狂わせは、今回も変わっていない。北米には181台、ヨーロッパには161台、アジアには143台のマシンがリストに記載されている。
GREEN500 結果
今回の GREEN500 では、トップ3リストの新しいシステムに大きな変化が見られ、1位以外の順位にも変動があった。
再び1位に輝いたのは、ドイツのユーロHPC/FZJのシステムであるJUPITER Exascale Development Instrument(JEDI)であった。 TOP500で224位となったJEDIは、HPLスコアが4.5PFlop/sであったのに対し、エネルギー効率の評価は前回のリストと同じ72.73GFlops/Wattであった。JEDIは、グレースホッパー・スーパーチップ72c 2GHz、エヌビディアGH200スーパーチップ、Quad-Rail NVIDIA InfiniBand NDR200を搭載したBullSequana XH3000マシンで、合計19,584コアがある。
今回のGREEN500で第2位となったのは、フランスのシャンパーニュ=アルデンヌ地方にあるROMEO HPCセンターに新しく導入されたROMEO-2025システムである。このシステムは、エネルギー効率の評価で70.91 GFlops/Wattを記録し、HPLベンチマークでは9.863 PFlop/sを記録した。このシステムは新しいものだが、そのアーキテクチャはJEDIと同じであり、規模は2倍である。そのため、エネルギー効率はやや低くなっている。
第3位は、フランスの国立スーパーコンピューティング設備センター(GENCI-CINES)の新しいAdastra 2システムが獲得した。Adastra 2がこのTOP500リストに初めて登場した際のエネルギー効率スコアは69.10 GFlops/Watt、HPLスコアは2.529 PFLop/sであった。このマシンは、AMD 第4世代 EPYC 24コア 1.8GHz プロセッサ、AMD Instinct MI300A アクセラレータを搭載した HPE Cray EX255a システムであり、合計 16,128 コアを備え、Slingshot-11 で RHEL を実行している。
新しいEl CapitanシステムとFrontierシステムは、いずれも特筆に値する。HPLベンチマークで1.742 EFlop/sという最高得点を獲得したことを考慮すると、エネルギー効率スコア58.89 Gigaflops/wattでGREEN500の18位に入ったことは非常に素晴らしい。前回のTOP500リストで1位、今回のリストで2位となったFrontierは、今回のGREEN500リストで54.98 Gigaflops/wattという素晴らしいエネルギー効率スコアを記録した。 これら2つのシステムは、いずれもエネルギー効率を優先しながら、非常に高い演算能力を実現できることを示している。
HPCGの結果
TOP500リストには、スーパーコンピュータの性能を評価する代替指標となる、高性能共役勾配法(HPCG)ベンチマークの結果が反映されている。このスコアは、HPL測定を補完し、マシンをより深く理解することを目的としている。
- スーパーコンピュータ「富岳」は、16PFlop/sでHPCGベンチマークの首位を維持している。2020年6月以来、首位を維持している。
- DOEシステムであるORNLのFrontierは、14.05 HPCG-Pflop/sで2位を維持している。
- Auroraシステムは、5.6 HPCG-ペタフロップスで再び3位を獲得した。
- El Capitanに対するHPCGの評価はまだ提出されていない。
HPL-MxP 結果(旧 HPL-AI)
HPL-MxP ベンチマークは混合精度計算の利点を明らかにすることを目的としている。従来の HPC では 64 ビット浮動小数点演算が使用されていた。現在では、32 ビット、16 ビット、さらには 8 ビットなど、さまざまなレベルの浮動小数点精度を持つハードウェアが存在する。HPL-MxPベンチマークは、演算中に混合精度を使用することで、はるかに高い性能が実現できることを示している。数学的手法を用いることで、64ビット精度の演算と比較して、混合精度技術でも同等の精度を達成できる。
- HPL-MxP部門の今年の受賞者は、11.6 EFlop/sを記録したAuroraシステムである。2位は11.4を記録したFrontier、3位は2.35 EFlop/sを記録したLUMIである。