世界のスーパーコンピュータとそれを動かす人々


5月 30, 2022

Top500発表、米国Frontierの登場でエクサスケールが本格登場、富岳は2位

HPCwire Japan

Tiffany Trader オリジナル記事(2022/05/30)

ドイツのハンブルクで開催されているISC2022において本日発表された第59回Top500リストでは、史上初のエクサスケールシステムがランクインし、スーパーコンピューティングの新時代を公式に示している。エネルギー省オークリッジ国立研究所に設置されたFrontierは、テネシー州オークリッジで金曜日の午前中に2時間30分かけて行われたハイパフォーマンスLinpackの実行で、1.102エクサフロップスを達成した。このリストの共同執筆者であるジャック・ドンガラ氏によれば、Frontierがこのリストに登場することは広く予想されていたが、1エクサフロップスのラインを超えた実行は、間一髪のところで提出されたものだという。

 

新しいFrontier

Frontierは、74台のCray EXキャビネットに9,408ノードを収容し、それぞれにAMD Milan “Trento” 7A53 Epyc CPUを1個とAMD Instinct MI250X GPUを4個搭載して構成されている。総GPU数は 37,632基である。ノード間はHPEのインターコネクト「Slingshot-11」で接続されている。各ノードは、CPUに512GiBのDDR4メモリ、ノード全体で512GiBのHMB2e(GPUあたり128GiB)コヒーレントメモリを搭載している。

提供:ジャック・ドンガラ氏、アル・ガイスト氏

 

Linpackの性能は1.102エクサフロップスで、FrontierはTop500の次の7つのシステムの合計よりも高速だ。昨日開催されたメディア向け事前説明会で、オークリッジ国立研究所のトーマス・ザカリア所長は、「0.1も割り引くことはできない」と語った。「0.1は100ペタフロップスに相当するため、四捨五入して考えがちですね。しかし、小数点以下は大きな能力を表しているのです。」

 
   

OLCF(Oak Ridge Leadership Computing Facility)の372平方メートルの敷地に、Frontierは9.2ペタバイトのメモリ(4.6ペタバイトのDDR4と4.6ペタバイトのHBM2e)を集約している。また、37ペタバイトのノードローカルストレージと、716ペタバイトのセンターワイドストレージにアクセスできる。

FrontierのTop500エントリには、ピーク速度(rPeak)が1.69ペタフロップスと記載されているが、HPEとオークリッジの関係者は、さらなる最適化によりピーク速度をプロジェクト目標の2ペタフロップスにまで高めることができると予想している。この場合、Linpackのスコアも向上する(現在65.4%しかないLinpackの効率も向上すると思われる)と、昨日行なわれたメディアブリーフィングでトーマス・ザッカリア氏が確認している。

トップ10

エクサスケールの壁が破られただけでなく、トップ10に3つの新システムがランクインし、リーダー層にも活発な動きが見られた。Frontierの快挙に加え、EuroHPCのLUMIが3位、GENCIのAdastraが10位を獲得した。両機はFrontierに続き、同じHPE Cray EXアーキテクチャ(AMD Milan CPU、AMD Instinct MI250X GPU、Slingshot-11ネットワーキング)を利用している。

フィンランドのカヤーニにある CSC のデータセンターに設置された LUMI は、EuroHPC コホートで最も大きなマシンだ。LUMI は,潜在的な理論値 214.3 ペタフロップス のうち 151.90 ペタフロップスを達成し,これは 71% の Linpack 効率に相当する。このTop500のマシンは、完全なシステム仕様の一部を構築したものと思われる。LUMIのメインパーティションは、550ピークペタフロップスのうち375HPLペタフロップスを達成する見込みであると、CSCとEuroHPCは以前に報告している。

トップ10にランクインしたフランスのGENCI Adastraマシンは、理論ピーク61.6ペタフロップスのうち46.1 Linpackペタフロップスを達成し、Linpack効率は75%に達したとのことだ。

HPE Cray EXの新システムであるFrontier、LUMI、Adastraは、Top500を獲得しただけでなく、Green500ランキングでも上位にランクインした。62.68ギガフロップス/ワットのエネルギー効率を達成したGreen500の第1位は、Frontier Test and Developmentシステムだ。Crusherとして知られるFrontier-TDSは、Cray EX Frontierスーパーコンピュータの1.5キャビネット版で、19.20 Linpackペタフロップス(理論ピーク23.11)を達成し、Top500で29位にランクインしている。

 
   

Frontierは、52.23ギガFLOPS/WでGreen500の2位にランクインしている。LUMIは1ワットあたり51.63ギガフロップスでGreen3位を獲得している。FrontierとFrontier-TDSは、より厳格な電力品質レベル3での申請だった。

Frontierが1位に躍り出たことで、理研の442ペタフロップスの富岳マシンが2位となった。富士通Arm A64FXシステムは、2020年6月にリスト入りしてから4期、Top500の王者となった。A64FXのCPU(1x)ノード数は158,976で、富岳はTop500ランキング1位、混合精度HPL-AIランキング1位(2021年11月に性能アップして2.0エクサフロップスを記録)、HPCGランキング1位(16ペタフロップス)を維持、Green500でも同機が健闘してきた。富岳、ミニ富岳(「A64FXプロトタイプ」)、そして同じくA64FXチップを採用したWisteriaは、Green500のトップ50(実際はトップ57!)の中で唯一、アクセラレータを使用していないシステムである。このシステムは、現在のGreen500のリストで、それぞれ34位、30位、35位となっている。

新しい3位のLUMIに続くのは、IBMのSummit(4位)とSierra(5位)、そして中国のTianhe-1Aが6位となっている。NERSCのPerlmutter HPE Cray EXシステムは、現在7位となっている。そして、8位にNvidiaの「AIスパコン」Seleneが入り、中国/NUDTの「Tianhe-2A」が続いている。

トップ10コーホートで表されるプロセッサは、AMD CPU、AMD GPU、富士通のArmチップ、IBM Power CPU、Sunway CPU、Nvidia GPUなどだ。このグループの中でIntel CPUを使用しているのは、もともと中国・天津の国立スーパーコンピュータセンターに設置された2010年代のTianhe-1Aシステムと、中国・広州の国立スーパーコンピュータセンターに設置された2013年代のTianhe-2Aシステムだけだ。

 
  トーマス・ザカリア氏
   

 

上位10システムは、3.22ピークエクザフロップスのうち2.27HPLエクサフロップスを達成し、70.53パーセントの効率性を実現している。

より広範なリスト

Top500リスト全体の集約性能が1.22複合エクサフロップスで初めてエクサフロップスの壁を越えたのは、わずか4年前の2018年6月のことだった。今回のリストの合計集計性能は、理論ピークエクサフロップス6.85のうち4.40エクサフロップス(効率77.8)である。

また、この最新リストの上位100台の合計性能は、リストの後半を占める、より疎結合なIT/Webマシンではなく、真のHPCマシンの大まかな代理として見るのに役立つ。このトップ 100 のグループは、潜在的な 4.76ピークエクサフロップスに対し 3.31 エクサフロップスを達成し、これは 69.48% Linpack 効率となる。

第59回Top500リストでは、合計39のシステムが新たにランクインし、その地域分布は広範囲に及んでいる。米国が9件と最も多く、次いでドイツが5件となっている。中国は、ほぼ10年ぶりに新システムがランクインしていない。しかし、それでも中国は最も多くのシステムをリストアップしている。中国が173基であるのに対し、米国は127基で2番目に多い。しかし、性能別シェアでは、Frontierにより米国が大きくリードしている。4.40エクサフロップスのうち、米国は2.08エクサフロップスを獲得している。一方、中国は530.24ペタフロップスとなり、米国の約25%に落ち込んだ。

不在が目立つ

中国といえば、Top500でもHPLベンチマークでもなく、Gordon Bell Prizeで検証された2つのエクサスケールシステムを立ち上げたと言われている。その2つのシステムとは、青島にある無錫スーパーコンピューティングセンターが運営する「OceanLight」と、北京の東に位置する天津市にある「Tianhe-3」である。「Tianhe-3」は、Phytium 2000+ FTP ArmチップとMatrix 2000+ MTPアクセラレータをベースにしている。昨年秋に完成したとされるこのシステムは、ピーク性能で推定1.7エクサフロップス、Linpackで1.3エクサフロップス強の性能を発揮するとのことだ。

ハンブルクで開催されるISC 2022に先立って話を聞いた、デビッド・カハナー氏のアジア技術情報プログラムに所属する情報筋は、中国が2025年から2026年の時間枠で10エクサフロップスのマシンを計画していると述べている。同人物は、中国が25年までに10台のエクサスケールシステムを保有するとした最近の報道について、誤解に違いないと反論している。2025年には2つの10エクサフロップスシステムが計画されていたと、この情報筋は語ったが、今では2026年には1つの10エクサフロップスシステムしか計画されていない可能性が高くなった。OceanLightと同様に、AlphaコアをベースとしたWuxi Sunwayアーキテクチャが実装される予定だ。

中国の著名な HPC エキスパートであるジェームズ・リン氏(上海交通大学 HPC センター副所長)は、1 週間あまり前に Twitter で、Top500 は事実上のエンティティリストになってしまったと述べている。( エンティティリストの目的は、米国の利益を著しく脅かすと判断されたエンティティへの先端技術の移転を抑制またはブロックすることだとされている)。「中国のトップスーパーコンピュータのベンダーとホストセンターは、両方のリストに載っている 」とツイートしている。「Top500に載るということは、国際的な協力関係を育むことですが、結果は逆です。コネクションを維持するためにTop500に投稿しているわけではないのです。」このリストのためにベンチマークされたいくつかの中国のシステムのバックエンティティやサプライヤーベンダーは、確かに近年、米国のエンティティリストに載るようになった。

ベンダーの状況

Top500では、Lenovoが新システムが17台と最も多く、HPEが14台と2番目に多い。全500システムで見ると、純粋なシステム数では、Lenovo(180)、HPE(84)、Inspur(50)というラインアップになっている。性能シェアでは、HPE(18.6%)、富士通(18.1%)、Lenovo(15.1%)となっている。Nvidiaベンダーの新システムはランクインしていない。Eosは良い成績を残すと期待されているが、Nvidiaによると、これを搭載するDGX H100ノードは来期まで出荷が開始されないという。

Nvidiaは、このリストに掲載された19のシステムのメーカーであり、他の5つのシステムの構築にも共同で関与している。Sierra (#5), Chervonenkis (#22), Lassen (#30), Galushkin (#40) and Lyapunov (#43)だ。

IntelはTop500のシステムで77.40%のシェアを獲得し、6ヶ月前の81.60%から減少している。AMDは94システムで18.80パーセントとなり、6ヶ月前の14.60パーセントから急上昇している。

IBM製システムのランクインと脱落はなかった。まだ9つある。Summit (#4), Sierra (#5), Marconi-100 (#21), Lassen (#30), PANGEA III (#33), AiMOS (#24), HPC2 (#160), Lenovo との SuperMUC Phase 2 (#205), そして Longhorn (#303) である。