Nvidia H100が「アンリ(Henri)」でデビュー、Green500で首位に
Oliver Peckham オリジナル記事

NvidiaのHopperアーキテクチャのフラッグシップであるH100 GPUが、SC22のTop500とGreen500のリストにデビューした。この新しいGPUは、IntelのXeon “Ice Lake” CPUを搭載した、Lenovo製の比較的小型のHenriシステムに搭載されている。Henriは、天体物理学、生物学、量子物理学に焦点を当てた計算機研究機関であるニューヨークのフラットアイアン研究所によって運用されている。しかし、おそらく最も注目すべきは、Henriが、Green500のトップ10を独占している多数のFrontierスタイルのシステムを抑えて、世界で最もエネルギー効率の高い公的ランキングのスーパーコンピュータになったことだろう。
![]() |
|
Henriの写真、フラットアイアン研究所提供 | |
Henriは、ニュージャージー州セコーカスのデータセンターに設置されている。ベンチマークには、Intel Xeon “Ice Lake” CPUをデュアルで搭載し、1TBのメモリとNvidiaの80GB PCIe H100 GPUを8台(合計80個のH100)搭載したLenovoのSR670 V2サーバー10台を活用し、NvidiaのInfiniBand HDRでネットワーク接続されている。(ベンチマーク終了後は、1ノードあたり4台のH100を搭載した20ノード構成にスワップしている)。
Henriは、最新のTop500リストで405位にランクされており、理論ピーク5.42ペタフロップスに対して、2.04 Linpackペタフロップスの演算能力を実現している。Linpack効率は37.6%と低いが、このマシンの優れたエネルギー効率はそれを補って余りある。Henriは1ワットあたり65.09ギガフロップスを達成し、世界で最もエネルギー効率の高いスーパーコンピュータのリスト「Green500」で1位を獲得している。
これは、1ワットあたり62.68ギガフロップスを実現したFrontier TDS(Frontierのワンラック試験・開発システム)を大きく上回るもので、インテルとNvidiaベースのシステムだ。AMD Epyc「Milan」CPU、AMD Instinct MI250X GPU、Slingshot 11 ネットワーキングといった Frontier 構成の HPE 製システムは、5 月の Green500 リストの上位 4 位を独占し、順に Frontier TDS、 Frontier 自身、 EuroHPC の LUMI システム、GENCI の Adastra システムとなっている。今年は、Pawsey の Setonix システムと KTH の Dardel システムの類似したアーキテクチャの GPU パーティションを追加して、Frontier スタイルのシステムが Green500 のトップ 10 に占める割合を増やしている。
これらのシステム(順に、Frontier TDS、Adastra、Setonix GPU、Dardel GPU、Frontier、LUMI)は、現在Green500リストの2位から7位を占めている。6月のGreen500では、Frontier系のシステムが上位を独占していたため、Nvidiaの新チップが期待されるとともに、意外なデビューを果たしたことになる。
そして、それは物語の終わりでは無いかもしれない。この37.6%のLinpack効率(11月のTop500リストの平均Linpack効率64.5%に対して)から、Henriのベンチマークは、SC22に間に合うようにアクセラレータをデビューさせるための突貫工事だった可能性が高いようだ。HPCwire のインタビューでジャック・ドンガラ氏は、「このベンチマークは、テストに合格するために急いだように見えます」と述べている。「マシンは通常、ピークの70~85%を獲得しており、これはHPLとしては立派なものです。だから、これだけ低いスコアだと、何かが間違っていることになります。さらなる最適化の余地は残されているはずです。」 SC22のプレスブリーフィングでは、Green500リストのスチュワードであるウー・フェン氏が、H100と前世代のA100との比較で報告されている3倍のエネルギー効率の向上を、Henriは全くアピールできていないとコメントしている。
Henriの効率は、H100ベースのシステムにとって、ある種の底辺なのか、それに応じて、ISC 2023では、もっと素晴らしい効率ベンチマークが見られるのか、推測するのは簡単だ。また、HPCwireのティファニー・トレーダーがTop500の取材で指摘したように、これはIntelのIce Lakeチップと組み合わせた場合のH100であり、(Intelの)Sapphire Rapidsまたは(AMDの)Genoaチップと組み合わせれば、さらに良い数字が出るはずだということを忘れてはいけない。ブログの投稿で、Nvidiaは、同社が言う “従来のCPUのワット当たり最大2倍の性能 “を実現するGrace CPU Superchipなどの技術からエネルギー効率でさらなる飛躍を約束している。
このアンリのスケジュールをNvidiaとLenovoはHPCwireへの電子メールで確認し、そのスケジュールを「例外的に速い」とし、システムが届いてから電源投入テストまで36時間未満だったことを付け加え、それがLenovoにとってH100の最初の大量導入だったことに言及しています。NvidiaとLenovoは、Hopperの新しい電力管理能力が、可変のOEM最適化に依存していることを詳しく説明し、両社がハードウェアで協力することで、H100の導入が「flops/wattを改善し続けるだろう」とも断言している。
もちろん、Henriは単なる技術のショーケースではなく、研究用スーパーコンピュータでもある。フラットアイアン研究所は、フラットアイアンの他の2つのシステム(RE1、Top500で442位、RE1A、488位)と共に、計算天体物理学、生物学、数学、神経科学、量子物理学の研究にこのシステムを使用すると述べている。
フラットアイアン研究所のサイエンティフィック・コンピューティング・コアの共同ディレクターであるイアン・フィスク氏は、「このスーパーコンピューターは、新しい種類の科学を行うための機会を開くものです。このスーパーコンピューターは、私たちの研究者が新しいことに挑戦し、発見を促進するための主力マシンです。それが私たちにとって重要なことなのです。”」(さらに、このシステムは少なくとも部分的に再生可能エネルギーで駆動している。)
NvidiaとLenovoは、HPCwireに対し、Green500リストに掲載されたシステムをベンチマークすることを思いついた人物に、このシステムの命名の特権が与えられたことも感動的に語っています。その人物は、生まれたばかりの息子、Henriの名前をシステムにつけることを選んだとのことだ。
Henriスパコンは、今月初めからフラットアイアンの研究者が利用できるようになった。