世界のスーパーコンピュータとそれを動かす人々


10月 31, 2022

ロスアラモス、Crossroadsの第1フェーズとなるSapphire Rapidsベースの「Tycho」を設置

HPCwire Japan

Oliver Peckham

ロスアラモス国立研究所(LANL)のスーパーコンピュータ「Crossroads」は、完成すれば、すでに強力なスーパーコンピュータ「Trinity」の4倍の性能(20.16 Linpack petaflops)を実現すると期待されている。現在、Crossroadsの第1段階(「Tycho」と呼ばれる)が研究所に無事設置されており、研究所はこれを大規模システムへの「足がかり」と呼び、Intelの新しいCPU「Sapphire Rapids」の最初の大規模展開として歓迎している。

国家核安全保障局(NNSA)傘下の研究所の1つであるLANLは、スーパーコンピュータの仕様とワークロードを少し秘密めいたものにしている。HPEの液冷スーパーコンピュータCray EXをベースにしたCrossroadsシステムには、IntelのSapphire Rapidsと高帯域幅メモリ(HBM)が採用される予定だそうだ。一方、Tychoは、Sapphire Rapidsプロセッサをベースに、従来のDDRメモリを搭載した2,600ノードで構成されている。LANLはまた、Tychoのファイルシステムが、同研究所のスーパーコンピューティングの歴史において初めて、完全にソリッドステートドライブで構成されると述べている。

このニュースにより、Tycho は、Intel の遅延した Sapphire Rapids CPU の最初の(公的な)大規模展開となった。これは、アルゴンヌ国立研究所にも最近出荷され、近日公開予定のエクサスケール Aurora システムで使用される予定である。AuroraのノードはHBMを搭載したSapphire Rapidsにアップグレードさ れる予定だが、LANLはHPCwireに、TychoのノードはDDR構成のままであると語った。

LANLのスタッフは、発表の中で、テストがCrossroadsの最終的なパワーに対する期待を裏付けていると述べている。

LANL の HPC プラットフォームのプログラム ディレクタであるジム・ルージャン氏は,「ラボにおけるスーパーコンピューティングの新しいフェーズに入ることができ,とても嬉しく思っています」と述べている。「初期のベンチマークでは、Trinity の 4 倍の速度が得られています。Tycho、そして最終的には Crossroads に含まれる新しい効率性のすべてが、理解への重要な時間を短縮するために統合されます。モデリングとシミュレーションの多くの領域で効率を向上させることが、このプロジェクトの目的です。」

Tychoは、研究所のシステムにとって、ちょっとしたブランディングの出発点にもなっている。NNSAにおけるLANLの役割にふさわしく、TrinityとCrossroadsはいずれも核兵器の実験シリーズにちなんで名付けられており、一方Tychoは人気のSF番組「The Expanse」に登場する宇宙船にちなんで名付けられています。Tychoには、RocinanteとRazorbackという、同じく「The Expanse」に登場する宇宙船にちなんだ「Crossroadsの主要コンポーネント」が付属する予定だそうだ。ルージャン氏は HPCwire への電子メールで、Rocinante は「Crossroads の約 1/5 サイズ版」で、非機密環境で動作し、アプリケーション開発とテストに使用されると説明している。一方、Razorback は「非常に小さなシステム」で、ソフトウェア開発のテストベッドとして、「大きなシステムの Crossroads と Tycho で見られる問題を再現し、ベンダー サポートと協力して解決策を検討」できる場所として機能する、と説明している。

現在、Tychoがインストールされたばかりで、作業はシステムの安定化に向けられ、2022年末の機密使用と来年3月の本生産を目指すとのことだ。CrossroadsのHBM部分が配備されるまでは、Tychoは3つのNNSAラボに提供され、本格配備後は、Advanced Simulation and Computing(ASC)プログラムの他のワークロードに移行する予定だ。フルシステムは、2023年9月に本番稼動する予定。Crossroadsは、国家の核兵器備蓄の “安全、安心、信頼性 “を確保することを目的としている。

ヘッダー画像:Tychoの8,000ポンドのキャビネットの設置の様子。画像提供:LANL