世界のスーパーコンピュータとそれを動かす人々


5月 21, 2021

独LRZ、インテルの「Ponte Vecchio」GPUを搭載したスーパーコンピュータ「SuperMUC-NG」の新フェーズを発表

HPCwire Japan

Oliver Peckham

ガウス・スーパーコンピューティング・センター(GCS)を構成するセンターの一つであるドイツ・ミュンヘンのライプニッツ・スーパーコンピューティング・センター(LRZ)では、数年前からSuperMUC-NGシステムが活躍しており、最新のTop500リストでは15位にランクインしている。同センターは、インテルやレノボとの提携により、SuperMUC-NGのAI機能を向上させる「フェーズ2」を実施することを発表した。

現在、SuperMUC-NG(ヘッダー写真)には、デュアルCPUのIntel Xeon「Skylake」と96GBのメモリを搭載した6,336台の「thin」ノードと、同じCPUを搭載しながら1ノードあたり672GBのメモリを追加した144台の「fat」ノードがある。水冷式のシステムには70ペタバイトを超えるストレージも搭載されており、19.5 Linpackペタフロップスを実現している。

 
   

フェーズ2では、SuperMUC-NGに、次期CPUであるIntel Xeon「Sapphire Rapids」と、レノボの将来のサーバープラットフォーム「SD650-I v3」に搭載される予定のGPU「Ponte Vecchio」を搭載した240の新しいノードを追加する。インテルのGPUは、アルゴンヌ国立研究所のエクサスケール・スーパーコンピュータ「Aurora」への搭載が予定されているが、特に7nmプロセスの欠陥によりその展開が遅れたことで、多くの関心を集めている。SuperMUC-NGフェーズ2は、Aurora以外でのPonte Vecchioの適用が初めて発表されたものだ。

これに伴う1ペタバイトの追加ストレージには、Intel Xeon 「Ice Lake 」CPUとIntel Optane Persistent Memory 200シリーズを搭載したインテルの分散型非同期オブジェクトストレージ(DAOS)が採用される。

インテルの上級副社長兼チーフアーキテクト兼アーキテクチャ・グラフィックス・ソフトウェア担当ゼネラルマネージャーのRaja Koduriは、「次世代のハイパフォーマンス・コンピューティングを実現するために、インテルのXPU製品群、先進のパッケージング技術、メモリ技術、統一されたoneAPIソフトウェア・スタックをベースにしたSuperMUCシステムを市場に投入するにあたり、LRZがインテルとのパートナーシップを選択してくれたことを嬉しく思います」と述べている。

より高速なCPU、そしておそらくそれ以上に重要なGPUは、LRZのシステム上で増大するAIの要求に応えるのに役立つだろう。同センターによると、最近までは物理学や工学などの歴史的に計算機を多用する分野からの需要が多かったが、HPCとAIの両方のブームにより、医学や人文科学などの分野からも新たな(そして異なる)需要が生まれているという。

LRZのディレクターであるDieter Kranzlmüllerは、「LRZの活動の中心にあるのはユーザであり、研究者がそれぞれの科学分野で活躍するために必要なリソースやサービスを提供することが最優先事項です。ここ数年、私共のシステムにアクセスするユーザは、古典的なモデリングやシミュレーションだけでなく、人工知能を用いたデータ解析を行うケースが増えてきています」と述べている。

レノボは、SuperMUC-NGフェーズ2のすべてのコンポーネントを、アメリカやアジアの製造拠点ではなく、ハンガリーで製造する。

現在、SuperMUC-NGフェーズ2の要素は、LRZのテスト環境であるBEAST(Bavarian Energy, Architecture, Software Testbed)でテスト中である。また、2022年春に納入を予定している新しい計算機システムに先駆けて、今年の秋にはストレージシステム「DAOS」が到着する予定だ。LRZは、研究者にGPUベースのシステムへのアクセスを許可し、社内の専門家がスーパーコンピュータの新しい機能に備えてコードやアルゴリズムを適応させるためのサポートを行っている。