世界のスーパーコンピュータとそれを動かす人々


8月 14, 2023

2023 ACMゴードンベル賞ファイナリスト

HPCwire Japan

朴 泰祐
(筑波大学・計算科学研究センター、2023 ACM Gordon Bell Award Committee Chair)

2023年のゴードンベル賞(Gordon Bell Prize、以下GBP)には、例年の如く多数の大変興味深くエキサイティングなノミネーションが寄せられた。GBPはノミネーションという形で応募されるが、基本的には実施する研究者らが投稿するのが慣例になっている。Association for Computing Machinery (ACM) GBP Award Committeeは慎重な議論の末、6件のファイナリストを選定した(ACM GBP Award Committeeについてはhttps://awards.acm.org/bell/committeeを参照のこと)。

GBPは最先端のソフトウェア及びハードウェアの下で実施された、最も価値のある科学的なアプリケーション実行に与えられる、高性能計算・スーパーコンピューティングの世界で最も権威があると考えられている賞である。GBPの選定には対象問題の重要性、性能最適化の手法や技法、対象となるハードウェアの十分な活用、その研究や実装がどれくらい他のプラットフォームや研究に役立つか等、多くの要素に基づいて評価され、通常の学術論文とは異なる視点での議論が求められる。このため、Award Committeeでの議論も時間をかけ慎重に行われる。その年の7月に最終候補として最大6件のノミネーションがファイナリストとして選定される。ファイナリスト達には論文の最終版の投稿機会が与えられ、性能最適化をより完全に行ったり、問題規模やシステム規模をさらに大きくしたり、アルゴリズムを改善したり、より完全な結果を示すことが認められている。この最終版論文を元に、再度Award Committeeによる議論が行われ、最終的な受賞者が決定される。ファイナリスト達には毎年11月に開催されるSCカンファレンスでGBP Finalists Sessionsでの発表機会が与えられ、受賞者の発表と表彰はSCのAward Sessionで行われる。

2023年のGBPファイナリストの対象研究は物質材料科学、流体力学、核反応炉、地震、バイオサイエンスといった多様な分野に跨る。アプリケーション実行に用いられた世界最高水準のスーパーコンピュータも、Frontier(米国ORNL)、new Sunway System(中国Wuxiスーパーコンピュータセンター)、LUMI(フィンランドEuroHPC/CSC)、Leonardo(イタリアEuroHPC/Cineca)、Cerebras CS-2(サウディアラビアKAUST)、そしてPerlmutter(米国NERSC)と多彩である。残念ながら、日本の「富岳」を用いたノミネーションはファイナリストには残れなかった。

以下は6件の2023年GBPファイナリストの概要である。

(1) “Large-scale Materials Modeling at Quantum Accuracy: Ab initio simulations of quasicrystals and interacting extended defects in metallic alloys”(Sambit Das, Bikash Kanungo, Vishal Subramanianら計8名、University of Michigan、Indian Institute of Science、 Oak Ridge National Laboratoryのチームによる)

この研究では、density function theory (DFT)とquantum many body (QMB)を融合した計算手法に機械学習を組み込んだ物質材料シミュレーションを行っている。DFTとQMBを組み合わせたinverse-DFT手法により、高精度を保ちつつ大規模モデルのシミュレーションを可能とした。QMB相当の精度の下での超大規模エネルギー計算を、ORNLのFrontier(2023年6月時点のTOP500で世界最高性能)の約60%の資源を用いて行った。

(2) “Towards Exascale Computation for Turbomachinery Flows”(Yuhang Fu, Weiqi Shen、Jiahuan Cuiら計20名、Zhejiang University、Tsinghua University、National Supercomputing Center in Wuxi、Taiyuan University of Technology、Xi’an Jiaotong-Liverpool University 、University of Cambridge、University of Florida 、University of Illinois Urbana-Champaignのチームによる)

この研究では、巨大なタービン機構における圧縮性流体のlarge eddy simulation (LES)を行っている。NASAのグランドチャレンジ問題として定義されている、高次の非構造的高圧タービンのシミュレーションを16億9千万メッシュと8650億自由度で行った。シミュレーションはWuxiのnew Sunway Supercomputerで行われたが、このマシンの計算ノードはノード当たり384個の超小型演算コアと6個の制御コアから構成される超メニーコア・アーキテクチャを持ち、合計1920万コアを持つ。

(3) “Exascale Multiphysics Nuclear Reactor Simulations for Advanced Designs”(Elia Merzaria、Steven Hamilton、Thomas Evansら計12名、Pennsylvania State University、Oak Ridge National Laboratory、Argonne National Laboratory、University of Illinois at Urbana-Champaignのチームによる)

この研究では、放射輸送と熱・流体シミュレーションを融合させたShiftと呼ばれる高解像度モンテカルロコードと、NekRSと呼ばれる流体力学コードを組み合わせ、先進的な核反応炉のシミュレーションを行っている。最新版のNek5000/RSがORNLのFrontierに実装され、10億スペクトルと3500億自由度のシミュレーションを実施し、Shiftは8192ノードまでのweak-scalingを達成した。その結果、214,896燃料ピンを持つ6つの核反応炉のシミュレーションを1%の誤差で実施しながら、モンテカルロ輸送アプリケーションとして最高の精度を実現した。

(4) “Exploring the Ultimate Regime of Turbulent Rayleigh–Bénard Convection Through Unprecedented Spectral-element Simulations”(Niclas Jansson、Martin Karp、Adalberto Perezら計12名、KTH Royal Institute of Technology、Friedrich-Alexander-Universität、Max Planck Computing and Data Facility、Technische Universität Ilmenauのチームによる)

この研究では、Nekoと呼ばれる厳密なスペクトル・エレメント・コードを元に、これまで実現されなかったスケールの乱流のダイレクト・シミュレーションを、性能可搬性の高いGPUコーディングによって実現している。タスク・オーバーラッピングを用いたGPU最適化を行い、圧縮性ポアソン方程式をin situ的手法で実行時にデータ圧縮している。また、Rayleigh–Bénard移流計算の初めての実行をLUMIとLeonardoという異なるGPUを持つシステム上で実行し、最大で16,384台のGPUによる計算を洗練されたワークフロー制御の下で実現した。

(5) “Scaling the “Memory Wall” for Multi-dimensional Seismic Processing with Algebraic Compression on Cerebras CS-2 Systems”(Hatem Ltaief、Yuxi Hong、Leighton Wilsonら計6名、King Abdullah University of Science and Technology、Cerebras Systems Inc.のチームによる)

この研究では、AI向けシステムであるCerebras CS-2の高バンド幅メモリを用い、ウェファスケール・ハードウェアに実装されたSRAMのサイズに適合した波動計算アルゴリズムを用いて、地震波シミュレーションを実現している。その結果、標準的な地震シミュレーション・ベンチマークのデータセットをCerebrasプロセッシング・エレメントの小規模メモリにフィットさせ、ロードバランシングが取りにくいケースに対して約3500万プロセッシング・エレメントを持つ48台のCS-2システムで実行した。これはAI向けシステム・アーキテクチャを新世代の地震シミュレーションに適用した画期的な事例である。

(6) “Scaling the Leading Accuracy of Deep Equivariant Models to Biomolecular Simulations of Realistic Size”(Albert Musaelian、Anders Johansson、Simon Batzner、Boris Kozinskyの4名、Harvard John A. Paulson School of Engineering and Applied Sciencesのチームによる)

この研究では、Allegroというシミュレーションシステムを開発し、精度と速度というトレードオフを克服し、これまでになかった複雑性を持つ原子シミュレーションにおいて、量子レベルの力学的構造を解明している。これは画期的な新モデル・アーキテクチャ、超並列処理、GPUに特化したモデル実装と最適化の結果による。Allegroのスケーラビリティは、ナノ秒スケールで実行されるタンパク質の動的シミュレーションと、4400万原子の完全な全原子モデルによるHIVカプシドの計算によって証明され、NERSC のPerlmutterシステムによって1億原子までのstrong scalingが示された。

以上が6件のファイナリストの概要であるが、ここに挙げたスーパーコンピュータ・システムのサイズ、問題サイズ、性能等については、ファイナリストらによる最終版の投稿までは暫定的なものであることをお断りしておく。最終的な実行環境及び結果についてはSC23におけるGBPセッションで明らかになる。

 

著者バイオ

筑波大学計算科学研究センター長、「富岳」成果創出加速課題・領域総括、ポスト「富岳」開発研究Feasibility Study・Program Director、HPCI計画推進委員会委員、HPC Asia Conference運営委員長、IEEE Cluster及びICPP運営委員、2023年ACM Gordon Bell Prize選定委員会委員長。