スーパーコンピュータ上で流体力学ニューラルネットワークを訓練
Oliver Peckham

風力タービンの設計から航空機の最適化に至るまで、流体力学シミュレーションは非常に重要だ。しかし,これらのシミュレーションを直接数値シミュレーションで実行するには計算コストがかかる。多くの研究者は、計算コストを削減するために、与えられた流体の運動を一般化するラージエディシミュレーション(LES)を利用しているが、この一般化は精度のトレードオフにつながる。現在、研究者はシュトゥットガルト・ハイパフォーマンス・コンピューティングセンター(HLRS)のスーパーコンピュータを使用し、より正確なシミュレーションをより多くの研究者が利用できるようにしている。
この作業の多くは、「クロージャーターム」と呼ばれるものに注目している。つまり、効果的に、低解像度のシミュレーションを高解像度の表現にアップスケーリングする方法である。
![]() |
|
「写真に例えるならば、クロージャータームは、粗い粒子の画像と完全な画像の間に欠けているものを表現したものです」と、このプロジェクトを主導したシュトゥットガルト大学、空気力学・ガス力学研究所(IAG)の研究者、Andrea BeckはHLRSのEric Gedenkとのインタビューで語っている。「それはある意味、あなたが置き換えようとしている用語です。クロージャーは、完全な画像からの情報が粗い画像にどのように影響するかを教えてくれます。」
教師あり学習を用いて、研究者たちは、これらのクロージャータームを理解するために人工ニューラルネットワークのトレーニングに着手した。「教師あり学習では、アルゴリズムに1,000枚の猫の写真と1,000枚の犬の写真を与えるようなものです」とBeckは言う。「最終的には、アルゴリズムがそれぞれの例を十分に確認すると、猫や犬の新しい写真を見て、その違いを見分けることができるようになります。」
![]() |
|
スーパーコンピュータ「Hawk」 | |
しかし、まず、この学習プロセスに必要なデータを作成するために、HLRSのスーパーコンピュータ、具体的にはHawkとHazel Henシステムを用いて、一連の直接数値シミュレーションを行った。稼動開始時には、Hawkの5,632台のAMD Epyc搭載ノードは26ペタフロップス、Hazel Henの7,712台のIntel Xeon搭載ノードは7.4ペタフロップスを実現している。Hawkは最近、192個のNvidia A100 GPUを搭載した24台のHPE Apollo 6500 Gen10 Plusシステムにアップグレードした。
チームは2台のスーパーコンピュータで約40セットの計算を実行し、それぞれの実行で約2万コアを使用した。その結果得られたデータを用いて2つのトレーニングアプローチをテストした結果、正しいクロージャータームの選択において99%の精度を達成したアプローチを特定した。
「これは、従来のHPCコードをデータ駆動型の新しい手法で拡張することを可能にし、決定的なギャップを埋める大きな一歩となります」とBeckは述べている。「これにより開発や研究プロセスのスピードアップに貢献するだけでなく、Hawk上で大規模に展開する機会を得ることができます。」
チームは、年内にデータを公開する予定だという。
ヘッダー画像:乱流の直接数値シミュレーション。シュトゥットガルト大学のMarius Kurzによる提供画像