世界のスーパーコンピュータとそれを動かす人々


7月 16, 2019

Summit、新「HPL-AI」ベンチマークで445ペタフロップスを達成

HPCwire Japan

Oliver Peckham

世界ランキングトップのスーパーコンピュータであるSummitは、現在はHPL-AIと呼ばれている新しい混合精度のLinpackベンチマークのテストのために使用されてきた。

従来スーパーコンピュータのパフォーマンスは、年に2回世界最速のスーパーコンピュータをランク付けするTop500リストの基礎となる、高性能Linpack(HPL)ベンチマークを使用して測定されていた。このLinpackベンチマークは、倍精度演算を使用する高性能タスク(シミュレーションなど)を実行するスーパーコンピュータの能力をテストするものである。今年6月のTop500リストでは、Summitの148 Linpackペタフロップスが他と大差をつけて1位となった。

オークリッジ国立研究所(ORNL)とNvidiaは、同じマシン構成を使ってHPL-AIでSummitをテストし、445ペタフロップスの結果を得た。

異なる種類のベンチマーク

 

 

オークリッジ国立研究所Summitスーパーコンピュータ(提供: ORNL)

   

HPLベンチマークではスーパーコンピュータのパフォーマンスを倍精度演算でテストしているが、スーパーコンピュータで急速に拡大しているAIの使用例においては、ほとんどの場合、混合精度の演算を使用している。

HPL-AIベンチマークは、主に評価におけるこのギャップを埋めるように設計されており、従来のHPLのアプローチの代替ではなく、補完をしている。HPL-AIはAIモデルのパフォーマンスを評価するために、HPLの規格をもとに混合精度計算を追加しているのである。

1970年代後半にLinpackを導入したJack Dongarraは、次のように述べている。「混合精度技術は、反復改良技術を用いた従来のシミュレーションとAIアプリケーションの両方にとって、スーパーコンピュータの計算効率を向上させるためにますます重要になっています。」 「HPLが倍精度機能のベンチマークを可能にするのと同じように、HPLに基づくこの新しいアプローチは、大規模なスーパーコンピュータの混合精度機能のベンチマークを可能にするのです。」

新たなパフォーマンスのピークに到達

 
ISC 2019の結果を発表したJack Dongarra         (2019年6月19日)  
   

NvidiaとORNLは、SummitでHPL-AIベンチマークのテストを行った。この、IBM、Mellanox、Nvidiaが製造し、9,216個のIBM Power9 CPUと27,648個のNvidia Volta V100 GPUを搭載した巨大なスーパーコンピュータは瞬く間に計算行い、HPLでは90分かかるところを、30分で完了した。その性能は445ペタフロップス(およそエクサフロップスの半分、そしてHPLでのSummit の148ペタフロップスの3倍)と評価されている。

このベンチマークは、いくつかの重要な成果を示している。1つ目はもちろん、Summitということ、2つ目はGPUベースのスーパーコンピュータということ、そして3つ目はHPC-AIベンチマーク自体、である。

ORNLのラボラトリーディレクター、Jeff Nicholsは次のように述べた。「NvidiaのVolta GPUを搭載した複合精度Tensor Core機能を含む200ペタフロップスのSummitシステムの納入と導入以来、システムのこのユニークな側面を使用してAIを実行するだけでなく、従来のHPCワークロードでも使用することが私たちの目標です。」「HPLで445ペタフロップスの混合精度の結果(148ペタフロップス[倍精度]の結果に相当)を達成したことで、このシステムは、従来のワークロードとAIワークロードで最大3倍のパフォーマンスを実現できることがわかります。かつてない規模で科学が生み出される中で、この結果は私たちに大きな競争力を与えてくれるでしょう。」

Nvidiaは、Green500リストが標準的な電力効率の尺度になったように、HPC-AIベンチマークがスーパーコンピュータ業界の新しい補完的な標準になることを期待している。

「今のところ、最初からHPLが倍精度機能に対して行っているような、大規模スーパーコンピューティングシステムの混合精度機能を測定するベンチマークはありません。」Nvidiaのアクセラレーテッドコンピューティング担当ゼネラルマネージャー兼バイスプレジデントであるIan Buckはこのように述べている。 「HPL-AIはこのニーズを満たすことができるはずです。スーパーコンピューティングシステムが大規模AIのような混合精度ワークロードをどのように処理できるかを示しているのです。」

Buckはブログの投稿記事の中で、科学者が混合精度スーパーコンピューティングに目を向けているいくつかの使用例(下記に記載)を強調した。

核融合

核融合は、ボトルの中で太陽を効率的に再現している。それは無限のクリーンエネルギーを約束するものであるが、核融合反応は摂氏1000万度を超える温度で行われることになる。それらは混乱を招きやすく、数秒以上持続するのが困難である。ORNLの研究者たちは、物理学者が原子炉内で何が起こっているのかをよりよく理解することによりプラズマ核融合の不安定性を研究することができるよう、核融合反応をシミュレーションしている。 Tensor Core GPUの複合精度機能によりこれらのシミュレーションが3.5倍高速化され、国際熱核融合実験炉(ITER)などの主要施設での持続可能なエネルギーの開発が促進されるのである。

新しい分子の識別

産業用の新しい化合物を開発する場合においても、病気を治療するための新薬を開発する場合においても、科学者は望ましい化学的性質を持つ新しい分子を識別し、合成する必要がある。ダウ・ケミカル社の研究者は、学習と推論にNVIDIA V100 GPUを使用し、化学製造業および製薬産業で使用できるよう新しい分子を識別するためのニューラルネットワークを開発した。

地震断層の解析

石油・ガス産業では、地震画像を分析して断層線を検出するが、これは貯留層の特性評価と坑井配置の決定に向けた重要なステップである。このプロセスには通常1回繰り返すごとに数日から数週間かかるが、テキサス大学の研究者たちはNVIDIA GPUを使用し、わずか数ミリ秒で断層を予測できるAIモデルを構築した。