新システムがエクサスケール科学の場を設定
Nicole Hemsoth

我々は、2016年半ば頃にNERSCに設置される予定の新しいスーパーコンピュータ、Coriの正式発表を伴って高性能コンピューティングの節目となる新たな大規模システムを歓迎する。 NERSC-8としてのRFPの段階から知られている新しいマシンは、 Cray XC環境内に収容された次世代のKnights Landingアーキテクチャを搭載する9,300以上のノードを誇ることだろう。
システムに関するベンダーからの情報収集のための要求原案の中で、 NERSCは、センターで実行する科学プロジェクトの広範な領域をサポートする新しいHPC環境を必要としたと述べた。このシステムは、 「代表的なベンチマークセットでNERSC-6 Hopperシステムを超える少なくとも10倍の実効性能の増加を伴なう計算能力の大幅なアップグレードを提供」しなければならなかった。Knights LandingベースのCray Coriマシンから予想されるノードあたり3テラフロップスの倍精度最大性能によって、明確に10倍(またはそれ以上)の改善があるように設定されている。 400GB/秒以上のIOバンド幅と28ペタバイトのディスクの追加で、これを完全に勢いづける – しかし再び、実際の重点が最大性能や能力ではなく、それは真のアプリケーション性能と新しいアーキテクチャを使用するための道筋を示し、次世代の科学のためのアプローチである。
新しいスーパーコンピュータで興味深いことは、それが大規模なレベルの並列処理を活用するための弾力性やプログラミング等のエクサスケールコンピューティングの最前線における幾つかの重大な障壁のための一種の試験場として設計されており、そしてソフトウェア、ハードウェア、メモリおよびストレージシステムでデータ集約型科学技術計算アプリケーションをサポートしていることである。これらの障壁周りの解決法を模索するための鍵は、自己ホスト型アーキテクチャとフラッシュメモリで信頼性と性能を拡張するより多くの新しいアプローチを持つKnights Landingメニーコアである。我々が発表に至るまでに話を聞いたNERSCの人々が絶えず繰り返したこととして、システムの要点はシステムを利用する5000名を超えるユーザの非常に多彩なワークロードに役立つことである・・・その想いはこの頃では目新しいものでは無いが、LINPACKのような計算ベースのベンチマークをアピールするためではない。
我々は、このシステムで明かされるよう設定されたKnights Landingプロセッサの最終的なコア数に関する変数をしばしば耳にするが、NERSCサービス部門のヘッド、Katie Antypasは各カード上に「60コア以上」あるだろうと述べた。 しかし、AntypasがCoriについての我々との会話中に何度も繰り返すように、本当の魅力は、実際のアプリケーションの要件であり、計算馬力では全くない。次世代のIntel部分で高バンド幅なオンパッケージメモリへアクセスすることが本当の魅力であると彼女は指摘した。 「私たちのアプリケーションのほとんどが計算処理の制限ではなく、メモリバンド幅によって足枷があることが分かっているため、これが私たちのワークロードにとって重要です。」パフォーマンスと効率が鍵である一方、「ユーザのために、この自己ホスト型アーキテクチャの持つ意味は、コプロセッサの内外でのデータ移動を心配する必要がないことです。」
Antypasは、使い慣れたプログラミング環境とノード内のデータ移動の課題について強調することが軽減されたとはいえ、先行する大きな最適化の課題が依然あることを指摘する。 「私たちは、ユーザのアプリケーションを新しいアーキテクチャへ移植するためにより高い並列性を見いだす必要があるため、彼らの一部にとって課題であることを理解しています。」それでも、彼女は言う「私たちは、ユーザのためにより多くのコンピューティング能力を供給する使命を満足させることは長期間要することを理解しており、私たちはメニーコアとより効率的なルートを降りて行く必要がありました。」
チームが最終的にエクサスケールシステムの潮流に先立って終局を迎えることを警戒する別の特徴的な要素がある。その契約は、バーストバッファ技術のオプションに言及した。本質的に、これはシステム内のIOを加速するためにメモリとディスクの間に置かれたNVRAMの層である。これは、NERSCの先端技術グループリーダー、Nick Wrightが一度稼働しているところを見ているものの重要な部分であり、いくつかの重要な信頼性の懸念を十分に与えることが出来る方法と、ますます重要なマシンのIOPS能力を強化することできる方法を探ることの両方である。
Wrightは、彼のチームがチェックポイントリスタート機能と言う従来のHPCの弾力性に対処するためだけでなく、データ集約型コンピューティングのためのバーストバッファオプションに注目していると言う。 「データ集約型アプリケーションにとって、フラッシュメモリについて言えることのひとつは、常時回転のディスクよりも非常に高いIOPSを持っていることです。私たちは、データ集約型アプリケーションの多くが一般的なIOバンド幅制限よりもむしろIOPS制限であり、そのため、私たちが有効にすることができる科学技術計算で何が新しい能力なのかを探求したいと思います。」
システムのこの部分のため、Crayはソフトウェア側で作業する予定である。しかし、彼らはまだどのベンダーがバーストバッファのハードウェア部分を担うか評価している。Wrightは、彼らが可能な限り多くの汎用技術を統合したいが、急ぐことはないと言う。まだ使う準備ができていない技術に今投資する代わりに、彼らが実際に性急で取り掛かる準備ができるまでの少しの間はフラッシュ価格の下落で乗り切ることができるため、マシンは暫くの間提供されない。
Antypasが言ったように、 「フラッシュは、よりコスト効率的にバンド幅を提供し、彼らが必要とするバンド幅をユーザーに与えるために、 NERSCでの私たちのような人々は、実際に大規模並列ファイルシステムを購入してきました。しかし、フラッシュの価格がスーパーコンピュータにとってますます有望に思えるポイントとなってきています。それは、バンド幅を大幅に増加するさせることができ、そしてIOを加速し、より多くの時間を計算に費やすことを正に私たちがしたいからです。 」
AntypasとWrightは、バーストバッファは、データ集約型科学を駆動するためだけでなく、ロールバックとチェックポイントをはるかに速く、より効率的な行えるチェックポイントとリスタートのメカニズムの両方がエクサスケールシステムで実現することを期待していることに同意する。彼らは将来のシステムのために学んだ教訓を共有したいと考えているが、今のところは将来の良い見解を反映した手元のメニーコア・アーキテクチャに応じたアプリケーションの進化に注力している。
ローレンス・バークレー国立研究所の国立エネルギー研究科学計算センターの所長、Sudip Dosanjhがまとめたように、「Coriは、私たちのユーザに大幅に増加した能力を提供し、メニーコア・アーキテクチャへ私たちの非常に広いユーザコミュニティが移行するためのプラットフォームを提供します。私たちは、CoriがDOEの科学コミュニティの計算やデータのニーズを満たしていることを確実にするためにCrayと協力します。 」
「私たちは、Intel Xeon Phiプロセッサ ー コードネームKnights Landing ー をベースに市場に次世代の高並列スーパーコンピュータを持ち込むことでCrayと仕事することにワクワクしています。」とIntelの副社長でデータセンターグループとワークステーションおよびハイパフォーマンスコンピューティング部門のゼネラルマネージャー、Charles Wuischpardは言った。「Crayと緊密に協力して、私たちは幅広いセットのアプリケーションのパワーとエクサスケールに向けた重要で実行可能なステップを得るために、次世代のCray XCスーパーコンピュータ上で単一ソケットノードあたり3Teraflops以上の性能を届ける多集積コア(MIC)アーキテクチャを展開します。」
いくつかの注目すべきは、読み込みのためにベンチマークをここをチェック ー NERSCの我々の友人たちとその新しい追加におめでとう!