DOEにおけるアプリケーションの準備 その2:NERSC、Coriへの用意
John Russell

HPC User Forumのパネル、「科学部の次世代リーダーシップコンピュータシステム上でアプリケーションを、誰が-何を-いつ 動かすようにするのか」の2番目のビデオの中で、今日の世代より5倍から7倍高速で、大幅なアーキテクチャの変更で構成される、エネルギー省(DOE)のスーパーコンピュータの将来の成果のために、科学アプリケーションを準備することに関する目標と課題について我々はもっと多くを学んだ。
パート1では、オークリッジ・リーダーシップ・コンピューティング・ファシリティのセンターにおける将来のSummitスーパーコンピュータのための加速化アプリケーションの準備で行われていることについて、Tjerk Straatsmaから話を聞いた。次に来るのは、国立エネルギー研究科学計算センター(NERSC)での科学計算及びデータサービス部のヘッドであるKatie Antypasから、Coriへの移行について話を聞いた。
Cori:Knights Landingおよび拡張「Silvermont」への大きな賭け
予測されたように、Coriで実行するアプリケーションからほとんどを得る事は、並列処理のより広範な利用が必要になる(領域、スレッド、およびデータ局所性)。NERSCのKatie Antypasは、それが役立つアプローチの例とそうでない驚きを含め、何をそれが意味するのかでやや深く見ていた。
もちろん、Coriは2016年にDOEの科学部用のプリ・エクサスケールのスーパーコンピュータとなるために待機しているマシンだ。「プリ・エクサスケール」という名称がエクサスケールの時代までCoriで使われる技術があることを示唆しているとAntypasは指摘している。次に彼女は、Coriアーキテクチャの鍵となる要素を強調し、CoriのメニーコアアーキテクチャのためにDOE科学部の大きなコミュニティを準備することを含んだNERSCのエクサスケール科学アプリケーション・プログラムの目標を評価している。
このスライドはAntypaの話から主要点を取り込んでいる:
- 良いニュース – 低い位置にぶらさがる果物があるようだ:ベクトル化の改良
– 複数のコードが半日のハッカソンで10%から2倍に高速化した
– コンパイラのベクトル化野能力を破壊するコード中の主要ループ調べる
- コードがメモリ帯域幅、CPU、おしくはレイテンシーの限界に達している場合の理解が重要
– ユーザはこれを知らないようだ – 複雑で、カーネルからカーネルに、アーキテクチャからアーキテクチャに変化すること
– メモリ帯域幅を計測するのにIntel VTuneがとても約に立つ事が分かった
- 最適化技術は特定のコードおよびアルゴリズムに完全に依存している
– どこに進むかチームガイダンスを提供できるが、固定したレシピはない
- 移植性が重要な懸念事項だ – パネルで議論しよう
次世代システムにおける移植性を達成する可能性と性能における移植性の本当のコストに関する議論は活発であった。
パート3はまもなく・・・