世界のスーパーコンピュータとそれを動かす人々


10月 17, 2014

Cray、次世代XC40スーパーコンピュータでバランスをとる

HPCwire Japan

Nicole Hemsoth

Crayがトップテンにランクされる「Piz Daint」マシンを含むいくつものTOP500システムのバックノーンとして活躍するXC30ファミリーに続く、次世代スーパーコンピュータに関する詳細を発表した。

新たに発表されたXC40はロスアラモス国立研究所の巨大Trinityシステム、来るNERSC-8「Cori」マシンおよびiVECや他のロケーションにインストールされる早期リリースシステムの基盤としてすでに利用されている。前述のセンターが「次世代」のCrayシステムをインストールするとすでに公表していたので、このシステムの発表は予想外ではないが、実質は中身である。例えば、これらのマシンの「バーストバッファ」コンポーネントについて知っているが、Crayが開発したI/Oキャッシング階層についてはほとんど知らない。新Haswell(および将来)の将来のチップに取り込む面においてどんな構成オプションがあるか述べられていないが、恐らくアクセラレータかコプロセッサだろう。

CrayのJay Gouldは我々のためにXC40に光を当て、マシンの早期の成功とその軌道に望むことがハイエンドにあると指摘した。多くの早期の大規模出荷顧客は、高いコア数、DDR4メモリオプションの利点が取れる高周波数システム、さらにXC40に組み込まれる新DataWard I/Oの構成オプションを使っているとGouldは語っている。

早期の顧客は新Haswellプロセッサで得られるコアを活用することを熱望してきたが、Cray はIntelがHaswellのニュースと一緒に最近リリースしたSKUをフルレンジでは提供していない。我々が利用可能となるもののリストを待っている間、多くのコア、周波数、そして選択可能な熱プロファイルがあり、カスタマイズと構成可能性に関する話であると彼は指摘している。XC30と比較して性能およびスケーラビリティに関して2倍の改善が証明されており、アプリケーション性能必要性のためにXC40をチューニングするのはXC30と変わらなく、そして
アップグレードをシンプル(出荷された際には新Broadwellカードを差し込むことができることを含む)にするだけでなくDDR4メモリを含んだ新しいブーストを提供している。

XC30に大して2倍の性能向上を提供するという数字が出てきたのは、今後18コアとなるかもしれないが、16コア、2.6GHz Intel(2693 v3)に基づいたものである、とGouldは語った。ご想像通り、理由はすべて熱である。いかに液冷システムだと言っても、18コアチップはとても高温で動作する。そのため彼は16コアチップが性能と熱の問題を調和するスイートスポットだと言っている。Crayは液冷48ブレードのX40の代わりに空冷16ブレードのスケールダウンバージョンのXC40も提供している。ユーザが完全なXC40マシンに移行する前にアプリケーションの実証にすでに使っており、低減された密度と改善されたエアーフローを除けばXC40と同じSKUのようである。

しかし構成オプションの他に、このマシンにもっと目を引く以上のものがあり、それはブレードの設計レベルから始まっている。新Xeon E5 v3シリーズの登場と共に、Crayは既存のブレード設計をもっとメモリが必要なすべての計算をバランスするように再考したのだ。DDR4での高容量DIMMにシフトしており、ブレードあたりのメモリバンド幅を高くするだけでなく、メモリ周りのいくつかのオプションもありノードあたり64-256 GBを提供している。

しかしXC40の最もユニークな特長は、ハードウェアとソフトウェアのコンビネーションだ。Crayは高速なI/Oの要望に対応するためのDataWarpと呼ばれる第三層を作った。本質的にこれは自家製のアプリケーションI/O技術で、演算ノード、ローカルメモリおよび並列ファイルシステムと回転ディスクに分別される性能と効率の隔たりを持った大規模システムを悩まし続ける不平衡に対応するように設計されている。現在、多くのサイトはピーク時のI/O処理に対応するように高価で非効率なストレージを過剰供給するようになっており、これは「バーストバッファ」の概念で対処することができる。演算ノードのバンクに挿入可能な「I/Oブレード」上のSSDを使った下記に見られるものに関係するCrayのアプローチは、ファイルシステムやストレージに対応するためにネットワーク上にすべてのデータを置く必要がなく、演算レベルでI/Oキャッシュへのアクセス性を提供する。

20140930-F1-datawarparch

20140930-F1-datawarp3

これはバーストバッファの感覚で利用できる、とシステムとこの機能の早期利用者であるGary Griderが以前、我々に詳細を述べてくれた。しかし、これはひとつの単なるDataWarp層と使って可能となる利用事例であり、それゆえに、Crayがシステムの初期の文献の中でこれを実際にバーストバッファと呼ぶことを避けていたのだ。ポイントは、システムあたり「IOPSを70,000から40Mまで」あげることであり、同じ価格のディスクベースのシステムに対して5倍性能が向上することだ。「演算とメモリ、および、DataWarp I/Oとディスクを適度にバランスすることにより、それらの層を再バランスでき、最速の性能を提供できるのです。」とGouldは語った。

我々は、特定の記事の中でDataWarp能力の他の利用事例を見つけるために、アプリケーションの高速化だけでなく、チェックポイント/リスタートも利用しているNERSCを含むもっと多くの初期ユーザをフォローするのを楽しみにしている。我々はまた、Trinity、Cori、およびiVecシステムを含む公開されているいくつかのグローバルセンターにおけるこのマシンのさらなる展開に関するニュースを期待している。