世界のスーパーコンピュータとそれを動かす人々


9月 1, 2014

Cray、CSシリーズにGPUパワーを追加

HPCwire Japan

Nicole Hemsoth

CrayシステムのCSファミリーが、HPCワークロードの選択を大きく加速することができる高密度でメモリーが搭載されたGPUの新しい追加で飾られた。

この新しいCS-Stormは、2Uサーバに最大8基のNVIDIA K40が搭載可能で、ピーク性能はIvy Bridge搭載ノード毎に11テラフロップスとなり、GPUのスケーラビリティをさらに必要とするキーアプリケーションを新たな高みへと導いている。

Cray CS3000スーパーコンピュータをベースとするこのシステムは、アクセラレータが全速力で動作するのに十分な冷却ができるように設計されている。48U標準ラックでは22台の2Uノードを収容可能でき、ノードあたり2個のIvy BridgeとGPUでラック全体で250テラフロップス、または4キャビネット買えば1ペタフロップスの性能をユーザに提供できる。CrayのBarry Boldingは我々に、ホストプロセッサ用の将来のIntel世代に関するさらなる情報を今後リリースすると語った。

これは単にGPUをこのシステムに高密度に追加するだけではない。Crayはいくつかの注目すべき機能で、冷却とデータ移動の面において、最大帯域とアクセラレータ性能をターゲットとするGPUワークロードをチューニングしているのだ。

これは空冷型のシステムだが、下記のグラフィックが示すように、重要な点は全面から背面へのエアフローによる冷却にあって、オーバーヒートや低いワット数で動作させることなしにGPUを動作させ続けることができるのだ。さらにこのエアーフローによって拡張オプションを許容している。将来の世代のアクセラレータを、要求される密度と同時に8台のGPUすべてを冷却可能にしながらボックスに追加することが可能だ。

20140826-F1-crayconfig

ご覧のように、これらはまた、CSシステムよりも多くのメモリを搭載し、2U構成の中で2CPUを搭載したマザーボードを中心に配置し、側面にそれぞれ4GPUを搭載させることによって、アプリケーションのための帯域幅の最大化を特長としている。繰り返すが、これは冷却と拡張性を助けるだけでなく、また、両ソケットの各サイドのPCIをどのように動かしているか注目して欲しい。PCIスイッチを通してこれらを動作させ、PCI Gen3を8つに分離してフル帯域幅で動作させているということだ。これはこの手のシステムの目的としては必ずしも斬新なデザインではないが、必要なのだ。

20140826-F1-csarch

「私たちは、エネルギー、高頻度取引、そして政府部門、並びにいくつもの異なるユーザ事例の中で数多くの顧客要求を見てきました。」と、Bolidingは語った。彼は機械学習、地震波処理やイメージ処理を含んだ高密度GPUシステムの需要を要求する他の分野も指摘している。

新CS-Stormスーパーコンピュータシステムの価格設定の感覚は押さえているが、これらはまだ早期の製造および生産段階であり、直ぐには限られた出荷しかできず、量産は今年の第4四半期になるだろう、とBoldingは語っている。一般的にCSシステム・シリーズと比較した場合、GPUの価格が構成に追加されるだろうと彼は言っている。その意味するところは、空冷式のCSシリーズとほぼ同じ価格でありそうだ。GPUの追加と、その追加に加えて多くのカスタムエンジニアリングを必要としないソフトウェア(OpenACCのサポートやGPUベースの機能など)の追加もあるだろう。

特色として、Crayは基本的にCS300に期待れるものと同じソフトウェア環境を使っているが、GPUアクセラレーションを可能とする適応したランタイムで、GPU加速するライブラリがある。ここには無いが誰もが予想するように、CrayはOpenACCで最適化されたコンパイラを持っており、また加速化されたワークロードを実行するために必要なIntelとNVIDIAソフトウェアもサポートしている。

Crayが大規模なユーザ数用の新製品を設計する際には、この会社は顧客との会話や市場データを基に需要の可能性を評価している。これは一つの顧客またはカスタム設計された製品ではなく、GPUは成熟した提案であり、顧客がGPUノードを追加してアプリケーションのチューニングに成功した現在、彼らにさらに大規模で強力な加速化されたシステムを見せている、とBoldingは言う。

「CSファミリーは市場主導のものですが、柔軟であり、私達が迅速に新しいフォームファクターのボードやサーバユニットを設計できることを意味しています。私達が見てきたことは8基のGPUを搭載する需要が増加してきたことであり、内部的には、どのくらい市場が大きいと我々が考えるかにおいてビジネス事例を実行し、新しい提案の開発の正当性を見ることなのです。」

「これはデザインとしては比較的新しいものでした。」と彼は続けた。「これは以前は私どものポートフォリオにはありませんでしたが、競合よりも優れたハードウェアとソフトウェアの組み合わせができると我々は考えたのです。」

「高密度GPU、空冷式オプションをCrayのCS3000が提供する既存の豊富なラインアップに追加することで、この標準型クラスタスーパーコンピュータ製品の市場をさらに拡大させます。」と、IDCのハイパフォーマンスコンピューティングにおける副社長であるSteve Conwayは語っている。「IDCの調査では、HPCシステムにアクセラレータやその他のコプロセッサを採用するサイトの比率は、2011年の28.2パーセントから2013年には76.9パーセントに跳ね上がると示しています。そして、GPUはこのカテゴリにおいて明らかなリーダーです。Crayは絶好調であり、Cray CS300シリーズの販売の上昇が支援しているのです。」