世界のスーパーコンピュータとそれを動かす人々


9月 17, 2013

Cray、共有メモリを語る

HPCwire Japan

Nicole Hemsoth

大規模共有メモリシステムは、時にもの珍しさと、例えば、PSCCの有名なSGI AltixのUV1000「Blacklight」システムを含む幾つかは特定の高性能コンピューティング・ワークロードに対処する能力のために大きな注目を受けている。

Blacklightや同様の大型のコヒーレントな共有メモリシステムは、統一されたアプローチをもたらすハードウェアベースのアプローチによって動作するが、Crayは、ソフトウェア方向に方針転換し、ソフトウェアレベルで類似の焦点を当てたシステムを作成することを決定した。 今朝、彼らは単一のオペレーティングシステム・インスタンス内で広大なメモリを必要とするワークロードのための空間を作るCray CS300システムの異なる2つの事前設定構成を発表した。

彼らが使命した長年のパートナー、仮想化ベースの共有メモリシステム・ソフトウェアベンダーのScaleMPによると、スーパーコンピュータメーカーは、彼らは単独で共有メモリシステムを作成するためのより投資の重いハードウェアベースのアプローチを行うリスクを負うことなく、彼らのクラスタ・アーキテクチャを拡大し、大規模メモリアプリケーションをサポートする両方の事ができると言う。 ScaleMPのVSMP Foundationソフトウェアは、複数の汎用のx86サーバーを一緒に束ね、SMPシステム(通常はより高価もの)の代替を提供する単一の仮想システムを作成する。

具体的には、今日、Crayは、基本的に360個のXeonコア、4.75TBのメモリ、単一または二重レールのFDR InfiniBandを装備する能力を誇る(アップグレードは別にして)、共有メモリ並列システムであるCS300 SMP製品を発表した。

20130917-F1-2

もう一つは、Cray CS300 LMS(大容量メモリシステム)は、シンプルなデュアルおよびクアッドソケットシステム上に進行する高メモリ要求な環境での多くのコア数を使用せずに、直接メモリアクセスによってこれらのワークロードを管理する。 Crayは、これら段階的なシステムは4.75 TBから8.75 TBまでのメモリと20~32個のXeonプロセッサコアまで拡張できるという。 これらは、HPCシステムの仮想化ベンダーの中核事業であるScaleMP vSMP Foundationソフトウェアを包含した標準の空冷型CS300sである。

CrayのBarry Boldingは、確かに従来のクラスタでは分割することが出来ない幾つかのHPCアプリケーションがあるが、それは少数、おそらく10%程度だろうと言うことを認めた。依然、これらのワークロードは大規模なメモリアーキテクチャが必要であるが、例えばSGIのようなハードウェアベースのアプローチは、多額の追加費用の発生の可能性があり、維持することも単純ではない (i.e. 新しいプロセッサ世代等でシステムのアップデートが求められたり)。

興味深い事に、そのスーパーコンピューティング・ハードウェアの歴史として知られている会社は、かなり大きな既知の市場が無かろうとソフトウェアの恩恵のためにその起源に背を向けるが、ライバルSGIがNUMAlink技術で行った事を行うには投資が必要であり - ScaleMPアプローチは、より低いコストで全てを提供 - そして、CrayがCS300ラインに対するオプションの一覧にそれを追加することによる現実的な危険性は無いと、Boldingは言う。

大規模メモリシステムを独自のハードウェアベースのアプローチで作ることは問題外ではないとBoldingが言ったのに対し(そして既に長い時間やり取りが行われているアイデアであった)、これは方向性として決定的な第一ステップとして見えるべきものでは無かった。 一つは、Crayがハードウェア共有メモリ分野の彼らの最終評価においてCS300ラインにこの追加の選択と成功を判断し、特定することができるが、Boldingは、共有メモリにおいてソフトウェアベースの利点 – 最も顕著な事は前述のように劇的に低コストであり、よりメンテナンスが安易である – があると言う。

コスト面では、ScaleMP共有メモリソフトウェアの追加は、大幅なコストを追加することなく、工場で統合し、出荷する準備ができている、とBoldingは指摘した。 システムの範囲は、大容量メモリ構成の約$ 200Kから上位のSMP版で$ 300Kからである。 Crayは、この追加で販売記録を更新することを期待していないが、CS300のポートフォリオを区別するものを提供し、そしてより一層共有メモリ領域をテストする。

ScaleMPの創設者で社長兼最高経営責任者(CEO)のShai Fultheimとの今朝の会話では、共有メモリシステム作成についてのソフトウェアベースのアプローチの価値について話をした。Fultheimは、我々に語ったように、それらの仮想化アプローチでは、システム全体(CAPEX)と管理の複雑さ(OPEX)のコストを削減すると言った。 具体的には、彼は、vSMP Foundationは、最大128台のx86システムを集約して、最大32,768個のCPUと最大256TBの共有メモリを持つ単一システムを作成出来るという。

Fultheimはまた、これらのアプローチは、高性能コンピューティング環境に留まらないことを指摘した。 ビッグデータ、分析論およびデータベース駆動型の企業は、性能、管理と効率性の目標に到達するひとつの単一のx86仮想化システムに共通のx86システムを集約するソフトウェアベースのパラダイムの利点を探している。

20130917-F1-3

ScaleMPは、2009年に始まり、128コアと1TB共有メモリまで拡張可能な共有メモリ型デスクサイド・スーパーコンピュータを運用するHPC顧客のための共同ソリューションを介して過去にCrayと提携していた。

「Crayは常にハイエンドシステムの要件を再定義し、最も要求の厳しいユーザーとの特別な関係を持っています。このコラボレーションでは、Crayの新しい大容量メモリと共有メモリシステムは、広範な技術計算の観客が大きなワークロードに対処し、迅速に結果を得るための機能の恩恵を受けるようになるでしょう。」とFultheimは言った。