Moonshot、ARMのリーチをHPCを近づける
Nicole Hemsoth

広い範囲のHPCユーザが、ARMエコシステム出現による新たな展開を袖から注視しているように思える一方、長期に渡り支配的なx86の発注にこれらの構えが重大な脅威となるには暫くかかるだろう。しかし、HPのMoonshotラインに沿った一般利用可能な2つの新しいARM参入製品の発表で、そしておそらく今後数ヶ月中に残りのベンダー集団からより多くのものが現れ、戦線が開始される。
HPCユーザは、多くの場合、HPC指向のベンダーとIntelからの増え続ける在庫単位によって満たされているデータセンターの一般的な量的ニーズよりもチューニングやカスタマイズに対する多くの明確な欲求がある。HPのMoonshotラインのサーバを含む64ビットARMの出現に伴い、そして高性能と効率のためにApplied MicroのSoCとGPUが組み合わされたEurotechのような他の小さなベンダーからのマシンは、新しいホストプラットフォームとしてだけでなく、今後数年間、多くの驚きを与えるかも知れない。
ここで興味深いことのひとつは、ARMがMoonshot、Eurotechおよび他のベンダーを介して其処彼処のHPCへ入って行く可能性があるにもかかわらず、一部のなかなか消えない疑問が残ることである。まず、HPCのための主要なx86サーバ間の性能の違いは何か? 次に、数年間それに関連し、計算した場合、TCOは何か、幾らかの潜在的な犠牲または性能の利点に対する電力と冷却の側面にどのようにその全てを合わせるのか? さらに、何が開発のハードルであり、それらが古いは数ラインであった時からx86サーバ上で活発に動いている特定の複雑なコードのために何が必要とされるのか?そして、このことを念頭に置いて、ひとつの重要なゴール ー 柔軟性 ー に占有されたプロセッサのエコシステムのために、どのくらいのカスタマイズが、HPCユーザーのための積み重ねを上下することが可能だろうか?
結局のところ、想像出来るように、それらはまだ読み取るための簡単な要素ではない。部分的にHPC側にあるため、単に十分なデータがまだ存在していない。それは、我々が実際の性能、TCO、開発のマトリックスを比較ポイントとしみなすことが出来ない箇所でのニワトリと卵のシナリオの一部である。しかし、これらHPのようなより「既製」のシステムが正式に発表されたことにより、それを始めることは少し簡単になるかも知れない。より多くのそのようなシステムが登場することで、HPCの中でのARMにとってこれらの指標がどのように見え、実際の道筋が何であるか良い感触を得ることだろう。
![]() |
最初に、そしてHPCにとっておそらく最も興味をそそるものは、Applied MicroのX-Gene SoCを適用したHP ProLiant m400であり、電力、冷却、空間の節約を含む3年間を反映させた新しいのProLiantを評価した最近の研究によれば、「ラックサーバと比較してTCOで最大35%の削減が提供される」。この比較は、ミッドレンジおよびハイエンドの1Uサイズのx86ラックサーバの組み合わせに基づいたものである。
これらのSoCは、Applied Microの言う最大2.4 GHzで動作するコアを8つ備えている。 HPは、このボード上にすべて4つのメモリチャネルを実装し、チャンネル全体で最大64ギガバイト搭載可能である。それらはまた、我々がよりたくさんの詳細を待っている新しいHP製スイッチの内部と2つの10GbE接続が可能なMellanoxのConnect-X3デバイスも備えている。それはより高密度な4.3Uの中にこれら45個のカートリッジを搭載することを可能にした。さらに、これらのパッケージは、好みや予算に応じて、64GBのDDR3メモリと120GB、240GBまたは480GBのSSDストレージを搭載することができる。一方、Eurotech仕立てのHPC仕様にするため、GPUでそれらをドレスアップすることはできないが、密度を損なうことはない。45個のカートリッジとスイッチの構成で既存のMoonshot1500シャーシに詰め込まれる。
私たちはすでに新しいMoonshotサーバのDSP変異体の初期のユーザ、PayPalとm800の利用、をプロファイルしているが、HPの認識しているm400の花形顧客のひとつは、それをプラットフォームとして使用し、HPC研究クラウドを構築しているユタ大学である。 「ARMベースの64ビットシステムオンチップのサーバカートリッジを搭載したHP Moonshotは、クラウドコンピューティングの将来に不可欠となる三つの要因、低コスト、高密度、そして低消費電力を兼ね備えています。」と、大学のコンピュータサイエンスの研究助教授、Robert Ricciは言った。さらに、サンディア国立研究所では既に、エクサスケールコンピューティング用の将来のアーキテクチャを評価するために使用している先進アーキテクチャテストベッド内でm400の早期使用について議論していた。サンディア国立研究所のJames Ang博士は、無名なX-Gene1クラスタ上のMantivoプロジェクトでの作業を引き合いに、この簡単な詳細についてISCで話した。
上記で引用したPayPalの例に見られるようなにより一層リアルタイム分析エンジン化したm800は、Texas InstrumentsのKeyStoneアーキテクチャのDSP機能を搭載した32ビット命令セットを備えている。 1GHzにクロック周期に落とされた4つのARMコアと1GHzで動作する8つのDSPを伴って、HPは彼らの4.3Uプラットフォーム内に180個のこのようなカートリッジを収納し、管理する。
一方HPは、主流のエンタープライズ市場だけでなくHPCの人たちにもアピールしている。この時点での最も有望な市場は、電気通信、Webサービス、および「ビッグデータ」とリアルタイムオペレーションが必要なその他の大規模オペレーションと思われる。彼らがCanonicalのUbuntu(Ubuntuは、HPC Linux市場のむしろ小さな部分を占めているだけだが不可能ではない)の周辺を含め幾らかの活動を行うために「典型的」なHPCの販売店を必要としないことは注目に値する。プログラミング側のそれらの急展開を容易にするために、HPは彼らのパートナーワンプログラムを通して完全な開発キットを提供している。
価格は、m400のフルユニットで約65,000ドルから始まり、DSP搭載のm800は81,000ドルからである。