世界のスーパーコンピュータとそれを動かす人々


11月 24, 2016

IBM、NVLink付Power8と3システムを発表

HPCwire Japan

John Russell

2017年に出荷する予定の次世代Power9チップの詳細が明らかになってからそれ程時間が経っていないが、IBMは、三つの新しいPower8ベースのLinuxサーバーとNVLinkインターコネクトを内蔵したPower8チップの新しいバージョンを発表した。そのサーバのひとつは、Power S822LC for HPCであり、新しいチップ(NVLink内蔵Power8)は、NVIDIAの最新の最高性能GPUであるP100 Pascal GPUと通信する。

他の二つのサーバーは、Power S821LCとPower S822LC for Big Dataであり、PCIeインターフェース経由でGPUアクセラレーション技術(K80またはP100)を活用し、フラッシュストレージおよびFPGAで使用するためのIBMのCAPI(Coherent Accelerator Processor Interface)を有している。すべての3つのサーバーは、IBMのLinuxのラインに標準的な2ソケットの追加になる。

IBMのHigh Performance Computing and Analytics部門のVPであるSumit Gupta氏は、これらの新しいサーバーの導入は、新しいパラダイムであるアクセラレーション・コンピューティングや主要な市場促進要因である認知コンピューティング(特筆される)とビッグデータ分析に向けたIBMのビジョンに対する継続的なコミットメントの証しとして見られるべきです、と述べている(HPCwireの記事「Think Fast: IBM Talks Acceleration in HPC and the Enterprise」を参照)。

また、注目すべきは、新しいシステムがパートナーによって製造されていることだ。「これらのOpenPOWERシステムの3つすべては、アクセラレーション機能から設計と製造にいたるまで、OpenPOWERパートナーの強みと専門知識を活用しています。オープンの精神に基づき、これらのシステムを製造している私たちの業界パートナー、OpenPOWERパートナーでもあるWistron社、およびSupermicro社は、彼らの顧客に対してOpenPOWERエコシステムを増殖させるために、POWERベースのサーバーを提供することになると期待している。」とGupta氏は述べている。

20160908-IBM.LC-Server-768x402

シリコンレベルで埋め込まれたNVLinkを備えたS822LC for HPCは同等のx86ベースのシステムよりも「5倍は速くデータを転送できる」とIBMは言っている。発表に際しGupta氏が書いている詳細なブログによれば、これによりGPUの積極的な使用に際しプログラミングレベルの障壁を大幅に低減することができる。IBMによると、これらのサーバーはNVLinkとともに提供される初めてのPower8ベースのシステムだ。

「CPUからGPUへデータを移動する際、それがボトルネックになっていました。何故ならほとんどのシステムで、PCIeという細いパイプを通過しているためです。NVLinkによって、GPUがはそのリンクの相手であるCPUと1TBの半分までのアクセスが可能になりました。」と、Gupta氏はHPCWireに語った。 NVLinkは両プロセッサ間のデータ転送を改善し、それは基本的にプログラムすることが容易になる。

「アプリケーションが起動されると、すべてのデータは、システムメモリ上にあります。あなたは、GPUへデータを移動しなければなりません。 NVLinkは、3つのことを行います。我々はプロセッサ間に太いパイプを用意したので転送性能が向上します。それにより、より小さな機能をGPUに移動することができます。GPU側でのデータ管理を減らす事ができるので、アクセラレータ側のプログラミングが簡単になります。」

20160908-IBM.POWER8_.NVLINK

NVLinkを搭載した新しいPOWER8プロセッサは10のコアを備え、最大3.26 GHzで動作する。このサーバーで使われているPOWER8プロセッサは、x86 CPUよりも高いメモリバンド幅、115ギガバイト/秒を有しており、ソケットあたりのシステムメモリを0.5テラバイトまで持つことができる。POWER8プロセッサでは、コア当たり大きなキャッシュがあり、これが高速なコアに結合され、高いメモリ帯域幅がアプリケーションの性能とスループットの向上をもたらしている。

新しいNVIDIAのTesla P100 GPUアクセラレータは浮動小数点性能を向上させ、半精度で21テラフロップス、単精度で10.6テラフロップス、倍精度で5.3テラフロップスを実現している。アクセラレータは
16GBのHBM2積層メモリを持ち、GPUとの間で720GB /秒メモリ帯域幅を提供している。NVLink結合を行うNVIDIAのTesla P100 GPUのSXM2フォームファクタは、PCI-E系のシステムよりも14%以上の演算性能を提供する。

Gupta氏は自身のブログに、アプリケーション・アクセラレーションにおけるNVLinkの三つの主要な利点を記載している。

性能:NVLinkを搭載した新しいPOWER8プロセッサと新しいテスラP100 GPUは4つのNVLinkインタフェースを持ち、「他のシステムで使用される、PCIe x16 Gen3 の接続よりも5倍の高速通信を」可能にする。これにより、GPUとの細いPCIeデータパイプの限界を克服して、より高速なデータ交換とアプリケーションの性能向上を可能にする。
プログラマビリティ:CUDA 8ソフトウェアとテスラP100のページマイグレーション・エンジンによって、CPUとGPUのメモリ間で統合メモリ空間の提供される。NVLinkと相まって、統合メモリ空間はGPUアクセラレータのプログラミングが開発者にとってより容易になる。アプリケーション開発者は、データ管理に苦労すること無く、順次GPUにCPUの機能を移動させることにより、加速化を行うことができる。
加速化するアプリケーションの多様化:NVLinkは、CPUとGPU間の通信時間を短縮するので、加速のためにGPUに転送するデータが小さい事を可能にします。これは、多くのアプリケーションが、GPUで加速できることを意味します。

IBMは発表を行う際に、「IBMはIntelよりも良い」という言い方を徐々に増やしている。その広範なアプリケーションのターゲットは、ビッグデータと分析だけでなく、ディープラーニングや認知コンピューティングを包含している。

「データ分析、データベース分野そして機械学習とディープラーニングさらに人工知能を含めたHPC分野において、我々はPower8の市場での優位性を感じています。」と、Gupta氏は語っている。 「何故なら我々は速いコアを持っており、例えばデータベースではIntelベースのシステムに比べて私たちはより高い性能を見ています。『kinetica』のようなGPUにより加速化されたディープラーニングや機械学習向けのデータベースアプリケーションにとって、CPUとGPU間のNVLink高速データ接続は価値ある事です。」

x86の市場シェア獲得で苦戦を強いられたIBMは、その成功へ転ずる為にハイパースケーラーに浸透するための努力を過去に強調していました(HPCwireの記事「Handicapping IBM/OpenPOWER’s Odds for Success」を参照)。

IBMの発表によると、「世界最大のインターネット・サービス・プロバイダのひとつであり、中国に拠点を置くTencentにおける初期テストの結果、新しいPower S822LC for Big Dataの大規模クラスターが以前のx86ベースのシステムと比較して、データ集約型のワークロードで3倍の性能を達成した。それ以上に、この結果はサーバの数を三分の二に削減して達成されたのです。少数のサーバーを使用して、より高い性能を実現できる大幅なコストメリットを考えて、同社は現在、ビッグデータのワークロードのために、そのハイパースケールデータセンターに新しいLCサーバを統合しようとしています。」

20160908-sumitgupta
Sumit Gupta、IBM

Gupta氏は、Power9の発表にもかかわらずPower8ベースの新しいサーバーに対する大きな需要がありますと主張している。 「いくつかの企業、研究機関そして政府機関は初期のシステムを事前にテストして発注しています。その中でも製品の出荷を先頭で待っているは多国籍小売販売巨大企業と米司法省のエネルギーのオークリッジ国立研究所(ORNL)です。」と、IBMは発表している。

ORNLは、内蔵NVLinkインタフェース技術を活用してアプリケーションを最適化するための開発プラットフォームとしてこの新しいシステムを使用する。さらにこのシステムは、IBMが2017年に提供するPower9チップベースのオークリッジ国立研究所の次世代スーパーコンピュータ「Summit」に必要となるアプリケーションを開発するための初期テストベッドの役割を務めることになる。OLCFプロジェクトディレクターであるArthur S. (Buddy) Bland氏は、プレスリリースで次の様に述べている。「GPUの長年のユーザーとして、私たちはこのシステムによりアプリケーションの性能が向上し、ユーザーが素晴らしい成果を容易に達成できるようになるであろうと信じている。」

エコシステムを構築することはむつかしい問題だ。 IBMとOpenPOWERにとっては、たくさんの多様なピースが、必要に応じて一箇所に集結する必要がある。結果は時が教えてくれるだろう。

Gupta氏のブログへのリンク:www.ibm.com/blogs/systems/ibm-nvidia-present-nvlink-server-youve-waiting

画像の出典:IBM