世界のスーパーコンピュータとそれを動かす人々


6月 17, 2015

金融系ベンチマークでIBM Power8がx86を凌ぐ

HPCwire Japan

Tiffany Trader

平均的な金融系ワークロードにおけるIBM Power8アーキテクチャの正式な評価を待っているなら、もう探す必要はない。6月4日に開催されたSTAC Summitにおいて発表された結果によれば、標準の金融業界ベンチマークのセットを実行時に、IBM Power8ベースのシステムサーバが対抗であるクラス最高のx86の2倍上の性能を達成したのだ。

IBMのHPCおよびOpenPOWERオペレーション担当副社長であるSumit Guptaが詳細について語った。3月に発行された認定STACレポートにおいて、IBM Power8アーキテクチャがSTAC-A2試験を通過した最初のタイムを記録した。ユーザコミュニティが開発したSTAC-A2ベンチマークセットは、モンテカルロシミュレーションと「ギリシャ指標」の計算で特徴付けられる金融リスク分析ワークロードのクラスを代表している。

ギリシャ指標ベンチマーク(STAC-A2.β2.GREEKS.TIME.WARM)におけるウォームランの他の公表されている結果と比較すると、2個の12コア3.52 GHz Power8プロセッサカードを装備した2ソケットのPower8サーバは次のように達成している:

  • 同等のx86セットである、2個の2.30GHzで動作するXeon E5-2699 v3(Haswell EP)を搭載したIntelのホワイトボックスに対して2.3倍の性能。
  • 最高性能のx86ソリューションである、2.30GHzで動作する2個のIntel Xeon E5-2699 v3プロセッサ(Haswell EP)と1個のIntel Xeon Phi 7120Aコプロセッサを搭載したIntelのホワイトボックスに対して1.7倍の性能。
  • 最高性能のソリューションである、3.0GHzで動作する2個の10コアIntel Xeon E5-2690 v2 (Ivy Bridge)と1個のNVIDIA K80 GPUアクセラレータを搭載したSupermicroサーバに対して、わずか10パーセント性能が劣るだけ。

このPowerサーバはまた、path scaling(STAC-A2.β2.GREEKS.MAX_PATHS)およびasset capacity(STAC-A2.β2.GREEKS.MAX_ASSETS)において新記録を達成している。最高の4ソケットのx86ベースのソリューション(2.80GHzで動作する4個のXeon E7-4890 v2(Ivy Bridge EX)を搭載したサーバ)と比較すると、Power8サーバは次のようになっている:

  • スループットで2.1倍。
  • Asset capacityで16パーセントの増加。

STACの試験システムは、2個の12コア 3.52GHz POWER8プロセッサカードを装備したIBM Power System S824サーバで、1TBのDRAMを搭載し、Red Hat Enterprise Linux Version 7が動いている。

ソリューションスタックは、IBMが書いたLinux on Power System(Rev A)用のSTAC-A2パックで構成されており、C++コンパイラと数学アクセラレーション・サブシステム・ライブラリ(MASS)、および工学科学サブルーチンライブラリ(ESSL)を含んだC/C++開発スイートであるIBM XLを使っている。

20150609-F1-IBM-Power8-STAC-A2-results-graph

ブログの投稿では、「マイクロベンチマークや単純なコードのループと比較して、STAC-A2は予測される性能のさらに正確な視野を提供しています。」とGuptaは書いている。

Guptaはこの機会にPower8の基本的な利点のいくつかを披露している。「最初に、POWER8の各コアは8ウェイにマルチスレッドすることができますので、単一コア上に8スレッドを実行させることができ、12コアCPU全体では96スレッドとなります。」とHPCwireに語った。「プロセッサがそのように設計されているので、アプリケーションのスケーラビリティもまた非常に良いです。」とGuptaは語った。「そしてメモリ帯域幅はかなり高く、様々なアプリケーションにおいて劇的に高い性能を出すことができるのです。例えシングル・スレッドの性能でもx86と比較して高いのです。」

ブログでは、ソケット当り192 GB/sのPower System S824のメモリ帯域幅が「一般的なx86プロセッサ速度のほとんど3倍である」ことと、Power System S824サーバの各コアが3.5GHzで同時に8個のスレッドが動作する方法について繰り返している。

「コア当り8MBの大規模内部L3を含んだバランスが取れたシステム構造などの要素が、代わりの選択肢よりもPOWER8ベースのシステムで何故金融計算のワークロードが非常に高速に動作するかの大きな理由なのです。」とGuptaは締めくくった。