Power8とOpenPOWERはHPCに何を意味するのか
Timothy Prickett Morgan

IBMはハイブリッドコンピューティングにおいて大きな劇を演じており、POWER8プロセッサと様々なアクセラレータおよび高速ネットワークとの融合を模索し、チップとソフトウェアをOpenPOWERファウンデーションと通じて切り開こうとしている。サンフランシスコでのオープンイノベーションサミットにおいて、IBMとファウンデーションのパートナーは、彼らの協力体制が、いかにハイパースケールのWebアプリケーションやデータ解析に対してチューニングされたマシンを出せるようにするかについて話をした。しかし同じ技術は間違いなく、従来のスーパーコンピューティング環境においてでも展開されるだろう。
ひとつの議論は、IBMは浮き沈みのあるハードウェアと、ロスアラモス国立研究所におけるx86とCellのペタスケール級ハイブリッドシステムである「Roadrunner」において数年前に試験された考えに基づくソフトウェアスタックを使って、多くのパートナーと開放的な方法でOpenPOWERファウンデーションを成し遂げようとしているというものだ。これは最初の大規模なアクセラレータ付きのシステムであり、IBMは何が6年前のRoadrunnerで斬新であって現在は簡単に行うことができ、そして数年後に普通になるものを探している。
この時に展示されたPOWER8チップは50%ほどコア数が増えており、ソケット当たりの性能は様々な負荷に対してPOWER7プロセッサの2倍から2.5倍程度向上している。IBMはすべての種類のアクセラレータがPOWER8プロセッサと密にリンクすることと、これらのチップがベースとなるスケールアウトするクラスタが正しい種類の加速機構を持つことを望んでいる。それはGPU、FPGA、DSPや特定のジョブに必要な他のコンポーネントだ。
「私のそれに関する好きな考え方は、スーパーレーンハイウェイとして作ったPOWER8に、今そこで運転する車が必要だということです。」と、IBMの新POWER8ベースのシステム発表の際のサミットにおいて、IBMのPower System事業部のゼネラルマネージャーであるDoug Balogは説明した。「とても高速で、とても効率的な乗り物です。POWERシステムに接続するアクセラレータを許容するオープンなインタフェースに関してです。」
POWER8プロセッサにアクセラレータをリンクすることができるインタフェースのひとつは、IBM独自のCoherent Accelerator Processor Interface、略称CAPIだ。これはPOWER8チップ上のPCI-Express 3.0のコントローラのトップにあるオーバーレイで、CPUとアクセラレータ間の高速リンクを提供する。さらに重要なのは、CPUに接続されたメモリとアクセラレータに接続されたメモリに渡って、アプリケーションに対して仮想共有メモリ空間を提供することだ。CPUメモリとアクセラレータメモリ間でデータを移動することは、アクセラレータ付きのマシンにおける性能についての大きな障害だ。そのため、全てのメモリを、全ての演算コンポーネントに対してアドレス可能とすることが重要だ。
IBMのCAPI対応とは別だが、それとうまく整合させながら、NVIDIAは独自のNVLinkインターコネクトを持ってきている。これはTesla GPUをPOWER8プロセッサ(おそらく他にも)に接続したり、Tesla同士を接続するために使われる。NVIDIAのGPU加速計算ビジネス事業部のSumit Guptaは、NVLinkがIBMの将来のPOWERプロセッサの設計に組み込まれ、そしてこのインターコネクトが2016年あたりが期限の「Pascal」世代のGPUの一部であることを思い出させるだろうと語った。NVIDIAはまた、NVLinkの技術をOpenPOWERファウンデーションのメンバーにライセンスすると、Guptaは言っている。そして2社は、POWERとTeslaでの演算を結合させることでアプリケーションを高速化することに一緒に取り組むことも付け加えた。今年の第4四半期において、NVIDIAはPOWERプロセッサ上のCPU-GPUハイブリッド用のCUDA開発環境をフルサポートすると、Guptaは語った。実際に、IBMはTesla GPU小プロセッサを搭載したPOWER8システムを出荷開始する予定だ。
「一日の終わりには、アドバンテージを取ることに関して、システムはソフトウェアと同じ程度のものになります。」とGuptaは説明した。「そうであるからこそ、未来と長期のフォーカスはソフトウェア周りにあるのです。」
IBMはFPGAメーカーのXilinxおよびAlteraと共に、CAPIインタフェース上で動くハイブリッドな組み合わせの利点を示すことに取り組んでいる、だから、これはGPUアクセラレーションだけのものではないのだ。Impact2014のイベントにおいて、IBMとXilinxはFPGAで高速化される「Memcached key value store」アプリケーションを展示する予定であり、35倍の高速化と低遅延を披露する。AlteraのFPGAで高速化されたPOWERマシンで実行するモンテカルロシミュレーションは200倍のスピードアップとなる。ネットワークアダプタとスイッチのメーカーであるMellanox Technologies社もまたIBMと、異なる「key value store」アプリケーションでRemote Direct Memory Access (RDMA)を使うと、いかにスループットを10倍に上げ、遅延をカットするかを見せることに一緒に取り組んでいる。
プロセッサとアクセラレータ間の高速リンクとは別にPOWER8チップに関する利点は他にもある。このチップはネイティブなリトルエンディアンのメモリ領域とアクセス方式を採用しており、x86プロセッサと同じものであり、メモリのビッグエンディアンの順序とは対照的だ。重要な事は、x86もPOWER8もリトルエンディアン・メモリをサポートとしており、x86システムからPOWER8システムに移行されるアプリケーションは、Balogが言うように「リコンパイルして、試験して、動かすだけ」だ。
これは特にC、C++およびFORTRANにとって重要であり、明らかにJavaのようなインタプリタ型言語とは関係がない。OpenPOWERファウンデーションのメンバーが従来のHPCアプリケーションを高速化することを模索しているとは明らかには言っていないが、これはらHPCシステムで利用されてきたコア技術であることは明白だ。IBMと検索エンジンの大手であるGoogleを含むお友達が、POWERチップとアクセラレータをミックスしてマッチさせるハイブリッドマシンと同様にプレーンバニラのPOWERシステムがもっと効率的に動く方法を思いついたとしたら、これらのスケールアウトするシステムは官庁やアカデミックなHPCセンターで終わらないと信じる理由はない。それは、いつものように、特定のワークロードに適合するマシンを適切な価格で持てるようになるだろう。十分に言うなら、IBMとOpenPOWERファウンデーションのパートナーがハイパースケールなデータセンターの運用にアピールできるほど、十分の低コストなサーバを作れるなら、間違いなくHPCセンターの興味をそそるだろう。
一方で、IBMはPOWER8プロセッサベースで販売する5つの新しいマシンの詳細を暴露している。これらはPOWER System S-Classと呼ばれており、「S」はスケールアウトのSだ。HPCコミュニティによるLinuxの圧倒的な採用を考えると、新たしいラインの2つのLinuxのみのマシンはおそらく最も適している。しかし、少し速いクロックスピードを持っている1つのマシンが、IBMが何を料金チャージするかによるが、HPC顧客の興味を引きかもしれない。
POWER S822Lは、2ソケットのマシンで2Uシャーシに収まっており、おそらくHPCショップが最初に見るものとなる。このシステムはシステムボードに取り付ける2個のプロセッサカード用の領域を持ち、各カードは最大512ギガバイトの主記憶を搭載できる。顧客はPOWER8を12コア中10コアを3.42 GHzで動作させるか、もしくは12コアすべてを3.02 GHzで動作させるか選択することができる。このマシンは安価なSATAディスクはサポートしていないが、1ダースの2.5インチSASドライブかSSDを搭載することができる。またストレージケージを持っており、6台の1.8インチSSDおよびPCI-Express 3.0スロットを9スロット持っている。このマシンは6月10日に販売開始され、Red Hat Enterprise Linux 6.5、SUSE Linux Enterprise Server 11 SP3、およびCanonical Ubuntu Server 14.04 LTSをサポートしている。また、IBMがRed HatとCanonicalと連携して作成したKVMハイパーバイザーの一種であるPOWERKVMハイパーバイザーも動作可能だ。
POWER S812Lは同じ2Uシャーシだが、プロセッサは1台で(上記の2ソケットマシンと同じオプション)、6個のPCI Express 3.0スロットを持っている。このマシンは8月まで出荷されず、おそらくPOWER S822Lと比べて低い演算密度のためにHPCショップにアピールできないだろう。
HPCでの活躍を見れるかもしれない3つ目のマシンはPOWER S822だ。このマシンはIBM AIX 6.1または7.1オペレーティングシステム、RHEL 6.5またはSLES 11 SP3 (Ubuntu Serverはまだ実証されていない)をサポートしている。このサーバは1台または2台のプロセッサカードを搭載し、顧客は2つの異なるプロセッサを選択可能だ。3.89 GHzの6コアPOWER8もしくは3.42 GHzの10コアからだ。マシン内の各ソケットは最大512ギガバイトのメモリをサポートし、1台のプロセッサカードだと6個のPCIスロットを、2台のプロセッサカードでは9スロット搭載している。
ベースのPOWER SYSTEM S-Classサーバで7,973ドルとIBMは言っているが、構成やどのシステムの価格なのかについては言及していなかった。Big Blueは新しいS-Classシステムの価格情報を現在公表している予定だ。