世界のスーパーコンピュータとそれを動かす人々


6月 12, 2015

SRC、防衛用に強固にしたFPGAサーバを登場

HPCwire Japan

Tiffany Trader

リコンフィギャラブル・コンピューティングのスペシャリストであるSRCコンピュータが作成したSRC Saturn 1サーバが先日登場し、ハイパースケール・コンピューティングおよびビッグデータ解析における大容量ワークロード用のx86の代替として位置づけている。

過去に我々はいくつかのFPGAベースのサーバソリューションが市場に出てくるのを見てきたが、Saturn-1はその血統とFPGAプログラミングの良くある複雑性との決別によって区別される。SRCは1996年にスーパーコンピューティングの革新者であるSeymour R. Crayとインテルの投資家で前ディレクターのJames Guzyによって設立された。Crayは少ないプロセッサ数でいかに最大の馬力を引き出し、そして複数のプロセッサの力をいかに利用するかにフォーカスする一方で、インテルのGuzyおよびその他のものはパーソナルコンピュータ用に設計された汎用プロセッサを作っていたのだ。汎用プロセッサを非常に特殊なタスクに使うには制限があることを認識して、この二人組はSaturn 1となるプラットフォームを思いついたのだ。

12年間、FPGAベースのサーバと開発プラットフォームのCARTEは様々な国防と情報ソリューション用に利用されてきたが、SRCは今がさらに広い市場に入るのに最適な時だと考えている。

SRCコンピュータのセールス&マーケティングの副社長であるDave EatonはHPCwireに対して、
例えばプロセッサ当りの性能を押し上げたり、設置面積を最小化したり、電力を削減したりなど、防衛用に開発した必要要件の多くはハイパフォーマンス・エンタープライズ・アプリケーションまで続いると説明した。

「サーバ市場は多くの同じ質問を尋ね始めているのです。」とEatonは言う。

より高速なクロック速度に基づいたムーアの法則主導の性能の向上は、2000年半ばには尽きてしまった。マルチコア技術はひとつのコアに複数のコアを加えてスループットを向上させたが、それは固有の問題には対処していない:マイクロプロセッサの性能は壁にぶつかっている。90パーセントのリソースを残り10パーセントに対するデータのストアと輸送に使うx86マイクロプロセッサとは異なり、SRCはワークロードが必要とするロジックのみを使用することで不要なオーバーヘッドを避ける。すべての命令は同時にたった1クロックサイクルで実行される。SRCはこのサーバが従来のx86設計より最大500倍高速であると報告している。

SRCはこの新プラットフォームの設計に1億ドル以上を掛けており、官庁の利用で10年以上も強固にされてきたのだ。ファームウェアはバージョン8でCARTEはバージョン12だ。

20150528-F1-SRC-Saturn-1-Server-slide

Saturn 1サーバのカートリッジはスタンドアロンのサーバとしてSRCコンピュータから購入可能であり、HPからはMoonshotシャーシの一部としても購入可能だ。上記の画像が示すように、カードには2個のStratix-IV FPGAが搭載されている。上のはユーザFPGAでユーザのアプリケーションに全て利用可能であり、下のシステムFPGAはSRCが書いたソフトウェアが搭載され、すべての部品を一緒に単一のシステムにまとめている。また2個のメモリバンク、小規模な4コアのインテル・プロセッサ、および複数のイーサネット・ポートを持ったエッジ・コネクタを搭載している。

サーバ・カートリッジはパッシブ・バックプレーンを持ち、プロセッサにとらわれないHPのmoonshotシャーシに入れる事ができる。各サーバは45ワットで動作し、Moonshotシャーシに42台のSaturn 1サーバを収納した場合の電力負荷は2000ワットだ。9シャーシを装備したラックはでは約20,000ワットを消費する。

このサーバはStata-IV FPGAを装備しているが、プラットフォームは実際にはプロセッサに依存しない。現在のバージョンであるAlteraに戻る前に、Lucent、Altera、Xilinxを採用する初期の繰り返しがあった。FPGAを選択する要因は純粋な馬力へのアクセスと、不要な業界固有のアドオンの回避である。

このプラットフォームの決定論的な性質は、Saturn 1で実行されるプログラムが何回実行しようが完全に同じ性能で動作することを意味している。従来のx86プロセッサと比べた場合の他のメリットとしては、桁違いの性能向上、処理消費電力の削減、そしてより小さい設置面積がある。

SRCが強調するもうひとつのメリットは使い易さである。FPGAをプログラムするのに要する時間と労力はより広い普及を阻害していた。Verilogのような低レベルな言語に追いやられる代わりに、SRCの顧客は、C+、PythonやRubyのような慣れ親しんだ高級言語でプルグラムを書けるカスタムな開発環境であるCARTEを利用することができるので、サーバは普通のx86サーバのように展開することができるのだ。SRCは、企業が自らのアプリケーションをSaturnサーバにたった3日間で移植したと報告している。

HPC特有の事例においては、Saturn 1は、プログラムもしくはアルゴリズムの中でCPUサイクルの90から95パーセントを消費する特定の箇所であるホットスポットに対処するのに理想的なものだとEatonは語っている。彼は、CPU集約型の定数と調整を追加して混ぜ合わせたブラックショールズアルゴリズムを使ってオプションの価格付けをする金融機関の例を取り上げた。Saturn 1に移行したために、このようなショップは最も高性能なx86マシンで得られるものよりも20から30倍のスピードアップを見ている。これはまた、処理速度を落とす事無く、アルゴリズムにさらに機能をもっと追加できるようにしている、とEatonは言う。

FPGAモデルの柔軟性の欠如を心配する人たちにとっては助けとなるかもしれないのが、プロセッサはたった1秒以内で完全に再プログラム可能であることを知る事だ。これは、サーバがピークのワークロードに適合するために、その場で最適化できることを意味している。例えば、Saturn 1を使えば、Googleのような会社はピークの昼間の時間帯は検索要求を処理するプロセッサを構成することが可能で、そして検索が少なくなる夜には、サーバ環境はWebクロール用に最適化することができるのだ。

「ソフトウェア定義サーバの検索について聞いたことがありますか?」とEatonは尋ねる。「ひとつは、メモリ構成を変更したり、もしくはハードドライブの容量を変更したりすることができるソフトウェア定義サーバを持つ事であり、今や我々はソフトウェアを持ったサーバ自体の実際のプロセッサを定義することについて話をしているのです。」

SRCのサーバは直ぐに出荷しているが、数百システムの大規模の注文は6から8週程度掛るそうだ。サーバのコストは各19,950ドルでボリューム価格があるそうだ。CARTE開発環境用のライセンスはシート当り14,000ドルで、CARTEを学習するための3日間のワークショップを参加者の人数に応じた価格で提供している。ソフトウェアおよびハードウェアの両方のサポートは必要であればSRCを通して行うか、もしくはHP Moonshotシャーシのバージョンを購入した場合には、HPが顧客のニーズをベースとしたサポートを提供可能だ。