世界のスーパーコンピュータとそれを動かす人々


3月 13, 2015

FPGAで高速化された検索がメインストリームに向かう

HPCwire Japan

Tiffany Trader

今やデータ量がムーアの法則を上回ったことで、通常のハードウェアとソフトウェア・ツールを超えた動きが出てきた。GPUやインテルMICアーキテクチャのようなアクセラレータは多くのHPCクラスのワークロードにおける性能目標を拡張してきた。しかし、フィールド・プログラマブル・ゲートアレイ(FPGA)は従来のHPCワークロードにおいては同じレベルの採用は見られなかったが、ビッグデータアプリケーションのサブセットにおいて、このプロセッサ型への適合が証明された。

FPGAが最高に輝いているのは検索ベースのアプリケーションの領域だ。最も顕著なのは、マイクロソフトがFPGAで高速化されたノードをBingサービスで展開しており、アジアのWeb巨人である百度は同様のアプローチをパターンおよびイメージ認識に採用している。

現在、私達は選択解析のワークロードを加速化し、HadoopおよびSparkクラスタにお金のために実行することをさせる、FPGAベースのアプライアンスの登場を見ている。10年以上官公庁セクターにサービスを提供している企業であるRyftは、XilinxのFPGA、ツインのパラレルサーババックプレーン、および48TBのSSDベースのストレージ、そしてハードウェアの複雑さを水面下に隠すカスタムソフトウェア基盤を合体させた1Uの解析アプライアンスであるRyft ONEの展開で、商用解析市場に出ようとしている。会社のベンチマークによると、このRyft ONEプラットフォームは毎秒10ギガバイトを超えるスピードでデータを解析することが可能であり、これは最高の4コアCPU/15GBメモリサーバよりも100から200倍高速である。

Ryft製品の副社長であるBill Dentingerは多くの場合は同時にストリーミングと過去のデータセットの両方からリアルタイムの洞察を必要とする顧客アプリケーションをターゲットとしていると説明している。官公庁との10年に渡る複雑なデータセットとの仕事の後、Ryftはその経験から汎用Linuxサーバのように見えるがハイパフォーマンス・コンピュータの用に動作する専用ソリューションを構築することを描いたのだ。

エンジニアリングの副社長であるPat McGarryは、Ryft ONEは従来のx86クラスタのスピードと性能ボトルネックを克服するように設計されていると語っている。各1Uボックスは8個のドライブを搭載しており、各ドライブは6台の市販の固定素子でバイス搭載可能で、合計で48台のホットスワップ可能なドライブを搭載できる。SSDはハードウェアRAIDで組まれている。データは2個の10GEカードでやり取りされる。

フロントエンド・ストレージの部分の後ろにあるのがRyftの秘密の部分で、基礎ロジックの集合体であり、特定の問題を解くように狙いが定められたRyft Analytics Cortex(RAC)の中に構築されている。x86、ARM、DSP等のようなシーケンシャルなプロセッサを使う代わりに、FPGAファブリックの中に、超並列ビット単位コンピューティング・アーキテクチャである収縮性の配列を実装していることを、McGarryは説明している。この非フォンノイマン型モデルへの動きはRyftを差別化しているものだ。

FPGAはx86Linuxクラスタのプログラマビリティと親しみ易さに欠けている一方で、ハードコードされた基本要素の使用は、機能として実行される標準C言語APIを使用して内部の複雑性を抽出することで、これらの限界をうまくかわしている。Ryftは3つの基本要素を打ち上げており、 – 検索、あいまい検索および用語頻度操作(語数カウントに相当) – 顧客と市場の要求に応じて、プリビルドされたアルゴリズム要素のライブラリを拡張するように計画されている。

最初のカスタム・ソフトウェア基本要素は、輝く速度でテキストの文字列を検索・一致させる必要のある領域で、特定の分析ワークロードに取り組むように設計されている。機械学習、不正検出や遺伝子配列は彼らが最初に最もインパクトのあるプラットフォームであると予測している領域だ。

ベンチマーク結果となると、1UのRyftボックスは次に詳述されているように、4コアのx86サーバよりも性能が大幅に優れている事をMcGarryは明らかにした。

図:
20150310-F1-RyftOneBenchmarks
20150310-F1-RyftOneBenchmarksnote

さらに数百台のバニラ・サーバを交換することで、このアプライアンスは保守と運用コストを最大70パーセント削減する。

もし顧客が複数のボックスが必要なら、shardingアプローチがシステムをスケールするのに使えるが、顧客のほとんどはストレージの限界までは使っていないようだと、この企業は述べている。彼らは、ある政府の要求外である20テラバイト以上はほとんどない低めのテラバイトの領域にあるデータサイズで実行している。

ホスティングされたRyft ONEのオンプレミス版が第二四半期早々に利用できるようになる。初年度のコストは200,000ドルで、80,000ドルのインテグレーション料金が含まれている。それ以降は年間120,000ドルに価格は落ちる。