Paypal、HPCでカオスからの注文を発見
Tiffany Trader

シアトルでの2014年のHPCユーザフォーラムで、PayPalのRyan QuickとArno Kolsterは、どのように同社が知的で実用的な洞察力へその混沌としたリアルタイムのサーバデータを変換するためにHPCを利用しているかについて説明した。独自の「Systems Intelligence」アプローチは、リアルタイムでの取引データについて集約し、分析し、行動するためにTIプロセッサを搭載したHPのMoonshotサーバを使用している。
PayPalの目標は、パターンと例外を検出し、ユーザ体験がマイナスの影響を受ける前に行動を取ることである。その主たるチャレンジは、PayPalがそのデータセンター内の数千の情報源から複数の毎秒300万のイベントを処理する必要があるとして、リアルタイムでこれを行う事である。ソースイベントは、アプリケーションログ、マシンデータ、データセンターから環境データ、およびソーシャルメディアイベントが含まれる。時間あたり約25 Tbのデータがやってきて、数千台のPayPalサーバから毎秒20 MBのマシンデータ、約5万のメタデータと関係し、そして増え続けるソーシャルメディアの動向や顧客との対話の潮流を検討する。
「私たちは、基本的にすべてのデータを取得し、それらすべてを一緒にして、それらのストリームに跨ってイベントを関連付けています。」とPayPalのシニアMTSでデータベースアーキテクトのKolsterは述べている。 「たとえば、私たちはサンノゼで木曜日の夜にリリースを出すと、その数分に私たちは、ダブリンでの顧客の交流やPayPalのこの最新リリースは正しく作用していないと言うドイツでのTwitterフィードが増加することに気づきます。私たちは、何が起きたのか人々が理解するまでに数時間かかると思われる前に今、数秒以内にすべての3つのイベントの関連付けを行うことができます。」
システムインテリジェンスフロー•アーキテクチャは、同様にHPCの原則に基づいて構築されたPayPalの不正検出システムと多くの類似点を共有する。それはかなり安易なものだが、しかし実際の展開に取り掛かる時、それははるかに複雑になる、とKolsterは述べる。すべてのソースイベントデータをリアルタイムに巨大なバスの中へ投げ入れ、そしてインライン処理を行っているアプリケーションサーバによって摂取される。これらのアプリケーションサーバごとに複雑なイベントプロセッサがあり、そしてSGI UV2000が持つ巨大な共有メモリイベントウィンドウがある。イベントストリームは、リレーショナルとグラフの両方のオフラインデータベースで増大している。機械学習要素は、アプリケーションサーバに戻す新たなモデルを後押しする。警告および通知システムは、問題の修復に使用される。
PayPalのHPC調査の開始は、2006年までさかのぼる。PayPalの先端技術グループ主任アーキテクト、Ryan Quickは、「私たちの仕事は、次善の策を見ています。」と説明する。QuickとKolsterは、彼らが特にリアルタイムの周りの問題のセットを持っており、彼らは定期的なチャネルから取得する事が出来るツールに満足していなかったので、HPCでの購入を開始した。
![]() |
「企業の中で満たされていない不可思議で曖昧な領域があるのですが、HPCはまだ少しも最先端過ぎます。」とQuickは加える。
どのように彼らがHP-TIプラットフォームに決定したのか議論する中で、QuickはKolsterを見て思い出し、「彼らが、ここでやったことは、HPCクラスタを構築し、それをシステム•オン•チップ上に置いたということです。」と言う。KeyStoneマルチコアプロセッサは、4つのARM Cortex-A15コア、8つのC66x DSP、加えて内部ファブリックとネットワーク機能の強力な組み合わせを提供する。
パートナーのTIが説明するように、66AK2Hx SoCはリアルタイム処理を支援するためにいくつかのユニークな利点を有するHPのMoonshotプラットフォーム内で動作している。これらを含めると:
1)C66x DSPコアは、並びに非常に低遅延応答時間を有し、非常に迅速に受信、処理およびパケットデータを返すことができるのと同様に優れた信号処理性能を持つ。
2)迅速かつ低遅延でデータを移動する統合I/Oファブリック。 C66AK2H IOファブリックは、イーサネットI / Oよりも10倍低いホップ間遅延を有するsRIOを利用している。
3)Multicore NavigatorとTeraNetなどのKeyStone IIアーキテクチャ要素が、さらにデバイスの内と間での低遅延なデータ移動を可能にする。
![]() |
新しいプラットフォームは基本的に、デジタル信号として複合イベント処理を扱う。 「あなたは、データをハードウェアで分析可能な信号に変えられます。」とQuickは言う。そして8つのDSPで、彼らは一度に多くの信号を取り込むことができ、それから同時にそれらのすべてに対してパターン認識を行う。システムはまた、非常に効率的である:それは、カートリッジ(4 SoC/カートリッジ)あたり55ワットで動作し、象徴的にワットあたり11.2GFlopsを実現する。比較のポイントとして、Green500リストの最新版に則って世界で最もエネルギー効率の高いスーパーコンピュータ、日本のTSUBAME-KFCで、より控えめなワットあたり4.4GFlopsを提供している。
アプリケーションは現在、TIを通じて公的に利用可能である。製品は、OpenCL、完全な開発キットとそのソフトウェアが含まれている。