世界のスーパーコンピュータとそれを動かす人々


6月 7, 2016

Mellanox、BlueFieldプロセッサにEZchip/TileraのIPを組み込む

HPCwire Japan

Tiffany Trader

Mellanox社は本日、プログラマブルプロセッサのBlueFieldファミリを発表した。8.11億ドルで買収したイスラエルのハイテク企業EZchipの技術に基づく最初の製品である。買収からわずか3ヶ月で製品発表が行われるという事実は、EZchipとMellanox社の強力な相乗効果の現れであると、Mellanox社のマーケティング担当シニアディレクターBob Doudは述べている。

DoudはEZchipが2014年7月に1.3億ドルで買収したTileraからEZchipを経由してMellanox社へ移籍している。Mellanox社が期待するのは、EZchip /Tileraの知的財産 – 単一のチップ上で百コアまで拡張可能な、エネルギー効率の高いTileマルチコアARM CPUとSkyMeshコヒーレントオンチップ相互接続方式 – である。それにより製品ポートフォリオを拡大し、新しい市場を開拓しようと考えている。

BlueFieldマルチコアSoCがTileベースの ARM A72コアアレイと一緒になる事により、最新世代のConnectXネットワークアクセラレーション技術を生み出した。Mellanox社は、ストレージやネットワーク・アプリケーションにおけるプログラム可能なイーサネット・ネットワーキング・シリコンの提供を目標にしている。

「Tileraが起源であるマルチコアプロセッサはMellanox社に非常に高度な知的財産をもたらしました。」と、Doudは以下の様に語っている。「ほぼ間違いなくTileraは、スケールアウトしたマルチコアプロセッシングのリーダーとして業界で見られていました。2011年には72コアのプロセッサを持っていました。Cavium社より先に、勿論Intelよりも前にです。私たちは本当に技術そのものであり、リーダーと考えられていました。売上的にはまだスタートアップモードのままでしたが、顧客にその話をすると、彼らは我々の技術を試すことを熱望していました。」

「Mellanox社は、このコアのメッシュを構築する方法で100以上の特許を持っています。我々は、チップ上に100コア以上をスケールアップすることができ、キャッシュ・コヒーレンシを行う方法を考え出しました。これは大きな問題で、Intelもまだこの問題の解決に取り組んでいます。」

EZchipは100コアのARMチップを開発してきたが、Mellanox社との契約を2015年9月に発表した際に、開発チームはメッシュアーキテクチャをMellanox社のポートフォリオに統合すべく再割り当てが行われた。TileraとEZchipは大規模化に焦点を当てていたが、Mellanox社は、その知的財産を旋回させ、アダプタに縮小化させ、それをクラウド、データセンターおよびセキュリティ領域におけるストレージ/ネットワークの役割を与えるようにうまく適応させた。Mellanox社は、SoCの上で使用されるARMコアの正確な数を発表していないが、同社から供給された写真によれば4×4のアレイの16コアを示していいる。関連するテキストでは、コアの数はより小さなまたはより大きな数の配列の可能性を示している。

20160601-F1-Mellanox-BlueField-graphic-768x486

組み込みプロセッサの領域に足を踏み入れると、Mellanox社にとって重要なターゲット市場は、フラッシュベースのストレージとNVMeだろう。「我々は、理想的なストレージ・コントローラ・チップの必要性を見いだしました。」と、Doudは続ける。 「ストレージというこの芝居の役者は本当にシリコンです。EMCs、日立、IBMなどの世界の大規模なストレージOEMにシリコンを販売することです。彼らがフラッシュ・ストレージ製品を製造し、そしてすべての機能を保持するストレージ・コントローラを必要としているのです。そしてその機能は高性能ネットワーキング機能を含んでいるのです。何故なら新しいストレージ・アーキテクチャは、スケールアウトする必要があるからです。それは、1U、2Uの製品の束が100GEやInfiniBandを介して接続されるのです。そのようなコントローラを作ることができる企業は限られています。単にNVMeドライブを利用すだけで少なくとも20Gigを必要としています。」

「Mellanox社がBlueFieldでやっているのは、サウスブリッジで多くのPCIにより、PCIe 3と4をサポートしているドライブ・アレイと話ができるデバイスの設計です。ノースブリッジでは100Gの帯域幅でファブリックと話をする必要があります。ハードウェア・アクセラレーションにより、プロトコル変換が行われ、NVMeなどのタスクが処理されます。 ConnectXは、RAIDの消去などのオフロード処理を実行します。」

「ARMコアのアレイにより、高度にプログラム可能なストレージ・コントローラを提供することができます。それはアレイを管理する制御プレーン機能を実行するだけでなく、データパスにタッチすることも可能です。重複排除するようなデータを操作や、データ圧縮/解凍、さらにはディスクセクタの暗号化/復号化を行うことができます。」

ネットワークに関しては、Mellanox社は、データセンター、クラウドそしてセキュリティのアプリケーションにBlueFieldを統合してアダプタを販売しようとしている。同社は現在、この市場のための2つのモデルを用意している。 第一のモデルは、Doudはサンドボックスのようなものだと言っているが、BlueFieldはARMコア上で走行するオペレーティングシステムとともに提供される。GoogleやFacebookなどのハイパースケールシステムを構築するに必要な基本的な部品は提供され、それを用いてARMコア上で実行する必要があるソフトウェアを開発する。データセンター運用社が、アプリケーション・コードを開発し、ConnectXおよびデバイス上のハードウェアは、データが適切に流れるように導き、コアへの入出力をサポートすることになる。第2のモデルは、Mellanox社自身がBlueFieldのためのコードを開発し、ConnectXのような純粋なターンキーシステムとして販売する方法です。この方面では、ソフトウェアパートナーと協働して、ターンキー・システムで簡単に使えるIPsec、SSLさらには侵入防止を目的としたソフトウェア・バージョンを提供していく。

Doudは、政府の関心を引いているBlueFieldのセキュリティ機能について次に様に強調して述べた。「固定化を進め、このカードはネットワークの高速化とセキュリティを行うことであり、このカードは既知のコードに対するコンテナ環境だなどと言うことができれば、ある程度の確実性は確保できるだろう。しかし、新しいDODモデルでは仮想化サーバによってスケールアウトすることであり、彼らはそれによりどんな事態が発生するか心配している。彼らはVMwareやKVMを始めとする種々の仮想化環境をコントロールはしていないので、必要な管理ができなくなる事を恐れています。そのため、彼らはコミュニティが分離化に関して良い仕事をしてくれる事を願っています。」

「Mellanox社が考えるには、計算はもはやサーバーだけが行う仕事ではありません。」と、Doudは続ける。 「我々の新しいモデルであるハイパースケールデータセンターでは、境界線が不明確になってくると思います。ストレージ装置で計算する必要がでてくるのです。ストレージ・ドライブのすぐ側に、価値ある機能を追加することができるのです。例えば、重複排除やいくつかのビッグデータ機能を追加して、計算を行います。ネットワーク自体は、よりインテリジェントになってきています。イーサネットスイッチは、10年前には本当に単機能製品でした。しかし今では、L2とL3も処理しています。さらに新な興味深い機能を追加し始めています。異なる形態のカプセル化/非カプセル化を押しつけられているだけではありません。Mellanox社のInfiniBandスイッチは、スイッチ間を移動するInfiniBandパケットにアトミック演算動作を行うことができるのです。アダプタの領域では、Mellanox社は何年もの間、インテルから特定の機能をオフロードする必要性とその価値を主張しています。アダプタ上にマルチコアのプログラム可能なアレイを配置するのが次のステップです。」

「NPU側では、ネットワーク・プロセッサとスイッチング機器との相乗効果を見ることができます。高度なL2 / L3スイッチである一連のSpectrum製品は、Broadcom社製のスイッチと対抗しています。Mellanox社はネットワーク・プロセッサにこの技術を利用して、次世代のネットワークプロセッサの性能はテラビット級になります。また、Cのコードで完全にプログラム可能です。ヘッダ処理をして異なるポートへパケットを送信するだけでなく、移動するパケットのセキュリティ操作を行ったり、パケットのペイロードへ集合的操作を行うことができるようになります。プログラマビリティは本当に新しい差別化要因です。これらのいくつかは、Broadcomの製品であるDuneに見られますが、我々がNPUでやっていることはもっと洗練されたものです。今日はそれについての発表はありませんが、それは確乎たる将来構想のひとつなのです。」

Mellanox社は、28nmプロセスでBlueFieldを製造している。発表に先立ち、ブリーフィングを行ったLinley GroupのアナリストTom Halfhillによれば、それは避けられぬ所与の環境からくる、やむを得ない妥協の産物との事だった。「2017年遅くから2018年早くでの生産を考えるなら、28nmの技術は最先端ではなくなっているかもしれません。 それでも28nmに固執する理由は、Mellanox社による買収が起こった時はすでに、EZchipのプロジェクトはかなり進んでいた事にあります。彼らは、より小さなプロセス技術に移行するためには、プロセッサの全体の設計を変更する必要があり、それをしたくなかったのです。Intelでも、プロセス技術の更新とプロセッサー設計は時計のチクタクの様に交互に進められ、設計の複雑さを抑えスケジュールを守る様にしています。」

一度は潜在的な低消費電力サーバーとして、HPCな連中の想像力をつかんだTileraだったが、Doudの説明では、TileraのコアはHPCアプリケーションに必要とされる浮動小数点性能を持っていなかったようだ。 「それは、整数コアでした。気象モデリングをやるよりもパケット処理を行うこと事に適していました。それは本当に市場の選択でした。私たちは、HPC市場でない方を選んだのです。」

しかし、クラスタのノードにヘビーなトラフィックを送信するフロントエンドで、Tileraがある種のHPCアプリケーションで使用されたことを、彼は付け加えた。「それは、データセンターの利用形態でした。現在、境界は不明確になってきています。HPCと呼ばれるものの周りに素敵なボックスを置くことができるようになっています。」

Mellanox社がTileraの知的財産をひっさげてサーバー市場の戻る事を推測するのも楽しいかもしれないが、Doudは、それはMellanox社の短期計画にはないと明言した。 「BlueField製造に踏み切った決定は、素晴らしいストレージ・プロセッサと素晴らしいネットワーキング・フロントエンドの組み合わせをインテル用に提供するためです。Intelのサーバーに置き換わろうとするものではありません。CaviumやQualcommのような企業はインテルの後を追いかけています。私たちも、今後ある部分ではその方向に進路を取ることになります。何故なら、自らの戦いは自ら選択する必要があるからです。Mellanox社は非常にネットワーク中心の会社です。しかし、同時にネットワーク中心とは何か、はっきりと定義されてはいないのです。 数年前からARMがIntelキラーになるかという話題がありますが、今では人々が本当にそれが起きるのか、それともIntelの価格が元に戻るだけなのか考え始めたと私は思います。」

2017年第1四半期には、BlueFieldシリコンをサンプル出荷し、2017年半ばまでに本格出荷を行い、2018年には収益カーブを軌道に乗せたい。より正確な出荷時期ならびに価格情報は、この冬までに用意されるであろうと、Mellanox社は述べている。