世界のスーパーコンピュータとそれを動かす人々


3月 9, 2016

EUのプロジェクトがヘテロなARMベースのエクサスケール・プロトタイプを統合

HPCwire Japan

Tiffany Trader

ヨーロッパがベースの3つのパートナー・プロジェクトであるExanest、Exanode、Ecoscaleは、1千万のコンピュータのパワーを1台のスーパーコンピュータにすると彼らが述べるエクサスケールのアーキテクチャ・プロトタイプ用の構築ブロックを開発するために緊密に協調しながら動いている。この取り組みは、基本的な「汎用」エクサスケール・プラットフォームとしてARM64 + FPGAのアーキテクチャを進めることを模索していることでユニークだ。

ヨーロッパのHorizon2020プログラムの一部として3年間資金提供されており、このパートナー達は、今年後半に1万以上のエネルギー効率の高いARMコア、リコンフィギャラブル回路、および先端ストレージ、メモリ、冷却およびパッケージング技術から構成される早期の「藁人形」プロトタイプを構築する目標を持った取り組みを行っている。

Exanestはインターコネクト、ストレージ、パッケージングとクーリングを含むシステムレベルにフォーカスしたプロジェクト・パートナーだ。名前が示すように、Exanodeは演算ノードと演算ノードのメモリを担当している。Ecoscaleはシステム内のアクセラレータとしてのリコンフィギャラブル回路の採用と管理にフォーカスしている。

Exanest

Exanestのプロジェクト・コーディネーターでギリシャのFORTH-ICSの計算機アーキテクチャの長であるManolis Katevenisは、Exanestが少なくとも1,000 ARMコアから構成されるこの「比較的大きな」最初のプロトタイプを作るための初期の2016年の目標を設定していることを説明している。

「我々は開発するシステムソフトウェアと移植してチューニングされるアプリケーションが欲しいので、既存の技術に基づいたプロトライプを使って早期に始めるのです。残りの2年間においては、継続的なソフトウェア開発に加え、インターコネクト、ストレージおよび冷却技術があります。我々はまたパートナーのプロジェクトから新しく興味深い演算ノードが出てくると確信しており、そのノードを使う予定です。」と彼は述べている。

目標とするワークロードの議論においては、Katevenisは、HPCコミュニティ全体から聴こえてくる気持ちと同じことを言いながら、柔軟性と幅広さを強調している。このプラットフォームの目標は、従来の計算の物理側とデータ集約側の両方において、幅広いアプリケーションをサポートできるようにすることだ。Exanestのパートナー・リストを見るとサポートされるハイパフォーマンス・アプリケーションの種類のヒントがある: 天体物理学、核物理学、シミュレーションベースのエンジニアリング、およびパートナーのMonetDBソリューションズと使うインメモリ・データベースだ。AllineaはARM v8のプロファイリングとデバッギングのツールを提供する。

プロジェクトはまだ仕様の段階ではあるが、エクサスケールに関係する具体的な課題を克服する狙いを持って選定を行っている。フォーカスされる領域には、コンパクトなパッケージング、永久ストレージ、インターコネクト、耐故障性、およびアプリケーション動作が含まれている。いくつかの設計上の決定事項はこのExanestのポスターに書かれており、ドーターボードおよびブレードの設計のdiagramに示されている。Xilinxが重要なパートナーであることに注意。

20160224-F1-Exanest-daughterboard-and-blade-design-768x823

2018年までに実世界のベンチマークとアプリケーションを実行することのできる完全なプロトタイプを実現するために、主要なパートナー達は、ハードウェアとソフトウェア要素を開発するためのコデザイン原理を使って、多くの他の学術グループや業界パートナーと協力している。これは古典的な産官の取り組みで、アカデミックと産業界のパートナーが協力し、産業界は開発された技術を再利用できるというものだ。

技術面では、Exanestにとってパッケージングおよび冷却が主要なフォーカスであり、革新的な冷却環境を設計する液浸型の冷却ベンダーであるIceotopeに依存している。最初のプロトタイプはIceotopeの技術を採用し、プロジェクトが進行するにつれて、より高い電力密度を持つ技術が開発されるとの期待があるのだ。

プロジェクト・パートナー達の主な基準のひとつは、メイン・プロセッサの低エネルギー消費である。彼らはメインの計算エンジンとして64ビットのプロセッサを選んでいる。劇的に低い電力を消費するプロセッサを持つことで、同じ物理量で、そして同じ総電力消費予算の中にパッケージされるより多くのコアを可能にできるのだと、Katevenisは断言している。「我々がスケールを達成する方法のひとつは、この低電力消費なのです。」とプロジェクトリーダーが述べてており、「しかし、もうひとつは適切なアプリケーションに対して浮動小数点性能の高速化をもたらすアクセラレーターを搭載することです。」

トポロジーに関しては、Exanestのチームはファットツリーやドラゴンフライ・トポロジーを含むネットワーク・ファミリーについて議論している。これらはブレードを光ファイバーを介してリンクさせており、ひとつ以上のトポロジーを実験できるように取り外しできるようになっている。Exanestはまた、インターコネクト・ネットワークの構築にFPGAを使う予定であり、彼らは新たなプロトコルを実験できることとなる。

Exanode

Exanodeのプロジェクト・コーディネーターであるDenis Dutoitは、このプロジェクトの目標がエクサスケールの可能性を示す技術を持ったノードレベルのプロトタイプを構築することである、とHPCwireに語っている。3つのビルディング・ブロックとは、ヘテロな演算要素(ARM-v8低電力プロセッサ、および様々なアクセラレータ、ASICやGPGPUもまた探求されるが、すなわちFPGA); 演算密度のための3次元インターポーザー実装; およびエクサバイトレベルまでスケーラブルな低レイテンシ、高帯域メモリアクセス用の先進的メモリ・スキームであるEUROSERVERプロジェクトの取り組みの継続である。

20160224-F1-ExaNoDe_Figures_04-1024x768-768x576

CEA-Letiのアーキテクチャ、IC設計および組込ソフトウェア部門の戦略的マーケティング・マネージャであるDutoitは、これは最初は技術駆動型のプロジェクトであるが、このプロトタイプのトップにはHPCの機能を持った完全なソフトウェア・スタックがあると指摘している。最初に行われる評価はノードレベルで行われるだろうとDutoitは説明している。彼らは最初にエミュレートされたハードウェアを活用し、ノードレベルで代表的なHPCアプリケーションを評価するが、その後はExanestはこれらの演算ノードを再利用し、完全なマシンとして実装することで実アプリケーションを使って完全な試験と評価を行うのだ。

エネルギー効率、コンパクトなハイパーコンバージド・プラットフォームにフォーカスしているUKの企業であるKaleaoとのパートナーシップを通して、得られた技術を製品化する公式な取り組みを行う予定だ。

Ecoscale

Ecoscaleのプロジェクト・コーディネーターであるIakovos Mavroidisは、3つの主要なプロジェクトがあるが、リコンフィギャラブル・コンピューティングに特化したEcoscaleで大きなひとつのプロジェクトとして見える、と述べている。

FORTH-ICSの計算機アーキテクチャおよびVLSIシステム(CARV)研究所のメンバーで、通信システム研究所のメンバーであるMavroidisは、
取り組んでいる主な問題は現在のHPCサーバの改良方法である、と指摘している。技術改良無しでの単純なスケーリングは、ユーティリティーのコストと消費電力の制限のため、不可能である。Ecoscaleは、HPCアプリケーションのニーズに合わせてカスタマイズされたハードウェア・アーキテクチャと共に、スケールアウト型ハイブリッドMPI + OpenCLのプログラミング環境とランタイムシステムを提案することにより、これらの課題に取り組んでいる。プログラミングモデルとランタイムシステムは、システムが複数の自律ワーカー(すなわち、演算ノード)に分割される階層的アプローチに従っているのだ。

20160224-F1-ecoscale_framework

「Ecoscaleの主なフォーカスは、これらの演算ノードからアクセスされる共有分割リコンフィギャラブル・リソースをサポートすることなのです。」とMavroidisは述べている。「この意図は、リコンフィギャラブル・リソースのグローバルな概念を持つことで、各演算ノードがローカルなリソースだけでなく、リモートのリコンフィギャラブル・リソースにアクセスすることができることです。このロジックはまた並列に動作している複数の演算ノードで共有することもできるのです。」これを実現するために、MPIプロトコルを介してより階層的に相互接続された、より大きな区分化大域アドレス空間(PGAS)パーティションを形成するために、ワーカーはツリーのような構造で相互に接続されている。

「仮想化はハードウェア内で自動的に行われますし、リモートアクセスが有効でない限りリコンフィギャラブル・リソースは非常に制限されているので、そうでなければならないのです。」とMavroidisは述べている。「狙いはプログラマがシステム内のすべてのリコンフィギャラブルなロジックを使えるようにユーザフレンドリーな方式を提供することです。これは非常に高速で低レイテンシなインターコネクトのトポロジーを必要とし、それをExanestが提供するのです。」

Mavroidisは、プログラマがシステムにアクセスする手段がなくてはならないし、マシンを再構成できるようにアプリケーションのニーズを理解するために、より高いレベルでランタイム・システムを再定義しなければならない、と説明している。これを完全に実現するために、すべてのスタック層においてイノベーションの必要があり、そしてまたプログラミング・モデル自体もまた再定義する必要がある、と彼は信じている。パートナー達は、ほとんどの既存のアプリケーションに対してこのアーキテクチャが有効となるように、既存の共通のHPCライブラリのほとんどをサポートすることを狙っている。

Ecoscaleの主な焦点は、FPGAプログラミングの複雑さを自動化することだ。HPCにおける足場を固めるためのFPGAの努力を見てきたものは、これが簡単な仕事ではないことを知っているが、低電力性能に対する必要性が興味とイノベーションを推進しているのだ。「プログラマーはマシンがリコンフィギャラブル・コンピューティングを使っていることを気にする必要はありませんが、MPIや標準Cのようなハイレベルなプログラミング・モデルを使ってプログラムを書くことができるようなりたいのです。」とMavroidisは述べている。

関連するノートとして、ExanetプロジェクトのパートナーであるBeeGFSは、BeeGFS並列ファイルシステムがwww.beegfs.comからオープンソースとして公開されると発表したばかりだ。「BeeGFSは現在ARMシステムのボックス上で動作できますが、このプロジェクト(Exanest)は、このアーキテクチャでも同様に最大性能を提供できることを確認する機会を与えてくれるでしょう。」