世界のスーパーコンピュータとそれを動かす人々


4月 15, 2015

最後だがおろそかにできないのは:アルゴンヌの2億ドルのスーパーコンピュータ発注

HPCwire Japan

Tiffany Trader

Auroraと名付けられたスーパーコンピュータは予定通りで米国、恐らくは世界で最高速のシステムになる。4月9日にDOE次官のFranklin “Lynn” Orrはインテル社とクレイ社がアルゴンヌ国立研究所に180ペタフロップスのシステムであるAuroraおよびThetaと呼ばれる約8ペタフロップスの2番目のシステムを提供することことに決まったと発表した。これらのシステムは、オークリッジ、アルゴンヌおよびローレンスリバモア(CORAL)イニシアティブの共同研究として最終的に設置される。

「Auroraは現在のアルゴンヌのMiraシステムより18倍強力になると予測されていますが、エネルギーとしては2.7倍しか使いません。」とOrr次官はアルゴンヌ国立研究所からほど遠くない、新システムが設置される予定の革新的スタートアップスペースである1871 Chicagoオフィスから語った。この種のエネルギー効率は将来のエクサスケールクラスのスーパーコンピュータを展開する上で非常に重要であると、彼は続けて語った。

今年初めにリリースされた科学部の予算文書が示すように、Auroraは2018年にオンラインとなるように予定されている。Thetaは2016年に登場する予定で、アルゴンヌがMiraからAuroraに移行するのを支援する。この契約の主契約者としてインテル社の完全子会社であるインテル・フェデラル社は、2つのシステムの供給に責任を持っており、このポジションはほぼ20年前にサンディア国立研究所にASCI Redを設置して以来だ。

20150409-F1-DOE-CORAL-Argonne-Aurora

Orr次官およびアルゴンヌ国立研究所ディレクターのPeter Littlewood、そして著名なイリノイ州下院議員を含むこのイベントでの他の多くの講演者は、コンピューティングにおける米国のグローバルなリーダーシップを維持することに関して、このプリ・エクサスケールシステムの重要性を強調した。マシンは、生物化学、材料科学、輸送効率、再生可能エネルギー、およびリーダーシップクラスのハイパフォーマンス・コンピューティングを必要とする多くのアプリケーションにまたがる領域での目標を実現するために進行している。

Auroraがオンラインになった際に、いくつもの新技術を利用して世界で秀でたスーパーコンピュータが動くことは驚くべきことではない。これは現在のクレイのXCシリーズの後継となる「Shasta」アーキテクチャで作られる最初のシステムとなる予定だ。クレイのBarry Boldingが述べるように、Shastaは新しいインテルの技術とクレイのアダプティブ・スーパーコンピューティング・ビジョンを組み合わせたものだ。中間システムであるThetaはCray XCスーパーコンピュータをベースとしており、Intel Xeonプロセッサと「Knights Lnading」Phiコプロセッサを搭載する。

「生産的なスーパーコンピュータは、スケールでだけで問題を解決するだけでなく、演算の観点、インターコネクトおよびソフトウェアの観点の両方からの最高品質の技術を使用するようにできなければならないのです。」とプレスイベントでBoldingは述べている。「私達はシステムを科学者が良く使う事ができる全体的、統合的、生産的なデバイスとして見ておりますし、このAuroraシステムのコンポーネントとなるシステムアーキテクチャであるShastaは、クレイにとっての大きな一歩であり、インテルとの共同作業における大きな一歩であり、そしてエネルギー省との共同作業の大きな一歩となるでしょう。」

インテルのフェデラル・ユニットの社長であるDave Pattersonは、AuroraシステムをインテルのHPCスケーラブル・システムのフレームワークをベースとしたユニークなアーキテクチャ的方向性を表したものであると特徴付けている。この新しいフレームワークは「計算集約型およびデータ集約型の両方のワークロードをサポートする能力のある、高性能でバランスが取れた、電力効率が高く信頼性のあるシステムを開発するための柔軟な青写真」を提供している、とPattersonnは語っている。「このフレームワークは、インテルの次世代XeonとXeon Phiプロセッサ、OminiPathファブリック、シリコンフォトニクス、革新的メモリ技術、およびシステムソリューションの広いスペクトルでこれらを効率的に統合する能力を持った高性能ソフトウェアスタックを組み合わせるのです。」

この発表はCORALプログラムの最後の部分であり、オークリッジ、アルゴンヌ、そしてリバモアのエネルギー省の国立研究所用の次世代スーパーコンピュータを確保するための共同調達作業は2014年に開始されている。最初の2つのシステムSummitとSierraの詳細は3.25億ドルのプロジェクトとして昨年公表されている。今回の発表でCORALの合計投資額を5.25.億ドルに引き上げることとなった。

主要なシステム発表の陰で、科学部と国家核安全保障管理局はDesignForward R&Dプログラムの下で、エクサスケール・コンピューティングにおける長期的投資を行っている。今日、1千万ドルの契約がAMD、クレイ、IBMおよびインテルに発注されており、DesignForward の第一ランドに投資された2540万ドルを補完している。さらにプロ・エクサスケール開発資金の1億ドルが、政府系研究所とベンダーパートナーであるクレイ、インテル、NVIDIAおよびAMDの共同研究開発プログラムであるFastForward 2の一部として2014年12月に発表されている。

CORALのひとつの要件は、オークリッジ国立研究所とアルゴンヌ国立研究所が、急速な技術進化の時代におけるリスク管理として、アーキテクチャ的に異なるコンピュータを持つ事であった。以前発表されたCORALシステムである、SierraとSummitはIBM、NVIDIAおよびMellanoxが開発した技術をベースとしたものだったので、アルゴンヌは異なる方向性であるクレイ-インテル・システムで行く事が有力視されていた。

クレイは次世代Shastaアーキテクチャを紹介する機会を得る事ができたが、Auroraの一部となるインテルのチップについては未だ多くの情報を持っていない。2018年のタイムフレームでは、システムに使われるPhiプロセッサが第三世代のメニーインテグレーティッドコア(MIC)であるコードネームKnights Hillとなる公算が大きい。インテルはこの未来の名前をSC14で明らかにしたが、10ナノメートルのプロセスを使い、より高密度で、消費電力と性能が高いこと以外はほとんど知られていない。インテルはまた、Knights Hillは標準と高レベルな互換性とインテルアーキテクチャを持ったプログラミングの話を進めると述べている。