米国、最初のエクサスケール・スーパーコンピュータAuroraの計画を見直し2021年に
9月26日にバージニア州アーリントンで開催されたAdvanced Scientific Computing Advisory Committee(ASCAC)会議で、「Aurora」スーパーコンピュータが米国初のエクサスケール・システムとなることが明らかになった。もともとCORALの「プリ・エクサスケール」プロジェクトの第3の柱として名付けられたAuroraは、アルゴンヌ国立研究所用にIntelとCrayによって構築されるが、納期は2018年から2021年にシフトし、目標能力は180ペタフロップスから1,000ペタフロップス(1エクサフロップス)となることとなった。

アルゴンヌの Auroraである 「CORAL」スーパーコンピュータの運命は、システムが米国DOEの予算要求に失敗して以来沈黙を保つ一方で、2021年にアルゴンヌに展開される「超新アーキテクチャ」のエクサスケール・マシンと呼ばれる同額の規模の提案が通っていた。これまで、米国エクセスケール・コンピューティング・プロジェクトの唯一の公式見解は、Auroraは「変化を見直しされ、別のタイムラインの下で進む」ということであった。
公式には、この契約は「延長」され、取り消されていないが、実際には、オークリッジ、アルゴンヌ、ローレンス・リバモア(CORAL)の2つの別個のプリエクサスケール・アーキテクチャを立ち上げるイニシアチブのコラボレーションの目標は満たされていない。
私たちが話した情報筋によると、DOEの多くの人々はIntel / Cray(Intelがプライム請負業者であり、Crayは下請け業者)のパートナーシップに満足していない。元の契約によると、両社は来年までに180〜200ペタフロップスのシステムを提供することができないと理解されている。現在、Intel / Crayは、現在のものよりも約50倍大きいエクサスケール・システムを推進している。
推測されているようにAuroraの中止はDOEの予算上の問題ではなく、またDOEとアルゴンヌはAuroraを欲している、というのが我々の理解だ。「暫定的」とか「プリ・エクサスケール」マシンのように参照されているが、科学研究コミュニティはそのシステムを期待していたし、使いたいと思っていて、これを価値のあるシステムと見なしていた。この非提供は科学研究コミュニティにとって破壊的であると考えられている。
我々のもう一つの疑問は、Intel / CrayがAuroraを納品することができず、より大きなエクサスケール・システムの契約に移行したのに、なぜ元のCORALの契約が取り消されて再度入札されなかったかということだ。世界的な競争の激化に伴い、DOEのステークホルダー達は、エクサスケール・トラックの非IBM / Nvidia側をさらに遅らせることを望んでいないようだ。おそらく、Auroraシステムについては再入札することができたかもしれないが、IntelとCrayを置き換える新しいベンダーもしくはシステムサプライヤーを立ち上げなければならない場合、さらに大きなギャップを残すことになるだろう。入札プロセスをもう一度やり直すことで、エクサスケールへの進展が遅れ、2021年までにエクサスケールの破滅さえあったかもしれないが、IntelとCrayは今や大きな成果をあげており、3年は継続することができるだろう。彼らはKnights Hillと同じPhiベースのテクノロジ・パスにとどまるのか、Intelが取り組んでいるXeon / FPGAプロセッサのコパッケージされたもののようなより斬新なものを考案するのか、厳格な電力ターゲットを満たすさらなる効率を提供できるのはどれなのか。
これらのイベントは、IBM主導の取り組みに関して疑問を掲げており、IBM / Nvidia / Mellanoxが比較的によく見ているかどうかということだ。 一方、オーぅリッジのSummitとローレンス・リバモアのSierraの2つのCORALの取り組みは軌道に乗っているが、両方あるいはどちらも、11月のTop500リストに載るかどうかはまだ分からない。
Cray、Intel、Exascale Computing Project(ECP)の代表者に、Aurora改訂版の正式なコメントを求めている。 Crayはコメントすることを拒否しており、IntelまたはECPからの報道発表はなかった。さらに分かり次第報告します。