生き残ったAurora:エクサスケール・スーパーコンピューターが8年間の運命の末に登場
Agam Shah オリジナル記事はこちら

Auroraスーパーコンピューターが誕生するまでの8年間、多くの製品が犠牲になった。それでも、米国で2番目のエクサスケール・システムへの期待は、この2年間で熱気を帯びた。
インテルの技術で構築されたこのスパコンは、ついにゴールラインを越え、Top500リスト入りを果たしたが、約束された2エクサフロップスの性能には達していない。
アルゴンヌ国立研究所のスパコンは、今週発表された11月のTop500リストで、トップを維持したFrontierに次いで2位となった。このシステムのLinpack性能は585.34PFlop(訳注:オリジナル記事ではピーク性能とあるが、実際にはLinpackでの実行性能)で、ランキングでは2位だが、エクサスケールの領域にはまだ達していない。
Auroraには60,000以上のGPUがあり、世界最大のGPU導入施設となっている。また、10,000を超えるコンピューティングノード、166を超えるラック、80,000を超えるネットワーキングノードがある。
Auroraの一部については、アルゴンヌがHPLを提出したため、ベンチマークは不完全なものとなっている。
すべてのテストと微調整が完了すれば、このシステムは最終的に2エクサフロップスを超える可能性がある、とTop500は声明の中で述べている。
「Auroraは現在試運転中であり、完成すればピーク性能は2EFlop/sとなり、Frontierを上回ると報告されています」(Top500誌)。
インテルは2025年まで主要GPUを発表しないため、これが同社にとって数年ぶりの主要トップ10入りとなるかもしれない。インテルは次世代GPU「Rialto Bridge」をキャンセルし、次のメジャーGPUアップグレードは2025年のリリースを予定している。
一方、エヌビディアは今後3年間に3つの新しいGPUを発表し、AMDのEpyc CPUとMI300Aは、ローレンス・リバモア国立研究所に設置されているEl Capitanと呼ばれる2エクサフロップ・システムに搭載される予定だ。
Auroraは200ペタフロップのシステムとして2015年に初めて発表され、8年にわたる構成の変更、ハードウェアのキャンセル、予算の遅れを乗り越えてきた。
初期のAuroraシステムは2018年にオンラインになる予定だった。当時、このシステムにはインテルのXeon Phi(コードネーム:Knights Hill)、Xeon CPU、シリコンフォトニクスが搭載される予定だった。当時、Xeon Phiはスーパーコンピューティング用GPUに対するインテルの答えだった。
インテルが2017年にXeon Phiチップを廃止し、「エクサスケール向けに特別に設計された新しいプラットフォームと新しいマイクロアーキテクチャ」に置き換えた後、Auroraの計画は変わった、と同社は述べている。
Xeon Phiはベクトルプロセッサーと低消費電力CPUをミックスしたもので、完全な失敗ではなかった。2017年11月のTop500リストでは、中国のTianhe-2Aを含む4つのトップ10システムに入っていた。
しかし、エヌビディアのGPUは2018年6月のリストで、IBMのPower9チップをベースとしたSummitとSierraとともにTop500入りし、1位と3位を獲得してPhiを破った。
インテルが2017年にPhiを廃止した際には、さまざまな動きがあった。同年9月、先進科学計算諮問委員会は、Auroraを米国初のエクサスケールシステムとする計画変更を発表した。インテルとクレイはベンダーとして維持され、サーバーの納期は2018年から2021年に変更された。
2017年後半、インテルはグラフィックスの第一人者であるラジャ・コドゥリ氏をAMDから引き抜き、チップメーカーがGPUを開発する意思を示した。インテルは、スーパーコンピュータにおけるエヌビディアのGPUの成功を再現したいと考えていた。
2019年3月、米エネルギー省はインテルとクレイが2021年までにAuroraを納入すると発表した。インテルはSupercomputing 2019の傍らでPonte Vecchioを発表し、AuroraにGPUを採用すると述べた。
![]() |
|
インテルAuroraブレード | |
しかしその後、インテルにはさらなる問題が降りかかった。2020年7月、インテルはPonte Vecchioを製造する7nmプロセス技術への移行を延期した。
結局、インテルはPonte Vecchioの部品の一部を製造ライバルのTSMCに頼らざるを得なくなった。GPUはチップレット設計で1000億以上のトランジスタを持ち、TSMCの5nmプロセスで作られた16個のコンピュート・タイルと、インテルの7nmプロセスで作られた8個のタイルを持つ。
スーパーコンピューターのメインCPUである第4世代Xeonチップ(コードネーム:Sapphire Rapids)も1年以上搭載が遅れた。
長年にわたり、米エネルギー省はAuroraに忍耐強く対応してきた。2024年の予算要求の中で、DoEはCovid関連のサプライチェーンの問題がAuroraを遅らせ、不足が技術的な実装を遅らせたと言及した。
2023年6月、インテルはついにスパコンの設置を完了したと発表した。しかし、システムはまだピーク時の2エクサフロップスには達しておらず、さらなるソフトウェアの微調整がシステム速度をさらに押し上げるだろう。
Auroraは、多くのA.I.および科学計算アプリケーションに使用されていると、データセンターおよびHPCソリューション担当副社長兼ジェネラル・マネージャーのオギ・ブルキッチ氏は記者ブリーフィングで述べた。
Auroraは、科学研究用の1兆パラメータ大規模言語モデルの学習に使用される。このスーパーコンピューターは、マウスの脳の再構築にも使われる。
「これは、ここで解決される問題の複雑さを物語っています。人間の脳をマッピングしようと思ったら、それどころではありません」とブルキッチ氏は言う。
Connectomeと呼ばれるマウスの脳の再構築プロジェクトは、512台のAuroraノードで実行されており、アルゴンヌが最近導入したトップ20のスーパーコンピューターであるPolarisよりも優れたパフォーマンスを見せている。
「現在のアプリケーションは継続的に最適化されており、機能的であるだけでなく、ソリューションに素早く到達するために非常に重要なスケーラビリティを備えています」とブルキッチ氏は語った。
AuroraのA.I.機能は、粒子間の相互作用を理解するためにも使われている。データセットの中には、宇宙空間に存在する他の粒子やノイズによって汚染されているものがある。
「これらの相互作用を理解するには、これらの相互作用を最も効果的に理解・参照するためのトレーニング・アルゴリズムが必要です」とブルキッチ氏。
インテルはまた、次世代GPUとA.I.チップに関する追加情報を共有した。来年、同社はエヌビディアのGPUと競合するGaudi3チップの出荷を開始する。
2025年のエンタープライズ向けGPU「Falcon Shores」は、Gaudi3のAIアクセラレーター技術と汎用GPUコアをミックスしたものになる。また、HBMメモリと標準的なイーサネットスイッチングを搭載し、幅広い大規模言語モデルをサポートするとブルキッチ氏は述べた。
ブルキッチ氏はまた、12月14日に正式発表される次期Xeonチップ「Emerald Rapids」についても語った。Emerald Rapidsの後継はGranite Rapidsと呼ばれ、多くの期待を集めている。この製品はA.I.と従来技術の両方が可能で、画期的なメモリと帯域幅技術を持っている。
インテルはまた、エヌビディアの顧客を独自のCUDA並列プログラミングフレームワークから脱却させ、業界標準のハードウェア上でA.I.モデルが動作するように独自のコードを取り除くことができるSYCLomaticなどのツールを通じて、自社のOneAPIを利用させようとしている。