世界のスーパーコンピュータとそれを動かす人々


6月 29, 2026

GPUを超えて:エヌビディア、ロスアラモスで科学AI向けCPU「Vera」を披露

HPCwire Japan

オリジナル記事「beyond GPUs: Nvidia Showcases Vera CPU for Scientific AI at Los Alamos

エヌビディアは今週、ロスアラモス国立研究所(LANL)における同社のVeraプロセッサの初期導入事例を紹介した。このプロセッサは、同研究所の「Universal Research and Scientific Agent(URSA)」プラットフォームの運用支援に活用されている。URSAは、研究者がコードを記述したり、シミュレーションを実行したり、科学ツールを活用したり、結果を分析したりするのを支援するために構築されたものだ。

ここ数年、AIインフラに関する議論は、GPUから始まりGPUで終わる傾向にあった。今回の発表は、CPUにも依然として重要な役割があることを改めて示している。

エヌビディアによると、VeraはURSAの主要なワークロードにおいて、LANLのスーパーコンピュータ「Crossroads」に搭載されたCPUの最大7倍の性能を発揮した。

この結果は、次世代スーパーコンピュータの設計において、AIワークロードの影響力がますます大きくなっていることも浮き彫りにしている。研究者たちがますます自律性の高いAIシステムの実験を進める中、CPUの役割はGPUと並行して進化している。オーケストレーションの増加、データ移動の増加、そしてデータとAIモデル間の連携の強化が進んでいる。

 
   

Veraの導入は、ロスアラモスで進行中のより広範な近代化の取り組みとも関連している。今年初め、同研究所はHPEおよびエヌビディアと提携して開発中の3つの次世代計算基盤、「Mission」、「Vision」、「Veritas」の計画を発表した。

「Mission」は機密扱いのワークロードをサポートすることが期待されており、「Vision」は非機密のワークロード向けに設計されている。「Veritas」は、高度なAIおよび科学計算研究のためのテストベッドとなる予定だ。これらのシステムは一体となって、従来のHPCと新興のAI機能を融合させるLANLの戦略において不可欠な要素を形成する。

URSAのようなプラットフォームが重視されていることは、スーパーコンピュータが自律的なAI主導の科学ワークフローをサポートするようますます設計されていく未来を垣間見せてくれる。

Vera CPUは、同社が今後展開するVera Rubinアーキテクチャにおいて、Rubin GPUと組み合わせられる見込みだ。

エヌビディアによると、フル構成のVera Rubinシステムは、最大144基のGPUをサポートし、7エクサフロップスを超えるAI性能と5ペタフロップスのネイティブFP64性能を発揮できるという。同社は、大規模なAIワークロードと従来の科学計算アプリケーションの両方をサポートする必要性が高まっている環境をターゲットとしている。

科学計算はAIとは異なる要件を持つため、FP64性能に重点が置かれている点は特筆される。AIモデルでは低精度の計算で済む場合が多いが、多くの従来のHPCアプリケーションは、精度を確保するために依然として倍精度演算に依存している。例えば、天気予報、物理シミュレーション、材料科学、原子力研究などでは、FP64演算が提供する数値精度がしばしば必要とされる。

エヌビディアはまた、ロスアラモスで採用されているオープンソースのモンテカルロ熱伝達シミュレーションコード「Branson」に関する初期の結果も報告した。同社によると、Veraは「Crossroads」で使用されたCPUの3倍以上の性能を発揮した。

新たなエージェンティックAIワークロードを代表するURSAとは異なり、Bransonは従来のHPCアプリケーションである。これは、このアーキテクチャの利点がAIに焦点を当てた研究の枠を超えて広がっていることを示している。

7エクサフロップスの「AI for Science」性能と5ペタフロップスのネイティブFP64性能を備えたVera Rubinは、TOP500クラスのスーパーコンピュータ性能を単一のラックに凝縮している

AI for Scienceで7エクサフロップス、ネイティブFP64性能で5ペタフロップスを実現した「Vera Rubin」は、TOP500クラスのスーパーコンピュータ性能を単一のラックに凝縮している

 

AI for Scienceで7エクサフロップス、ネイティブFP64性能で5ペタフロップスを実現した「Vera Rubin」は、TOP500クラスのスーパーコンピュータ性能を単一のラックに凝縮している

 
   

エヌビディアはブログ記事の中で、この性能向上の要因として、カスタム設計のOlympusコア、LPDDR5メモリサブシステム、高速オンチップファブリックなど、Veraアーキテクチャのいくつかの機能を挙げた。

同社は次のように記している。「単一のVera CPUは、単一ソケットのx86ベースCPUを3倍以上上回る性能を発揮すると同時に、コアあたりのメモリ容量は4倍以上、ノードあたりのメモリ容量は6倍以上を提供する。結局のところ、これはLANLにとって科学的な成果をより迅速に得られることを意味する。」

「同研究所のすべてのスーパーコンピュータは、ハードウェアアーキテクト、システムソフトウェア開発者、専門分野の科学者、コンピュータ科学者、応用数学者によって共同設計された。これにより、システムが抽象的なベンチマークだけでなく、実際の科学的なワークロードに基づいて構築されることが保証されている。」

新しいシステムは、HPEのCray Supercomputing GX5000アーキテクチャを基盤とし、エヌビディア Quantum-X800 InfiniBandネットワークを組み込む。計画されている構成に基づき、「Mission」はVera Rubin GPUノードと約2,300台のスタンドアロン型Vera CPUを組み合わせる一方、「Veritas」はVera Rubinノードと約1,150台のスタンドアロン型Vera CPUを組み合わせる予定だ。

これらのシステムはそれぞれ異なる役割を担う見込みだ。「Veritas」は、エージェンティックAI技術がより大規模な本番システムに導入される前の実証の場として機能することが期待されている。

「Mission」は2027年に稼働開始予定であり、ロスアラモスにおける機密扱いの国家安全保障ワークロードを担う主要システムとして「Crossroads」に取って代わる。「Vision」も2027年の稼働が予定されており、エネルギーモデリングや生物医学研究など、より幅広い科学研究を支援することが期待されている。

 
  ロスアラモス国立研究所(提供:米国エネルギー省)
   

これらのシステムは、LANLとエヌビディアとの既存の提携関係も基盤としている。これらは、2024年にロスアラモスに導入されたHPE Cray EXスーパーコンピュータ「Venado」の導入に続くもので、同システムにはエヌビディアのGrace HopperスーパーチップおよびGrace CPUスーパーチップが搭載されている。

チップメーカーによると、「Grace」から「Vera」への移行は、ハードウェアアーキテクト、ソフトウェア開発者、専門分野の科学者、コンピュータ科学者、応用数学者が連携し、実世界の科学アプリケーションに合わせてシステムを最適化するための継続的な共同設計の取り組みを反映している。

真の試練は、「Mission」、「Vision」、「Veritas」が稼働を開始した時に訪れるだろう。その頃には、ロスアラモスでは、エージェンティックAIが従来の科学計算ワークロードとどのように共存できるかについて、はるかに明確な見通しが立っているはずだ。