世界のスーパーコンピュータとそれを動かす人々


11月 3, 2025

NVIDIAと米国エネルギー省(DOE)、科学研究向けの7台の新AIスーパーコンピュータを発表

HPCwire Japan

オリジナル記事「Nvidia, DOE Announce Seven New AI Supercomputers Built for Science

ワシントンD.C.で開催されたGTCイベントにおいて、NVIDIAは米国エネルギー省の国立研究所と協力し、7台の新たなスーパーコンピュータを構築すると発表した。このうち5台はアルゴンヌ国立研究所が、2台はロスアラモス国立研究所が設置する。

NVIDIAのジェンセン・フアンCEOはGTC基調講演で「コンピューティングは科学の基盤となる道具であり、我々は複数のプラットフォーム移行期を経験している」と述べ、「将来のスーパーコンピュータは全てGPUベースのものになる」と付け加えた。

新システムの中で最大規模となるのはアルゴンヌ国立研究所の「Solstice」スーパーコンピュータだ。SolsticeはNvidia Blackwell GPUを10万基搭載する。これは現行のTop500首位「El Capitan」のアクセラレータ数の2倍以上であり、科学研究向けに構築されたGPUベースのスーパーコンピュータとしては史上最大級となる。Nvidiaによれば、Solsticeは米国エネルギー省(DOE)の新たな官民連携モデルを用いて構築される。このモデルは、DOEの研究目標と民間セクターの能力を連携させ、業界の共同投資を呼び込み、システム上での共同研究プロジェクトを支援することで、大規模AIシステムの展開を加速することを目的としている。

 
  NVIDIAのCEO、ジェンセン・フアンがGTCのステージに(画像提供:ALCF)
   

より小型のシステム「Equinox」は1万個のNVIDIA Blackwell GPUを搭載し、2026年に稼働開始予定だ。NVIDIAによれば、SolsticeとEquinoxの両システムはアルゴンヌ国立研究所に設置され、NVIDIAのネットワークで相互接続される。これにより2,200エクサフロップスのAI性能を実現する。

この提携の枠組みにおいて、オラクルはアルゴンヌ国立研究所のシステムにおける主要産業パートナーとして参画する。同社はまた、NVIDIAのHopperおよびBlackwellアーキテクチャに基づくAI計算リソースをエネルギー省に即時提供する。これらのリソースはアルゴンヌ国立研究所および全国の研究機関の科学者に利用可能となり、科学・エネルギー分野におけるAI応用研究を支援する。

Solstice および Equinox スーパーコンピュータは、DOE プログラム全体の科学的発見を加速するために設計された自律型 AI 研究エージェントのトレーニングおよび導入に使用される。アルゴンヌ国立研究所の所長であるポール・カーンズは、このシステムは AI を活用した幅広い科学的ワークフローをサポートし、先進光子源などの DOE 実験施設に接続することで、研究者が AI 手法を実験データに直接適用し、複雑な国家的な研究課題に取り組むことを可能にする、と述べた。

アルゴンヌでは、Nvidia ベースの 3 つの追加システム、Tara、Minerva、Janus も発表された。これらのシステムは、Nvidia、Hewlett Packard Enterprise、World Wide Technology の支援を受けて構築され、AI 推論と人材開発を加速するためにカスタマイズされる、とアルゴンヌは述べた。Tara は、統合された AI-HPC 環境として設計された AI 推論システムであり、エクサスケール計算と AI の進歩を科学的ブレークスルーに変換することを目的としている、とアルゴンヌは述べた。NvidiaとWWTが共同開発するミネルヴァも科学的な推論ワークロード向けに設計される。HPEとNvidiaが共同開発するJanusは、労働力育成・研究システムとして機能し、DOEの科学者や学生が大規模なAI・HPCワークロードの実践的経験を積むのを支援する。

 
(JHVEPhoto/Shutterstock)  
   

アルゴンヌ国立研究所のコンピューティング・環境・生命科学担当副所長、リック・スティーブンスは、現代科学は強力なコンピューターだけでなく高度なAI能力にも依存していると述べた。「推論により、仮説の検証、実験設計、大規模で複雑なデータセットからの知見獲得のプロセスを効率化できます」と彼は語った。

アルゴンヌ研究所によると、新たに導入さ れる5つのAIシステムは、研究者がHPC(ハイパフォーマンスコンピューティング)とAIツールに迅速にアクセスできるようにすることで、概念から発見までのプロセスを短縮すると期待されている。この取り組みは、米国エネルギー省(DOE)の科学的専門知識と産業界パートナーの先進技術を組み合わせ、国家研究インフラの能力を拡大するものだと同研究所は説明している。

TPCのエグゼクティブディレクターであるチャールズ・キャットレットによれば、新たなHPCリソースはTPC25で概説された兆パラメータコンソーシアムの取り組みに沿ったものだ。

「コミュニティを活性化させた新たなTPC共同イニシアチブの一つは、米国、日本、欧州のリーダーたちの知見と専門知識を活用し、共同でオープンフロンティアモデルを設計・構築することです」と、アルゴンヌ国立研究所の上級コンピューター科学者でもあるキャットレットは述べた。「このパートナーシップは、我々が必要とする規模を実現する上で極めて重要となるでしょう。」

アルゴンヌの新システムがオープンサイエンスとAI駆動型発見の拡大に注力する一方、ロスアラモス国立研究所はHPEがNvidiaと共同開発した2つの新システムを導入する。 MissionとVisionスーパーコンピュータは、科学研究と国家安全保障研究向けのAI機能を組み込み、同研究所のモデリング・シミュレーション分野における主導的立場を強化する。

Missionは、米国国家核安全保障局(NNSA)の先進シミュレーション・コンピューティング計画における5番目の先進技術システム(ATS)となる。2027年に稼働を開始すると、Missionは機密計算環境でのみ運用され、米国の核安全保障の基盤となるモデリングとシミュレーション作業を支援する、とロスアラモス国立研究所(LANL)は発表で述べた

 
  Mission:2027年に稼働予定とされるロスアラモスシステム(画像提供:ロスアラモス)
   

このシステムは現行のCrossroadsスーパーコンピュータを置き換え、新たなレベルの並列処理能力を導入する。これにより複数の大規模シミュレーションを同時に実行可能となる。ロスアラモスはMissionを「エクサスケール時代以降を想定して設計された初のNNSAシステム」と位置付け、従来の高精度シミュレーションとAI支援手法を組み合わせることで精度と速度の向上を図ると説明した。

ロスアラモス研究所のトム・メイソン所長は次のように述べた。「MissionとVisionは、わが国の安全保障科学と基礎科学能力への重要な投資です。これらのシステムは、AI時代におけるスーパーコンピューティングのために特別に設計されたものです。」

関連システムであるVisionは、研究所の非機密分野向けに運用され、オープンな科学研究を目的として設計される。2024年にロスアラモスに導入されたHPE-Nvidiaシステム「Venado」の成功を基盤とし、Missionも同じアーキテクチャ基盤を採用する。Visionは材料科学・核科学、エネルギーモデリング、生物医学研究のプロジェクトを支援すると同時に、科学応用分野におけるAI開発を推進する。

MissionとVisionの両スーパーコンピュータは、NvidiaのVera Rubinアーキテクチャを搭載した新たなHPE Cray Supercomputing GX5000プラットフォームを基盤とする。この設計ではNvidiaのVera CPUとRubin GPUを統合し、同社のQuantum-X800 InfiniBandネットワークで相互接続され、直接液体冷却システムによって冷却される。ロスアラモス国立研究所は、Venadoプロジェクトを起点とした共同設計プロセスを通じてHPEおよびNvidiaと協力した。このアプローチは、ハードウェア設計、ソフトウェア最適化、ドメインサイエンスの専門知識を活用し、システムアーキテクチャをそれが支える科学的なワークロードに適合させるものである。

 
Vision、ロスアラモス国立研究所の第二の新システム(画像提供:ロスアラモス国立研究所)  
   

「MissionとVisionは、ロスアラモス研究所との長年にわたるパートナーシップと共同イノベーションを深化させるものです」と、HPEのHPC&AIインフラストラクチャソリューションズ部門シニアバイスプレジデント兼ゼネラルマネージャーであるトリッシュ・ダムクローガーは述べた。「我々はパートナーシップを拡大し、新たなHPE Cray GXスーパーコンピューティングアーキテクチャを搭載した初期システムの一部を提供できることを誇りに思います。これらは科学的発見を支え、重要な課題解決に貢献するでしょう。」

MissionとVisionは、大規模シミュレーションワークフローへのAI統合を目指すロスアラモス戦略における前進だ。「ロスアラモスは長年、科学的発見の最前線を推進してきた」とNVIDIAのハイパースケール&HPC担当副社長イアン・バックは述べ、新システムが加速コンピューティングとAIを融合させ、国家研究ニーズに向けたシミュレーションと生成型知能の限界を押し広げると付け加えた。

二つの国立研究所で七つの新システムが発表された今週は、エネルギー省(DOE)のコンピューティングがここ数年で最も大きく拡大した週の一つだ。アルゴンヌ国立研究所とロスアラモス国立研究所の新システムは、今週発表されたオークリッジ国立研究所の「Discovery」と「Lux」に続くもので、AI駆動型アーキテクチャがオープンサイエンスと国家安全保障の両分野でDOEコンピューティングを再構築している実態を示している。これらの新システムに関する詳細な性能や構成情報はまだ公開されていないが、今後数ヶ月で技術仕様が明らかになるにつれ、HPCwireは注視していく。