世界のスーパーコンピュータとそれを動かす人々


5月 14, 2026

Bolt Graphics、Zeus GPUでFP64 HPCワークロードをターゲット

HPCwire Japan

オリジナル記事「Bolt Graphics Targets FP64 HPC Workloads with Zeus GPU

シリコンバレーの半導体スタートアップ企業「Bolt Graphics」は、HPC(ハイパフォーマンスコンピューティング)、レンダリング、その他の計算負荷の高いアプリケーションに対応するために設計された新しいRISC-V GPU「Zeus」のテストチップのテープアウトを完了した。同社によると、単一のマザーボード上で20テラフロップスのFP64性能を発揮するZeusの納入は、2027年第4四半期に開始される見込みだという。

ダルウェシュ・シン氏は2020年、ゲームデザイナー、アーティスト、科学者、エンジニアが使用するシミュレーションや3Dグラフィックスといった高負荷アプリケーションを駆動できるチップを提供することを目標に、Bolt Graphicsを設立した。今日のGPUは高性能ではあるものの、数十年前の問題を解決するために設計されたものであり、グラフィックスやシミュレーション分野が現在直面している計算上の課題には対応できていない。

 
(画像提供:Bolt Graphics)  
   

「明らかに、GPUが当初解決するために設計された1990年代の問題は、今日の問題とは異なります」と、シン氏は同社のウェブサイトに投稿された動画で述べている。「今後30年間のコンピュータグラフィックスを支え、次世代のユースケースを駆動するためには、全く画期的な新しいタイプのGPUが必要です。」

シン氏は、Bolt Graphicsが困難なレンダリング課題の解決に向けて、一切の妥協を許さないアプローチを取っていると述べた。例えば、現代のGPUでは、ビデオゲームデザイナーやアニメーション制作者が求めるラスタライズ処理やレイトレーシングを効率的に実行できないと彼は指摘した。4K解像度で120fpsの短いアニメーションクリップを完全にレンダリングするのに数時間かかり、長編アニメーション映画の完成には数年を要することもあるという。

「Zeusにより、我々はラスタライズとレイトレーシングの両方を飛び越え、リアルタイムのパストレーシングを実現します」とシン氏は語った。「パストレーシングは、最高品質のビジュアルを提供する最も先進的なレンダリング技術です。」

最大384GBの拡張可能なDDR5メモリを搭載したZeusは、研究者がフルFP64精度でより大規模なシミュレーションを実行するのにも役立つ。Bolt Graphicsによると、このチップはIEEE-754 FP64精度での電磁気シミュレーションを、Nvidia Blackwell B200よりも300倍高速に実行できるという。

 
  Bolt Graphicsは、Zeus 4cモデルで20テラフロップスのFP64性能を実現している(画像提供:Bolt Graphics)
   

「Zeusは、精度を犠牲にすることなく、これらの主要な物理シミュレーションを実行する際、従来のGPUよりも数桁高速です」とシン氏は述べた。「実際、コンシューマー向けであれエンタープライズ向けであれ、すべてのZeus GPUには、HPCワークロードを効率的に実行するように設計されたフルFP64コアが搭載されています。」

Bolt Graphicsがテープアウトを完了したばかりのGPU設計には、TSMCの12nm FinFET Compact(12 FFC)プロセスをはじめとする、確立された半導体プロセスが採用されてる。Bolt Graphicsによると、Zeusのスケーラブルなアーキテクチャは、5nmを含む先進ノードにも対応しているとのことだ。このチップには、スカラーコア、ベクトルコア、その他の専用プロセッサが搭載されている。同社は、Zeus 1c、Zeus 2c、Zeus 4cの各製品において、1ボードあたり1個、2個、または4個のチップレットを組み合わせてGPUをパッケージングしている。Zeus 1cと2cはPCIeカードに収まるが、Zeus 4cは大きすぎるため、専用のマザーボードが必要となる。

Bolt GraphicsのZeus仕様書によると、ハイエンドモデルのZeus 4cは、500Wの消費電力で20テラフロップスのベクトルFP64演算性能を発揮する。顧客は単一のサーバに数十枚のZeus 4cを搭載でき、スケールアップ構成で最大9TBのメモリを扱えるようになる。Bolt Graphicsのウェブサイトによると、Zeusカードには400GbEインターフェース(オプションで800GbE)が搭載され、顧客は数千枚のGPUで構成されるスケールアウトクラスターを構築できるようになるという。

ハイエンドモデルであるZeus 4cのFP64性能は、NVIDIAのHopper H100およびH200 GPUと同等の水準にある。これらNVIDIAのGPUは、同様の消費電力(約350ワット)で34テラフロップスのFP64性能を実現していた。NvidiaのBlackwell B100およびB200 GPUは、それぞれ30テラフロップスおよび37テラフロップスのFP64性能を実現したが、消費電力は実質的に2倍の700ワットとなった。Nvidiaの新しいRubin GPUは、GPUあたり最大2,300ワットを消費しながら、33テラフロップスのFP64性能を提供する予定である。

言うまでもなく、Nvidiaの最新GPUは膨大なAI処理能力を備えており、その処理は一般的に4ビットや8ビットといった低精度で行われる。
NVIDIAは、低精度コアを用いてFP64並みの演算能力を実現するために、Ozakiエミュレーション方式に期待を寄せている。しかし、Ozaki方式に賛同しない声もあり、従来のモデリングやシミュレーションワークロードに必要なネイティブのベクトルFP64処理能力が、AI処理能力を強化するために犠牲にされているのではないかという懸念がHPCコミュニティ内で生じている。

 
Zeusのスペックシート(画像提供:Bolt Graphics)  
   

このネイティブFP64性能に関する懸念に対し、AMDは次期GPU「MI430X」で対応を図っている。このGPUは、2028年にオークリッジ国立研究所に設置される予定の次世代スーパーコンピュータ「Discovery」において、米国エネルギー省が採用する予定だ。推定によると、MI430XのFP64性能は約200テラフロップスに達する見込みである。

「計算需要は指数関数的に増加しているが、コストが依然として制約要因となっている」と、カリフォルニア州サニーベールに拠点を置く同社のCTO兼CEOでもあるシン氏はプレスリリースで述べた。「次世代のコンピューティングは、性能だけでなく効率性によって定義されると我々は考えている。我々の目標は、計算の経済性を根本的に変革し、次世代ワークロードのデフォルトプラットフォームになることだ。」

Bolt Graphics社によると、同社の製品パイプラインは5億ドルを超え、早期アクセスプログラムには企業、開発者、エンドユーザーを含む1万4,000人以上の参加者がいるという。FP64処理能力を強く求めている政府系研究所がこのプログラムに参加しているかどうかは不明だが、参加していても不思議ではない。詳細については、同社のウェブサイト(https://bolt.graphics)を参照のこと。