Nvidia、BlueField-4 DPUの速度を800Gbpsに引き上げ
オリジナル記事「Nvidia Cranks Its BlueField-4 DPU To 800 Gbps」
本日開催されたGTCワシントンイベントで、Nvidiaは最新世代のデータ処理ユニット(DPU)「Bluefield-4」を発表した。新世代DPUはストレージからコンピューティングへのデータ転送速度を800Gbpsに高め、前世代比で2倍の速度を実現。計算能力は6倍向上している。Nvidiaは、稼働開始する新たなギガスケールAIファクトリーを支えるため、顧客がこの追加性能を必要としていると説明した。
DPUは新生AIインフラストラクチャスタックにおいて重要性を増している。ネットワーク経由でのデータ移動という比較的単調な作業をCPUに任せる代わりに、ネットワークインターフェースカード(NIC)と組み合わせたDPUが専用のデータ移動装置として機能する。これによりCPUはデータ移動のオーバーヘッドから解放され、クラスターはより有用な作業を遂行できるようになる。
![]() |
| Bluefield-4-DPU(画像提供:Nvidia) |
前世代のBluefield-3 DPUは、Nvidiaが2021年に発表したもので、400GbpsのイーサネットとInfiniBandネットワークをサポートしていた。これは、わずか1年前に発表されたBlueField-2と比較して、ネットワーク帯域幅が2倍、演算能力が4倍、メモリ帯域幅がほぼ5倍という性能を提供した。
BlueField-4でNvidiaは再び性能を向上させた。Nvidia Grace CPUとConnectX-9 NICを組み合わせたこの新DPUは、BlueField-3と比較してネットワーク帯域幅が2倍、演算性能が6倍になったとNvidiaは述べている。
Nvidiaは、AIギガファクトリーで導入される最速の800Gbps RDMA対応ネットワークを処理するよう設計されたConnectX-9 NICにさらなる性能を詰め込んだ。BlueField-4は16レーンのPCIe Gen 6ホストインターフェースを備えており、BlueField-3のNICが採用していたPCIe Gen 5インターフェースを上回る。
DPUの中核プロセッサもアップグレードされ、64コアのArm Neoverse V2プロセッサが追加された。これは640億個のトランジスタを搭載しており、BlueField-3で使用されていた16個のArm Cortex-A78コア(220億個のトランジスタ)と比較すると大幅な増加だ。Nvidiaはさらに、Arm Neoverse V2プロセッサを128GBのLPDDR5メモリ(BlueField-3の32GB DDR5メモリと比較)と114MBの共有L3キャッシュ(従来の8MB L2キャッシュと比較)で強化し、512GBのオンボードSSDと組み合わせた (v3の128GB SSDと比較)。これら全てが相まって、以前よりも多くのデータをより迅速に移動する能力を実現している。
前世代と同様に、BlueField-4はNvidiaのDOCA(Data-center-infrastructure-On-a-Chip Application)フレームワークをサポートする。これは開発者がDPUを中心に安全かつスケーラブルなコンテナ化サービスを構築することを可能にする。DOCAは、Nvidiaが目指す「マルチサービスアーキテクチャ」を実現する手段だ。RTX PROサーバー、HGX、DGX、GB200、GB300といったNvidia製品群上で動作するストレージ、セキュリティ、ネットワーク活動に「ネイティブサービス機能チェイニング」を組み込んだ完全なアーキテクチャである。
![]() |
|
| DGX SuperPOD(出典:Nvidia) | |
2026年に出荷されるBlueField-4は、PCIeカードとして、あるいはVera Rubin NVL144ラックスケールシステムに統合された形態で提供される。Vera Rubin NVL144は来年出荷時に、単一の液体冷却ラックで8エクサフロップスの性能を発揮する。
NvidiaはBlueField-4を、Cisco、DDN、Dell Technologies、HPE、IBM、Lenovo、Supermicro、VAST Data、WEKAといった主要なHPCサーバーおよびストレージベンダーの支援を得て発表した。
以下はストレージベンダー各社がBlueField-4を支持する声明の一部である:
「NVIDIA BlueField-4はAIファクトリーにおける可能性を再定義するものです。データ、演算、インテリジェンスが単一の自己最適化システムに融合する場です」とDDNのCEO兼共同創業者アレックス・ブザリは述べた。「DDNでは、これをデータ進化における次の飛躍と見ています。NVIDIAのアクセラレーションファブリックと当社のデータインテリジェンスプラットフォームを組み合わせることで、真に自律的で高性能なAIをグローバル規模で構築するための基盤を顧客に提供します。」
「ストレージは今や、NVIDIA BlueFieldテクノロジーによって駆動されることでより効率的かつ安全に動作する、より大規模なインテリジェントシステムのサブコンポーネントとなりました」と、VAST Dataの特命全権技術責任者であるハワード・マークス氏は記している。「この進歩は、DBox内部におけるデータプレーン最適化、より豊富なインバンド分析、リアルタイムテレメトリの新たな可能性を開きます。
追加された演算リソースにより、よりスマートなエンクロージャー管理、予知保全、ライブテレメトリに基づく動的なワークロード配置が可能になります」と述べている。
![]() |
|
「WEKAでは、BlueField-4をソフトウェア定義・サービス指向のAIストレージの未来に向けた重要な一歩と捉えています」と、WEKAのプロダクトマーケティング担当副社長であるジム・シャーハート氏は記している。「我々はNVIDIAと協力し、BlueField-4のアーキテクチャを活用する次世代NeuralMeshを設計中です。これにより、従来のサーバー+ストレージ設計よりも簡素かつ効率的な方法で、データ・演算・ネットワークを統合します。」
デルのプロダクトマーケティング上級コンサルタント、ロバート・マクニール氏は次のように述べている。「BlueField-4はホストCPUから重要なネットワーク・ストレージ処理をオフロードし、データ暗号化、トラフィック管理、ネットワークセグメンテーションといったタスクに対してラインレート性能を提供します。これらの機能を独立して処理することで、BlueField-4はデルシステムがAIアプリケーションの演算スループットを最大化することを可能にし、GPUとCPUが最も重要なこと、つまり洞察とイノベーションの加速に集中し続けることを保証します。」









