世界のスーパーコンピュータとそれを動かす人々


10月 3, 2022

Nvidia、新Ada Lovelace GPUアーキテクチャ、OVXシステム、オムニバースクラウドを発表

HPCwire Japan

Oliver Peckham、Jaime Hampton  オリジナル記事

NvidiaのCEOであるジェンセン・フアン氏は、本日のGTC基調講演で、もうひとつの新しいNvidia GPUアーキテクチャを発表した。Ada Lovelaceは、最初のコンピュータプログラマとされる伝説的な数学者にちなんで命名さ れたものである。また、Ada Lovelaceアーキテクチャをベースにした2つのGPU、ワークステーションに特化したRTX 6000とデータセンターに特化したL40、そしてオムニバースに特化したL40搭載の第2世代OVXシステムも発表さ れた。最後に、Nvidiaは、新しいソフトウェアおよびインフラストラクチャー・アズ・ア・サービスであるオムニバース・クラウドの立ち上げを発表した。

Ada Lovelace(エイダ・ラブレス)

Ada Lovelaceは、NvidiaのHopper GPUアーキテクチャ(わずか6カ月前に発表)のサブセットでもなく、真の後継でもない。その代わりにAda Lovelaceは、HopperがAIやHPCワークロードに対応するように、グラフィックスワークロードに対応するものだ。Nvidiaのプロフェッショナル・ビジュアライゼーション担当副社長であるボブ・ペッテ氏は、「深層学習やAIに最適なものを探しているなら、それはHopperです」と述べている。「L40はAIに最適ですが、Hopperほど高速ではありませんし、そうなることを意図していません。L40は最高のユニバーサルGPUであり、さらに重要なことは、そこにある最高のグラフィックスGPUであることを意味しています。」

「Ada Lovelaceは確かに全く別のアーキテクチャです」とペッテ氏は強調した。「そして、これは我々にとって少しユニークなことです。[AmpereからAmpere、HopperからAmpere、そしてHopperからAda Lovelaceと、非常に速く物事を進めようとしていますが、これはHopperの亜種であると誤解しないでください。一から設計したものなのです。」

「Ada世代」のRTX 6000とL40は、608mmのダイを共有し、TSMC経由のNvidiaの4nmカスタムプロセスを採用している(参考までにHopperもNvidiaの4nmカスタムプロセスを採用している)。新しいAda Lovelace GPUは、763億トランジスタ、18,176個の次世代CUDAコア、568個の第4世代Tensorコア、142個の第3世代RTコア、48GBのGDDR6メモリなどを誇っている。また、どちらも最大消費電力は300Wであるが、6000はアクティブファン冷却、L40はパッシブ冷却を採用しており、L40はroot of trustによるセキュアブートにも対応している。これらはいずれもPCIeデュアルスロットカードで、NVLinkは活用しない。Nvidiaによると、RTX 6000は、業界の他の動きに合わせて、数カ月以内にチャネルパートナーから発売され、今年末から来年初めにかけてOEMから広く発売される予定であるとのことだ。L40の入手は12月に開始されると予想される。

Ada LovelaceベースのGPU「L40」 画像提供:Nvidia

 

OVX

フアン氏は、オムニバースの第2世代となるOVXコンピューティングシステムも発表した。「本日、我々は新しいAda Lovelace L40データセンターGPUを搭載したOVXコンピュータを発表します」と彼は基調講演で述べた。「48GBの巨大なフレームバッファを持つOVXは、8つのL40を搭載し、巨大なオムニバースの仮想世界シミュレーションを処理できるようになります。」

 
  Nvidiaの第2世代OVXサーバー 画像提供:Nvidia
   

Nvidiaは3月にOVXシステムの第1世代を発表し、3Dシミュレーションおよびデザインプラットフォーム「Omniverse Enterprise」内でデジタルツインシミュレーションを実行するために作られたものだとアピールしている。第2世代のOVXシステムは、最新のGPUアーキテクチャと強化されたネットワーキング技術を特徴としている。

各OVXサーバーノードには、8つのAda Lovelace L40 GPU、デュアルIntel Ice Lake 8362 CPU、3つのNvidia ConnectX-7 400Gb/s SmartNIC、16TB NVMeストレージが搭載されている。Nvidiaは、第2世代のOVXシステムは2023年初頭までにInspur、Lenovo、Supermicroから発売され、将来的にはGigabyte、H3C、QCTが提供すると推定している。

Nvidiaによると、L40 GPUは、マテリアルのレイトレースおよびパストレースレンダリングの加速、物理的に正確なシミュレーション、フォトリアリスティックな3D合成データの生成など、Omniverseワークロードに高度な機能を提供するとのことだ。

新しいGPUに加え、OVXシステムはネットワークもアップグレードされている。そのConnectX-7 SmartNICは、最大400Gb/sの総帯域幅を提供でき、インラインデータ暗号化により各ポートで200Gネットワーキングをサポートする機能を含んでいる。従来のConnectX-6 Dx 200Gbps NICからのアップグレードにより、デジタルツインシミュレーションに必要な正確なタイミング同期のためのネットワークとストレージのパフォーマンスが強化されるとしている。

OVX は8 台の OVX サーバからなる 1 つの Pod から、Nvidia の Spectrum-3 Ethernet プラットフォームで接続された 32 台のサーバからなる SuperPOD まで拡張することができるため、スケーラビリティにも対応している。

「OVXの場合、サイジングの観点からデジタルツインに最適化していますが、仮想化も可能であることを明確にしておきたいと思います。複数のユーザ、複数のデスクトップ、オムニバースの作成アプリや表示アプリをサポートすることができます。非常に柔軟性があります」とペッテ氏は言う。

OVXシステムを最初に導入するのは、自動車メーカーのBMWグループとジャガー・ランドローバーだ。

BMWグループのイノベーションとバーチャル・プロダクションの責任者であるユルゲン・ヴィットマン氏は、「将来の工場の計画は、Nvidia Omniverseを使用して最先端のデジタル・ツインを構築することから始まります」と述べている。「当社のデジタルツインワークロードの実行にNvidia OVXシステムを使用することで、工場の大規模なフォトリアリスティックモデルを開発し、製造、設計、生産プロセスを変革するリアルなシミュレーションを行うために必要な性能と規模を提供します。」

ジャガー・ランドローバーの電気・電子・ソフトウェアエンジニアリング担当ディレクターのアレックス・ヘスロップ氏は、「Nvidia OVXとDRIVE Simは、次世代コネクテッドカーや自律走行車のテストを安全かつ効率的に行い、また、車両の特徴や機能を実証するためのカスタマージャーニーの再現を可能にする、幅広い実世界走行シナリオのシミュレーションを行う強力なプラットフォームを提供します」と述べている「”この技術を使用して、スケーラブルでコスト効率の高い方法で、高忠実度の物理的に正確なシナリオを大量に生成することは、事故ゼロと渋滞の少ない未来という我々の目標への歩みを加速させるでしょう。」

5月、Nvidiaは、4つのGPUとBlueField-3 DPUと一緒にGrace Superchipを採用したArmベースのOVX設計図システムを発表した。HPCwireへの電子メールで、NvidiaはGrace Superchipを搭載したOVXモデルがまだ計画通りであることを確認した。

オムニバース・クラウド

 
オムニバース・クラウドのエコシステム 画像提供:Nvidia  
   

Nvidiaは、アーティスト、開発者、企業チームがどこでもメタバース・アプリケーションをデザイン、公開、運用、体験できる包括的なクラウドサービス・スイートと呼ぶ、初のソフトウェアおよびインフラストラクチャー・アズ・ア・サービス提供製品「Nvidiaオムニバース・クラウド」も発表している。オムニバース・クラウドを使えば、ユーザはローカルの計算能力を必要とせずに、3Dワークフローで共同作業を行うことができる。

オムニバース・クラウドのサービスは、グラフィックスと物理シミュレーション用のNvidia OVX、AIワークロード用のNvidia HGX、分散データセンターエッジネットワークのNvidia Graphics Delivery Networkからなるコンピューティングシステム、Omniverse Cloud Computer上で実行さ れるものである。

新しいオムニバース・クラウドのサービスの例としては、RTX GPUを持たないユーザ向けに、Omniverse Createやレビュー・承認アプリOmniverse Viewなどのオムニバース・アプリケーションをストリーミングするサービス「Omniverse App Streaming」などがある。また、NvidiaのAIクラウドサービスと統合した、研究者、開発者、企業向けの3D合成データ生成ツール「Omniverse Replicator」もある。その他のクラウドサービスには、オムニバース・ヌクレオスのクラウド、オムニバース・ファーム、Nvidia Isaac Sim、Nvidia DRIVE Simがある。

オムニバース・クラウドの初期の支援者には、マーケティング・サービス企業のWPP、シーメンス、新しく設立されたブガッティ・リマック社の一部であるリマック・グループが含まれている。

Omniverse Farm、Replicator、およびIsaac Simコンテナは、Amazon EC2 G5インスタンスを使用してAWS上でセルフサービス展開するために、Nvidia NGCで本日より利用可能になっている。また、オムニバース・クラウドのサービスは、Nvidiaマネージドサービスとして、申し込みによる早期アクセスで利用できるようになる予定だ。