NVIDIA、GPUボトルネックの周りでロードマップを進展
Nicole Hemsoth

The GPU Technology Conference (GTC ’14) は、2014年3月25日の朝にサンノゼで始まった。NVIDIA CEOのJen-Hsum Huang氏は、ビッグ・データとビッグ・コンピューティングに向けてとの予告で、このイベントを始めると選んだ。ゲームとエンターテインメントを合わせたものを人々が注目していたことに対し、高性能計算、機械学習、機械視覚、大規模な解析がこの年のトーンになった。そして、GPUメーカーが、性能と効率を意識した主力企業のための事業と、研究分野のユーザーに関して真剣であると、疑いの余地を残さなかった。
GPUコンピューティングのためのNVIDIAのロードマップは、常にアクセラレーターのためのデータ移動と記憶能力に関して存在した、主要なボトルネックのいくつかを解決して、ぐるぐる回る。「ビッグ・データ」のこの時代には、性能レベルは、これまでより大きなデータ・ストリームの追加と共に落ちる。データ移動が最近DMAによってバックグラウンドで行われる革新にもかかわらず、GPUの危機である。
データ移動ボトルネックに対するNVIDIAの回答は、GTC初日に発表のMVLinkに見つかる。これは、PCIエクスプレス・バスを通さずに、CPUとメモリーを共有し、他のGPUとチップ対チップの直接通信をする試みである。現在のPCIエクスプレス3.0と比較しても優れている。実質的に、DMA付きのPCIエクスプレスの束は、広帯域で、所有権(proprietary)が加えられるべき、PCIエクスプレスの拡張に見える。それは、純粋なPCIエクスプレスの効率と性能の流路を、両方とも同じ流路に通す代わりに、構成要素に分配する。Huang氏の基調講演によると、PCIエクスプレス3.0と比べて、4倍の効率改善、5倍から12倍の性能改善であった。
詳細の多くを公開することをNVIDIAは嫌った。しかし、本質的には、NVLinkは、バンド幅を向上するために束ねることが可能な、双方向8車線の「brick」から成る。通路のそれぞれの速度は、brickごとにおよそ200GB/sである。最初のPascal GPUでは4車線のハイウェイを持ち、その次にもう4車線が追加されるように見えるだろう。
NVLinkをサポートしないCPUにユーザーがフックされた場合には、同一の速いレーンがGPUとGPUの間で下記のように開かれることが可能だ。
インターコネクトの達人Bill Dally氏に率いられた研究グループによる開発の成果かもしれない。そして、何らかの「chatch」が必要であろう。建築の土台から始める必要があり、新しいマザー・ボードとエコ・システムに投資する必要があるという困難の他に、OEMがまだ発表されていないライセンス計画の条件を満たす努力をする必要があるかもしれない。それが競争するマザー・ボードの新しい群れをもたらすかもしれない一方で、福音は、非常に高密度なサーバーの製造を考慮に入れるために、非常に小さいモジュールをはめ込めることである。さらに、プログラミング・モデルはボトル・ネックであってはならない。NVLinkがPCIエクスプレスによく似ているように見えても、その特別なDMA能力にソフトウェアが適応することが簡単な必要がある。NVIDIAの注意によると、第一世代がメモリー・コヒーレントではなく、第二世代のNVLinkをユーザーが繰り返し要求し、それまでには、エコ・システムがその周りで発達する機会があるかもしれない。
有名な数学者の名前に由来するPascalは、NVLinkの最初の世代と共に、ユニファイイド・メモリー、3次元メモリーを持つだろう。ご覧の通り、が、どんなにNVIDIAが質問を断ったとしても、Teslaグループの必要を満たすために、Maxwellの現状は、現時点において正しい。
Pascalの鍵となる特徴は、288 TB/sec から 1000TB/sec に3倍ほど増強されるメモリー・バンド幅である。さらに、ボルテージ・レギュレーターによってパッケージの外のGDDR5メモリーのエネルギー効率が4倍になり、隣接するものの性能が上がる。
Huang氏によると、「GPUは既に288 GB/sec のバンド幅を持っています。これはCPUの何倍もあります。これこそ、GPUが多くの並列処理に使われる理由です。しかし、GPUが多くのピンを持っていることは、挑戦的課題です。これは既に世界最大のチップです。インターフェースは既に非常に広いです。パッケージがより巨大になり、シグナルの制御でエネルギー効率が落ちることを、どうやって解決できるでしょうか。ほとんどあらゆるアプリケーションにしわ寄せが来る原因であることを、私たちは知っています。」
![]() |
|
GTC 2014の写真を見るにはここをクリック |
Huang氏は、PCIエクスプレスカードの約1/3でiPhone程度の大きさであるPascalを持ち出し、3Dメモリーと第一世代NVLinkをサポートする予定であり、彼自身の質問に答えた。Pascalの展望についてむしろ面白いことは、Huang氏がフォーム・ファクターについて話さなかったことである。彼は単にそれを「モジュール」と称した。これは、サーバー市場が彼らの本来の居場所であるが、彼らが他の場所も見回っていることを意味した。基調講演によって、モバイル性とアクセスについても強調があった。クラウドによって届けられるサービス、トランクにモジュールを積んで自動的に運転する車、超音波などの医療デバイスからヒントを得る装置など。要するに、NVIDIAがVolta (次世代GPU) を開発するのを我々が待っている間に、Maxwellとちょうど発表されたPascalは、箱の外側を回っているということだ。