GPUを理解する —現在のAI革命の推進力
オリジナル記事「Understanding the GPU —The Catalyst of the Current AI Revolution」

Manasi Rashinkar
GPUは、今日の生成AI時代に不可欠な人工知能の「ゴールド」に例えられることが多い。本記事では、なぜAIはGPUなしでは実現不可能なのかを説明することを目的としている。まずは、画面に画像を表示するという単純なプロセッサのタスク(下記参照)から始めよう。
一見単純そうに見えるこのタスクには、幾何学変換、ラスタライゼーション、フラグメント処理、フレームバッファ操作、出力結合といったいくつかのステップが含まれている。これらは、3DグラフィックスのレンダリングにおけるGPUパイプラインのプロセスを概説している。
![]() |
(出典:https://img-new.cgtrader.com/items/708323/72453d4a2d/teapot-3d-model-c4d.jpg) |
GPUパイプラインでは、画像は以下のようにポリゴンメッシュ表現に変換される。
![]() |
ティーポットの画像は、個別にレンダリング(並列処理)可能なポリゴンメッシュに変換される |
単一のティーポット画像は、数百の三角形で構成されるメッシュ構造に変換され、それぞれが同様に個別に処理される。
この「単純な」タスクを処理するにあたり、CPUにはないGPUの利点とは何だろうか? ハイエンドサーバーのCPUは最大128コアまで搭載可能であるため、CPUはティーポットの128個の三角形を同時に処理することができる。ユーザーは部分的にレンダリングされたティーポットを目にすることになるが、CPUコアが処理を終え、新たにレンダリングする三角形を選ぶと、ゆっくりとレンダリングが完了する。グランド・セフト・オート(GTA)をプレイしているときに、シーンが部分的にレンダリングされるのを想像してみてほしい。それは体験を台無しにし、古いスネークゲームでさえもより楽しく感じられるだろう。
GPUはどのようにして完全なGTAゲーム体験を提供できるのか? 答えは「並列処理」である。GPUには何万ものコアがあるためだ。GPUは、各三角形に対して並列に動作する多数のスレッドにより、ティーポットのすべての三角形を同時にレンダリングすることができる。基本的に、CPUは逐次処理を行うが、GPUは並列処理を行うように設計されている。
この魅力的なビデオは、GPUコンピューティングの力を示している。
当初は3Dグラフィックのレンダリングを高速化するために開発されたGPUは、時を経てより多機能でプログラミング可能なものへと進化してきた。高度な照明や影付けにより、より優れた視覚効果やリアルなシーンを実現する機能が追加され、ゲームに革命をもたらした。しかし、それだけにとどまらなかった。開発者たちはGPUの未開拓の可能性に気づいた。先ほどのティーポットの例に戻ると、GPUはベクトルベースの数学計算と行列乗算を行い、画像をレンダリングする。単純なティーポットのレンダリングには約192バイトが必要だが、100個のオブジェクトを含む複雑なGTAのシーンでは約10KBが必要となる。
GPUに内蔵された並列処理機能と高い処理能力により、計算処理が高速化され、タンパク質の折りたたみシミュレーションや物理計算などのタスクにGPUを使用する研究者が増えている。こうした初期の成果により、GPUはグラフィックレンダリング以外の計算負荷の高いタスク、例えばニューラルネットワークで使用される行列やベクトル操作などを高速化できることが示された。ニューラルネットワークはGPUを使用しなくても実現可能であったが、その能力は利用可能な計算能力によって制限されていた。GPUの登場により、複雑で深いニューラルネットワークを効果的に訓練するのに必要なリソースが提供され、ディープラーニング技術の急速な進歩と普及が促進された。
GPUが幅広いタスクを効果的に処理できるように、エヌビディアはさまざまな機能に特化したさまざまなタイプのGPUコアを開発した。
- CUDA コア: グラフィックレンダリング、科学計算、基本的な機械学習タスクなど、汎用並列処理用である。
- テンソルコア: ディープラーニングとAI用に設計されており、ニューラルネットワークのトレーニングと推論に不可欠な行列乗算などのテンソル演算を高速化する。
- RT コア: リアルタイムレイトレーシングに重点を置いており、グラフィックに現実的な照明、影、反射効果を提供する。
これは、GPUがCPUに取って代わることを意味するのか? 決してそうではない。CPUはコンピュータの頭脳のようなもので、少数だが強力なコアで個々のタスクを迅速に管理することに優れている。CPUはレイテンシ(待ち時間)に重点を置いており、これはシステム応答時間を反映している。一方、GPUはスループットに重点を置いており、これはシステム容量を示している。単なるグラフィックアクセラレータからスーパーコンピュータで重要な役割を担うまでに進化したGPUの歴史は、急速な技術進歩と応用分野の拡大を物語っている。かつては遅くて不正確だった機械学習も、GPUの統合により大規模なニューラルネットワークが革命的に進歩し、自動運転や画像/物体認識などの分野で飛躍的な進歩をもたらした。今や企業技術の主流となった高性能コンピューティングは、主にGPUによって推進されてきた。
マナシ・ラシンカーは、サンタクララ大学で電気工学の修士号を取得しており、現在はエヌビディアのシニアASICエンジニア兼タイミングリードを務めている。本記事はマナシ自身の著作であり、エヌビディアを代表するものではない。