RISC-Vの新しい高性能チップとソフトウェア研究の詳細
Agam Shah オリジナル記事「New RISC-V High-performance Chips and Software Research Detailed」

RISC-Vをサーバーやスーパーコンピュータで実用化するための取り組みが数多く進められているが、実用化にはまだ何年もかかる見通しだ。中国とヨーロッパは、新しい高性能チップの詳細を明らかにしており、EUはオープンソースソフトウェアを基盤としたRISC-Vのクラウドコンピューティング環境の実験的構築を進めている。また、研究者らはTenstorrentのGrayskullを含む新しいRISC-Vチップのテストを行っている。
RISC-Vは、サーバー市場を独占しているx86およびARMアーキテクチャの代替となるものである。RISC-Vがサーバーや高性能コンピューターの実用的な選択肢となるにはまだ何年もかかるが、学術機関や研究機関がそのギャップを埋め、現実のものにしようとしている。
RISC-Vを後押しする勢いは否定できない。RISC-Vは、このアーキテクチャを基盤とした独自のチップを構築したいと考えているEU、ロシア、中国の国家戦略的利益と密接に関連している。
RISC-Vは、各国が半導体技術における自国の運命を切り開くことを支援する。ISAはライセンスが無料であり、設計はオープンで、国益に左右されることもない。米国は、中国がCPUやGPU技術にアクセスできないように、自国のチップとAI技術を武器化している。
![]() |
|
RISC-V オープンISAプロセッサのプロトタイプ。(写真:デリック・コッツィー: https://commons.wikimedia.org/w/index.php?curid=25845306)) | |
今年、多数の中国企業が協力し、3GHzで動作するオープンソースのXiangshan K100 CPUをリリースする予定である。これは高性能チップであり、中国は一部のARMサーバープロセッサよりも性能面で優れていると主張しているが、この主張は鵜呑みにしない方が良いだろう。
中国の機関は2020年にXiangShanファミリーのチップの開発を開始した。
K100チップの設計はオープンソースであり、誰でもその設計を採用できる。中国はRISC-Vのメンバーであるが、米国議会のメンバーはISAの標準設定組織であるRISC-V Internationalへの中国の参加について調査したいと考えている。
また、欧米の研究者らは、HBM2eメモリを搭載し、チップレット設計で12nmプロセスで製造された432コアのRISC-Vチップ「Occamy」の詳細を記した論文を発表した。
より高速なRISC-Vチップが利用可能になりつつあるが、高性能コンピューティングにおけるアーキテクチャの採用を推進するには、ソフトウェアとハードウェアの両面でさらなる作業が必要であると、エディンバラ大学のシニア研究員であるニック・ブラウン氏は論文で述べている。
「近年、HPCでは統一メモリ空間の提供により、GPUとCPUの緊密な統合が進み、明白なメリットがもたらされてきました。RISC-VはISAとプログラミングモデルを統合することで、これをさらに一歩推し進める可能性を提供します」とブラウン氏は述べた。
同氏は、Esperanto、Sophon、Tenstorrentなどの企業が多数のサーバーチップをリリースしており、2024年以降にはさらなる進展が期待されると指摘した。
EUが支援する機関が、RISC-Vに関連するソフトウェアの取り組みで遅れを取り戻そうとしている。欧州連合は、RISC-Vに必要なソフトウェアをクラウド環境に移植することを目的とした「ビタミンV」と呼ばれる取り組みに資金を提供している。
研究者たちは、クラウドにおけるARMとx86の展開に匹敵する同等のソフトウェアツールチェーンを作成したいと考えている。
「ビタミン-VはLLVMをベースとした完全なビルドツールチェーンを提供します。従来からサポートされているHLL(高レベル言語)に加えて、GO、Python3、Rustのサポートも追加する予定です」と研究者は論文で述べている。
クラウド開発は、Kubernetes、Docker、OpenStackの開発を中心に展開される。プロジェクトの研究者たちは、すでにSipeedのLichee PI 4A開発ボードのクラスタを搭載したRISC-Vサーバー上でOpenStackの開発を行っている。Lichee PI 4Aには、TH1520 RISC-V CPU(4スレッド)、16GBのRAM、128GBのストレージが搭載されている。
開発者は、プロジェクトのパッケージの多くをすでにサポートしているDebian Linuxのバージョンを使用している。 重要なのは、RISC-VはまだLinuxの第一級市民ではなく、多くのアプリケーションとドライバが現在も開発およびアップストリームされているということだ。
しかし、研究者たちは根本的なソフトウェアの問題を抱えている。
「ソフトウェアが成熟しているため、すべてのノードのオペレーティングシステムパッケージと構成を更新することもまた困難です」と研究者たちは述べた。
研究者らは、DevstackやKollaなどのツールの使用を検討したが、「特定バージョンのパッケージと依存関係をダウンロードすると、RISC-Vでは多くのコンパイル問題が発生しました」と研究者らは述べた。
RISC-V標準委員会は、ウェブサーバー、ゲーム、データベース用のRISC-Vサーバーをメーカーが開発するための青写真として、標準サーバー設計を開発している。
8月初旬、RISC-Vは、ハードウェア企業がISAに基づいてベアボーンサーバーを構築するためのサーバー標準の最新バージョンを公開した。
「RISC-Vサーバープラットフォームは、SoCハードウェア、プラットフォームファームウェア、ブート/ランタイムサービス、セキュリティサービスの集合体として定義される」と、プラットフォームを定義するPDF文書には記載されている。
このプラットフォームには、ハッカーによる侵入を防ぐためのブート、ファームウェア、セキュリティ用のモジュールを含む中央層がある。サーバープラットフォームは、CXLおよびPCIe 6.0インターフェースをサポートする。
中央層は、オペレーティングシステム層とハイパーバイザー層に分岐し、ソフトウェアと仮想マシンを調整する。もう一つの分岐は、サーバー上のプロビジョニング、ハードウェア、インターフェースを管理するベースボード管理コントローラである。
サーバー設計の取り組みは、x86およびARMアーキテクチャ向けの標準サーバー設計を構築するオープン・コンピュート・プロジェクトの取り組みに似ている。これらの設計は現在、AIとウェブのワークロードを拡張するために、トップサーバーメーカーがデータベースで使用している。
また、ミュンヘン工科大学が実施した調査では、RISC-Vプロセッサと120個のTensixコアを搭載したTenstorrent社のGrayskull AIチップが調査された。研究者のモーリッツ・チューニング氏は、同社から799ドルで入手可能なGrayskull e150 AI開発者キットを選択し、アテンションメカニズムで使用される特定の操作を実装し最適化した。
GraySkullチップには、Tensixコアが10×12のグリッド状に配置されている。各コアには、5つのRISC-Vコア、演算エンジン、データ移動エンジン、1MBのSRAMが搭載されている。GraySkullのSRAMは合計120MBで、これはエヌビディアのH100 GPUの80MBを超える。ネットワークオンチップは、コア間の通信にトーラス型トポロジーを採用している。
SRAMにより、アテンション機構に関連するデータへの高速アクセスが可能になり、出力の各部分を生成する際に、モデルが入力データの関連部分に焦点を当てることを可能にする。
研究では、行列乗算、スケーリング、Softmaxなどの特定の演算の最適化を含む融合実装に焦点を当てた。Softmaxは、オブジェクト分類に関連する好みの度合いを確率に変換する重要な機能である。
研究者は、キャッシュ機能を備えたCPU実装と比較して、融合実装では17倍の高速化が達成されたことを確認した。Grayskullは、効率的な処理を行うために、GPUよりも多くのSRAMと並列処理機能を備えている。
GraySullはH100ほど全体的な演算性能は高くないが、特定の演算ではよりコスト効率が良くなる可能性がある。GraySullは16ビット浮動小数点演算で92TFLOPS、8ビット浮動小数点演算で332TFLOPSであるのに対し、エヌビディアのPCIe版H100はそれぞれ1513TFLOPS、3026TFLOPSである。
しかし、チューニング氏は、H100 PCIeは「一般消費者向けとしては約30倍の価格」であることを指摘した。
「実装を新しい世代(例えば、Tenstorrent Wormhole)に移植し、複数のカードでスケーリングするのは興味深い」とチューニング氏は述べた。