ARMと富士通、2nmチップの電力効率を高めるオープンソースソフトウェアを目指す
Agam Shah オリジナル記事 「ARM, Fujitsu Targeting Open-source Software for Power Efficiency in 2-nm Chip」
富士通とARMは、2027年に出荷される空冷式スーパーコンピュータ・チップの電力効率を高めるために、オープンソースのソフトウエアを利用している。
Monakaチップは2ナノメートルプロセスで製造され、ARMv9-aアーキテクチャをベースにしている。二つのソケットそれぞれに144コアを搭載する。このチップは、世界で4番目に速いスーパーコンピュータ「富岳」に採用された富士通A64fxの後継となる。
富士通とARMは、Monaka上で動作する開発ツール、ライブラリ、コンパイラを含むオープンソースのツールチェーンを採用している。このチップが日本の次期主力スパコンに採用されれば、波及効果が期待できる。
富士通は、このチップをAIとHPCシステムの両方に向けている。同社は、ワークロードに関係なく、ARMベースのチップで可能な消費電力の削減に注力している。
「データセンターはAIのエコシステムを支える重要なインフラであるため、業界は電力効率の高いハードウェアとソフトウェアのエコシステムを統合することで、データセンターの効率を大幅に向上させる新しいアプローチを構築することが求められています」 と富士通はブログで述べている。
このチップは、「富岳」の後継となる「富岳NEXT」と呼ばれるスーパーコンピューターに搭載される可能性がある。新しいスパコンは2030年に計画されているが、理研の最終決定は、現在進行中のフィージビリティ・スタディが完了した後に判明する。
日本を拠点とする理化学研究所は、既存の「富岳」を10年間稼働させる計画を延長しているが、その理由はシステムのエネルギー効率にある。
「富岳」は、世界で最も電力効率の高いスーパーコンピューターとして、Green500のトップを走っている。日本は電力効率優先のアプローチを変えておらず、2030年までにデータセンターのエネルギー消費を40%削減することを目標としている。
富士通はARMと協力し、機械学習ワークロードをARMのScalable Vector Extension 2(SVE2)機能に対応させ、推論機能を提供している。CPUのソフトウェア最適化により、電力効率も向上する。
富士通はまた、CUDAに代わるAI開発フレームワークを開発しているUXL財団を支援している。UXLの並列プログラミングフレームワークは、インテルのOneAPIをフォークしたもので、AIアプリケーションを最小限のソフトウェア変更で幅広いハードウェア上で実行できるようにする。
UXLは、AMDやARMなど、エヌビディア以外の競合他社が大々的にプッシュしている。
CUDAをベースにGPUを販売しているエヌビディアにとっては悪いニュースだ。しかし日本は最近、ABCI 3.0と呼ばれるAIスーパーコンピューター用にエヌビディアのH200 GPUを購入すると発表した。このスパコンは、科学計算用に410ペタフロップスの倍精度性能、AI用に6エクサフロップスの性能を実現する。
富士通は、GPUの設置にはコストがかかり、消費電力も大きいと主張している。しかしエヌビディアは、GPUの消費電力は高いが、より速く計算できるため、研究の生産性が上がると述べている。
Monakaチップは12チャンネルのDDR5を搭載し、PCI Express 6.0とCXL 3.0をサポートする。空冷チップは3Dチップレットアーキテクチャを採用する。
理研は、「富岳」スパコンをAmazon Web Servicesクラウド上の仮想化環境に移植した。顧客は「富岳」と同様のワークロードをAWS上で実行できる。
世界で2番目に速いスーパーコンピュータAuroraのソフトウェアフレームワークも、UXLが開発しているフレームワークをベースにしている。