NVIDIAによるSchedMD買収がSlurmに与える影響?
オリジナル記事「What Does Nvidia’s Acquisition of SchedMD Mean for Slurm?」
冬休み直前に、NvidiaはオープンソースのSlurmスケジューリングソフトウェアを開発する企業SchedMDを非公開の金額で買収したと発表した。Nvidiaはこの買収がAIワークロード向けの優れたワークロード管理構築を目的としており、Slurmの開発継続とSchedMDの既存顧客へのサポートを続ける計画だと述べている。しかしこの買収は、人気のあるHPCワークロードスケジューラに対するNvidiaの意図について疑問を投げかけている。既存顧客が代替手段を探し始めるかどうかを含めてだ。
Slurm(Simple Linux Utility for Resource Management)は、2000年代初頭にローレンス・リバモア国立研究所で開発された。HPCクラスタやスーパーコンピュータ向けの商用ワークロード管理ソフトウェアに代わるものとしてだ。C言語ベースの本製品は主に3つの機能を持つ。計算リソースへのアクセス割り当て、ジョブの起動・実行・監視のためのフレームワーク提供、そしてジョブキューを通じた限られたリソースの競合処理である。
Slurmは過去20年間にわたり、極めて高いスケーラビリティと信頼性を実証してきた。GPL 2.0ライセンスで無償提供される本ソフトウェアは、Top500リスト掲載システムの65%で採用されている。Intersect360 Researchによれば、SlurmはHPCコミュニティで最も普及しているスケジューリングソフトウェアであり、市場シェアは20%を占める。政府機関や学術機関での利用が最も多く、一方、企業環境ではVMwareのKubernetesやAltairのHPC Worksといった商用ワークロードマネージャーが好まれると、同社の調査は示している。
![]() |
|
| Intersect360 Researchの調査によると、2024年時点でSlurmはHPC施設において20%の市場シェアを占めていた(図提供:Intersect360 Research) | |
SchedMDは2010年、モリス・モー・ジェットやダニー・オーブルらSlurmの主要開発者によって設立された。2017年に本社をカリフォルニア州リバモアからユタ州リーハイに移転した同社は、約40名の従業員がSlurmの開発とユーザー向け専門サポートに従事している。非公開企業であった同社は、昨年12月にNVIDIAに買収されるまで、世界中に数百の顧客を抱えていた。
Slurmには世界中に数百人の貢献者がおり、NVIDIAの開発者も含まれる。彼らはSlurmがNVIDIAのデータセンターGPUやCUDA開発フレームワークなどの製品と良好に連携するようコードを提供してきた。では、Slurmが既にNVIDIAプラットフォームで良好に動作していたなら、なぜNVIDIAはSlurmを支える主要な商業組織を買収したのか?
Nvidiaは発表の中でいくつかの手がかりを示した。同社はSlurmが「生成AIに必要な重要インフラの一部」であり、「基盤モデル開発者やAI構築者がモデルのトレーニングと推論のニーズを管理するために使用している」と述べている。
同社は、この買収により「SchedMDの新システムへのアクセスを加速」でき、「Nvidiaの高速化コンピューティングプラットフォーム利用者が、自社のコンピューティングインフラ全体でワークロードを最適化できる」と説明している。Nvidiaは、Slurmによって「多様なハードウェア・ソフトウェアエコシステムをサポート」し、「顧客が最新のSlurm技術を活用した異種混合クラスタを運用可能」になると強調している。
Intersect360のCEOであるアディソン・スネルは、科学的発見やエンジニアリングを加速するAIモデル開発への注目が高まっていること、そして従来のHPCワークロードと新たなAIワークロードを統合する必要性を考慮すると、SchedMDの買収は理にかなっていると述べている。
![]() |
|
| LLNLのSequoiaのようなトップクラスHPCシステムは、ワークロードのスケジューリングと管理にSlurmを使用している | |
「この買収は『AI for Science』への注力が強まっていることを示すものだ。米国ではジェネシス・ミッション、欧州ではEuroHPC AIファクトリなど、国家レベルで注目が高まっている」とスネルはHPCwireに語った。「科学のためのAIをやるなら、AIと科学の両方をやらねばならない。」
スネルによれば、SlurmがHPC向けスケジューリングソフトウェアのトップであり、特に政府系・学術研究機関で人気が高いことを考慮すれば、今回の買収は理にかなっているという。エネルギー省はジェネシス・ミッションを通じて「AIのための科学」に投資している。NvidiaによるSchedMDの買収は、従来のHPCと新興AIワークロードの統合を加速させる可能性があるとスネルは述べた。
「残念ながら、この二つの分野は依然としてほとんどの場合分離したままだ」とスネルは言う。「HPCとAIの真の統合は近づいているが、これまでの移行と同様に時間がかかる。今回の買収は、エンジンをより速く滑らかに動かすための内部調整のようなものだ。Slurmは重要なツールだ。適切に扱えば、Nvidiaが従来のHPCユーザーを獲得する上で大きく貢献するだろう。」
ここで不確定要素となるのは、Slurmの自由なGPL 2.0ライセンスだ。Nvidiaが単に科学分野のAIワークロード向けにSlurmを強化したかっただけなら、SchedMDを買収する必要は必ずしもなかった。Slurmの拡張性の高いプラグインアーキテクチャを使って追加機能を開発し、オープンソースプロジェクトに還元することもできたはずだ。
長年のHPC実践者でありHPCwireの寄稿者であるダグ・イードラインは、この買収はNVIDIAが将来のプロジェクトに向け、Slurmの専門開発者を獲得したいという意向に起因している可能性があると推測している。
「Nvidiaは単にSlurmに対する支配力を強め、自社内部で使うか顧客に提供する『非公開機能』を追加したいだけかもしれない」と彼は言う。「Red Hatがやったように、コードの周りに浅い堀を築く計画かもしれない。」
HPCコミュニティがNvidiaのSlurmの方向性を好まなければ、オープンソースプロジェクトの分岐につながる可能性があるとイードラインは語っている。また、Kubernetesや、現代のHPCワークロード向けの新規スケジューラであるFluxなど、競合するワークロードスケジューラの採用拡大につながる可能性もある。
FluxはLLNL(ローレンス・リバモア国立研究所)から生まれたもので、同研究所はもはやSlurmを使用していないとイードラインは述べている。









