新オーナーと新ロードマップにより、独立したOmni-Pathがカムバックを果たす
Tiffany Trader

2019年にインテルによって棚上げにされたOmni-Pathは、先行きが見えない状況に直面していたが、新しい管理人であるコーネリス・ネットワークス社のもと、Omni-Path Architecture(OPA)は、独立した高性能インターコネクトソリューションとして復活を目指している。同社によると、「Omni-Path Express」と呼ばれる「大幅な刷新」が今年後半に予定されているという。
コーネリス・ネットワークス社は、昨年9月にインテル社のOmni-Path部門からスピンアウトして設立された。Omni-Pathネットワーキングブランドの新しい管理者は、技術を紹介し、今後の展開を予告するために、仮想会議に参加している。この会社を率いるのは、共同設立者でCEOのPhil Murphyで、以前はインテルのディレクターとしてファブリックプラットフォーム技術とビジネス開発を担当していた。また、QLogic社のネットワークソリューショングループの幹部であり、OpenIB Alliance(後のOpenFabrics Alliance)の創設メンバーの一人でもあった。Murphyのキャリアは、オムニパスとその開発の方向性に向かっていると言えるだろう。
先月開催されたSupercomputing Frontiers Europe(SCFE)で、Murphyは、HPCインターコネクト市場における性能と価格競争に勝つことを目指しているOmni-Pathポートフォリオの最新情報を提供した。現在は、Nvidia社のMellanox社InfiniBand製品が圧倒的な地位を占めている。Mellanox社と同様に、生まれ変わったOmni-Pathポートフォリオは、AMDやIntelのプラットフォームを含む様々な業界のCPUやアクセラレータをサポートしている。HPE独自(Cray)のSlingshotインターコネクトも、さまざまなデバイスをサポートしている。ただし、SlingshotはHPEのシステムでしか利用できない。
コーネリス社のミッションは、従来のモデリングやシミュレーション、高性能なデータ分析や人工知能のために、業界をリードするファブリックを提供することだ。Murphyは、従来のHPCの中でも、深層学習の機能をどんどん追加していく傾向にあると指摘する。また、コードの一部では、重い演算を、忠実性を損なうことなく、あるいはほとんど損なうことなく置き換えることができるとしている。
「演算インフラのパワーを真に引き出すためには、それに対応する強力なインターコネクトが必要です。これは、ノード間の通信を可能な限り高速化するための非常に低いレイテンシーを意味します。また、ネットワーク全体で非常に高いメッセージ注入率が必要であり、人工知能では拡張性の高い帯域がますます重要になります。」とMurphyは述べている。
コーネリスという名前は、AIの先駆者であるDouglas Hofstadterが書いた『ゲーデル、エッシャー、バッハ―あるいは不思議の環』という本に由来している。「この本は、表面的には3人の重要な人物について書かれていますが、本質的には知性とは何かということの基礎を築いていました。また、M.C.エッシャーの “C “はコーネリス(Cornelis)を意味しており、それが社名の由来となっています。」とMurphyは述べている。
コーネリス・ネットワークス社のOmni-Pathポートフォリオは、OpenFabrics Alliance、QLogic、Cray Aries、そしてもちろん、Intel Omni-Pathプロジェクトによる投資を活用している。インテル社では、Omni-Pathファブリックは(現在は廃止された)Phiの取り組みと密接に結びついており(OPAはPhi Knights Landingプロセッサに統合されていた)、プリ・エクサスケールのスーパーコンピュータ「Aurora」のオリジナルデザインの一部でもあった(全く異なるエクサスケールクラスのマシンとして作り直されたが)。
コーネリス社は、インテル社の下で開発されたOmni-Path 100Gbps(OPA100)製品を現在も出荷しているが、来年末には400Gbps製品の発売を予定しており、2023年の第1四半期にはより広い範囲での提供を予定している。OPA400製品では、200Gbpsへの分岐をサポートする予定だ。
コーネリス社のオムニパスのロードマップでは、さらに先に800Gbpsのソリューションがある。
![]() |
CEOのMurphyは、「我々には様々な方法があります。我々は、コストとパフォーマンス、オプチカルとカッパー、そしてワイドとさらなるナローの間のトレードオフをすべて評価しています。」と述べている。
今回のロードマップでは、インテルが約束していたOPA200の製品はなくなっている。しかし、コーネリス社はOPA100を大幅に強化したOmni-Path Express(OPX)という製品を開発中だ。
![]() |
Omni-Path Expressは、OpenFabrics Allianceの下で開発されたOpenFabrics Interfaces(OFI)をサポートする、高度に最適化されたホストソフトウェアを搭載している。アライアンスでは、OFIを 「ファブリックサービスのエクスポートに使用されるライブラリとアプリケーションのコレクション 」と表現している。コーネリス社は、Omni-Pathのソフトウェアスタックに、OFIのlibfabricレイヤーに対応したネイティブOFIプロバイダーを追加した。「OFIとlibfabricの目標は、アプリケーションとファブリックサービスの間の緊密なセマンティックマップを可能にするインターフェースを定義することです。」プロジェクトは述べている。
コーネリス社によれば、Omni-Pathの結果は、メッセージレートの向上とレイテンシーの低減による優れたパフォーマンスである。また、VerbsやPSM2では対応できなかった幅広いアプリケーション環境に対応できるようになったことも重要だという。(OpenMPIやMVAPICHなどの一般的なMPI実装に加え、SHMEMやChapelなどのPGASプログラミングモデルにも対応している(上図参照)。また、TensorFlowやPyTorchなどのAIフレームワークやオブジェクトストレージファイルもサポートしており、GPUについても「汎用的にサポートしている」とMurphyは述べている。
下記のベンチマークスライドでは、IntelとAMDの両方のプラットフォームで、Omni-Path(PSM2搭載)からOmni-Path Express(OFI搭載)に移行した際のメッセージレートの向上を示している。
![]() |
![]() |
![]() |
コーネリス社は、AMDのハードウェアでもレイテンシーの改善を実証している。「小規模なメッセージでレイテンシーが30%近く低下したケースも見られ、これらは長期的に見てアプリケーションのパフォーマンスを予測する上で重要な要素です。小規模なメッセージでのレイテンシーの平均削減率は16%でした。」とMurphyは述べている。
![]() |
競合するインターコネクトソリューションとの直接対決による性能ベンチマークは公開されなかった。しかし、5月に開催されたRMACC HPCシンポジウムでは、デュアルレールのOmni-Path OPA100とInfiniBand HDR200を比較した競合ベンチマークの概要が発表された。(以下のスライド)。)
![]() |
コーネリス社は、同社の技術が独立したものであり、特定のプロセッサやアクセラレータの技術に技術的にも商業的にも縛られないベンダーアグノスティックなものであることを強調している。Cornelis社のOmni-Pathは、Nvidia社のMellanox部門(NDR 400Gbps製品の出荷準備中)に比べて1世代(または2世代)遅れているが、最近のHPCインターコネクトの状況の変化は、Cornelis社にとってチャンスになるかもしれない。
Intersect360 Research社のCEOである業界アナリストのAddison Snellは、まさにこの点を指摘している。「数年前までは、InfiniBandがスケーラブルで低遅延なシステムのための事実上のオープンスタンダードでした。」と同氏は最近の声明で述べている。「コーネリス社がOmni-Pathに投資したことと、NvidiaによるMellanoxの買収が相まって、話が急に変わりました。Omni-Path Expressはオープンでマルチベンダーのソリューションです。」
Intersect360のチーフリサーチオフィサーであるDan Oldsは、コーネリス社のチームの能力と経験について次のように述べている。「彼らは、新しいインターコネクトを構築しようとしている星の数ほどの理想主義者ではありません。」とOldsはHPCwireに語った。「彼らは元インテルや、他の会社から来た人たちで、自分たちが何をしているかを知っています。マイルストーンを達成して実行すれば、破壊的な存在になる可能性があると思います。」
「私は、彼らが現在どこにいるのか、どこに行こうとしているのか、そしてInfiniBandに対してどこにいるのか、もっと頭を突き合わせて比較してみたいと思います。」とOldsは付け加えた。