世界のスーパーコンピュータとそれを動かす人々


7月 1, 2026

TOP500の頂点に立つ中国の新型スーパーコンピュータ「LineShine」の内部

HPCwire Japan

オリジナル記事「Inside LineShine, the New Chinese Supercomputer Sitting Atop the TOP500

ここ2日間、ドイツのハンブルクで話題をさらっているのは、ISC 2026カンファレンスで、突如として登場し、誰もが憧れるTOP500リストの1位を獲得した中国のスーパーコンピュータ「LineShine」だ。この巨大な新クラスタについてすべてが明らかになっているわけではないが、LineShineが最初に姿を現した4月時点よりは多くのことが分かっている。

 
  LineShineはLX2 ARMプロセッサを基盤としている。GPUやその他のアクセラレータは搭載されていない
   

6月22日、ハンブルク・コングレスセンター(CCH)で開催されたTOP500セッションにおいて、深圳国家スーパーコンピューティングセンター(NSCC-SZ)の所長であり、「LineShine」の主任設計者であるルー・ユートン氏によるプレゼンテーションが行われたおかげで、TOP500の頂点に立つこの新しいクラスタについて、さらに詳しい情報が明らかになった。

LineShineは、1ダイあたり304コアを搭載し、1.55 GHzで動作するARMプロセッサ「LX2」をベースとしてる。このクラスタは20,480台の演算ノードを備え、約1,400万個のARM9コアを提供する。LineShineは、各ダイを4つのNUMAドメインに分割するチプレットアーキテクチャを採用しており、各ドメインには38個のARMv9コアと4 GBの高帯域幅メモリ(HBM)が搭載されている。また、専用のスマート・ダイレクト・メモリ・アクセス(SDMA)エンジンが、HBMとダイごとに搭載された128 GBのオフパッケージDDRメモリとの間でデータを転送する。

中国が「世界最高性能のCPU」と主張する各LX2は、60.3テラフロップスのFP64演算性能を備えており、このクラスタはまさにこの分野の高速化を目的に設計されてる。LX2チップは、Scalable Vector Extension(SVE)およびScalable Matrix Extension(SME)コアを搭載しており、従来のHPCワークロード(モデリング・シミュレーション)だけでなく、FP64を必要としない新しいAIワークロードに対しても、多精度演算能力を発揮する。

 
LineShineは90台のキャビネットで構成されている  
   

クラスタ全体は90台のラックに設置されている。1ラックあたり512個のCPUを搭載し、1ラックあたり30ペタフロップスのFP64演算性能を提供する。各ラックは380Vの直流電源で駆動され、1ラックあたり580キロワットの演算能力を提供する。クラスタ全体の消費電力は合計で42.2メガワットである。冷却は100%液体冷却方式を採用し、両面コールドプレートを利用している。

インターコネクトには、デュアルプレーン・マルチレールのファットツリー・トポロジーを特徴とする、中国製のLingQiネットワークが採用されている。中国側によると、LingQiはLineShineノードをノードあたり1.6 Tb/sの帯域幅で接続しているという。また、LingQiインターコネクトは200万ポートをサポートし、10万ノード以上に拡張可能であるとしている。データフローを最適化するクレジットベースのフロー制御など、InfiniBandに類似した機能を備えている。200PBのダイレクトストレージに接続されている。

広州国家スーパーコンピュータセンターの所長であり、ISCの前議長でもあるユートン氏によると、LineShineはABCという設計原則に基づいて開発されたという。「アプリケーション主導。バランスの取れたアーキテクチャ。そしてフルスタックでの共同設計」と、彼女はTOP500でのプレゼンテーションの壇上で述べた。

 
  LineShineのインターコネクトは、約1マイクロ秒のレイテンシを実現する
   

「私たちは、ハイパフォーマンスコンピューティング、高電力効率、そして高いプログラム可能性を追求しています」と彼女は語った。「私たちは、HPCの伝統を継承し、AI主導の未来を受け入れ、計算加速の本質に立ち返る、新しいオンラインアクセラレーション・CPU専用アーキテクチャを提案します。LX2 CPUの設計では、マトリックスアクセラレーションユニットがチップ上、実際にはコア上に統合されており、データ移動のオーバーヘッドを大幅に削減し、プログラム可能性を向上させています。」

ソフトウェア面では、LineShineシステムはKylinオペレーティングシステムを採用している。ユートン氏によると、LineShineは「HPCとAIのための統一されたソフトウェア環境」に加え、「SMEおよびSBE、HBM、DDRメモリ管理を活用する行列アクセラレーションスイート、そしてハードウェアの能力を実際のアプリケーションパフォーマンスへと変換するための最適化された計算カーネル」を備えているという。

ユートン氏によると、このベンチマーク結果はLineShineの設計理念を反映しているという。「この設計により、統合性が向上し、消費電力が削減され、多様なHPCおよびAIワークロードにおける設置面積が縮小されます」と彼女は述べた。「これらすべてで優れたパフォーマンスを達成しており、当ハードウェア・ソフトウェアアーキテクチャのバランスの取れた設計と高い効率性が実証されました。」

LineShineはLinpackテストで2.198エクサフロップスを記録し、TOP500で前回1位だったEl Capitanの1.809エクサフロップスを上回った。また、LineShineは、より実世界のスーパーコンピュータの利用状況を反映するために作成された「High Performance Conjugate Gradients Benchmark(HPCG)」ベンチマークにおいて、22.00ペタフロップスのスコアを記録し、新記録を樹立した。混合精度ベンチマーク「HPL-MxP」では、LineShineは7.92エクサフロップスを達成し、

 
LineShineは水冷方式を採用している  
   

TOP500グループは、「HPLスコアに対する3.6倍という比較的控えめな速度向上は……、専用の低精度アクセラレータを備えていないCPUのみの設計であることを示唆している」と述べた。

42.2メガワットの電力(El Capitanは29.7メガワット)で稼働するLineShineの総合効率は52.07ギガフロップス/ワットであり、El Capitanの60.95ギガフロップス/ワットと比較される。

2025年後半に稼働を開始して以来、LineShineは中国の研究者たちにとって有益な役割を果たし始めている。「気候、CFD、地震シミュレーション、材料、エネルギー、創薬、神経科学、科学AIなど、多岐にわたる分野のアプリケーションが、このプラットフォーム上で着実にコーディング、開発、実行されています」とユートン氏は述べた。

「スーパーコンピュータ上で動作する、多様かつ大規模なHPCとAIの融合アプリケーションのポートフォリオが拡大していく様子を、世界のHPCコミュニティも喜んでくれると確信しています」と彼女は続けた。「私たちは、さまざまな科学・工学アプリケーションのワークロードに対応するエコシステムの構築、HPCとAIによるユビキタス・コンピューティングの実現、そして名目上の計算能力を具体的な生産性へと転換することに尽力しています。あらゆる形態の国際的な協力を歓迎します。」