衝撃!中国のLineShineがTOP500で1位を獲得
オリジナル記事「Surprise! Chinese LineShine Takes Number 1 on TOP500」
中国のスーパーコンピュータ「LineShine」が業界を驚かせ、本日ドイツ・ハンブルクで開催中のISC26で発表された最新のTOP500リストで1位を獲得した。約1,400万個のARMコアで構成されるこの特注クラスターは、TOP500のLinpackベンチマークにおいて公式に2エクサフロップスを超えた初のシステムであり、1位を獲得した2台目の中国製スーパーコンピュータ、そして世界で5番目のエクサスケールシステムとなった。
「LineShine」の存在を初めて耳にしたのは4月のことだった。当時、深圳国家スーパーコンピューティングセンター(NSCC-SZ)の主任設計者であるルー・ユートン氏がこの新システムについてプレゼンテーションを行い、同センターのウェブサイトで紹介されたほか、地元メディアもこれを報じていた。中国側は、このシステム全体が中国製のコンポーネントのみで構成されているだけでなく、FP64演算で2エクサフロップスの性能を発揮できると主張していたが、我々はこれをかなり懐疑的に受け止めていた。
ところが、実際には中国側の主張は事実だったことが判明した。さらに、当時明らかではなかったが、彼らはすでに「LineShine」を構築していたのだ。NSCC-SZはHigh Performance Linpack(HPL)ベンチマークテストを実施し、史上最高スコアを記録しただけでなく、CPUのみで構成されたマシンで2.198エクサフロップスを達成した。これはもちろん、前代未聞の成果である。
![]() |
|
LineShineのオールCPUシステムは、非対称NUMA構成で20,480の演算ノードを擁しており、各LineShineノードには、1.55 GHzで動作するARMv9ベースのLX2プロセッサが2基搭載されてる。各プロセッサには2つの演算ダイが含まれており、これらのダイはそれぞれさらに4つのNUMAドメインに分割されている。各NUMAドメインには、38個のARMv9コアと4 GBの高帯域幅メモリ(HBM)が搭載されている。専用のスマート・ダイレクト・メモリ・アクセス(SDMA)エンジンが、HBMとダイごとに128 GBのオフパッケージDDRメモリとの間でデータを転送し、デュアルプレーン・マルチレール・ファットツリー・トポロジーを採用した中国製のLingQiインターコネクトが、ノード間をノードあたり1.6 Tb/sの帯域幅で接続している。
TOP500によると、LineShineの消費電力は約42.2メガワットで、効率は52.07ギガフロップス/ワットである。また、高性能共役勾配法ベンチマーク(HPCG)ランキングでも、毎秒22.00 HPCG-ペタフロップスを記録し、首位に立っている。また、HPL-MxP混合精度ベンチマークでは、毎秒7.92エクサフロップスを記録し、4位にランクインしている。TOP500は、HPLスコアに比べてわずか3.6倍の速度向上にとどまっている点について、「専用の低精度アクセラレータを備えていない、CPUのみの設計であることを示唆している」と指摘している。
LineShineの登場は、2017年以来初めて中国がリーダーシップクラスのスーパーコンピュータについてLinpackの結果をTOP500組織に提出したことを意味する。当時、無錫の国家スーパーコンピューティングセンターにある「Sunway TaihuLight」クラスターが、HCLベンチマークで93ペタフロップスを記録して首位に立ち、2018年春にORNLのIBM Summitシステムが登場するまでの2年半にわたりその座を維持していた(現在は27位となっている)。中国政府はスーパーコンピュータの構築を継続していたものの、2019年に米国政府が中国に対して制裁を課し、最高性能のチップへのアクセスを制限したことを受け、同国はLinpackテスト結果の提出を停止した。しかし、中国の「サービスプロバイダー」は、同様の構成を持つ約20台のLenovo ThinkSystem HR650XシステムについてLinpackテスト結果を提出しており、その順位は400位台半ばとなっている。
TOP500の首位に「LineShine」が初登場したことで、他のシステムは順位を1つずつ下げた。ローレンス・リバモア国立研究所の「El Capitan」は1.809エクサフロップスで2位に、オークリッジ国立研究所の「Frontier」は1.353エクサフロップスで3位に浮上し、 アルゴンヌ国立研究所の「Aurora」は1.012エクサフロップスで4位に浮上し、一方、ユーリッヒ・スーパーコンピューティング・センターの「JUPITER Booster」クラスターは1.000エクサフロップスの性能で5位に後退した。
トップ10に新たな顔ぶれが加わった。イタリアのエネルギー企業Eni S.p.A.の新しいシステム「HPC7」は、「El Capitan」を稼働させているのと同じCrayシステムの小型版であり、571.5ペタフロップスで初登場し、世界で6番目に強力なスーパーコンピュータとなった。これにより、マイクロソフトのAzureベースの「Eagle」システムは7位に、Eniの「HPC6」システムは8位に押し下げられた(つまり、HPC7が6位、HPC6が8位となる。これについては後でクイズが出る予定だ)。トップ10を締めくくるのは、442ペタフロップスで9位にランクインした「Fugaku」と、434.9ペタフロップスで10位となったスイスの「Alps」システムである。
TOP500は、スーパーコンピューティング界のトップ層において、アーキテクチャの多様性が著しいことを指摘している。中国製の全CPU構成「LineShine」システムや、AMDアクセラレータを搭載した一連のHPE Crayクラスタ(DOEの「El Capitan」や「Frontier」から、Eniの「HPC7」や「HPC6」まで)、NVIDIAのGrace Hopperアーキテクチャを採用した「JUPITER Booster」や「Alps」、さらにはIntelのPonte Vecchio GPUを搭載したANLの「Aurora」に至るまで、特定の単一アーキテクチャが支配的な状況にはなっていない。マイクロソフトの「Eagle」クラスターは、インテルXeonプロセッサとNVIDIA H100アクセラレータを組み合わせている一方、日本の「富岳(Fugaku)」システムは、富士通のA64FX ARMプロセッサを中核として構築されている。
「このリストは、リーダーシップクラスのコンピューティングを実現するための、単一の支配的な技術経路は存在しないことを示している」と、TOP500はプレスリリースで述べている。「その代わりに、ベンダー各社は、さまざまなインターコネクトやシステム設計と組み合わせた、CPU、GPU、APU、カスタムアクセラレータといった多様なアプローチを追求している。」







