Top500、富岳が王座をキープ、NvidiaのSeleneが5位に上昇
Tiffany Trader

SC20において本日発表された第56回Top500リストによれば、完全インストールされた日本のスーパーコンピュータ「富岳」が再び勝利を掴み、また、サイズを倍増させたNvidiaの自社製HPC-AIマシン「Selene」が2つ順位を上げて5位にランクインした。トップ10入りを果たしたのは、「JUWELS Booster Module」(Forschungszentrum Jülich、7位)と「Dammam-7」(Saudi Aramco、10位)である。Nvidiaは、A100駆動のDGX SuperPOD(Top500の#172)で、1ワットあたり26.2ギガフロップスのパフォーマンスを実現し、Green500の栄冠を獲得した。
![]() |
|
冨岳がHPCベンチマークでリードを拡大(出典:松岡聡、Top500 BoF) | |
理化学研究所のスパコン「富岳」は、6,912ノードを追加し、フル実装の158,976ノード(48コアのA64FX CPUを1つずつ搭載)としたことで、Linpackスコアを半年前の415ペタフロップスから442ペタフロップスに向上させた。また、この富士通Armベースのシステムは、新しい混合精度HPL-AIベンチマークの性能を半年前の1.4エクサフロップスから2.0エクサフロップスに向上させた。HPCGランキングとGraph500で1位を獲得し、Green500エネルギー効率ランキングの上位に位置し、14.78ギガフロップス/ワットで10位を維持している。
簡単に言えば、日本の最高峰の山の名前を冠した初のナンバーワンArmスパコン(富岳は富士山の別名で、富士(Fuji)と岳(Mountain)の頭文字を組み合わせて実現したもの)のために、またもや複数のカテゴリーを制覇したということである。
SummitとSierra(IBM/Mellanox/Nvidia、米)がそれぞれ2位と3位に残り、Sunway TaihuLight(中国)が4位に安定した順位をキープしている。
2つのスポットを駆け登り5位に上昇したアップグレードされたSeleneスーパーコンピュータは、63.4 Linpackペタフロップスを実現し、以前の27.6ペタフロップスの2倍以上のスコアを達成した。Seleneは、AMD Epyc CPUと新しいA100 80GB A100 GPUを搭載したNvidiaのSuperPod A100 DGXモジュールアーキテクチャを実装しており、オリジナルのA100 40GB GPUの2倍のHBM2メモリを提供している。社内でのAIワークロード、システム開発とテスト、チップ設計作業はすべてSeleneの主要なユースケースであり、以前は民間システムとして指定いたが、今回のTop500ではNvidiaのサイトをベンダーセグメントの下に置き、Nvidiaのシステムサプライヤーとしての地位を整えることにした。
![]() |
|
中国製のTianhe-2Aは61.4ペタフロップスで1つ順位を下げて6位にランクインした。Intel XeonチップとカスタムMatrox-2000アクセラレータを搭載したTianhe-2A(別名MilkyWay-2A)は、2018年に4位でリストに入った。広州の国立スーパーコンピュータセンターに設置されている。
第7位の新システムは、Atos製のJUWELSブースターモジュールで、44.1 Linpackペタフロップスというヨーロッパで最も強力なものである。AMD Epyc CPUとNvidia GPUを搭載し、ドイツのForschungszentrum Jeulich (FZJ)に設置されたこのシステムは、モジュラーシステムアーキテクチャを採用している。このシステムは、リストの44位にあるIntel Xeonを搭載したJUWELSモジュールのコンパニオンシステムであり、両方ともParTec Modulo Cluster Software Suiteを使用して統合されている。
Dellは8位と9位(それぞれHPC-5/Eni、Frontera/TACC)を獲得しており、学術的にも商業的にもトップのサプライヤーであることに変わりはない。
10位には2番目の新システムが入っている。Dammam-7である。サウジアラビアのサウジアラムコに設置されたDammam-7は、8位のHPC5(Eni/Dell)に次ぐ、現在のトップ10の2番目の産業用スーパーコンピュータである。HPE Cray CS-Stormシステムは、CPUにIntel Gold Xeon、GPUにNVIDIA Tesla V100を採用。HPLベンチマークでは22.4ペタフロップスに達した。
上位 50 位まで視野を広げると、6 つのシステムが追加された。HPEとHLRSのHawk(#16)、富士通と日本エアロスペースのTOKI-SORA(#19)、AtosとメテオフランスのTaranis(#30)、NECと核融合科学研究所のPlasma Simulator(#33)、HPEと日本原子力研究開発機構の無名システム(#45)、そしてAtosとHLRNのEmmy+(#47)である。
6 月にも経験した COVID-19 の影響によるフラット化傾向は継続しており、新規参入は 44 社にとどまり、過去最低の更新率を記録している。このグループのうち、最高ランクの上位11社は米国以外である。 米国は、4.3 Linpackペタフロップスで70位にランクインしたSandia Labs社の「SNL/NNSA CTS-1 Manzano」システム(Penguin Computing社がIntel CPUとIntel Omni-Pathを搭載して供給)を含む8つの新規システムを追加した。中国は 13 台と最も多くの新規システムを獲得したが、そのうち 10 台は 10G または 25G の相互接続を使用しており、HPC というよりはむしろ Web 規模の展開を示している。日本は、A64FX Arm(とTofuインターコネクト)を搭載した富士通、IntelとNvidiaチップを搭載した富士通、NEC SX Aurora Tsubasaベクタエンジン、AMD Epycを搭載したDell PowerEdge、ストレートIntel CPUを搭載したHPE SGIなど、多様なアーキテクチャを持つ6つの新しいシステムをリストアップしているのが印象的だ。
![]() |
|
Selene SuperPOD システム | |
このリストのネットワーク構成を見てみると、157のシステムがInfiniBandを使用しており、その中にはHDR InfiniBandのセミカスタムバージョンを使用しているSunway TaihuLightシステムも含まれている。Tofu を使用したシステムが 6 つ、Aries を使用したシステムが 31 、カスタムまたはその他の独自のインターコネクトを使用したシステムが数システムある。Omni-Pathは47台のマシンに搭載されているインターコネクト技術で、その中の1つの新しいシステム(LivermoreのRubyスーパーコンピュータ)には「Cornelis Networks」バージョンが採用されている。2015年に発売されたIntelのOmni-Path Architecture(OPA)は、市場で十分な足場を見つけることができず、2019年にIntelはプラグを抜いた。このIPは今年9月に米ラボの後押しを受けて「Cornelis Networks」としてスピンアウトしている。Ruby(Supermicro/Intel)に加えて、最近発表されたLivermoreのMammoth Cluster(Supermicro/AMD)もCornelis Omni-Pathネットワーキングを採用している。
全 500 システムで提供された Linpack パフォーマンスの合計は 2.43 エクサフロップスで、6 ヶ月前の 2.22 エクサフロップスと 12 ヶ月前の 1.65 エクサフロップスから上昇している。リスト全体のLinpack効率は63.3%と半年前の63.6%と比べて安定しており、上位100セグメントのLinpack効率も71.2%と半年前の71.3%と比べて実質的に変わっていない。第1位のシステムである富岳は、6月の80.87%からわずかに上昇して82.28%という健全な計算効率を実現している。
第56回Top500リストに必要なLinpackの最低スコアは半年前の1.22ペタフロップスに対して、1.32ペタフロップスとなっている。トップ100セグメントのエントリーポイントは、前回のリストの2.80ペタフロップスに対し、3.16ペタフロップスとなっている。現在の500位のシステムは、前回版では461位にランクインしていた。半年前もそうだったが、Linpackの100ペタフロップスの地平線を越えたのは2台(FugakuとSummit)のみ。2台の(Sugon)中国のシステムは、ここ数年前にほぼベンチマークされていたが、公式にはリストに入れられていなかった(情報筋によると、1台は200ペタフロップスを計測し、2台目は300ペタフロップス以上に達したと報告されている)。中国は、1年半前に頭打ちになった米国との技術戦争の緊張に対応して、スーパーコンピューティングのPRを抑制している。
エネルギー効率の向上
Nvidiaは、DGX SuperpodでGreen500のエネルギー効率ランキングのトップを獲得した(Top500では172位)。A100 GPU、AMD Epyc Rome CPU、HDR InfiniBandテクノロジーを搭載したDGX Superpodは、2.4 Linpackペタフロップスのパフォーマンス実行時に26.2ギガフロップス/ワットの電力効率を達成した。
前回のGreen500のリーダーであるPreferred NetworksのMN-3は、評価が21.1から26.0ギガフロップス/ワットに改善されたにもかかわらず、2位に後退した。Top500で332位にランクされたMN-3は、行列演算をターゲットとした独自のアクセラレータであるMN-Coreチップを搭載している。
Green500の3位には、Forschungszentrum Jülichに設置されたAtos製のJUWELSブースターモジュールがランクインした。この新製品(AMD Epyc Rome CPUとNvidia A100 GPUを搭載し、HDR InfiniBandを搭載)は、1ワットあたり25.0ギガフロップスを実現し、Top500の7位にランクされている。
その他のハイライト
このリストには、アクセラレータ/コプロセッサ技術を利用した148のシステムが含まれており、6月の146から増加している。110台がNvidia Voltaチップを搭載し、15台がNvidia Pascalを使用し、8台がNvidia Keplerを採用している。AMD GPU を使用しているのは 1 台だけである。Pukou Advanced Computing Center の Sugon 製の中国製システムで、AMD Epyc “Naples” CPU と AMD Vega 20 GPU を搭載している。このシステムは、現在291位にランクインしており、1年前に初めて登場した。
Top500によると、Top500システムの中で最も大きなシェア(91.80%)を占めるプロセッサはインテルが引き続き供給しており、半年前の94.00%から減少している。AMDは21のシステムにCPUを供給しており(4.2%)、前回の2%から増加している。AMDはSelene(5位)でIntelのTianhe-2A(6位)よりも上位にランクインしている。リストの上位4システムはx86ベースではない。
![]() |
性能向上経過 – 1993年~2020年 (出典:Top500) |