世界のスーパーコンピュータとそれを動かす人々


11月 21, 2017

FLOPSをひっくり返してTOP500を読み解く

HPCwire Japan

Tiffany Trader

年2回行われるLinpackのベンチマーク結果に基づく世界最速のスーパーコンピュータのTOP500リストの第50回版がデンバーで開催中のSC17において公表され、再び中国が首位を獲得し、少なくとも多次元的な状況の中で決定的なリード位置を保持している。中国は今や最も多くのシステム数、最大のFLOPSシェア、そして10回連続で首位を獲得している。これはこの5年間でクーデター・レベルの成果であり、TOP500における20年間の米国の独占を破壊したが、このTOP500の茶葉をもっと深く読むと、スーパーコンピューティングの性能を同じくらい中国のベンチマークに関するニュアンスのある分析が明らかになるのだ。

ISC2017でのPEZY-SC2bのチップ

この針に糸を通す前に、リストの上位に関する動きをレビューしてみよう。トップテンについては新たなエントリーは無く、トップスリーの変化も無かったが、アップグレードされたZettaScaler-2.2である「暁光(Gyoukou)」が第4位に位置づけている。65スポットも躍進し、この大規模なGyoukouはXeonとPEZY-SC2アクセラレータを結合して前回の1.68ペタフロップスから上昇して19.14ペタフロップスを達成した。Top500リストの著者達は、このシステムの19,860,000コアがこれまでのTop500のランキングで最大の並列レベルであると指摘している。

Gyoukouはまた、5番目にグリーンなスーパーコンピュータである快挙も達成している。仲間のZettaScalerシステムであるShoubuシステムB、Suiren2、およびSakuraは1位、2位、3位をぞれぞれ達成している(下記のワット当りの性能を参照)。Nvidiaのサンノゼの本社に設置されているDGX Saturn V Voltaシステムは4番目にグリーンなスパコンとなった。

2017年11月のGreen500トップファイブ

2017年11月のTop500のトップテン

もうひとつのアップグレードされたマシンであるTrinityは、最近投入されたIntel Knights Landing Xeon Phiプロセッサの貢献で、Linpackのスコアを8.10ペタフロップスから14.14ペタフロップスに上昇させ、3ポイント上がって第7位に位置づけている。Trinityはロスアラモス国立研究所とサンディア国立研究所が運営するCray XC40スーパーコンピュータである。

Sunway TaihuLightデータセンター(無錫、中国)

中国は93ペタフロップスのSunwau TaihuLightでリストのトップの座を握ったままであり、33.86ペタフロップスのTianhe-2は第2位のままとなっており、この2台のシステムの合計は性能で全体の15パーセントを占めている。スイス国立スーパーコンピューティングセンター(CSCS)に設置されているCray XC50システムであるPiz Daintは、19.6ペタフロップスで第3位のままだ。Gyoukouが第4位に入ったことで、米国エネルギー省のオークリッジ国立研究所に設置された17.59ペタフロップスのベンチマーク実績をもつ5年落ちのCray XK7システムである米国最速のシステムであるTitanは1個落として第5位となり、米国はトップ4の中に入ることが無くなってしまった。このシステムは首位を獲得した後、2013年6月に中国のTianhe-2に落とされるまで1回しか首位を維持することができなかった。これにより、このリストの24年間の歴史の中で、米国が上位4位以内に入らなかったのは初めてのことだ。

中国はこの4年間近くに渡って首位を自慢する権利を享受してきているが、今回はまたシステム数と合計性能のシェアでも同様に独占することとなった。中国は最も多くのシステムを持っており、前回の159から202に増えており、米国は2番で前回の169から今回は144まで落としている(日本は3番目で35、ドイツ20、フランス18、イギリス15と続いている)。合計性能も同様で、中国はリスト全体の35.3パーセントを所有し、米国は2番で29.8パーセントだった(日本10.8パーセント、ドイツ4.5パーセント、イギリス3.8パーセント、フランス3.6パーセント)。

これらの指標に基づいて、間違いなく一部の出版物が中国のスーパーコンピューティングの覇権を宣言するだろうが、それは早すぎるであろう。中国がSC15でトップ500の台数を3倍に拡大したとき、Intersect360リサーチのCEO、Addison Snellは、中国がTop500リストで発見したものほどはスーパーコンピューティングを見出せていないと指摘している。この観測は筋が通っている。

中国がこのリストに追加している新しいシステムを吟味してみると、中国のベンダーであるInspur、Lenovo、Sugon、そして最近ではHuaweiが、HPCの定義を歪める疎結合のWeb /クラウドシステムをベンチマークするために共同で努力していることを示している。中国が最新のリストに導入した96システムのうち68システムが10Gのネットワークを利用しており、いずれも研究サイトとしては展開されていない。 Top500におけるインターネットやテレコム・システムのベンチマークは新しいものではない。 HPEやIBMのリスト(現在と過去)では同様の状況を見ることができるが、中国は倍増している。比較のために、米国は19の新しいシステムをリストに載せており、その内8システムは10Gネットワークである。

性能シェアによる国別のトップ500の推移。米国は赤。中国はダークブルー。

HPC以外のシステムのLinpack性能が中国の存在を拡大しただけでなく、イーサネットベースのマシンの台数が着実に増加するにつれて、ネットワークの統計が変化してきた。 Top500の著者が指摘しているように、ギガビットイーサネットは現在、228システムを結合しており、その内204システムが10Gインタフェースを使用している。 InfiniBandは現在、6ヶ月前の178システムから163システムに減少し、2番目に多いインターコネクトとなっている。

Snellはさらに次のような見解を示した。「我々が見ているのは、中国のシステム、特に中国のシステムベンダーをリストアップする協調した試みです。投稿の規則は、本質的にプロキシによるベンチマーキングを可能にしています。 1つのシステムでLinpackが実行され検証されている場合、同じ(またはそれ以上の)構成の他のシステムでも結果が推測できるため、明らかな市場シェアを示すことを望むかどうか、または単に国家の誇りのためかに関わらず、リストにもっとシステムを追加する協調した試みが可能となるのです。」

リストの純度と代理によるとベンチマークの議論では、High Performance Linpackもしくは任意の1次元のメトリックは、今日の広範なHPCアプリケーションの組み合わせには有用性が限られている。HPCのサークルではよく理解されているこの真実は、公的投資のために「何かを見せたい」と望む政府関係者やコミュニティの外では常に評価されるわけではないのだ。

Snellは、「業界が特殊ハードウェアに向かって戻っているので、実際のシステムの有効性は比較が難しくなってきています。」とコメントしている。 「1つのアーキテクチャが1つのベンチマークで他のアーキテクチャより優れているという理由だけで、すべてのワークロードにとって最適な選択肢にはならないのです。これは、複数のドメインにサービスを提供しようとする複合ワークロードの研究環境にとって特に困難です。HPCユーザーの88%は、今後数年間、複数のアーキテクチャをサポートし、要件に応じて最適なシステムでアプリケーションを実行する必要があると言っています。」

チップ技術 – (出典:Top500)

複数回にわたってリストには停滞があり、回転率は歴史的に低かった。 SummitやSierra(米国のCORALマシン、180ペタフロップスを達成すると予測されている)も、アップグレードされたTianhe-2A(94.97ペタフロップスのピークが予測された)も、推測されていたように50回目のリストには現れていない。 HPCではシステムとプロセッサレベルでのアーキテクチャの多様性が増しているが、現行のリストは見方によってはあまり多様化していない。リストに載っている136の新しいシステムのうち、インテルはすべてのものに基礎を置いている(その内36システムはアクセラレータを利用している)。新しいPowerはなく、新しいAMDもなく(まだEPYCの早い段階であるが)、ARMからのものもまだない。471システム(94.2%)がインテル・プロセッサを使用しており、6カ月前の92.8%から上昇している。 IBM Powerプロセッサのシェアは14システムで、6月の21システムから減少している。まだ5台のAMDベースのシステムがリストに残っており、1年前の7台から減少している。

Nvidiaの新しいSaturnV Voltaシステム。

米国では、IBM Power9システムであるSummitとSierraが、オークリッジとリバモアの各研究所(それぞれ)に2018年の設置を予定しており、中国、ヨーロッパ、日本には複数のエクサスケールを目指したシステムがあり、アーキテクチャの多様性の新しい波を示している。我々は、フランクフルトのISC 2018から報告される、よりエキサイティングなスーパーコンピューティングの傾向があると予想している。

* 36台の新しいアクセラレータ・システムの内訳:29台のP100(1台はNVLink、292台のHPE SGIシステム)、1台のNVIDIA V100 Voltaシステム(#149、SaturnV Volta) 1台のK80ベースのシステム(#267、Lenovo)。 2台のSugon製 P40システム(#161、#300)と3台のPEZYシステム(#260、#277、#308)がある。さらに、36台のうち、Nvidiaマシンだけが米国にある。 30台は中国製(Lenovo、Inspur、Sugon)。残りの5台は日本製(NTT、HPE、PEZY)。