世界のスーパーコンピュータとそれを動かす人々


6月 21, 2017

49回目のTop500リストがISCで発表

HPCwire Japan

Tiffany Trader

フランクフルトからこんにちわ、2017 International Supercomputing Conferenceにおいて最新のTop500リストが公表された。大きな変化はないが、上位の2位は93ペタフロップスのTaihuLightと33.8ペタフロップスのTianhe-2で中国が掴んだままだ。注目すべきGreen500において日本が上位4位までを獲得したことを含め、いくつかの歴史的で世界的な傾向があった。

49番目のTop500リストのトップ10においては同じ名前が並んでいるが、スイス国立スーパーコンピューティングセンター(CSCS)にインストールされたCray XC50システムのPiz Daintは、8位から3位と5段階も上昇している。この性能向上では、古いTeslaギアをNvidia Tesla P100 GPUに置き換えて(詳細はこちらを参照)、以前の9.8 Linpackペタフロップスを19.6ペタフロップスに倍増させたことだ。 Intelプロセッサも、Sandy BridgeからHaswellアーキテクチャにアップグレードされた。

Piz Daintの上昇は、17.6ペタフロップスの米国のTitanスーパーコンピュータを第4位に押し下げ、トップ3のランキングのいずれにも米国が入らないこととなっている。 Top500の著者が本日の発表で述べたように、これが起こった唯一のもう一つの時期は、1996年11月に日本がトップ3のスポットをすべて取った時だ。

参考までに、新しいトップ10ランキングを以下に示す:

出典:Top500

この最小限のリストの変化について、Top500ウォッチャーとマーケットアナリストのAddison Snellは次のようにコメントしている。「Piz Daintのアップグレード以外のトップ10システムには何の変化もなく、状況は前進していないように見えるかもしれませんが、特に米国国立研究所の2つのCORALのプリエクサスケールシステムと可能性として中国Tienhe – 2Aのアップグレードが次のリストに現れる前の静けさなのです。」

「このリストでより興味深い傾向としてはリストの中のシステム数です。」とIntersect360 ResearchのCEOが続けた。「例えば、殆どがNvidia GPUやスタンドアロンプロセッサとしてのIntel Xeon Phiであるアクセラレータやコプロセッサのようなメニーコアシステムの数は増え続けています。このことはエクサスケールと動かすのに必要な電力効率の向上を推進しています。またIntel Omni-Pathの採用がリストにおいて継続していることに注目しています。我々はイーサネットやInfiniBandに対してどのくらいOmni-Pathが浸透していいるか見るために、エンドユーザ調査でこのことをモニターしているのです。」

CORALシステムであるSummitとSierraが今年の次のリストで準備できるかどうかについて聞かれると、Snellはそれよりも早くできることについては驚かないと言う。ではSC17か? 我々はSnellをフライトの乗り継ぎの際に捕まえたが、ISCにおいて彼の考えをもっと聞くこととした。米国はエクサスケールのタイムラインを加速すると発表(最新の米国エクサスケールの記事を参照)しており、さらなる資金提供を確約している。そのため、パートナーのIBM、NvidiaやMellanoxが可能であれば、「プリエクサスケール」の迅速化が理にかなってくる。

その後、Snellも指摘しているように、Tianhe-2Aシステムの問題は依然として残っている。Knight Landingへのリフレッシュを止めさせた米国の禁輸措置の後、Feitengプロセッサで行くこととしたTianhe-2のアップグレードはまだ実現していない。
現在Tianhe-2Aは、中国における3つのエクサスケール候補のひとつであるNUDTのエクサスケール・プロトタイプであることを示している。(SugonとWuxiスーパーコンピュータセンターの共同)次期Tianheは2016年のHotchipsカンファレンスでPhytium Technologies社が発表したFeiteng FT-2000/64を搭載すると推測されている。FT-2000/64は64コアのARMプロセッサで、2.0 GHzの動作周波数で512ギガフロップスのピーク性能を持ち、100ワット(最大)の電力と言われている。

Top500パイを分割する

米国はピークにおける覇権を失ったが、他のどの国よりも上位10位以内に5つのシステムを数えている。米国は169台のシステムシェアを獲得している。中国は160ヵ国にとどまっている。6ヵ月前に米国と中国がタイの171システムであったことを考えると、他の国々がその分を獲得したと想定され、それは取り分け日本とイギリスである。日本は11月の27台から33台で3位になった。ドイツは31台から28台で4位にランクされている。フランスとイギリスはそれぞれ17システムで5位、フランスは3台減少し、イギリスは4台増やした。

合計性能シェアの観点で見ると、順位は保たれており、米国(33.8%)、中国(32%)、日本(6.6%)、ドイツ(5.6%)、フランス(3.4%)、イギリス(3.4%)の順となっている。

ベンダーの状況を見ると、Hewlett Packard Enterprise(HPE)は、昨年11月に完了したSGIの買収で25台のシステムを獲得し、システム台数において143台を得て首位となった。Lenovoは88台で2位、Cray(57台)、Sugon(46台)、IBM(27台)と続いている。前回のリストでは、HPE(112台)、Lenovo(92台)、Cray(56台)、Sugon(47台)、IBM(33台)であった。今回のリストでは、新しいIBMシステムが1つしかなかった。

2017年6月Top500ベンダーツリーマップ(合計性能によるシェア)

合計性能シェアで見ると、Crayは21.4%のリードを維持し、6ヶ月前の21.3%から上昇している。 SGIの買収により、HPEは9.6%増の16.6%で2位に戻った。Sunway TaihuLightの開発者であるNRCPCは、HPE + SGIの組み合わせを強く示すことにより、インストールされている性能全体の12.5%(13.8から)で3位に落ちた。 Lenovoが次で(9.3%、8.8%から増)、その次がIBM(7.5%、8.8%から減)。

49回目のリストに掲載された全500台のコンピュータの総合計性能は、749ペタフロップスで、6ヶ月前の672ペタフロップス、1年前の567ペタフロップスであった。この32%の年間成長率は、2008年以前は年間平均約90%で最近では年間平均約55%であった過去の傾向をはるかに下回っている。これはTop500の著者によると、逆転の兆候を示さない傾向であるとのことだ。

出典:Top500

上位10台のマシンの総合計性能は226ペタフロップスから235.9ペタフロップスにアップしており。これはPiz Daintのアップグレードだけに起因している。ペタフロップスクラブには21台のシステムが加わり、6ヶ月前の117台から138台になった。 TOP100のエントリポイントは、1.07ペタフロップスから現在1.21ペタフロップスとなった。リストに入るためのバーは、前回リストの349.3テラフロップスと比較して432.2 Linpackテラフロップスに上がった。

Top500著者によって観察された他の注目すべき傾向:

2017年6月までのアクセラレータ/コプロセッサの動向(出典:Top500)
  • 2016年11月の86システムから増加し、合計91台のシステムがアクセラレータ/コプロセッサ技術を利用している。内71台がNVIDIAのチップを使い、14台のシステムがIntel Xeon Phi技術(コプロセッサとして)を使い、1台がATI Radeonを、2台がPEZYを使っている。3台のシステムがNvidiaとIntel XeonPhiアクセラレータ/コプロセッサの組み合わせを使っている。さらに13台のシステムがXeon Phiをメインのプロセッシング・ユニットとして利用している。
  • これら91システムの平均アクセラレータコア数は115,000コア/システムであった。
  • Intelは、TOP500システムの最大シェア(92.8%)のプロセッサを引き続き提供している。
  • システムの93%が8コア以上のプロセッサを使い、68.6%が12コア以上であり、27.2%が12コア以上であった。
  • ギガビット・イーサネットは207システム(変化なし)で最大シェアであり、194システムが10Gインタフェースを使っている。InfiniBandは178システムで前回の187システムから減少しているが2番目に最も使われている内部システム・インターコネクト技術である。
  • Intel Omni-Pathは1年前に最初に現れ8システムであったが、現在は38システムになり前回の28システムから増えている。

また注目すべきことに、Top500リストにはHPCGベンチマーク結果が組み込まれている。本リストの著者によれば、「性能をよりバランスよく見せるために」というだ。彼らはさらに、「HPCGベンチマークで最速のシステムは、富士通の京コンピュータであり、Top500全体で8位にランクされています。それに続いて、Top500の2位のTianhe-2となっています。」このラインナップは11月のHPCGランキングの結果以来変わっていない。

Green500のハイライト

新リストでは、エネルギー効率計測について興味深い話がある。日本はGreen500の上位4つのスポットを新システムで獲得し、アップグレードされたスイスのPiz Daintは5番目のスポットを獲得した。これら5つ全てのシステムがTesla P100 GPUを採用しているという事実は、Nvidiaにとっても良い話であり、NvidiaはまたGreen500の7番目から14番目のスポットも占めている。

Greenのトップランキングにおいて、14.110ギガフロップス/ワットを叩き出したのは東京工業大学とHPEが設計した新しいTSUBAME 3.0(改造HPC ICE XAマシン)だ。このシステムは1.998ペタフロップスのLinpackでTOP500に61位となっている。新しいGreen500記録保持者は、NVIDIAの社内Saturn Vスーパーコンピュータ(6月前の8.17ギガフロップス/ワット)の72.7%の記録を達成した。

第2位のGreen500システムはエクサスケーラー社によって構築され、Yahoo Japan Corporationにインストールされた「kukai」である。これは14.045ギガフロップス/ワットで、0.3%差でTSUBAME 3.0の背後につけている。これはトップ500ランキングでは466位である。第3位には、国立研究開発法人産業技術総合研究所の産総研AIクラウドシステムがある。 このNECマシンは12.68ギガフロップス/ワットを達成し、トップ500で148位にランクされている。第4位のGreen500システムは、富士通製のRAIDEN GPUシステムであり、理化学研究所の革新知能統合研究センターにインストールされている。これは10.6ギガフロップス/ワットを達成し、トップ500のラインナップでは306位に座っている。

Green500で5位のスーパーコンピュータであるPiz Daintは、10.4ギガフロップス/ワットを達成している。 第3位のシステムとして、エネルギー効率が必ずしもこれ程高くなるとは限らないため、これは大きな成果である。 Piz Daintがトップ50のスーパーコンピュータで最もエネルギー効率の良いスーパーコンピュータであるという事実は、その点を語っている。

第6位は、海洋研究開発機構のExascalar ZettaScaler-1.6システム「Gyoukou」が10.2ギガフロップス/ワットである。 PEZY-SC2アクセラレータに依存しており、GyoukouはGreen500のリスト上で最高の非GPUシステムだ。

TOP500とGreen500の表彰は、6月19日フランクフルトで10時30分に、Top500共同執筆者のHorst D. Simon(Lawrence Berkeley National Laboratory担当ディレクター)によって贈呈された。 Top500とGreen500のプログラムトラックからさらに多くの分析が出てくると期待している。 今後もISC 2017で発表されたこれらのベンチマーク結果やその他のベンチマーク結果について報告する予定だ。もし知見やコメントがあれば、電子メールまたはショーで私を捕まえてください。