世界のスーパーコンピュータとそれを動かす人々


7月 22, 2015

中国、Tianhe-2で5回目のTOP500の首位を獲得

HPCwire Japan

Tiffany Trader

中国が2013年6月にTianhe-2スーパーコンピュータで次の最速マシン(オークリッジ国立研究所のTitan)のピークFLOPSの倍の性能でTOP500の冠を掴んだ際に、誰が2年後の今までこのマシンがトップの座を継続すると予測していただろうか? 2015 International Supercomputing Conferenceと共に先週月曜日発表された第45回目の年2回のTOP500リストを見るとおり、Tianhe-2もしくは「Milky Way-2」ばかりがその位置を維持しているのでなく、トップ5については変化がなかったのだ。

20150714-F2-TOP500-list-June-2013-or-June-2015

また、過去2年間のこのリストの5回の繰り返しの中で、トップ10においてはたった2台の新システムがあっただけだ。スイスのスイス国立スーパーコンピューティング・センター(CSCS)の6.27 LINPACKペタフロップスのCray XC30であるPiz Daintと、サウジアラビアのアブドラ国王科学技術大学にインストールされている5.53 LINPACKペタフロップスの性能を持つCray XC40であるShaheen IIで、それぞれ6位と7位であり、SuperMUC (IBM/Lenovo、LRZ ドイツ 2.89 ペタフロップス)とTianhe-1A(天津国立スーパーコンピューティングセンター、中国、2.56ペタフロップス)を押し下げている。

この過去2年間において、2015年6月と前回の11月のリストを比べると、この希薄なトップ10ゾーン内に唯一1台の新規追加がある:サウジアラビアのShaheen IIがそれで、非公開の米国政府サイトにインストールされている3.57ペタフロップスのCray CS-Stromシステムを押し出した。

スーパーコンピューティングのトップにおけるこのよう停滞レベルは前例がなく、ハイパフォーマンス・コンピューティングの上位の階層が直面している課題について話すと、バークレイー研究所のディレクター代理でTOP500の著者であるHorst Simonやその他多くのような有名人によると、ムーアの法則の限界に最も明白に起因するものである。

この減速の重要度の説明として、TOP500の主催者は、過去2年はリスト全体の年毎の性能向上において歴史的な低さであったため、リストのトップに座している非常に大規模なシステムの効果を強めていることを認めている。現在のリストでは、全ての500システムで363ペタフロップスの全体性能があり、6ヶ月前は309ペタフロップスで、1年前は274ペタフロップスであった。

20150714-F2-Performance-development-TOP500-June-2015

さらに、リストの最後(500位)のシステムの性能は、その性能軌道における著しいシフトで過去6年間のトレンドに遅れをとっている。2008年以来、500位のシステムの性能は年間55パーセント増えてきた。比較として、ムーアの法則の全盛期として認識されてきた性能スケールの期間である1994年から2008年においては、90パーセントの年間増加であった

継続的な停滞はかなり劇的であるが、驚きではなかったのだ。最も明らかなのは、複数年の調達サイクルでは、我々が今日直面している減速は、リセッション時代の投資レベルから残っているものだ。しかし、恐らくただ重要なものとして、これらのリーダーシップクラスのシステムを購入する主要なサイトは、どんな技術やアーキテクチャが彼らのユーザやワークロードにとって最大の価値を提供してくれるのかを見極めるために待っているように、保持状態にいるのだ。

過去には、強力なムーアの法則がより高速、より安く、より効率的に順次処理を進めることで、典型的なリフレッシュ・サイクルは次世代のCPUが中心であったが、さらにヘテロに進むことで、NVIDIAのTesla GPU SKU、インテルのMICライン、および64bit ARMの継続する進化のような、見ていく技術サイクルが複数になったのだ。また新しいメモリとストレージ技術(NVRAM、バーストバッファ、SSD、メモリスタ)や次世代インターコネクト(NVIDIAのNVLink、インテルのOmni-Pathなど)もある。

これら確約された進歩の多くが結実し、それらの上につながるパイプライン化されたシステムはリストの運動性を復活させる;これは6ヶ月から1年で起こり始める。米国においては、ACESおよびCORALの共同の取り組みが30から180ペタフロップスの範囲の5台の主要システムを提供する予定だ。Trinityスーパーコンピュータが国家核安全保障局(NNSA)に40ペタフロップスのコンピュータ能力を提供するように契約されている。1億7千4百万ドルのCray XC40マシンのインストールはこの夏に予定されているが、SC15および次のTOP500までに稼働させてベンチマークさせる十分なリード時間があるかどうかは不明だ。

システムは物理的にはロスアラモスのニコラスメトロポリス・モデリング&シミュレーションセンターに設置され、ロスアラモス国立研究所とサンディア国立研究所のエクストリーム・スケールにおけるコンピューティング連合(ACES)パートナーシップにより管理運用される予定だ。

この他の米国システムが次のタイムラインで予定されている。

2016: Cori, NERSC (> 30 petaflops)
2017: Summit, ORNL, OLCF (150 petaflops)
2018: Sierra, LLNL, NNSA (150 petaflops)
2018: Aurora, ANL, ALCF (180 petaflops)

日本とヨーロッパもまた自らの「エクサスケールにフォーカス」された予定を強化しているが、ほとんどの国は2020年のタイムフレームに狙いをつけるのを諦めている。Horst Simonが見ているように、米国においてエクサスケールを2020年の締切を達成しようとするならば、CORALシステム(Summit、Sierra、Aurora)はすでにインストールされていなければならないが、実際にはまだ2〜3年先なのだ。

中国の長期に及びFLOPSのリードを考えると、次の1,000倍性能の障壁を破る競争におけるトップ候補であった。Tianhe-2は、米国政府による禁止措置がこのアップグレード計画を狂わすまで、110ペタフロップスのマークを超える拡張をもたらす数万個のIntel Xeonチップの注入を受けることになっていた。

昨年8月、インテルは米国政府より中国のシステムメーカーであるInspurへの出荷の輸出許可証を取るように要請されたが、アプリケーションは却下され、このチップメーカーがTianhe-2のアップグレードの道を支援することを妨げられたのだ。その後直ぐに、4つの中国のスーパーコンピュータセンターが米国政府により、彼らが「米国の国家安全保障や外交政策利益に反する行為」を行っているという根拠で、ブラックリストに載ったのだ。

業界の多くはこれを政治的駆け引きとして見ており、この動きが中国の自国開発のチップ製造プログラムを加速化することに拍車をかけていると見ている。完全に国産のマシンがこの保護主義国家にとっての目標であったので、チップの技術革新の最高難易度との組み合わせにおいて、米国マイクロプロセッサ技術への容易なアクセスは減衰効果を有していたのだ。この重要な構成部品が効果的に閉ざされたので、中国は完全に国産のスーパーコンピューティング・スタックを設計するための取り組みを倍増することを余儀なくされるのだ。

中国が国内の半導体事業の構築についてどのくらい深刻かの兆候として、メモリ側ではあるが、中国の国有チップ設計会社であるTsinghua Unigroup Ltdが米国のメモリ製造メーカーMicron Technologyに対して230億ドルの入札を行ったのだ。この種においては最大規模の譲渡となり、国家安全保障と米国の最後のメモリチップメーカーが国営事業体に移転されることを許可する独占禁止法を懸念する米国当局による厳しい調査に直面することになるだとう、とアナリストはこの取引について語っている。