TOP500の解析で「ムーアの法則に問題なし」が判明
Tiffany Trader

SC15会期中のTOP500のセッションにおいて、リストの共同創設者で共同著者のErich Strohmaierは、中国がかつてない程の規模で場所を占有する初めてのこととの見方を示し、これら新エントリーの多くがライフサイクル半ばのシステムで今回ベンチマークが行われたことを説明した。しかし、もっと明らかにしたそうだったのは、ムーアの法則の外見上の状況について何をTOP500が言っているかの再分析である。結局、インテルが正しかったのだろうか?そして、それは負けてしまった唯一の共通の知恵ではない。アクセラレータの成長もまた詳細な調査が行われた。では見てみよう。
共著者であるHorst Simon、Jack Dongarra、Martin Meuer、そしてバークレー研究所の未来技術グループのヘッドであるStrohmaier博士を紹介したHLRSの研究科学者Vladimir Marjanovic等がステージに上がり、リストの歴史の中で最も成熟したエリートマシンの成果を含んだセットとしてとらえられるトップテンのレビューを始めた。その中には2台の新システムがあり、両方ともクレイだ:8.1ペタフロップスのLINPACK性能を持つロスアラモスとサンディア国立研究所にインストールされたTrinityの最初の部分; 8位に入った5.6ペタフロップスのLINPACK性能を持つ最も強力なPRACEマシンである、ドイツHLRSにインストールされたHazel-Henシステムだ。
この11月のリストにおける最大の変化は中国のシステム数(7月の37から109に上昇)であり、米国の通常50-60パーセントのシェアを40パーセントのシェアまで押し下げて、システムシェアで米国に次ぐ2位になったのだ。
しかし、Strohmaierが言っているのは純粋なシステムシェアだけを見るのでなく、インストールされたシステムの全体性能であり、多くの小規模なシステムによる影響を排除する規模によるピーク・システムのランキングである。
「過去におけるインストールされた性能の成長を見ると、過去10年間に中国がインストールされた性能の面で驚異的な成長があったことをみることができるでしょう。」とStrohmaierは述べている。「現在中国は、米国には程遠い[システム数でみた場合に]がインストールされた能力の面で明らかに2番目に重要な地理的地域である日本よりも前にあるのです。」
もう1ステップ先に進むと、6回も第1位の座にある中国の国立国防技術大学が開発した33.86ペタフロップスのスーパーコンピュータであるフラグシップマシンのTianhe-2を除いては、中国にインストールされたシステムは実際には小規模のものである、とリストの著者は明らかにしている。
「中国は過去10年間で驚異的な実行を持っていました。」とStrohmaierと見ており、「そしてそれは継続していますが、単一のシステム数が示唆するほどには劇的ではないのです。」
システム数では、HPは明らかに市場シェアの面で支配的である。クレイは2番で、3番はこのリストでは驚きの企業であるSugonだ。Sugonは最新nのTOP500システムにおいて49システム、9.8パーセントのシェアを持っている。TOP500リストの共著者がTOP500のBoFの間中議論したように、性能の観点からSugonを見た場合には少し異なって見える。同社は21ペタフロップス以上で市場シェアの5パーセントを取っているが、クレイ(25パーセント) 、IBM(15パーセント)、HP(13パーセント)、NUDT(9パーセント)、SGI(7パーセント)、そして富士通(約5パーセントだが22ペタフロップスよりやや高い)についで第7位である。
Strohmaierは、SugonはTOP500では新参で、LINPACKベンチマークをどのように実行し、リストにサブミットするかを学ばなければならなかったという点について説明した。同社は前回のリストにおける5システムから49システムにリストのシェアを増加させた。(1システムが脱落したので、結局45システムが追加された)
「Sugonは本当に努力、エネルギーそして労力を費やして、そのシステムがどんな性能を出そうとも、すべてのインストールにおいてベンチマークを実行して、その数値を送ってくれたのです。」とStrohmaierは述べ、「彼らは、スーパーコンピューティングの面、システムができることの面、統計上どの位置にあるかの面において彼らがどこにいるのかを把握するための長大な道のりに出たのです。」
彼は、これを可能にした企業と個人に与えた。「Sugonは今や第3位で、以前にはほとんど存在がありませんでした。」と付け加えた。
しかしここでの意外な結末はこれらがもしそうであるなら驚異的な偉業となるような新しいシステムではないことだ。「追加さらは多くは、2、3年が経過したもので、これまで計測されたサブミットさたことがないものでした。」とStrohmaierは明らかにした。
今回のリストではまた、次のカテゴリによる混乱した4通りの事業表現で、IBMのx86からLenovoへのオフロードによる混乱が反映されている:IBM、Lenovo、Lenovo/IBMそしてIBM/Lenovoだ。これらの「人工遺物」は直に消えるだろうが、現在は
ベンダーと顧客の間で働いているこのアレンジメントがオリジナルのIBMとLenovoのカテゴリを希釈している。
Lenovoはもちろん中国の企業で、彼らが製作し販売するシステムと同様に現在は彼らがタイトルを保持する以前のIBMシステムとの混成だ。そして、もうひとつの中国ベンダーであるInspurが15システム保持している。全部で、TOP500で現在顕著で中国のシステムの流入を作る3つの中国企業がある、とStrohmaierは述べた。
彼は次にリストシェアのパーセンテージによるベンダーの合計FLOPSを検討して、「HPは伝統的に小規模システムをインストールしており、クレイは大規模システムを、そして次にSugonがありますが、例外で、小規模のシステムがあるので性能シェアはさらに小さいのです。」であることを示した。45システム(ほとんどがBlueGeneの残り)でシステムシェアが近接しているIBMは、大規模Blue Geneシステムの遺産で性能の面において大きな市場シェアを持っている。InspurとLenovoの両方は平均リスシェア以下で、富士通とNUDTはもちろん彼らのフラグシップシステムである京コンピュータとTianhe-2が反映して、もっと大きなシェアを持っている。
リストに戻って一般的に見てみると、この数年間における低い回転率を取り上げている。2008年以前は、平均システム年数は1.27年であったが、現在は3年よりちょっと下になっており、6月のリストよりも僅かに良くなっている。TOP500の著者は、SugonやIBM-Lenovoのオフロードからの影響が強化されたことによるものだとしている。「顧客は以前よりも長くシステムを維持しています; これは[説明できる]小さな入れ替え以外は何の変化もないということです。」
ムーアの法則は健在である!
各リスト毎のクラシックなスライドは、1位、最下位、およびStrohmaierは「平均の500倍」として考えるTOP500合計の性能において過去どのように性能が成長してきたかを示すものである。
これらは印象的な成長であり、長年、将来の成長を予測するのに非常に正確であったが、ここ数年においては、2008年および2014年に軌道が減少した変曲点が現れている。
これは2つの重要な問題を提起している、とStrohmaierは言う:何故変曲点があるのか、そして何故変曲点が2回起きたのか?
「良い事は、変曲点以前の古い成長率が両方の線上で同じであり、新しい成長率もまた同じであることです。ひとつの影響は明らかに技術であり、もうひとつは私の意見では財務的なものです。」とStrohmaierは指摘した。
変曲点の前後の10年間の最後に向けた予測を示したスライドでは、ここでは一見小さな相違が、その10年の最後までには大きく10倍の差を起こす結果となっているように見ることができる。
「10年前に我々が予測したように2019年までにエクサスケール・コンピュータが到来すると言う代わりに、今では次の10年間の中程辺りではないかと考えているのです。」とStrohmaierは述べた。
「実際に何が起こったのかを見ると、統計の基礎を構築する方法において、我々はより注意する必要がありのです。」と彼は続けた。「TOP500は在庫ベースのリストで、新しいのと古い技術が混在しています。もしこのリストで技術の変化を本当に見たいのであれば、このリストにくる新しい技術を持ったすべての新しいシステムをフィルターするフィルターを適用して、そのサブセットを分析する必要があります。」
Strohmaierはすべての新しいシステムを抽出し、さらに従来のスーパースカラ・プロセッサのみを使ったすべてのシステムを抽出したところ、Nvidiaチップがあり、Intel Phiはなかった。この試みのポイントは、従来のプロセッサ技術の軌跡を引き出すことである。
これが結果だ:
Strohmaier:
ここで見ることはコア当りの性能が2005-2006年辺りで劇的にヒットしていることですが、これは赤色の線で示されるように単一チップにもっともっとコアを置く我々の能力によって補償されたものであり、そして実際のチップ当りのソケット当りの性能として掛け合わせると、青色の線になり、実際にはムーアの法則に合致しています。なので、ここで言えることは、ムーアの法則に問題があるという明らかな兆候が無いというサンプルなのです。
では、性能曲線におけるスローダウンは何が原因なのでしょうか?
もうひとつのことは、過去数十年に渡って我々は非常に大きなシステムの中にもっともっと部品を詰め込んだことです。これらの大規模システムが持っているスカラープロセス毎のチップソケット数(赤色の曲線)を見ることで近似しようとしました。平均性能がムーアの法則に従う一方で、赤色の線は2005-2006年以降は明らかに指数関数的成長率には従っていないのです。
その時点で、大規模システムにもっと部品を詰め込む能力においてすべての勢いとお金を使い果たしているように見え、大規模システムは以前のように規模においてもう成長することがなくなったのです。これが私のデータの分析です。そのためにTOP500における全体の性能の成長が以前のレベルよりも減少して、変曲点ができた理由なのです。
現時点ではスーパーコンピューティングは、ちょうどスーパーコンピューティングが始まった時のようにムーアの法則で成長しており、それは我々がこれまで見てきたようなものではないのです。
ですので、明らかに技術的な理由ですが、チップに問題があるのでなく、実際には施設およびシステム・レベル、最も可能性があるのは電力もしくはお金もしくはその両方の問題なのです。
アクセラレータの停滞
統一されたベンチマークとしてLINPACKの利点の熱烈な擁護者の一人であるStrohmaierは、アクセラレータのトレンドに動向について探求し、それらがペタフロップスのかなりのシェアを持っていることを認めた。「しかし、それらのアクセラレータが貢献している全体のリストの割合をみたならば、」と続けた、「過去2年間についてフォーカスすると、そのシェアは実際には落ちてはいないが停滞しています。」
「これは科学計算以上に市場に浸透することができない、アクセラレータの市場への浸透に関するハードルがあることを意味しています。これらはHPCコンピューティングの主流にはまだ入っていないのです。」と彼は付け加えた。
電力効率はこのBoFにおいてもうひとつの測定基準でもある。平均電力効率におけるトップテンを見てみると、コースは不均一であるが成長している。しかし、最高の電力効率はもっと良い。これらの電力による勝者達はアクセラレータもしくはBlueGene Qシステムのいずれかであり、電力効率のために設計されている。
上の図では最高の電力効率で目立ったもので、新しいマシンは黄色でマークされている。東京工業大学のTSUBAME KFCは最新のベンチマークのためにNVIDIAのK20xからK80にアップグレードされ、1位となった。(訳者注:Green500では理研のShoubuが1位、TSUBAME KFCは2位) Strohmaierが驚いたのは電力の面での2位と3位のSugonとInspurである。(訳者注:Green500ではSugonは4位、Inspurは6位) もう一度言うが、ワット当りのメガフロップスによりランク付けされるこのリストのシステムはすべてアクセラレータを搭載している。
Strohmaier博士の最後のスライドは毎年SCで授与されるGordon Bell賞のベスト・アプリケーション性能とTOP500の相関関係をプロットしたものだ。潜在的に異なるシステムでの異なるアプリケーションであるために、過去のこれら2つのトレンド間の密接な軌跡は、LINPACKがまだ現実世界の性能の便利な反映であることを提言できるものかもしれない。これは別の機会にもっと深く分析してみるが、今はここにスライドがある。