世界のスーパーコンピュータとそれを動かす人々


8月 16, 2021

15年後、Green500はHPCの第一優先事項としてエネルギー効率の向上を訴え続ける

HPCwire Japan

Oliver Peckham

世界で最もエネルギー効率の高いスーパーコンピュータをランク付けする「Green500」リストは、事実上、常に苦しい戦いを強いられてきた。Green500リストの管理者であり、バージニア工科大学の准教授であるWu Fengが語るように、Green500の種が蒔かれた2000年代初頭には、エネルギー効率について「誰も」関心を持っていなかった。それでも2007年、Green500は最初のリストを発表し、参加したスーパーコンピュータのワットあたりの処理能力をランキングした。29のリストが発表され、約15年が経過した現在も、Green500の主催者(現在はTop500と提携)は、ますます大規模になるシステムを効率化のために投入することを躊躇している企業がある中で、エネルギー効率を第一に考えたスーパーコンピュータの未来を提唱するために、このリストを続けている。ISC 2021でFengは、Green500とその対象となるスーパーコンピュータの現状について語った。

より野心的な(そしてより困難な)報告のあり方

 
   

Green500では長年にわたり、エネルギー効率に関する報告をレベル1、2、3の3段階に分けて行ってきた。レベル1では、最も寛容な要件が設定されている。システム運用者は、コアフェーズにおいてシステムの一部を使用して効率を評価することができ、メーターの精度についてはさらに寛容である。

他の2つのレベルは、システム運用者がより正確な報告を行い、エネルギー効率をより積極的に検討するよう促すことを目的としている。レベル2では、サブシステムを含むシステムの大部分を使用し、フル稼働時の平均電力をより高い精度で測定する必要があり、レベル3では、システム全体の効率とフル稼働時のエネルギー使用量を厳密な精度(0.5%未満)で評価する。

画像提供:Wu Feng

 

Fengによると、レベル2やレベル3の報告書を作成すると、システム運用者がより正確な情報にアクセスできるようになり、その知識やデータをシステム運用(あるいは調達)に活用できるようになるというメリットがあるという。さらに、レベル3の報告書を作成するための参入障壁は比較的低いとの報告もあった。

また、異なるレベルでの報告は、報告された値と小さな相関関係があるとFengは言う。「通常、レベル1のワットあたりのフロップスは、レベル2やレベル3に比べてわずかに高くなります。」Green500の報告を自動車のマイル・パー・ガロンに例えると、「高速道路で29マイル・パー・ガロン、街中で22マイル・パー・ガロンの代わりに、28.96マイル・パー・ガロン、21.96マイル・パー・ガロンとなるかもしれません…レベル2とレベル3の間には、レベル1に対するレベル2とレベル3の間よりも高い相関関係がありますが、いずれもかなり近い値です。」

しかし、このように精度を高めることには障害がある。例えば、Fengは、レベル3の実行は組織にとってそれほど困難ではないかもしれないが、「適切なインフラが整っている場合のみで、そうでない場合は非常に難しい」と説明している。

「レベル3の実行には、スーパーコンピュータ全体(すべてのノード)を計測する必要があります」とFengはHPCwireに語った。大規模なシステムでは、レベル3のレポートに必要なメーターの数は数千にもなる。適切な計測機器を持たない大規模なシステムの場合、Green500へのより正確な報告は非常に難しいものとなるのだ。(例えば、Nvidiaはレベル3の報告書を作成することができなかった。)

その結果、レベル2とレベル3のレポートはより正確で、システム運用者にとってもメリットがあるにもかかわらず、そのような高い基準を要求することは現実的ではない。 特に、5年前にリストが提携したにもかかわらず、レベル1のレポートでさえTop500への提出は任意であることを考えるとなおさらだ(Fengは、ある提案では、主催者はレベル2以上のレポートを作成した場合にのみGreen500システムを表彰することを提案していたと述べている。)「最初にレベル1を設定したのは、主に報告を始めてもらうためでした。なぜなら、もしレベル3の測定をしなければならないということが参入障壁になっていたら、Green500へのエントリーはさらに少なくなってしまうからです。」

しかし、レベル2とレベル3の報告を求める声のほかに、より広範なGreen500リストには一般的な抵抗があります。Fengは、「Top500の調査には多大な労力が必要であり、さらに電力の測定も加わります。そのため、これらの機関の多くは、いわばスーパーコンピュータをこれほど長時間にわたって占有することは難しいのです。」

さらにFengは、多くのTop500システムがGreen500に報告しないことを選択していると説明している。それは、エネルギー効率の評価が競争力に欠けることを知っているか、疑っているからだ。「大体において、(Green500に掲載されている)測定値のほとんどは、よりエネルギー効率の高いスーパーコンピュータのものです。」と彼は言う。「しかし、それはおそらく、初期の段階では上位にいて、その後も数値を報告し続けたからでしょう。」

このような傾向から、Green500のリストは、有望な報告傾向と懸念される報告傾向の二面性を持っている。「すべてがレベル1だった初期には、最高で約350件の応募がありました。」とFengは言う。「しかし、報告のレベルはやや下がっています。」IBMがエネルギー効率に強い関心を持ち、投資を行っていたことが大きな要因だったとFengは言うが、実際、最新版の報告件数は181件であった。

一方で、回答者の平均的な報告の質は向上しており、レベル2と3の報告を選択した回答者の数も増加している。レベル2の報告書29件(報告書全体の16%以上)は、レベル3の報告書14件と同様に、少なくとも4年ぶりの高水準となっている。また、最もエネルギー効率の高いスパコンでは、レベル1の報告書を採用しているのはGreen500のトップ10のうち5社のみで、レベル2以上の報告書が多く採用されている。

2021年6月の「Green500」に掲載されたエネルギー効率の高いシステムのトップ10。右側の「電源品質レベル」の欄は、報告レベルがレベル1、2、3であることを示す。画像提供:Wu Feng

 

ハイエンドモデルを中心に効率化が進む

システムは1ワットあたり30ギガフロップスの効率に大きく近づいており、ヘテロジニアスシステムは「エネルギー効率の面で本当に貢献し、牽引している」とし、アクセラレータがリストの上位を占めている。これらの傾向は、システム効率の高い層で顕著に見られる。「中央値は着実に改善されていますが、それ以上に急速に改善されているのは上位の方です。」とFengは述べている。Green500のトップ10は、11月のリストから60%もの大幅な入れ替えがあり、比較的安定していたTop500とは対照的な結果となっている。

このような変動があったにもかかわらず、Fengは、米国のエクサスケール・スーパーコンピューティングの計画に長い間つきまとっていた野心的な20MWのエネルギー効率目標について、依然として弱気な見方をしている。例えば、Green500では1ワットあたり30ギガフロップスの効率を実現しようとしているが、これは「エクサスケールのコンピュータが約33メガワットになることを直線的に外挿する」ものであり、Top500のトップシステムを基準にすると、外挿する量は68メガワットに近いものになる。米国で計画されている3つのエクサスケールシステムのうち、いずれかが20MW(50ギガフロップス/ワット)の目標を達成するかどうかは、もちろん、幅広いコミュニティで議論されているが、その詳細については、HPCwireのFrontierシステムに関する特集をご覧ください。

画像提供:Wu Feng

 

しかし、FengとGreen500は、1システムあたり数十メガワットに達することもあるスーパーコンピュータの現状において、エネルギー効率の限界を超えようと努力している。

「このリストの目的は、スーパーコンピュータのエネルギー効率に対する認識を高め、奨励することであり、エネルギー効率を性能と同等の一次設計上の制約条件として推進することです。」とFengは述べている。その後、「問題は……率直に言って、ここ米国では、性能がすべての社会になっていることです。」と付け加えた。

2021年6月のGreen500リストは、こちらをご覧ください。