世界のスーパーコンピュータとそれを動かす人々


3月 28, 2014

CRAY、天気予報の未来へ戻る

HPCwire Japan

Nicole Hemsoth

1977年6月にEuropean Centre for Medium Range Weather Forecasts (ECMWF) に初期のCRAY-1Aシステムが納入され、Crayが天気予報に関わってから、天気予報は長い道をたどってきた。今後数十年のヨーロッパの気候を予測するために、ベクトルと共有メモリーのシステムを配備するという、いつか来た道にCrayが回帰するのは初めてだ。

ECMWFの最初のCrayシステムは、160 MFLOPSのピーク性能に対して50 MFLOPSの持続性能を出す気候モデルによって、センターによる10日間の天気予報を可能にした。このシステムに続き、CRAY X-MP/22、X-MP/48、Y-MP/8/8-64、C90 (ピーク性能1 GFLOPS)、そしてT3Dまで、共有メモリーのシステムが続いた。これが、ECMWFが導入した最後のCrayシステムになり、その後は富士通とPowerベースのIBM製品に代わられた。ECMWFは、最初のCrayシステムを導入してから36年後に、スーパーコンピューターを巻き戻している。

The Big Blueのマシンに代わって今年の初めに導入されたXC30は、最近のTop500で51位と52位になった。結合可能で基本的に同じシステム2台がなぜそこにあるのか疑問を持たれるかもしれないが、ECMWFにおいて、2台の計算機を使うアプローチによって、全ての大陸の天気予報を可能にするモデルを使うからである。

気候センターの計算機部門長で、世界中の気候センターでトレンドとなっている2組のクラスターを使う気候モデリングの導入を決定したIsabella Weger氏によると、予測業務の困難に対して、データセンターに別々のクラスターがある理由を説明する。「本質的に、1つめのシステムは、天気予報の業務を処理し、結果を20の加盟国と14の協力州に送り、地域の天気予報に役立てます。」他のクラスターは、数値予報モデルを改善して大気の振る舞いにより広い見解を提供するために、研究目的に使われる。

両方のクラスターともに計算に忙しいが、すべてのデータは両方のクラスターが利用できる。 Cray Sonexionに基づく2重のストレージ・クラスターが、2組の計算用クラスターにクロス・マウントされるので、システムの更新や障害によって予測をリスタートさせる場合にも、データは利用可能になっている。

Weger氏と同僚がECMWFにおける2重クラスターのトレンドをもたらした際に、CrayのCEOである Pete Ungaro氏の経験において、これは継続性についてのユニークな取り組みだった。Ungaro氏によると、「天気予報センター以外に、本当にこのような構成を見たことがありませんでした。研究のために我々の製品を使っている大部分のユーザーは、可能な限り最大のエンジンを1台構築する傾向があります。しかし、運用のための要求から、EMCWFとその他の気象センターは、注目すべき市場でした。」

この2重クラスター・アプローチとストレージは、Isabella氏と同僚の直接的な結果であり、ヨーロッパの気象予測を絶えず提供するために、非常に重要である。さらに、データの重要性はこれで終わりではない。EMCWFは、テープ・アーカイブを持ち、歴史的な気象データは50ペタバイト以上になる。さらに、Isabella氏らのシステムは、毎日50テラバイトのデータを生み出す。これらの詳細なデータは、世界中で気候と大気の研究者に使われ、
先進的な気象モデルと長期間の気象変動の研究に役立つ。

しかし今、政府機関が気象現象に備えるために、よりチューンアップされた高解像度のモデルが追加されている。「世界を覆う格子を想像してください。現在の解像度は16kmです。2015年の計画では、10kmになります。計算機資源によって可能になるのです。」

これらの話のためには、とてつもない計算能力が必要である。2014年初めからの「Aries」インターコネクトを使う「Cray XC20 Cascade」スーパーコンピューターと、ペタバイトを超えるSonexionストレージ・システムによって、再び2個に分かれたクラスターが始まる。Ungaro氏の説明によるとアクセラレーターはないが、Weger氏によると将来のアプリケーションがアクセラレーターを使う可能性があり、その可能性に備えている。Ivy Bridgeを使っている。2つの部屋にある19のキャビネットに約3600のノードがあり、約80,000個のコア全てがCray製の「Aries」インターコネクトで相互接続されている。

EMCWFがこの計算を始めるために、6000万以上の観測データが必要なことに注目しよう。これらのデータは、人工衛星、地上、ブイ、飛行機から来る。これらのデータによって、計算のベースラインが提供される。Weger氏によると、「私たちは多くの気象観測をして、予測のための初期値であるベースラインを分析します。これらは、異なる時間と空間からの観察です。そして、地球全体に渡る時間と空間のグリッドに当てはめます。」これが、EMCWFにおける「データ同化(data assimilation)」作業である。そして、予測モデルを走らせる前に、データと計算能力が必要である。

複雑な予測は、「ワンショット」のシステムではない。予想が完璧ではないので、確率論的な気象現象も計算する必要がある。「確率論的であるために、私たちは、1日につき初期条件を少しずつ変えた51の予想のアンサンブルを求めます。ハリケーンと関連づけるならば、例えば、それぞれのモデルは異なる状況でハリケーンの予想進路を与えます。」

訳注:計算物理学的に不安定なモデルをシミュレーションする際には、しばしば、初期値に揺らぎを加えた複数のデータセットを計算し、複数の計算結果の統計的性質を吟味する。これを、ショットガン法ともいう。

Weger氏は付け加えた。「性能はもちろん、また、頑健性と信頼性と移植性も重要です。システムを入手するサイクルにおいて、多くのベンダーの選択肢があるように、アーキテクチュアに依存しない移植性を重視します。アプリケーションは、主にFortranで書かれています。そして、コードを最適化するときと開発するときに、移植性を妨げないか考慮します。私たちは、特定のベンダーまたはアーキテクチュアに閉じ込められたくありません。」

Weger氏はIBM Powerアーキテクチュアを使っていた間の経験をコメントしなかったが、ベンチマークの手順が長くて詳細であることに、Weger氏もUngaro氏も同意した。EMCWFには、科学と運用のモデル全体をアップグレードする10年計画がある。「 Intergrated Forecasting System」と呼ばれ、モデル、コード、データ同化から成る。アップグレードの多くは、より多くの計算資源を要し、より多くの観測データを使い、よりよい空気の物理モデルを使い、これが解像度を上げる原動力になる。予測によりおおくの計算資源を加えることは、時と共に重要になってくる。過去にうまくいっていなかったが、この10年間で、もう1日先の気象現象を予測する潜在能力に驚くべき進歩があった。Weger氏によると、「20年前の5日間の予測と同程度に、現在の7日間の予測は正確です。」

Weger氏と同席していたSngaro氏は、ECMWFのこの新しいシステムの「full circle」が話題になった際に述べた。「私たちは非常に誇りに思います。この種の歴史があり、命を救うことができ、世界を変えられるシステムの提供を手伝えたことを。」

次のTop500リストにおける新しいCrayシステムの位置について、若干の純粋数学的議論をできるかもしれない。そして、IBMのPowerベース・システムよりも良く、モデルに計算能力を提供できるかどうか、議論できるだろう。2014年6月のリストに再びこのシステムが掲載されれば、HPCwireは再び物語にチェックインするだろう。