世界のスーパーコンピュータとそれを動かす人々


6月 15, 2015

Jetstream:科学のロングテールに的を絞る

HPCwire Japan

John Russell

科学のいわゆるロングテールへのHPCへのアクセスを改善することは、進行中のNSFの優先課題である。少なくともNSFに資金提供された複数のイニシアティブが進行中であり、そのひとつであるJetstreamは、一般的にHPCのリソースへのアクセスや専門知識が制限されている領域科学者やエンジニアを直接ターゲットとする最初のNSF資金提供のHPCクラウドである。

「これは、NSFのすべての領域全体で科学と工学用の最初のクラウドです。これが少し微妙な違いのあるように聞こえるかもしれませんが、それはそれがあるからです。」とインディアナ大学の研究技術のシニアマネージャであるDavid Hancockは語った。「他にもいくつものクラウド・プロジェクト(例えばChameleonやCloudLab)がありますが、これらは計算機科学者や他の観衆のための試験環境としてフォーカスしています。」Hancockはバージニア州ノーフォークで4月に開催されたHPC User Forumにおいて、Jetstreamのアップデートと進捗状況について説明した。

インディアナ大学拡散技術研究所が主導するJetstreamは、国家のサイバーインフラにクラウドベースの計算環境を追加する。研究者は、リモートのリソース上に仮想マシンを作成することが可能で、研究室のワークステーションや自宅のマシンのように見て感じることができるが、数千倍の演算能力を利用することができるのだ。

Jetstreamは本番環境に着目し、違うレベルの利便性を提供しています。私達はこの環境が、HPCに良く役立っている既存のユーザ、NSFプログラムで提供される高度なサイバーインフラ、そしてXSEDEのまだ一部ではないユーザの境界と交点であることを願っています。」

ここにHancockのJetstreamの概略説明がある。

  • NSFによって支援される全ての分野の活動での科学工学研究のためのNSF初のクラウドである!
  • 研究者に自己プロビジョンされた会話型演算とデータ解析リソースへのアクセスを提供するユーザフレンドリーなクラウド環境!
  • データ転送および認証用のGlobus!
  • 研究者がカスタマイズ可能な仮想マシンのユーザ選択可能なライブラリ!
  • 地理的に分散した環境;Internet2とXSEDEのリソースを活用!

ロールアウト 計画は現在進行中のテストギアのインストールと開発で積極的であり、本番ギアのインストールは夏を通して予定されている。初期の「フレンドリーなユーザ」用のアクセスはSC2015までに予定されており、本格運用は2016年1月になる。

計画では、Jetstreamはインディアナ大学、テキサス州立大学(TACC)、およびアリゾナ大学に跨った複数サイトのプロジェクトだ。詳細は下のダイアグラムに示されている。

20150521-F1-Jetstream-schematic-copy

Hancockは支配手的な利用は次の3つの領域になるだろうと語っている:

  • 来週の数千コアよりも今、一握りのコアを必要とする研究者。
  • カスタマイズされた独自の仮想マシンを作る必要のあるソフトウェア・クリエイターおよび研究者。
  • 科学へのゲートウェアをサポートするバックエンドとして。

科学領域の多様な範囲と事例がJetstreamを使う予定である。Hancockはいくつかを引用している:生物学;地球科学/極地科学;フィールドステーション研究;地理情報システム;ネットワーク科学;観測天文学;そして気候だ。

特に使い易さを保証するソフトウェアが大きな課題だ。「36個もボタンがあるようなものを欲しいのでなく、ただVLANを設定しろと言いたいだけなのです。つまり、ほとんどの領域の科学者が使いたいと思うようなものではないのです。このプロジェクトで私達は要件を簡素化できると感じています。」とHancockは語る。

Hancockによると、ソフトウェアのレイヤーは次を含んでいる: Atmosphereイインタフェース;OpenStack;KVM;CentOS Linux。この考えは、現在広く使われているツールを使い、使い易いインタフェースを提供しようというものだ。例えばAtmosphereはiPlant共同研究で現在使われているもので、この環境の中に300程度のVMを持っている。驚く事ではないが、これらはバイオ中心だが、多くの分野からもっと多くのVMが時間とともに追加されると予想されている。

先の11月の発表によると、最初のJetstreamの資金は660万ドルであった。さらにおおよそ500万ドルが5年間に渡って期待されており、インディアナ大学がこれまで受けた中で最大規模の資金となり、全国の研究コミュニティに対して計算とデータストレージサービスを提供する予定だ。

シカゴ大学がデータツールのプロジェクトを提供し、既存の環境との連携認証を組み込む。ジョンズホプキンス大学もプロジェクト・パートナーであり、その専門知識と銀河コミュニティへの深いつながりを提供する。保守と運用については、さらに資金を持ったパートナーが、仮想ワークショップを提供するような活動にターゲットを絞って参加してくるとHancockは述べた。

提案書をまとめる際に、「私達は2013年版XEDEクラウド報告書を検討し、このレポート中の12事例中の10個にターゲットを絞ってJetstreamを使いました。」とHancockは語った。

WranglerBridges、Jetstreamを見る間に、これらのコミュニティのいくつかを三角測量できると思いました。これは素晴らしいオーバーラップです。HadoopはJetstreamにはあまり適合しませんが、WranglerやBridgesには非常に良く合うと思われます。Wranglerでサポートされている以上の異なるスケールにおいて、もっと多くの会話型VMの利用のいくつかはJetstreamでうまくサポートされるでしょう。」

ここに15分間のHancockのプレゼンテーションビデオのリンクがある。https://www.youtube.com/watch?v=YEyjFpvGwo0&feature=youtu.be