世界のスーパーコンピュータとそれを動かす人々


9月 6, 2013

アイオワ州立大学、GPU-Phiスーパーコンピュータでサイエンスを加速

HPCwire Japan

Tiffany Trader

この夏、アイオワ州立大学は、今までで最も強力なスーパーコンピュータを受け取った。 「Cyence」は、2.6百万ドルのコストで毎秒183.043兆回の計算を行うことが可能で、38.4兆バイトの合計メモリを持っている。 見通しとして、Cyenceの1秒間の計算量は、地球全体の人口では12時間以内に同じ計算を実行することができるが、一人の人間が計算すると500~600万年かかるだろう。

 20130906-F1
アイオワ州立大学にインストールされた”Cyence”、写真:Bob Elbert

 

Cyenceは、幾分ユニークな構成となっている。 4,768コアを持つQDR InfiniBandクラスタは、16コアのSMPで構成され、GPUとPhiによって加速される。 システムの大部分は、各16コアを持つ248台のSupermicroサーバを採用し、128 GBのメモリを装備し、Gigabit EthernetおよびQDR(40Gb) InfiniBandで相互接続される。 24ノードの2つの追加セットは、同様な装備を持ち、注目すべき追加にとして1番目のインスタンスにはNVIDIA K20 Kepler GPUと2番目のインスタンスにはIntel Phiアクセラレータカードが装備される。大容量メモリノードは、32コアと1TBのメインメモリから成る。システムは、Red Hat Enterprise Linux 6.4で動作し、リソースとジョブ管理するためのTORQUE(PBS)を使用する。

このリーグの他のコンピュータと同様に、Cyenceは、困難な問題を解決するためのモデルを設計し生成するために使用されている。 7月上旬から運用を開始し、マシンはすでに生物科学、エコロジー、流体力学、地球大気科学、材料科学やエネルギーシステムなどを含む分野の広い範囲で8つアイオワ州立大の学部から17の研究プロジェクトのためのデータを生成し始めている。

「大規模なコンピューティング・パワーは、優れたパフォーマンスを提供し、そして使用しているモデルは、より現実的になります。」とアイオワ州立大学の情報技術担当副学長で最高情報責任者(CIO)のJim Davisは述べた

より強力なマシンはまた、研究のより速いペースを可能にする。モデルのパラメータは、より簡単に変更することができ、複数の結果を迅速に生成することができ、それに加えてただひとつのグループどころか複数の研究グループがコンピュータ上でモデルを実行することを可能にする。

「これは、大規模な研究モデルを実行する[Cyence]を持っている研究事業にとって非常に重要なことです。」とDavisは言う。「これは本当に発見までの時間が短縮されます。」

Cyenceは、キャンパス全体の誇りの源である。 7月にアイオワ州立大に設置し、183Teraflops(最大)システムがかろうじてTOP500ランクを逃したが、その事実は、ISUの研究者や大学院生が大多数である新規ユーザーのその価値を損なうものではない。

「それは科学に影響を与えるだろう。」とDavisは宣言した。「私たちは、教職員が自分の研究活動を加速するために利用できる施設を提供しています。」

電気工学およびコンピュータ工学担当副学部長のArun Somaniは、2011年に全米科学財団(NSF)の助成金を申請し、チームを率いていた。 彼らの提案の有益性を認識したNSFは、HPCシステムのため180万ドル以上を割当て、そしてアイオワ州立大は、80万ドルのマッチング・グラントを思い付いた。大学側では、この投資は、工学、自由芸術と科学、そして農業と生命科学の各大学と経済研究開発事務所の副社長との間で共有された。

「これは、殆どの大学でこのタイプのパートナーシップは見た事がないくらい非常にユニークなもので、3大学間でのジョイント・ベンチャーでした。」とSomaniは言い、プロジェクトの共同アピールで述べた。

最高情報責任者のDavisは同意する : 「受賞に至るまでの作業、大学の管理部門と情報技術の専門家と多くの分野からの教職員が一緒に働くことによって生産的なパートナーシップとなっています。」

大学は、すでに来年の夏に展開される「コンドミニアム・クラスター」と呼ばれる次のHPCシステムを計画している。 複数部門共有のマシンは、さらにアイオワ州立大学のHPCの協働要素を固めるだろう。

「この背後にある考え方は、教員は、共通の要件を開発し、彼らの資金をプールし、彼らが個別に購入するよりはるかに大きなシステムを購入できます。」とDavisは説明した。 「コストはサポートとインフラストラクチャを共有することによって、そして、すべての利害関係者から未使用の容量をプールすることによって低く保たれています。研究者は、別の方法で彼らが出来ることよりもはるかに大きなジョブおよびシミュレーションを実行することができます。」