世界のスーパーコンピュータとそれを動かす人々


11月 25, 2013

TACC、Corralでデータ集約型科学を刺激

HPCwire Japan

Tiffany Trader

TACC、テキサス先端計算センターは、ビッグデータのすべてを知っている。米国の主導的な卓越した計算センターとして、TACCは、革新的科学と社会の発見を可能にする先進的なコンピューティング技術を必要としている。もちろん、生成されたすべてのデータは貯蔵庫を必要とする – Corralの出番である。大規模データリポジトリは、テキサス大学の研究データの保存と共有をサポートするために、2009年に配備された。

TACCウェブサイトの最近の記事では、Corralについての重要なマイルストーンを強調している。DataDirectNetworksのストレージシステムは、最近保存されたデータの合計で1ペタバイトを越え、今では100以上の固有のデータコレクションを提供する。科学記者、Arron Dubrowの記事のひとつによると、地球重力場の測定値からクジラの歌の質量スペクトル分析データまでデータセットの範囲は多種多様に取り揃えている。

システムの利用は、上昇し続けている。最近6ヶ月間で月あたり10%使用率が増加した。

「私たちは、過去数年にわたってCorral上のコレクションの数と多様性が増え続いて成長する様を見てきました。」とTACCのデータ管理とコレクショングループのマネージャー、Chris Jordanは述べている。「これはデータ収集に特化したリソースが、データを生成する研究者、および独自の研究を促進するために公共のデータコレクションを使用する研究者の世界的なコミュニティの両方にとって、現代的研究の実践のために如何に重要であるかを示しています。」

Corralは、TACCで唯一のストレージ機構ではありませんが、コミュニティへ積極的にサービスを供給する大規模なコレクションを提供するためのユニークなものである。TACCの100ペタバイトのランチテープアーカイブは、記録作業のために長期的な保管庫として機能する。このサイトの最新のペタスケールスーパーコンピュータ、Stampedeは、15ペタバイト以上の占有ストレージを備え、さらに別に20ペタバイト追加されたスケーラブルグローバルファイルシステムもある。これら両方とも継続的なシミュレーションと分析をサポートするための短期的なデータ保持に使用されている。

現在、6ペタバイトの容量を持っているCorralは、複雑で大規模なコレクションと共同研究環境をサポートするために設計・最適化されている。TACCの他の高度コンピューティングシステムへの高速接続によって科学者たちは、簡単にデータと結果を共有することができる。

TACCのデータインテンシブコンピューティングのディレクター、Niall Gaffneyによると「大量のデータへのグローバルでオンデマンドなアクセスが、以前に達成不可能な結果につながることを発見している研究者のために、Corralはデータの保存と普及を先導しています。」