世界のスーパーコンピュータとそれを動かす人々


9月 2, 2015

科学的発見のための大規模データ探索

HPCwire Japan

Scott Gibson, Communications Specialist, University of Tennessee

高度に学際的でマルチスケールなコラボレーションと組み合わせた、よりエレガントな技術は、大量の情報を扱うために不可欠であると、XSEDE15会議において基調講演のスピーカーが語った。

特別なツールを必要とする大量のデータの山を扱うことの難点は、もし何かを探している時に解析にバイアスを吹き込むことでおそらく見つかることだ、と計算機科学者のValerio Pascucciは語った。

20150827-F1-XSEDE15-pascucci-sg
Valerio Pascucci

7月28日にセントルイスで開催されたXSEDE15会議中の「エクストリームデータ管理解析と可視化: 科学的発見のための大規模データ探索」と題された彼の基調講演において、Pascucci博士は、データ解析において、クリーンで、保証された、公平な結果を得るには、物理学、生物学、および医学で使われるアプリケーションの背後で、数学と計算機科学を統一する高度に学際的で、マルチスケールなコラボレーションと技術が必要であると語った。

彼が講演の中で表明した技術と利用事例は約10年間と、異なる科学領域における研究の取り組みを理解する溝の中へ半分沈んだことを反映し、意味論を突っ切って進んで、強固で効率的なアルゴリズムとアプリケーションの開発の中で適用される拡張可能な数学的基礎を捕捉している。

少数のツールだが素晴らしいユーティリティ

「数学を解体して、共通性を探して、より多くの人々に役に立てるようなツールを少数開発することで、ツールの経済を構築することができます。」と講演後のインタビューでPascucciは語った。そしてバイアスされたアルゴリズムを開発するのを避けるために、「可能な限りアプリケーション開発は遅らせましょう。」目標は、精神的なショートカットまたは経験則のための余地を残す技術を作り、正式な数学的アプローチを協調することである、と彼は指摘している。

しかし、これらの技術を作るには、データ管理とデータ解析、および従来異なるコミュニテイによって実行されたタスクの間および統合の相互交流が必要である、とPascucciは指摘している。これらの取り組みを組み合わせるコラボレーションは、成功するスーパーコンピュータ・センターやサイバーインフラストラクチャにとって必要な成分であると彼は付け加えた。人々のダイナミックなエコシステム、高度な計算システム、データ、そしてソフトウェアだ。

その場処理

研究者は不完全な情報で意思決定を行うようにできる必要があるので、大規模なデータセットを管理する際に、その場(オンザフライ)処理のプラットフォームが重要だ、とPascucciは語った。「これは人がしばしば過小評価するものです。」と付け加えた。

ユタ大学のエクストリーム・データ管理・解析・可視化センター(CEDMAV)においてPascucciの仲間達が開発した技術は、数テラバイトの生データ上における高性能な選択クエリで大規模科学データを処理するViSUSと呼ばれるフレームワークである。このデータモデルは、iPhoneから簡単なワークステーションまで様々な計算デバイスでの処理を可能とする並列スーパーコンピュータの入出力に対する進歩的なストリーミング技術と組み合わせている。例えば、このフレームワークは、米国エネルギー省のプラットフォームから国立研究所までの大規模な燃焼シミュレーションのリアルタイムのストリーミングを可能にしたのだ。

重要なインフラ要素と大きな構図

Pascucciの講演では、科学的発見のための計算基盤の重要な要素であるとして、性能、ユーザアクセス、解析、およびアプリケーションを述べており、6テラバイトの画像データのインタラクティブなリモート解析と可視化からその場解析のスケーリングまでの各時代のデモと利用事例を掘り下げ、データの抽象化と視覚的な比喩ばかりでなく、気候、燃焼、天体物理学、顕微鏡、Twitterなどなどに関連するシミュレーション、実験やデータ収集の例について議論した。

空間の特性に関する数学の領域であるトポロジの解析技術は、統計に対する非常に良い補完として強調する対象であった。トポロジは、ローカルおよびグローバルなトレンドを示し、高い精度で形状を説明する際に特に熟達しているが、数の原理はまた、他のデータ型の解析にも拡張可能だ、とPascucciは説明した。彼は、大規模な科学的データの表現と解析のための離散位相幾何学のフレームワークのアプリケーションを発表した。

基礎研究、ソフトウェアの展開、ユーザーサポート、および商用化を伴う共同活動の好循環のための触媒であり得る大量の情報、統合管理、分析、および大規模データの可視化に対処するための大きな構図において; 学際的共同研究の広いスペクトルは、作業をやる気にすることに相対的にプラスの効果を持つことができ、正式な理論的なアプローチを提供し、特定の分野にフィードバックを提供する、Pascucciは述べている。

PascucciはCEDMAVの創設ディレクター;ユタ大学コンピューティング・スクールの科学計算・イメージング研究所の教授; パシフィック・ノースウェスト国立研究所の研究室フェロー: ユタ大学発のVisus LLC (visus.net)のCTOである。