分子動力学へのヘテロジニアス・アプローチ
Tiffany Trader

スタンフォード大学の生物物理学プログラムのディレクターであるVijay Pande氏は、クラウドがペタスケールBlue Watersマシンのようなスーパーコンピュータの代替品ではないが、科学者は分子動力学研究のための疎結合クラウド・コアを使用して成功しつつあると理解している。
訳注:タンパク質は20種類のアミノ酸が鎖状につながった分子であり、折りたたまれて3次元構造をなすことをフォールディングという。ウェット実験と数値実験によって、タンパク質の構造と機能の関係を解明し、医療に応用することが、構造生物学の大きな課題である。
Pande氏は、タンパク質のフォールディングの誤りがアルツハイマー病、パーキンソン病、狂牛病と多くの癌などの疾患と相関しているかを判断するために、タンパク質のフォールディングの誤りを研究する全米スーパーコンピュータアプリケーションセンター(NCSA )でBlue Watersシステムを使用している。誤りが病気につながり、薬がどのような種類のフォールディングの誤りをターゲットにすることができているを決定できれば、衰弱や致命的な病気のこれらのクラスを治療または治癒する大きな可能性がある。
大規模分子動力学(MD)シミュレーションは、伝統的に、プロセス内の最も遅い部分はコア間でデータを転送している部分である考え、密結合、高速のネットワークを持つスーパーコンピュータ上で実行されている。Pande氏は、しかし、分散コンピューティングの効率的な並列化を活用し、通信のボトルネックを回避する別の方法を開拓してきた。Pande氏の短く、独立したシミュレーションは、クラウド•コンピューティングのように、異種のハードウェア上で実行できる。ひとつのシミュレーションが終了しても、残りの部分は実行を続けているため、ボーナスとして、インフラも、ハードウェア障害に対して良い処理をできる。それは同時に、時間のひとまとまりに多くの短いランを完了し、従来のMDシミュレーションと相補的なアプローチだ。
作業の初期段階では、Pande氏のグループの研究者らは、タンパク質の折りたたみの(MD)シミュレーション詳細な分子動力学を実行するために@ homeは、Googleと簡易折りたたみ利用する。 Folding @ homeは、ボランティアが持っているデスクトップやラップトップの空き時間を使い、長時間実行させるボランティアコンピューティング•プロジェクトである。各コンピュータは、独立したMDシミュレーションのセットを実行し、 Folding @ homeは、その結果を返す。 Google ExacyleはすべてのサイクルがGoogleの研究者によって供給されていることを除いて、基本的に同じアーキテクチャを使用している。グリッドや分散コンピューティングのこの種は、いくつかによってクラウドコンピューティングの風味が、低I / Oおよび通信要件を持つワークロードに適していると考えた。
次の工程のために、研究者は、第一段階の実行結果を取得し、Blue Watersにこれらを渡す。この時点で、 MSMBuilderというツールは、構造体に類似している分子を識別し、微視的にそれらをクラスタ化する。その後、寿命の長い、あるいは準安定状態に到達している分子を決定する。このスクリーニングを通過するマイクロステートは、モデルの実行の第二段階の開始点を提供する。この分子のサブグループは、バックランの第二段階のためにFolding @ homeはに渡される。これは、単一の実験中に数回反復する可能性のあるプロセスである。
Pande氏の作品は、ワークフローが、あるいはこの場合は、ワークフローの一部が、最も適切なリソースとマッチングされ、ヘテロジニアスなHPC のさらに別の例である。
しかし、Pande氏は、従来のアプローチと競合するように彼の作品を見ていない。実際には、スタンフォード大学の研究者は、両方のアプローチの組み合わせは、彼らはエクサスケールに向かうように、次世代のコンピューティングリソースを利用するために必要であると考えている。
プロジェクトの詳細については、こちらにある。