世界のスーパーコンピュータとそれを動かす人々


10月 28, 2015

Moab、カナダの病院でHPC4Healthクラウドの構築を支援

HPCwire Japan

Tiffany Trader

HPC、クラウドおよびビッグデータの収束のさらにもうひとつの例として、Adaptive Computing社はクラスタおよびクラウド管理ソフトウェアのMoabが、カナダの医療機関のニーズに対応するために構築されるパイロットIT基盤の一部となることを発表した。健康科学のためのハイパフォーマンス・コンピューティングもしくは短縮名でHPC4Healthと呼ばれるこのプロジェクトは、研究者や臨床医がオーダーメイド医療の可能性を解きあかすためにHPCやビッグデータを活用できるように支援するために作られたのだ。

創立パートナーには、カナダ最大の病院である病気の子供のための病院(SickKids)と大学健康ネットワーク(UHN)のマーガレット王女癌センターの2病院が含まれている。一緒に協力することで、共同研究者達は、リソースを効率的にバランスするが、複雑な分子解析や医療画像のワークロードを処理する十分な処理能力とストレージ能力を持つための計算基盤のモデルを構築したのだ。このプロジェクトはTorontoで開始されたが、パートナー達はサービスへのアクセスを最終的にカナダ中に広げるために、より広いビジョンを共有している。

7月に発足し、SickKidsのデータセンターに配備され、HPC4Healthのインフラは、340台のSGI計算ノード、13,024個の計算スレッド、52.7テラバイトのRAM、306テラバイトの総ローカルディスク容量、および4PBのストレージで構成されている。各機関は自分たちが管理する独自の専用リソースを持ち、プラスで共有プールへもアクセスする。Moab HPC Suite Enterprise Edition version 8.1が、エラスティク・コンピューティング、高度なポリシーおよびアカウンティング機能によって選択された。

ワークロードが増えるにつれて、Moabはこれらの要件を自動化し、ダイナミックに割り付けて、その後共同プールにリソースを解放する。Moabのアカウンティング機能は、リソースがどのように利用されたか追跡し記録する。Moabはまた、例えばパブリック・クラウドのようなサードパーティーへバーストさせる能力も提供しているが、この機能はこの事例ではインストールされていない。

Adaptive Computing社のCEOであるMarty Smuinは、このような画期的なプロジェクトに参加できて非常に幸せだったと述べている。彼は、パートナーがHPCの機能をクラウド環境に持ってくる手助けをすることで、病気が癒され、命がすくなわれるという事実を強調している。

「私達はしばらくの間、Sick Kidsの病院のために働いてきました。」とSmuinは話した。「そして、最近まで、今我々が行っている多くの事が出来なかったのです。しかし、我々の関係を構築し続けることで、HPCをクラウド環境に混在させることで、彼らはかなり本質的な何かをしたかったことが分かったのです。」

HPCのコンポーネントを持つ共有高可用性インフラを構築する目的は、非常に短時間で高い安全性の下で大量のデータの処理を可能することである、とSmuinは説明した。「cloud」の定義された特長は規模の経済の原理である。コストはより大きなデータセンターに渡って償却される。Adaptive社および他のベンダーパートナー(BrightComputing、OpenStack、SGI、Mellanox、EMC、Scaler)と共に、SickKidsのパートナー達とUHNのマーガレット王女癌センターは彼らの計算リソースを共有でセキュアなデータセンター内に統合することができたのだ。

これらのパートナー達は大量のジョブ負荷を持っている、とSmuinはHPCwireに語った。彼らはDNAシーケンシングのコストを大幅にダウンさせることができ、そして今、彼らは出来るだけ多くの人々のDNAシーケンシングを行い、安全なデータベースを構築したいと考えている。リソースをもっと効率的に共有し、サードパーティーを増加させることで、治療をガイドし、究極的には命を救う決断と行うために、情報を収集し、処理し、そして引き出すことができるのだ。

共有クラウドもしくは他のデータセンターのリソースに向けたバーストを通じたリソース拡張を管理する能力は、もうひとつのクラウドの特徴である、弾性だ。エラスティック・コンピューティングは元々MoabのCloud Suiteの一部であったが、8.1の一部としてMoabに導入された。エラスティック・コンピューティングはMoabに設定されたスレッシュホールドが超えた際にトリガーされるとAdaptive社は説明している。OpenStackと一緒に使うことで、Moabはカナダのプライバシー規制に準拠するように完全に各リソースを使用後に消し去るのだ。

20151013-F1-HPC4Health-cloud-stack-800x
HPC4Health cloud stack

HPC4Healthのパートナーが利用しているAdaptive Computingのソフトウェアの他のコンポーネントには、スケジューリング、ワークロード管理、アカウンティングおよびサービス・レベル・アグリーメント(SLA)の自動実行、仮想リソースのダイナミック・プロビジョン、およびジョブアレイなどの高度なポリシーが含まれている。

同社の文献での説明は次の通り。

  • 自動SLA実行は、一貫したサービス保証とビジネス・プライオリティを満たすためにワークロードをスケジュールし調整することで、最適な時間でワークロードを完了させる。
  • ダイナミック・プロビジョニングは、現在のリソースレベルが与えられたSLAを満たさないことを発見し、プロビジョニング・ツールに対し仮想リソースの共同プールへのアクセスを行うように指示する。リソースが割り付けられ、その後必要な環境に合うようにプロビジョンされる。ワークロードが完了すると、追加されたリソースは共同プールに戻される。(プロビジョンが戻され、ワークロードマネージャから消去される。)
  • ジョブ・アレイは、同じスクリプトを使うが異なるデータセットを扱うような仕事を実行する多くのサブジョブの投入を支援する。