NCGAS、生物学者のHPCを支援
Ken Chiacchia, Pittsburgh Supercomputing Center

インディアナ大学にあるNational Center for Genome Analysis Support (NCGAS) は、HPCを使う生物学者のためにサービスを拡大した。サンディエゴで開催されたXSEDE13会議において7月13日に、NCGASのマネージャーがプレゼンテーションを行った。
リチャード・ルデュク氏によると、「全ての人にはある程度のコンピューティング・スキルがあるが、徹底的なバイオインフォマティクスに必要な本当に高度なスキルを持っている人はまれである。」あらゆるレベルでバイオインフォマティクスのフィールドに生物学者が入るための入り口として、NCGASが存在する。
NCGASは全米科学財団から資金提供を受け、インディアナ大学、ピッツバーグ・スーパーコンピューティング・センター (PSC)、サンディエゴ・スーパーコンピューター・センター (SDSC)、テキサス・アドバンスド・コンピューティング・センター (TACC) が共同で運用する。ルデュク氏のプレゼンテーションと同じ日にNCGASが利用者に提供するものが発表された。
・IU製Scientific Data Archive による50テラバイトのストレージ
・長期間にわたるキュレーション (訳注:自動生成データなどに対する人手による精選と修正) サービス、生データおよび計算結果の公開
・利用者の要望に応じてコンサルティングとストレージ・リソース
ルデュク氏によると、その他のNCGASリソースは下記のようになる。
・あらゆる技術水準の生物学者へのエキスパート・バイオインフォマティクス・サポート
・ペン・ステート大学によって開発された研究ワークフロー・ツールGalaxy 、それにはデータ転送、データ加工、分析ツールがプリインストールされている
・IUによってホスティングされるスーパーコンピューター・クラウド Rockhopper
・IU製の512ギガバイトRAMを搭載する大容量メモリークラスターMason
・PSCのBlacklightその他SDSCとTACCのようなHPCリソースへアクセスするため20Gbpsの通信と5PBのストレージ
どのような水準の要求に対してもNCGASはサポートするとルデュク氏は強調した。「大部分のプロジェクトは、少しの支援しか必要としないだろう。彼らが必要とするものは、分析のための大規模なコンピューターとリソースである。しかし、一部分の研究者は、基本レベルからバイオインフォマティクスに入る必要がある。HPCをサポートしてくれる人がいなかった研究者に対しても、NCGASはバイオインフォマティクスの専門知識によって必要に応えられる。」例えばある海洋学プロジェクトでは、バイオインフォマティクスの背景が不足している研究者に対して、ゲノム解析とアノテーション(訳注:生物学系データベースに人間が書き加えた注釈)をNCGASが提供した。
企業および非営利団体が支援し、National Science Foundation の Extreme Sciece and Engeneering Discovery Environment が主催する XSEDE (xsde.org)の年次大会は、科学と社会のための研究サイバー・インフラストラクチャ統合デジタル・サービスを進めるコミュニティーである。XSDE13は、サンディエゴで7月22日から7月25日に開催された。XSDE14は、アトランタで7月13日から18日に開催される予定である。