世界のスーパーコンピュータとそれを動かす人々


8月 7, 2015

バイオインフォマティクス・アプリケーション用のスクリプトがHPCファイルシステムの”もつれ”を止める

HPCwire Japan

Ken Chiacchia, Senior Science Writer, Pittsburgh Supercomputing Center

テキサス先端計算センター(TACC)のAntonio Gomez Iglesiasによると、NSFのXSEDEネットワークのスタッフが、HPCシステムを使ういくつかの一般的な科学アプリケーションをスケールする際に見られるファイルシステムの”もつれ”を避けるスクリプトを作成した。この修正は同様のアプリケーションを採用している多くのユーザに役に立つと、ミズーリ州セントルイスで開催されたXSEDE15会議におけるプロゼンテーションの中で彼は述べた。

「HPCの多くのユーザは科学アプリケーションをブラックボックスのように使っています。」とXSEDEの拡大協調支援サービスのメンバーであるGomezは語った。これは自分の研究をするのにHPCのテクニックを学びたいと思わない研究者にとって恩恵ではあるが、デスクトップ・コンピュータ用に書かれたプログラムを並列計算環境に適用する場合、「実装は常にベストであるとは限らない。」

例えば、米国国立生物工学情報センターのBasic Local Alignment Search Tool (NCBI-BLAST)は
クエリのためにデータベースを開き、データと読み、そしてデータベーツを閉じるのです、とGomezは説明した。TACCのStampedeシステムでは、これが膨大な数のリクエストを作り、ファイルシステムにストレスを与えている。

共同研究者達は、NCBI-BLASTのデータをファイルシステムに戻すのではなく、一時的にローカルディスクに保管するスクリプトを開発した。この変更はファイルシステムの影響を大幅に低下させるだけでなく、Stampedeの900コアを使用した際にはおおよそ4倍にテスト計算に必要な時間を短縮したのだ、とGomezは語った。

新しいスクリプトを開発したこのチームには、Gomez、アイオワ州立大学のArun Seetharam、NOAAのCatherine PurcellとJohn Hyde、ピッツバーグ・スーパーコンピュータセンターのPhilip Blood、そしてアイオワ州立大学のAndrew Severinがいる。HPC最適化BLASTを実行するスクリプトおよびドキュメントは次で見られる。https://github.com/ISUgenomics/StampedeBLAST