本日の米国の独立記念日に、国の防衛能力を高めるために国のトップ空軍施設の一つに設置された新しいシステムのニュースをお届けします。
オハイオ州デイトンにあるライト・パターソン空軍基地内の空軍研究所スーパーコンピューティングリソースセンター(DSRC)にSpiritと呼ばれるSGI ICE Xシステムをベースとした新たなスーパーコンピュータシステムが追加された。
Top500の20位クラスの1.4ペタフロップスのシステムは、特に航空機や船舶の設計支援を中心に様々な研究開発、テストおよび評価プロジェクトを支援している。
Spiritは、4,608ノード構成によりクロック周期2.6 GHz動作の73,728個のIntel Xeonプロセッサコア、146TBの主記憶空間、そして4.6 PBのディスク容量を誇っている。
「Spiritの背景にある技術ソリューションを提供することにより、SGIは空軍の武装行動におけるミッションの成功と、人員の安全確保により一層の貢献をすることが出来る。」とJorge Titinger、SGI社長兼CEOは語る。 「さらにSGI ICE XシステムSpiritが生み出すTOP500を含め成果は偉大な名誉であり、複雑なHPCニーズに対応するために構築された効果的なスーパーコンピューティングアーキテクチャと我々の共同作業が一層認められることでしょう。」
DSRCは、国防省ハイパフォーマンスコンピューティング近代化プログラムの5つのHPCサイトの1つである。 国防総省を代表して米国陸軍の工学研究開発センターによって管理運営されているこのプログラムは、スーパーコンピューティング能力とそのサポートを国防総省各機関へ提供することを目的としている。
新しいシステムをより詳しく知るためにAFRL DRSCのディレクター、ジェフ・グラハムとHPC近代化プログラムを率いるジョン・ウェストに話を聴いた。
ライト・パターソンや他基地での現在のHPC環境はどのようなものですか?
グラハム:AFRL DSRCは、国防総省全体の顧客に対して非常に広範囲な分野に渡るサービスを提供しています。我々は最近、将来の大規模スケールなシステムを収容する情報技術複合体を設立しました 。 SGI ICE Xシステム、Spiritが最初のシステムです。この新しい複合体は、一貫性のあるサービス提供を保証し、電力損失に起因するシステム障害の可能性を最小限に抑えるため、8MWのバッテリーもしくはバックアップのディーゼル発電機に結合された循環型無停電電源装置を提供する予定です。
全ての人的資源とモニタリング機能の収容のため、大容量ストレージ、テストならびに開発部門、そしてトレーニング部門が設置されている、通りの向こう側の場所を引き続き確保しています。 さらにHPCMPシステムに加えて、我々はデスクトップや中規模のクラスタからの重要な研究を支援するために、顧客投資による特殊な要望に基づく小型のクラスタ群もサポートしています。
多くの選択肢よりSGI ICE Xシステムに決定したことに何かコメントはありますか?
ウエスト: 国防総省HPCMPは、HPCシステムの購入のポートフォリオを構築する際に国防総省のミッション要件とユーザ行動に関する最新のデータを考慮に入れ、総じて、部門のニーズに最適な新しいHPCシステムを獲得するための厳格かつ非常に洗練されたプロセスを持っています。
AFRL DSRCにおけるSpiritは、HPCMPによる4つのスーパーコンピューティングセンターにIBM、クレイ、およびSGIの大規模コンピューティングシステムを導入した最新の調達案件の一部です。
新しいシステムのそれぞれが、ユーザーコミュニティのワークロードの一部に最も効果的に合致するユニークな属性を持って導入されており、性能ポートフォリオとして管理するとき、それらは、国防総省の計算要件を満たすために最も効果的なソリューションを表しています。
モデリングとシミュレーションは、マシン利用の核をなすと思われますが・・・このシステムへのアクセラレータやコプロセッサの適用の可能性を検討しましたか?
ウエスト: プロセッサとコプロセッサ間でのラウンドトリップ遅延に起因する問題と、多くのファイン・チューニングされたHPCコードのメモリの利用形態とコプロセッサのメモリ構造とを比較した際に生じるミスマッチの問題を克服しなければ、すべてのモデリングとシミュレーションコードがアクセラレータの恩恵を受けることは出来ません。
HPCMPは、主要アプリケーションに固有のアクセラレータの適用可能性を検討されており、今後の調達でこれらの結果をもとに戦略的投資を行うことができます。 HPCMPは、現在市販されているTelsa K20sとのXeon Phi等の幾つかのオプションを含んだ小規模なプラットフォームを有しており、これらを活用してコプロセッサ個別のメモリ帯域幅(ECCの有無も含む)、メモリサイズ、ハードウェア構成、およびプログラミングのアプローチ等を直接的に比較検討することでアプリケーションの適応感度を決定しようとしています。
このシステムでのHPCMPの役割を説明してください。
ウエスト : 質問2への回答で説明したように、AFRL DSRCはHPCMPから資金を供給を受け、AFRLが代表して管理運営しています。 AFRL DSRCは、国防総省が資金提供を行う5つのスーパーコンピューティングリソースセンターの1つであり、国防総省のテクニカルコンピューティングユーザコミュニティのためHPCMPによって管理運営されており、そして、今回のSpiritの導入はHPCMPの定例的なスーパーコンピューティング調達のひとつです。基本的に購入は、DSRC及びユーザーコミュニティの代表者からの重要な助言を受けてHPCMPプログラム事務所によって管理され、購入のための資金は、HPCMPプログラムによって提供されます。