TACCの新しいディレクターがシステムの未来を語る
Nicole Hemsoth

国立研究所とスーパーコンピューティングの各サイトはほとんどの場合、彼らの計算リソースを活用するユーザー·コミュニティによって決められる特性や「人格」を定義している。あるセンターでは特別なミッションやニーズと密接な関係がある。いくつかはTOP500チャートのトップのような全体的な性能とサイズを最大化するアーキテクチャを好む傾向がある。他は、エネルギー、宇宙物理学、生命科学や他の分野における特定のアプリケーション・ニーズを中心に考えられている。そして、ユーザベースが様々であるために、大胆で、多様なアーキテクチャ的決定をすることが知られている。
最後のカテゴリに分類されるセンターの中で、テキサス・アドバンスド・コンピューティング・センター(TACC)は、革新的な選択という言葉を変えないため、過去数年の間注目すべきサイトとなった。NSF資金によるプロジェクトから入ってくる非常に広範なユーザのために、このチームは高性能、可用性、効率性およびアクセス性の要求を、潜在的に破壊的スーパーコンピューティング技術を探求する彼らの目標に向けて、バランスさせなくてはならなかった。
例えばStampedeシステムは、異なるアーキテクチャ上で様々な性能向上のためにユーザがアプリケーションの試験、最適化および実行ができるハイブリッド環境を作るGPUとXeon Phiを成功裡に一緒に統合した最初のスーパーコンピュータシステムだった。最新のマシンであるWranglerを含む他のマシンは、従来のスーパーコンピュータでは取り組むように設計されていない科学におけるデータ集約型の新進クラスまたは「ビッグデータ」問題を探求するのに専念している。これは、これらのようなマシンの陰で、チームが通常のシステム設計のコースを超えて、新しい技術を探求しなければならなかったことを意味している。
![]() |
これらすべてのミッションおよび過去数年間に渡ってTACCの最も興味深いシステム(特にStampedeとWrangler)を引き受けることを先導しているのがDan Stanzioneだ。彼は2009年からの長期の仕事であったディレクター代理から、今回TACCのエクゼクティブ・ディレクターと正式に命名された。それより前に、彼はアリゾナ州立大学のFultonハイパフォーマンス・コンピューティング・イニシアティブの創設ディレクターとしての役割を含む他のセンターにおいても、アーキテクチャおよびシステム設計の選択において積極的に関与してきた。
Stanzioneはいつくかの大胆な選択をリードしてきており、システムアーキテクチャの多様性に彼の今後の中心的なテーマを作っている。大規模HPCやシミュレーション・リソース(Stampedeで代表される)に焦点をあてるだけでなく、彼は他の取り組みとして、ビッグデータやクラウドコンピューティングを推進している。「我々は科学コンピューティング・ワークロードの多様化を支援するために、様々な異なる種類のエコシステムが必要です。」と彼は我々に教えてくれた。このチームはStampedeからのスケーラブル・メニーコア・アーキテクチャの面と、Wranglerマシンで代表されるデータ集約の面の両方から学んだ教訓を活用すると述べた。「我々の将来のシステムはこれら2つのシステム・タイプを融合するでしょう。スケーラブルなメニーコア技術を超高速IOとブレンドするのです。」さらに多くのユーザ用にさらなる可能性を適切に追加する際には、フロントエンド・アプリケーション用のオープンスタック・ベースのRodeoクラスタを介して、このすべてをクラウド・モデルを使って活用する。
単にTACCにおける現在のスーパーコンピューティングの安定性に設定されたレベルに向けて、Stanzioneは、来年中にはアプグレードのサイクルに入り、コアに今後のKnight’s Landingアーキテクチャの変異体で半分が埋まる7位にランクされたDell構築のStampedeスーパーコンピュータの未来について語った。彼らのアーキテクチャ的な選択(Intelはこの自己ホスト型部品の正式な日付と完全な仕様をまだ公表していない)について詳細を語ることはできないが、この夏にさらにクリアになるまで待たなければならない。チームは現在、次のビッグ・システムの可能性を検討しており、今年のどこかで知ることになるだろうと彼は言っている。
TACCには他にも重要なマシンがある。インタラクティブ・ビジュアライゼーション・クラスタのMaverick、そして現在はスループット指向システムとして使われているLonestarだ。これらのシステムは堅実に利用されているが、現状ではこれらビッグ・クラスタは飽和している。「この四半期単独でのStampedeへの要求は、我々が持っていたものの6倍でした。」とStanzioneは語った。2015年の初頭にWranglerが公開される際には、これらのワークロードのいくつかはWranglerに移行することになるだろう。しかし、このシステムは従来のHPCでない問題を探求するために、ユニークなアーキテクチャと大規模グラフ・アルゴリズムと問題および大量データセット間の大規模解析を処理するために専用設計された専用マシンだ。
これらの機能性の鍵は、ここにあるさらに興味深い話のひとつである。詳細はまだ多少軽いとしても。Wranglerの中心は、Andy Bechtolsheimが創業し、長い間隠れていたが、突如EMC社の傘下になったDSSD社が供与する技術だ。我々は共同主任研究者のChris Jordanに2013年に技術詳細について話しており、もしポップアップして見たければどうぞ。しかし言うまでもなく、アレイ中に組み込まれPCIの直接接続される100,000のフラッシュ・チップの可能性を見るのはとても面白そうだ。Stanzioneは特にこのマシンについては興奮しており、さらなる詳細は2、3ヶ月以内に公表されるだろうと指摘している。
彼が言うには重要なことは、データ集約型専用マシンを所有することでTACC がこれまでの彼らのHPCのポートフォリオに適合しない新しいクラスのアプリケーションを取り扱うことができるようになることだ。これはライフサイエンス、経済、人文学などのプロジェクトで、従来のスーパーコンピュータにはあまり適応しない解析操作を必要とする幅広い分野を含んでいる。
「今はHPCで生きているには最高の時です。」とStanzione語っている。そして特にTACCにおいては良い時代のようだ。次のシステム用の領域、システムグループ用の仕事場、ビジュアライゼーション・エリア、および追加の80名を収容するためのさらに必要なオフィス・スペースに分割された新しい施設が作られるからだ。
「私は、我々が経験した成功を継続し、NSFと共にオープンサイエンスおよびHPCプロジェクトを推進したいと思っています。様々な分野とミッションに渡ってもっと多くのユーザを支援するために、これらを多様化することを楽しみにしています。私どもはHPCのリーダーでありたいし、データとクラウドにおいてはメニーコアと新しい技術を推進していきたいと考えています。」