世界のスーパーコンピュータとそれを動かす人々


1月 19, 2015

クラスタライフサイクル管理:最後の波

HPCwire Japan

Deepak Khosla

以前のクラスタ•ライフサイクル•管理のコラムで、私は組織が投資に前向きのリターンを提供しながら、アプリケーションのニーズを満たすHPCクラスタデザインを開発するために必要なステップを説明した。次のステップは、最高の価値で必要なシステムを構築することができるベンダー、またはベンダーたちを選択するための基礎としてそのデザインを使うことである。

ベンダー選定プロセスの最初のステップは、ニーズ調査から得られているクラスタの設計要件のすべて – ハードウェアとソフトウェアの両方 – を書き下すことである。本格的なRFPを行う必要はないが、少なくともハードウェア要件は、ノード数、CPUタイプ、メモリ容量、ローカルディスク容量、インターコネクトタイプ、およびストレージ容量を含むべきである。開発のこの段階では、それはある程度の許容範囲の値でこれらの要件を定義することはよい。

ソフトウェア仕様はまた、要件文書に含まれることがある。好みのオペレーティングシステム、ライブラリ、コンパイラおよびワークロードマネージャーは、特定すべきである。もう一度言うと、アプリケーションが数種類のスケジューラーの元、幾つかの異なるオペレーティングシステムで実行出来る場合、ベンダーの調査はある程度の柔軟性(最高の価値ある買い物をするときに必要)を持つため、これらのオプションを書き下すべきである。

一度、ハードウェアとソフトウェアの要件の輪郭が出来たなら、設備やIT部門にもどのくらいの電力、冷却、物理的スペースが利用可能であるかを判断するために連絡する必要がある。仕様を共有することで、彼らはこれらのための幾つかの準備オプションを用意し、任意のITソフトウェアやシステムの制約を浮き上がらせる手助けをすることができるだろう。

これを最小化する2つの決定的なリスクがある。それは、施設がシステムを運用するのに必要な電力や空調を欠いていたことが分かった場合、多くのクラスタの配備が、最後の最後で遅れてしまうことである。電力と冷却のアップグレードがHPCクラスタのために必要な場合、突発事態を防ぐため、計画プロセスに含めるべきである。さらに、任意のソフトウェアやネットワーク関連のガイドライン(例えばOS、セキュリティ、アクセスなど)がある場合、これらもまた、プロセスの初期段階で対処することが可能である。これらのIT仕様は、次に全体の要件に追加されるべきである。ここでも、可能性のある柔軟性を与えることは、最大の価値の達成を助けるベンダーによってより多くのオプションを可能にするだろう。

要件文書が準備されているように、組織もまた、HPC開発プロセスにおける利害関係者のすべてを代表する人員の構成で正式なベンダー選考委員会を作る必要がある。事業運営者、エンドユーザ、そして内部ITスタッフが関与すべきである。多くの大規模な組織において、IT部門はストレージ、ネットワークとサーバー運用を処理する3つのチームに分かれている。これら3つすべては、選考委員会に参加しなければならない。

ベンダー中立の外部のコンサルタントもまた、チームに加えることが歓迎される可能性がある。複数のHPCクラスタの導入に関する経験を持つコンサルタントは通常、要件を確認し、プロジェクト全体のために実行可能な予算を計算する際に組織を支援し、そして様々なオプションについてのリスクと恩恵のアドバイスを提供することができる。彼らはまた、多くの提案に必然的に忍び込む不要な「高価格」に駄目出しをすることによって最終的なベンダー選定の際に役に立つ。

潜在的なベンダーに接触する前の最終段階は、内部配信機能を評価することである。あなたのITスタッフをベンダーとして扱い、どの程度展開するか、もし何かあれば彼らが扱うことができるかを決定するために彼らに詰問する。これは多くのお金を節約することができる。しかし、経験から、外部のハードウェアまたはソフトウェア•ベンダーもまた、クラスタをインストールし、それらを起動し、運用するための責任がある場合、よりスムーズに展開を進められることを発見した。説明責任の一点は、スケジュールに余裕が無い時、しばしば管理が容易である。

内部機能もまた、一旦運用が始まると、誰がクラスタを管理し、サポートするのか決定するための検討をしなければならない。幾人かの従来のITスタッフは、社内のHPC専門家経験がある。新しい人材を雇う必要があるかもしれない。もしそうでない場合、多くのベンダーは、十分考慮をする価値がある上位販売が可能なオプションサービスとして管理契約を提供している。これらの管理ニーズに事前に対処しなければならない。

潜在的なベンダーを見つける

一旦、要件文書が完成すると、それはベンダーを選択するために送る準備が整う。HPC分野に全く新しい組織は、どこから始めれば分からないかも知れない。私は、お好みのコンピュータシステムベンダーがHPCソリューションを提供するかどうか、既存のIT部門に尋ねることをお勧めする。もしそうであれば、信頼できるベンダーと取引し続けられることは、彼らのソリューションがあなたのデザインを満足すると仮定するならば、素晴らしいオプションである。

ガイダンスを探すために2番目の場所は、開発者もしくは主要なアプリケーションのユーザである。彼らは、どんなHPCハードウェアやソフトウェアシステムが正常に彼らのアプリケーションを実行しているかを知っている可能性がある。あなたのアプリケーション開発者は、HPC環境でソフトウェアを実行している他のクライアントの参考文献を提供することがある。関連するLinkedInのグループに質問を投稿することによってアドバイスを求めることは、特定の潜在的なベンダーを見つける(または避ける)ための別の迅速かつ簡単な方法として知られ始めている。

HPCベンダーは、概ね3つの「層」に分けることができる。最初のグループは、Dell、HPやIBMなどの大手ベンダーで構成される。ハードウェアとソフトウェアに特化し、彼らは大規模HPCクラスタの周知のプロバイダである。次の層は、Cray、SGIやAspenのような高度にカスタマイズされたHPCシステムを提供する専門企業が含まれる。これらのグループのいずれかのベンダーは、ハードウェア、ソフトウェア、および配備サービスを含むエンド・ツー・エンドのソリューションを提供することができる。

プロバイダの3番目の層は、PCPC DirectやDasher TechnologiesなどのHPCの経験を持つシステムインテグレータである。彼らは、あなたの要件を満たすために適切なハードウェアとソフトウェアコンポーネントをつなぎ合わせるために必要となるよく開発されたチャネルを持っている。彼らはまた、エンドツーエンドの展開に対処することができる可能性がある。高度にカスタマイズされたソリューションを構築する能力を別として、ここで重要な利点は、価格競争力を提供している彼ら自身のチャネルサプライヤーの間で比較するためのオプションを提示する能力である。

少なくとも3つのベンダーを選択し、それぞれにあなたの要件文書を送付する。彼らは、あなたがオプションを探していて、任意の質問に答えるか、説明を提供してすることで満足することを知ることができる。もし、ベンダーが良いHPCチームを持っている場合、彼らはあなたが特定の仕様を作った理由の詳細について尋ねる質問があなたに戻って可能性が非常に高いだろう。反復プロセスを期待する。各段階であなたの委員会全体が関与すべきである。この議論の一部は、電話またはオンライン会議によって行うことができる。第一段階での質問と説明を受け取り、ベンダーに改訂された文書を再送する。

一方、各ベンダーが用意した参考文献を要求し、呼び出す。 ベンダーがプロジェクトの各段階(調達、配備、そして配備後)をどのように実行するのか、これらの参考文献を尋ねることで確認する。

次に、個人的なインタビューを進める。選考委員会全体と会うためにあなたの施設にベンダーからの代表者を招待する。この時点で、設計文書の最も微細な詳細は、確定すべきである。委員会は、ベンダーが実行可能なソリューションがあると確信している場合、彼らは記入された価格提案を提出する時である。委員会は、それぞれが要求したHPCクラスタコンポーネントのすべてが含まれていて、ベンダー間の比較は同一条件であることを確証するために提案を検討しなければならない。

委員会はその後、最も密接にあなたの設計基準を満たし、最高の価値を備えるHPCクラスタソリューションを提供するベンダーに投票しなくてはならない。そして、最高の価値は常に最低価格ではないことを覚えておく。最高の価値は、価格だけでなく、速度だけでもなく、ユーザーがアプリケーションをクラスタ上で実行することで生産的に得ることができる品質、システムの信頼性、そして継続的なサポートの質で考慮される。

そして、プロセスを楽しもう!