世界のスーパーコンピュータとそれを動かす人々


2月 16, 2016

Bright Computing 、HPC/ビッグデータの混成クラスタを構築する

HPCwire Japan

John Russell

従来のHPCとビッグデータ・コンピューティングを’単一’環境に融合させるという収束の最新版では、HPCwireを含む現在のHPCにおける会話の大多数を占めている。確かに非常にハイエンドにおけるエレガントな統合ソリューションはまだ製作中だ。Bright Computing社はクラスタやクラウドを、従来のHPCと現代のビッグデータの両方をサポートするハイブリッド・リソースから構成される’統合’プラットフォームに転換する多くの取り組みを行っていると言われている。

1月半ばに、Bright Computing社はクラスタおよびクラウド管理ソフトウェア・スイートのバージョン7.2をリリースした。先日、Bright社はHPC-ビッグデート-OpenStackの機能を製品に組み込むことに関する150万ユーロの助成金を欧州委員会のHorizon 2020プログラムグラントから獲得した。2016年の第1四半期のどこかで、同社はさらなるOEMパートナーを発表すると予測している、と同社の創立者でCEOのMatthijs van Leeuwenは語っている。タイミングが全てだとしたら、そのタイミングはBright Computingのためにあるようだ。

HPCとビッグデータの基盤を組み合わせる取り組みにより作られているインフラストラクチャの複雑さは、HPCコミュニティーに対する大きな課題を表しており、Bright Computingにとって急速にチャンスが広がっているのだ。HPCにおいて確立し、エンタープライズにおいては急速に成長しており、Bright Computingのプラットフォームはリソースの割り付けと管理プラットフォームである。同社の製品の広がりは(Bright Cluster Manager for HPC, Bright Cluster Manager for Big Data,  Bright Open Stack)約束した通りに提供されており、このプラットフォームは必要に応じてパブリック・クラウドに拡大できる能力を持ちながら、単一利用(HPCまたはビッグデータ)、混成利用(HPCとビッグデータ)および(プライベート)クラウドを作り出すための重要なツールとなるのだ。

Bright Computing社の創立者でCEOのMatthijs van Leeuwenは現在の状況をBeowulfクラスタの草創期と比較している。

20160203-F1-Matthijs-van-Leeuwen
Matthijs van Leeuwen

「研究者はクラスタを自分自身で組み立て始め、従来のスーパーコンピュータのベンダーを無視し、そしてそこには商用の管理ソフトウェアは何も無かったのです。誰もがHPCとビッグデータ技術を組み合わせたいと願う新しい時代に向かうとともに、我々は同じ状況を今見ていると思います。独自のスクリプト、システム管理者、そして開発運用を持ってこれらの多くのことを社内でまだ行っている人達は、それがあまりにも厄介で、時間が掛かり、そして危険だとわかっています。」

この2つの環境の融合におけるいくつかの難しさを考えて見る。Hadoopクラスタは典型的にすべての演算ノードに多くのストレージを持っている。HPCクラスタはストレージとかないディスクレス・ノードであっても良いのだ。HadoopはHadoop分散ファイルシステムを使う。HPCシステムはGPFS(現在はSpectrum Scale)、Lustre、またはNFSに依存する傾向がある。だが、van Leeuwenは直ぐにこう付け加える、「Brightのソフトウェアであれば、HPCおよびHadoopおよびSpark用のビッグデータの両方で動く、特にLustreのような共通ファイルシステムを簡単にセットアップ可能です。」

ポイントは、単一環境におけるHPCとビッグデータの組み合わせは簡単な作業ではなく、つぎはぎで作られたハイブリッド・リソースは管理するのが大きな課題であることだ。そこには対処しなければならない多くのハードウェア、ソフトウェア、および管理に関する問題がある。(例えば、HPCwireの記事Toward a Converged Exascale-Big Data Software Stackを参照) さらに、混成利用環境の性能は一般的には純粋なHPC利用には匹敵しないのだ。

van Leeuwenによると、データセンター内部における統合の一般的な傾向もまたある。「これは専用HPCクラスタ、専用Hadoopクラスタ、そして他のタイプの専用クラスタやサーバファームを持つデータセンターから離れる動きです。より多くのHPCがパブリック・クラウドに移動していますが、それが劇的なシフトになるとは思えません。それは長年に渡って緩やかであり、劇的なシフトを引き起こすようなものはないと考えています。」

Bright Computingプラットフォームは、プロビジョニング、モニタリング、およびベアメタルにまで渡る管理を行う。例えばSlurmのようなジョブスケジューラは、Brightのトップに組み込まれている。サーバから始まり、物理インフラはすべてLinuxで動作する。「我々は各サーバ内部で動作するエージェント配置することでBrightをインストールします。私はこれを基礎レイヤーと呼んでいます。」とvan Leeuwenは語った。

20160203-F1-Bright-Computaing-image-2-768x443

図(左)で示されるように、Brightに定義され、物理インフラに渡った基礎レイイヤーを通して実装される複数の異なるクラスタ(HPCまたはHadoop)を構築および管理可能だ。

最初からBrightは、van Leeuwenのバックグラウンドの自然な結果として、HPCにフォーカスしてきた。彼の確率的表面下モデリングにおける博士号(インペリアルカレッジ、イギリス)は、クレイや富士通のスーパーコンピュータだけでなくコモディティHPCクラスタ上でシミュレーションを行うことを含むHPCリソースを必要とした。最近では、同社はまた積極的にプライベートクラウド用の‘ビッグデータ’指向のインフラストラクチャ(HadoopおよびSpark)やOpenStackを扱う機能を取り入れてきている。

「多くの人々はOpenStackがベアメタルにインストールされないことに気づいていません。OpenStackをインストールする前に、多くの準備を必要とします。Brightの基礎はその全てを提供するのです。Hadoopのインストールを直接ベアメタルにしなくてもです。」とvan Leeuwenは語った。HortonworksClouderaのようなHadoopのサプライヤーがベアメタルのインストール・メカニズムの提供を開始したことは事実だであり、彼は次のように同意している。「しかし、それは専用Hadoopクラスタを構築するときだけ機能するのです。」

完全なクラスタ・リソース・割付/管理ソリューション(プロビジョニング、モニタリング、セキュリティ、およびアップデート)として位置づけることで、Brightはほとんどのジョブスケジューラと機能する。「実際に我々はそれらをインストールし設定しており、ワークロード管理のフェールオーバーの世話をしているのです。それは本当に重要な要素です。我々はワークロード管理からのすべての測定値をサンプルし、顧客がクラスタを拡大もしくは縮小する際に、ワークロードマネージャが知ることを確実にして、そうるすことでシステム管理者がBrightに10ノードを追加することを伝え、Brightは自動的にバックグラウンドで作業を再割付するのです。」とvan Leeuwenは述べた。

ユーザはグラフィカルもしくはコマンドラインでのUIを選択することができる。van Leeuwenは差別化として使いやすさを強調した。同社は製品のアップデートを年に2回行っており、最新機能を取り込むためにOpenStakのリリースを緊密にトラックしようとしている。ここにバージョン7.2のハイライトを示す。

  • Bright Cluster ManagerはDockerを使ってノード上でのコンテナーの実行の拡張サポートを含んでいる。管理者およびその他のユーザは簡単にWebワークロード・オーケストレーション・システムを設定し、もしくはKubernetesを使った他のコンテナ化されたワークロードを動かすことができる。管理者はシステムを設定し、新ユーザの追加、システムの監視、および簡単なアップデートを行うことが可能。他のアップデートとしては、個々のノードに渡る細粒度制御のためのPuppetを使った改良された組み込み、ソフトウェア・リビジョン制御用BtrFSの堅牢な代替を提供するためのZFSのサポート、そしてIntel Omni-Pathのサポートを含んでいる。
  • ビッグデータ用のBright Cluster ManagerはApache SparkだけでなくApache、ClouderaおよびHortonworksの最新リリースための拡張サポートを行っている。現在は、Apache Accumulo、Apache Kafka、 Apache PigおよびApache Stormのようなコンポートネントのためのビルトイン組み込みも行っている。Apache Drill、Apache Flink、Apache Zeppelin、およびTachyonオープンソース ・メモリ中心の分散ストレージ・システムのようなツールもまた現在はサポートされている。
  • Bright OpenStackはユーザの細粒度管理制御、大規模展開のための性能拡張、および運用環境におけるコンテーナーのような新技術を管理するためのより強力なツールを提供するOpenStack Libertyにアップデートされている。インストールはOpenStackノードを論理ユニットにグルーピングし、構築オーバーレイ、クラスタ管理グラフィックユーザインタフェース(CMGUI)OpenStackインストール・ウィザードをストリーム化し、および新しい基本CMGUISウィザードを追加することですることで単純化されている。

「新しいドッカーKubernetesの統合は、我々のロードマップ上に全く新しい軌跡を基本的にリードする機能のひとつです。いくつかの機能ではそれは一限です。やればできるのです。いくつかの機能は基本的にサードパーティーのパッケージなどからアップデートをキープしています。それから、ロードマップに新しい軌跡を本当に開く新しい機能があり、コンテーナーの統合は確かに繰り返されている改善の1つなのです。」とvan Leeuwenは述べた。

彼はコンテーナー(‘軽量’)と仮想マシン(‘ヘビー級’だがより強力)は、支配を得るためにあの手この手を使い続けることを主張していると指摘する。それはそうであるか提案であると、van Leeuwenは主張している。知識豊富なユーザにフォーカスしたコミュティにより支配されているHPCの世界では、コンテーナーはしばしば十分である。エンタープライズの要件は多くの場合非常に多様であり、より多くのシステム管理者の調整を必要とするのだ。

20160203-F1-Bright-Computing-3-768x487

「大企業では、WebサーバやSAP用の5台のサーバを迅速に必要とする事業部があり、コンテーナーは彼らには意味のないものです。彼らは仮想マシンを必要とします。もしくは、迅速にOracleデータベースをセットアップする必要のある誰かを必要とします。もう一度言いますが、コンテーナーは使われず、仮想マシンを必要としているのです。コンテーナーはユーザの観点やアプリケーションの観点からはより重要ですが、システム管理者の観点からは仮想マシンがより重要なのです。HPCにおいては、ユーザは仮想マシンよりもコンテーナーの方をより多く必要としています。」

OpenStackは仮想マシンの管理に熟達しているとvan Leeuwenは指摘している。「それは一人で立ち上がって、動き回り、シャットダウンとしますが、OpenStackは実際には仮想マシンの中で何が起きていることを制御することはできないのです。ブラックボックスとしてそれらを見ています。これらのすべての仮想マシンは、ほとんどがLinux、いくつかはWindowaや他のオペレーティングシステム上で動作しています。」

BrightはVMのオペレーティングシステムの中にエージェントを展開することでこの課題を解決しており、仮想マシン内の環境を完全に制御している。このエージェントを配置することで、もうひとつのBright基礎レイヤーをトップに置くことも可能だ。レイヤーに対するこの機能は混成ユーザ環境においては重要であると彼は述べている。「トップにHPC、トップにビッグデータなどや、Open Stackを再びなど、我々は同じものを構築し始めることができ、理論的にはトップに構築を続けることができるのです。」