石油企業がHPCクラウド問題を掘り下げる
Nicole Hemsoth

デンマークのエネルギー会社であるMaerskオイル社は、特に炭化水素の新しい資源に対する終わりのない競争の先頭を維持する能力の面で、1962年の設立以来、数々の技術トレンドを見てきた。この企業の研究と技術のチームは、重要なシミュレーションを強化する潜在的なオプションの評価において、クラウド・コンピューティングの見込みに対して免疫が無かった。
彼らの中核コードのひとつであるEclipse Schlumberger社とAmazon Web Serviceの製品)にあるソフトウェア企業と協力する最近の実験の中で、Maersk社は油層シミュレーションの実行試験にクラウドを使った。
この実験が性能的に驚くほどの結果はもたらさなかったが、ハイパフォーマンス・コンピューティング用のクラウドに関する重要な話題の側面について、いくつかの重要な疑問が浮上した。ライセンス・モデル、全体コスト、そしてPanzura社のような企業が提供する「クラウド・ゲートウェイ」サービスの可能性は、パブリック・クラウドの資源を使ったこの実験を注目すべきものにした。たとえもし、世界クラスの基盤の選択肢として使うことができないといったゴールとなったとしてもだ。
Maersk社のサーバ基盤のヘッドであるThomas O’Reillyとの最近の会話の中で、このチームが行ったことの意図は「我々のプロダクションのHPCをクラウドに持っていくことではありません。」と語った。もっと正確に言えば、「ポイントは、一般にクラウドの可能性に関する議論を開始し、何に可能性があるのかの例として、これを使うことです」と語った。この企業はかれらの努力をハイライトし、かれらのベアメタル環境と構成の点で複数のオプションを持ったクラウドの違いを強調するダイアグラムを提供した。彼は、この試験の制限はこのコードを実行するための特定のCPU、ネットワークカードなどなどのSchlumberger社の要求事項と、同様に最新の世代のAmazon Ivy Bridgeベースのサーバが利用可能である前に実行したことであったと述べた。
O’Reillyはこの実行試験で制限付のコードを使うことを許可してくれた共同研究者であるSchlumberger社は、ライセンス・モデルに関する重要な教訓を学習した、と強調した。ここでの利益は、コア当りの価格付けの先に行くためのモデルの可能な値を直接理解することができことだ、とO’Reilly言っている。
最もポピュラーな油層シミュレーション・コードの1つであることに加えて、Eclipseは、大規模クラスタに展開した場合、そのコア当りの価格体系と必要な追加モジュールによって、数百万ドルものライセンスコストが掛かる最も高価なもののひとつだ。結局、このテストケースは小規模の企業にとって低めのスタートアップと維持費を保証する有名な概念を証明した。また、特にXeon E5と拡張ネットワークを持った最新の世代3へのアップグレードで、Eclipseのようなアプリケーションにとって快いコストモデルで、これらの利用者が合理的に良い性能が引き出すことが可能であることを証明した。24時間週7日動かしていない限りではあるが。問題は、ほとんどの主要なオイル企業はEclipseまたは選択したコードを際限なく循環させていることだ。
コスト、性能およびライセンスを念頭において、CPU数が多くてもスケールしない場合、大規模システム上でこのようなコードを実行することに何故悩まないのかと不思議に思うかもしれない。これらのシミュレーションは確率論的アプローチをとることができ、そこではすべてのシナリオを実行して、さらに焦点を絞ったシミュレーションの実行による信頼できる結果から最も可能性のある位置を示ために、エキスパートな油層エンジニアの知識を叩く傾向と決定論的シミュレーションを見ることだ、とO’Reillyは語る。いずれの場合も、非常に大きなデータセットに対する「バッチ」を実行し、分割統治スタイルで一緒に結果をメッシュにする。これはクラウド環境でジョブを実行する2つのことを意味している。ひとつは、これらの小さめの実行はクラウドベースのリソース上でうまく扱うことができ、アクセスと共有のためのPanzuraボックスのようなアプライアンスを一緒に持つことができる。
チームはクラウド高性能を維持し、可能な限り実際のプロダクションと近いように利用しようとした。サイトにおいては、ほとんどダウン時間なしに昼も夜も同じEclipseコードを実行している。興味深いことは、かれらは約40 CPUを持つInfiniBandで接続された3台のHPブレード・クラスタしか持っていないことだ、とO’Reillyは語る。これは過去のコードがはスケールしないからだ、Schlumberger社はIntersectと呼ばれる選択肢を持っているが、まだ採用していない、と彼は語った。
スケーラビリティの制限のため、このコード専用の大規模なクラスタを維持する必要がなく(アクセラレータをアピールする必要もない)、超高帯域や低レイテンシの必要性もない。クラウドを選ぶことに直観に反するように聞こえるが、間もなく我々も得ることができるように、たとえ小規模スケールで、Maersk社のような大企業が要求するような本当のプロダクションの計算要求がなくとも、チームの経験は性能の面でポジティブだった。
Amazonのようなクラウド事業者の最近の進歩によってネットワークの強化が図られたことは、さらなる顧客の獲得を意味する、それはこのようなコードがInfiniBand接続が必要だからだ(O’Reillyは10GbEが効果的であるとしたいくつかの詳細を指摘した)。