CERN、OpenStackを詳述
Tiffany Trader

フランス・パリでのOpenStackのサミットで、CERNのインフラサービスマネージャ、Tim Bellは、彼が「文化と技術転換」として特徴付けるOpenStackへの移行について彼の研究所での経験の概略を総合セッションで話した。
欧州原子核研究機構、CERNは、世界中の11,000名の物理学者をサポートしている。これら科学者たちは、何で宇宙が作られ、それがどのように作用しているかを理解するための彼らの探求の中の基礎研究を行うために施設を利用している。
CERNは、2012年の有名なヒッグス粒子の確認の背後にいたが、ヒッグス粒子だけが、CERNの科学者たちが探し求める基本的な問題では無かった。物理学者たちは、物質と反物質の性質に関する疑問が残されている。「例えば、惑星や星を数える時、私たちはたったの5パーセントしか見ることができません。」とBellは言う。そこには、暗黒物質や暗黒エネルギーとして理論づけられた、それが見えないような何かがあり、なぜ宇宙はそのように振る舞うのかを説明するための存在でなければならない、と彼は付け加えた。
もうひとつの根本的な問題は、重力の懸念である。科学者たちは、ヒッグス粒子が確証を助けた標準モデルで非常に上手く4つの力の3つを表現することができるが、しかし重力は本当に問題である。物理学者は、他の次元に出入りする重力子と呼ばれる粒子が存在することを理論化した。
「私たちがさらにLHCに移ることで、これらの粒子の一部を発見し、さらに宇宙を理解できることを願っています。」とBellは言う
この規模の問題を解決すると言うことは、大きな専用コミュニティとうまく構成された実験が必要である。1980年代に考案されたLHCは、フランス-スイス国境の地下100メートルにある27キロメートリングで構成されている。これは、ちょうど光の速度以下の粒子ビームを衝突させるように設計されている。
検出器は、これらの衝突の結果を観察、記録し、1秒間に4000万枚の撮影を行う。
「それは、とりわけ、沢山の素晴らしい絵を作ります。」とBellは言い、「それはまた、1秒に1ペタバイトのデータを作り出します。」
この大規模なデータストリームを処理するために、CERNは、さらなる分析のため、記録することができるレベルにデータをフィルタリングする、地下100メートルにある非常に大規模なコンピュータファームに依存している。
それでも、リングに関連する実験は、毎年最大27PBのデータを生成し、20年間保存されることが期待されている。2014年までに、CERNは100PBのアーカイブを蓄積し、主にテープに保存していた。2015年4月には、加速器はビームのエネルギーを倍増するためのアップグレードの後、通常運用に戻ってくるだろう。これは、より高いデータレートをもたらす。
しかし、CERNはさらに先を見ている。2023年までに、彼らは年間のデータ負荷を400PBと予想し、計算能力で50倍の増加を必要とする。
CERNは、これらの大規模なニーズに対応するために拡張された環境を必要としている。彼らの主力のジュネーブデータセンターは、1台のメインフレームと1台のCrayを備えていた。業界標準のサーバを使用して、この環境を冷却することが可能な平方メートル当たり6kwの最大値を超えることなく、データセンターに並ぶ空のラックを埋めることは不可能である。
機能を拡張するために、CERNは、ブダペストに追加のデータセンターを設立し、現在稼働しており、2重の100GbE接続によってジュネーブにリンクされている。残念ながら、現在の経済的、政治的状況から、スタッフの数は固定、材料の予算は減少、使いふるされた道具は高い保守費用で壊れやすいのが実情である。このような制限があるにもかかわらず、ユーザは高速な自前のサービスを期待している。
CERNの主な課題は、サポートスタッフを増加させることなくITサービス強化することだった。これは、新しい基盤ツールとプロセスを調査することをCERNに促した。彼らは計算の観点から、特別にする理由がないことを推定した。人員配置状況については、人々のためのムーアの法則が無い。したがって自動化はAPIが必要であり、文書化された手順ではない。文化的に、彼らはオープンソースコミュニティとひらめきのモデルを探っていた。
多くの議論と研究と試作の後、CERNは、ユーザに柔軟かつ機動的なクラウドをもたらすOpenStackを選択した。
彼らは、Cactusと2011年に本質的に研究プロジェクトだったことで始めていた。すぐにソフトウェアの成熟率が、CERNが独自に生産に達している率を超えそうだったことが明白だった、とBellは言う。トレーニングと機器整備の期間の後、2013年7月に発表したGrizzlyで本格運用に入った。
現在、CERNは4つのOpenStackのアイスハウスクラウドを運営してる。最大のものは、現在、3,000台以上のサーバで約75,000コアある。追加的なシミュレーション能力を提供するために合計45,000コアの3つの別のインスタンスがCERNの地下計算施設に置かれている。彼らは発注中の別の2000台の追加サーバを持っており、2015年の第一四半期までに合計15万コアを越えるだろう。コミュニティへの何らかの関心があるすべてのコードは、上流に提出され、すべてのCERN固有のコードは、github上で公的に利用可能である。
OpenStackのNova Cells機能は、短期的かつ将来のニーズを満たすためにCERNが拡張することを可能とする。Cellsアプローチは、単一の均質リソースとして見えるように一緒に組み立てることが可能なOpenStackの小さな単位を構築することができる。それはまだ根底にある環境をスケールアウトさせながら、エンドユーザの体験を簡素化する、とBellは言う。
CERNはまた、複数のクラウドにわたって問題の作業に対処することもできた。Rackspaceからの支援を受けて、CERNは、OpenStack上の連合アイデンティティ機能を開発し、このためのコードは、現在、製品提供されている。
「だから、覚えておいてください。」とBellが観客に伝え、「あなたがOpenStackを支援しているときは常に、私たちが宇宙がどのように動き、何からそれが作られているか、理解することをあなたが支援しているということを。」
OpenStackサミットの始めの方で、CERNが彼らの成果とコミュニティの貢献の認識でOpenStackスーパユーザ賞の最初の受賞者として発表された。