世界のスーパーコンピュータとそれを動かす人々


1月 8, 2016

バークレーラボ、NERSCおよびESnetの新施設を祝う

HPCwire Japan

Tiffany Trader

XBD201507-00261.TIF
バークレーラボのWangホール、コンピュータ研究施設、2015年7月6日に外観を撮影

2015年11月12日、米国エネルギー省(DOE)のローレンス・バークレー国立研究所は計算科学のためにUCバークレーのキャンパスとサンフランシスコ湾を見渡す丘の上に建設された最先端の施設を正式にオープンした。著名な半導体研究者で長年UCバークレーの教授であるShyh Wangに敬意を表してWangホールと名付けられたこの近代的なビルは、国立エネルギー研究科学計算センター(NERSC)を抱え、そしてDOEのエネルギー科学ネットワーク(ESnet)のオペレーションセンターになる予定だ。

「本日ここに我々がオープニングで座っているのは奇跡です。」とバークレーラボの副所長であるHorst Simonが落成式でコメントしている。Horstは10年以上に及ぶ計画と、代替場所と訴訟を起こした回り道を参照したのだ。「このビルは計算科学を本当に変えるのです。」と彼は述べた。

20151113-S1-Berkeley-Lab-Wang-Hall-opening-ceremony-20151112
この落成式は400 Gbpsの光ネットワークの象徴的な接続も祝賀している。左から:DOEのBarbara Helland、UC学長Janet Napolitano、バークレーラボ所長Paul Alivisatos、Dila Wang、UCバークレー学長Nicholas Dirks、Ipitek CEO Michael Salour、バークレーラボ副所長Horst Simon

オープンサイエンスのための世界有数のスーパーコンピューティング・センターのひとつであるNERSCは、米国および海外の約6,000名の研究者にサービスを提供している。149,000平方フィートを占めるWangホールはまた計算の研究および理論施設として知られており、上から下までエネルギー効率のために設計されており、この地域の温暖な気候を利用してスーパーコンピュータを冷却し、機械的な冷却を不要にしている。

この施設はまもなく2台のスーパーコンピュータをWangホールの2階部分にあるNERSC内部に収容する: Cray XC30システムであるEdisonはNERSCの現在のフラグシップ計算機とCoriの第一フェーズである10キャビネットのHaswellマルチコア・プロセッサベースのCray XC40はまもなく完成する。

XBD201511-00442.TIF
WangホールのNERSC Cray Cori supercomputer – グラフィックパネルの取付中 – 2015年11月9日

以前の記事でHPCwireに話したところによると、NERSCの計算システム・グループのリーダーであるJay SrinivasanはHaswellベースのCoriを、Hopperの退役と2016年のKNLベースのCoriとのギャップを橋渡しする親しみのあるシステムとして特長づけていた。アップグレードされたXeonは、新しいエネルギー源を開発し、エネルギー効率を改善し、気候変動を理解するユーザ取り組みを支援する中において、彼らが自分たちのアプリケーションを割込み無しに実行し続けれることを意味している。

NERSCによると、第一フェーズのCori (また“Coriデータ部分”として知られている)は、Hopper(Cray XE6、ピーク性能が1.28ペタフロップス、2015年後半に退役予定)とほぼ同じ持続性能を持っている。LustreファイルシステムとAries接続をベースとしたdragonflyトポロジは、センターの現在のEdisonスーパーコンピュータと同じである。1,400台を超えるHaswellの計算ノードの各々は、Edisonのノード当りのメモリの2倍である128ギガバイトのメモリを搭載している。早期のユーザアクセスは2015年11月に予定されている。

Cori第一フェーズ・システムアーキテクチャ:

  • 1,630台の計算ノード
  • ノード当り128GBのメモリ
  • ノード当り2台の2.3 GHz 16コアHaswellプロセッサ
  • 各コアは独自のL1およびL2キャッシュを持ち、各々64KB(32KB命令キャッシュ、32KBデータ)と256KBである。またソケット毎に40MBの共有L3キャッシュもある
  • Cray Aries高速“dragonfly”トポロジ・インターコネクト、キャビネット、および冷却(Edisonと同じ)
  • 30PBのディスクを持ったLustreファイルシステム、700 GB./秒以上のI/O帯域幅
  • I/O性能の高速化のためのフラッシュ” Burst Buffer”、メモリとディスク間に置かれたNVRAM層、第一フェーズ・システムは約750 GB/秒のI/O性能と約750TBのストレージ
  • 12台のログイン/インタラクティブ・ノード
  • SLURMワークロード・マネージャ

NERSCによると、第二フェースのCoriシステムは2016年中頃にインストールされ、第一フェーズと合体する予定だ。第二フェーズは自己ホスト型のIntel Xeon Phi Knights Landing (KNL)部品がベースとなる。このシステムは持続性能で少なくともHopperの10倍となる予定で、推定ピーク性能は30ペタフロップス近傍になる予定である。

このユニークなビルに関する情報はこちらをチェック。こちらではWangホールの詳細を見ることができ、高価な計算機器や人員を守るための特注の免震床を含むビルの構造を見ることができる。