【東京大学】 長時間ジョブ実行用演算加速装置付き並列スーパーコンピュータシステム 【入札公告 6/7】
【東京大学】 長時間ジョブ実行用演算加速装置付き並列スーパーコンピュータシステム 【入札公告 6/7】
機関名
東京大学
件名
長時間ジョブ実行用演算加速装置付き並列スーパーコンピュータシステム
調達方式
購入
導入時期
平成29年10月以降
これまでの流れ
手続き | 公示日 | 説明会開催日 | 締切日 |
入札 | 2017/4/17 | 2017/4/25 14:00 東京大学本部棟3階入札室 |
入札:2017/6/7 17:00 開札:2017/6/28 14:00 |
意見招請 | |||
資料招請 | 2016/11/1 | 2016/11/10 14:00 東京大学情報基盤センター1階遠隔講義室 |
2016/12/12 17:00 |
主な仕様(資料招請時)
本システムは、大学等の広範囲にわたる学術研究に対して、大規模かつ超高速の演算処理機能を提供するため、全国共同利用施設である本学情報基盤センターにおける電子計算機システムの一部として導入するものである。2016年7月より運用を開始した「データ解析・シミュレーション融合スーパーコンピュータシステム(Reedbush-U/Reedbush-H)」は既に多くの利用者に使用されているが、データ解析、機械学習等の従来の計算科学とは異なる分野を含む多様な利用者のニーズには必ずしも応えられていない。本システムは、計算資源占有利用、個別カスタマイズに対応したシステムを目指すものである。
A 長時間ジョブ実行用演算加速装置付き並列スーパーコンピュータシステムは以下のハードウェア要件を満たしていること。
a システムは演算加速装置部を備える計算ノードから構成されること。
b 総理論演算性能(倍精度浮動小数点演算性能)は2.5PFLOPS以上であること。
c 汎用CPU部の総メモリバンド幅は18TB/s以上であること。
d ノード単体あたりの理論ピーク性能が20.0TFLOPS以上(倍精度浮動小数点演算)であること。ただし汎用CPU部の理論ピーク性能が1.2TFLOPS 以上(倍精度浮動小数点演算)であること。
e 各ノードの汎用CPU部は複数のCPUコアからなり、全てのCPUコアはハードウェア共有メモリ機構により相互に接続されること。
f 汎用CPUは64ビット拡張されたIA32アーキテクチャに基づくものであること。
g ノード単体あたりの汎用CPU部の主記憶容量は256GiByte以上であり、メモリバンド幅は150GB/s以上であること。
h 演算加速装置部は複数の演算装置からなり、内部にそれらの演算装置間で共有可能な独自の共有メモリを持ち、汎用CPUと適宜データ交換を行うことにより超高速演算が可能であること。
i 計算ノード上の各演算加速装置は、15.7GB/s以上の理論ピーク転送速度を持つバスで汎用CPUと結合されること。
j ノード単体あたり演算加速装置部の主記憶容量は64GiByte以上であること。同容量が単一の演算加速装置で達成不可能な場合は、複数の演算加速装置の合計によりこれを満たしてもよい。
k ノード単体あたり複数の演算加速装置を用いる場合、演算加速装置間はそれぞれデータ転送速度20GB/s以上で直接接続されること。
l 各ノードが備えるノード間接続のためのネットワークリンクのデータ転送速度の理論ピーク値は、1ノードあたり200Gbps以上であること。複数のリンクによる理論ピーク値の合計によりこれを満たしても良い。
m 全ノード間はフルバイセクションバンド幅で接続されていること。
n ファイルキャッシュシステムとして、140TB以上の不揮発性半導体メモリデバイスからなる記憶装置を提供すること。計算ノード群から300GB/s以上の転送速度で読み書きが可能であること。
o 本センターが運用するReedbush-U/Reedbush-Hシステムに対し、InfiniBand EDR 14ポートを用いて接続すること。
B 長時間ジョブ実行用演算加速装置付き並列スーパーコンピュータシステムは以下のソフトウェア要件を満たしていること。
a 本センターが保有するReedbush-Hシステムと同等のC/C++/Fortranコンパイラ、通信ライブラリ、数値計算ライブラリ及び性能チューニングのためのツールを含むプログラミング環境が利用できること。
b 本センターが保有するReedbush-U/Reedbush-H システムのログインノードから本システムを操作でき、ジョブの投入を可能とすること。
c 本システムの計算ノード群から本センターが保有するReedbush-U/Reedbush-H システムの並列ファイルシステムを利用可能とすること。
C 導入システム全体の消費電力は、空調設備の電力を除いて200kVA以下であること。CPU、メモリおよびディスク装置が連続的に稼働し続けた際にも十分な廃熱が行えるよう、電源容量、空調、設置方式が考慮されること。設置面積は空調設備を除いて42㎡以下であること。
D 長時間ジョブ実行用演算加速装置付き並列スーパーコンピュータシステムは、Reedbush-U/Reedbush-Hシステムとログインノード群、管理サーバ群、並列ファイルシステムを共有すること。ただし必要に応じて補助サーバを用意しても良い。