世界のスーパーコンピュータとそれを動かす人々


2月 7, 2014

データセンターにおける液体冷却の実現性チェック

HPCwire Japan

ASETEK によるスポンサー記事

データセンター用液体冷却の評価は、技術的アプローチと、データセンターのビジネスと運用に関する懸念に対処するソリューション能力の両方の理解が必要である。

実用的には、技術上の響きだけではなく、運用コスト(OpEx) および/または資本経費(CapEx) の削減を提供する必要があり、そして保守性、モニタリング、冗長性、障害の分離とサーバー保証適応範囲などの他の基準を満たす必要がある。

液体冷却へのアプローチ

ほぼすべてのデータセンターは今日、液体冷却である。ほとんどのデータセンター は、データ センター内の空気を冷却するためにコンピュータールーム空気ハンドラー(CRAH)やコンピュータールームエアコン(CRAC)ユニットに液体を用いている。CRAHユニットは、空気を冷やす冷水をもたらす。冷媒は、液体としてCRAC ユニットに入って来る。我々は液体冷却にすべきなのか?は、質問ではない。どのように最も効率的に液体冷却するのか?が質問である。エネルギーコストを削減し、拡張を緩和して、密度の増加を可能とするために、どのように液体にサーバーの熱を取り込むのか?

CRACとCRAHユニットには3つの重大な欠点がある。最初は、サーバーを冷やすのに十分に冷たい空気を生産するために、データ センター(設備液体)へ入って来る液冷媒を周囲(屋外)の空気より冷たい温度まで冷却しなくてはならない。冷却設備は高価である。2番目は、CRACとCRAHユニットはデータセンターの周辺で冷たい空気を生成し、ラックにそれを移動するため相当の労力が必要であり。3番目に、サーバーのファンを介してサーバーにそれを移動するのも相当の労力が必要である。

ラック列の後部ドアとラック列上の液冷クーラーは、サーバーに密接して空冷ユニットを配置することによってデータ センターにおける空気の移動コストを削減することに焦点を絞っている。例えば、後部ドアクーラーは、熱気がサーバーに残るように液体中へサーバー熱を送る液体冷却熱交換器でラックの後部ドアを置き換える。サーバーは、依然空冷で、設備の液体はCRAHユニットに必要とされる18℃未満および液体出口で27℃未満の同じ温度でコンピュータルームの中へ持ち込まなければならない。空気の処理は簡素化されているが、高価な冷凍機はまだ必要でサーバーファンは依然同量のエネルギーを消費する。

「直接接触」冷却は、サーバー間の冷却板が熱を転送するところで、サーバー筐体の表面に熱を冷媒へ転送する「ヒートライザー」で空気ヒートシンクを置き換え、そして建物から熱を除去できるようする。これは、サーバー内のファンを不要とし、サーバー冷却のためにデータセンター周り空気を動かす必要がなくなる。しかし、設備は16℃未満に冷媒を冷却する必要がまだあり、サーバー間の冷却板を42Uラックから35RUsまでの容量に減らす。

浸透冷却は、誘電体液のタンク内のサーバーまたは誘電体液が充填されたカスタムサーバー サーバーにあるサーバーの熱を削除するために全ての液体パスが使用される。この技術の主な懸念は、サーバーの保守、データセンター内での大量の油性冷媒、非標準部品によるサーバの改造と有効「ラック」としての乏しいスペース利用率がそれらの背後に横たわっている。

実用的な水冷システムの最も重要な進歩は、AsetekRackCDU™ Direct-to-Chip(D2C™)温水冷却システムに見る事ができる。

D2C温水液体冷却は、サーバー内で最も熱を発生するサーバーコンポーネントを直接的に液体で冷却することをもたらし、空気で残りのコンポーネントを冷却する。このソリューションは、すべて液体パスでサーバーによって生成される熱の60~80%を削除する。ポンプは、データセンターおよびサーバー内のファンのエネルギー を置き換え、温水は冷媒を冷却する必要を排除する。ソリューションの空冷側も残りのコンポーネントを冷却するのに十分な低量の暖かい空気でより効率的である。D2C液体は、劇的に冷却チラーの使用、CRAHファンのエネルギーとサーバーファンのエネルギーを削減し、最大80%のエネルギー節約と空冷式データセンターと比較して2.5〜5倍のサーバーラック密度の増加を提供する。

ビジネスとデータセンターの運用の懸念に対処する。

資本経費や運用コストでのコストの抑制は、データセンターにとっての必要性である。AsetekのRackCDU D2Cによって可能となったラックあたり30Kw以上は、 統合を可能にし、補償のための必要性を軽減する。コストは、冷却用の温水の使用によってさらに減少する。CPUは非常に高温(85℃への 67℃)で実行され、メモリとGPUによってより熱くなる。水の冷却効率(空気の4000倍)は、空気よりはるかに小さい温度差でコンポーネントを冷却することができる。これもサーバーファンのために必要な電力を低減する。

データセンターは、通常必要とされるすべてのCRACsまたはCRAHsを必要とせず、データセンター外側の大規模な冷却プラントを必要とするのでは無く、安いドライクーラーを使用できる。これは資本経費と運用コストの両方に大きな影響を与える。

監視および警告が、現代のデータセンター内のすべての技術に不可欠である。AsetekのRackCDUシステムは、温度、流れ、圧力と漏洩検出を含む監視、警告を提供するソフトウェア スイートが含まれており、 そしてデータセンター管理ソフトウェアスイートの中へ報告出来ることが重要である。

障害分離は、データセンターのための主な指標である。AsetekのRackCDUを使用するサーバーは、非常に低圧を使って、施設の水ループでCDU内の熱交換の閉じたループを温める。これは、集中排気システムを使用した冷却システムとの重要な違いである。集中化されたシステムは、高圧を必要とし、それ故に高圧力漏れと広い「爆発半径」のリスクが伴う。

冗長性は、データセンターの神聖にして侵されざるもののひとつである。Asetek のRackCDU D2CのCPUとGPUのポンプ/冷却板は、空冷ヒートシンクのための差し込み式代替品である。ひとつのポンプでサーバーに必要な冷却を十分に行うことができる。故に、デュアルCPU、デュアルGPUまたはCPU+GPUサーバーには、独自の冗長ポンプが含まれる。

保守性は、データセンターのハードウェアシステムの重要な要求要件である。したがって、Asetek RackCDUは標準的なラックを拡張し、各サーバーのための独立したためクイックコネクトを持ち、データセンターの設備チームが今日行えるように修理またはアップグレードのためにサーバーを取り外しまたは交換ができる。

保証は、サーバー製造者保証を無効することができる第2次市場の液冷ソリューションを設置することに伴う問題である。Asetekはまた、Asetekの液体冷却技術でアップグレードされたシステムに関する保証範囲を維持する保証サービスとサポート企業、Signature Technology Group(STG)との提携によってこの問題に取り組んでいる。

データセンターの液体冷却についての現実性チェックは、データセンター運用のための風変わりな技術から実用的なオプションへAsetekが液体冷却を動かしたことである。