世界のスーパーコンピュータとそれを動かす人々


12月 26, 2013

エネルギー認識スケジューリングのための動的な電気料金

HPCwire Japan

スーパーコンピュータが成長し続けているとともに、関連して電気料金が発生する。これらの費用は現在、HPCシステムの総所有コスト(TCO)の主要な構成要素である。イリノイ工科大学とアルゴンヌ国立研究所のチームは、スマートバッチスケジューリング機構を経由してHPCシステムの電気料金を削減することを目指している。

彼らのデザインは、2つの重要な観察に基づいている。まず、並列ジョブは、差が2倍以上と高く、明確な消費電力プロファイル(図1を参照)がある。次に、動的な電力価格は広く北米に適応され、同様に世界の多くの地域で適応されている。米国では、大口電気料金は1時間から次の間で10倍程度の差がある。

このSC’13の論文で、チームはHPCシステムのための知的なエネルギー認識スケジューリング手法を提案する。これは、多様な電源プロファイルを持つジョブのスケジューリングタイミングのより良い意思決定を行うための手段として電力価格の変動を考慮に入れる。

20131116-F1-2
図1。 2012年12月中のMira上のジョブ電力プロファイル

具体的には、オフピーク期間中に高い消費電力のジョブを投入し、ピーク期間中は低消費電力なジョブを投入する。HPCシステムは、膨大な設備投資を必要とし、それ故に、この高価なリソースをフル活用することは、HPCセンターに非常に重要である。

そのために、チームは新たなウィンドウベースのスケジューリングアプローチと、Greedyと0-1 knapsackと呼ぶす2つのスケジューリングポリシー(図2参照)を提案する。デザインは、システムの利用率を低下させずにジョブをスケジュールするための効果的な方法である一方、電気の支払いを減らすことができる。

20131116-F1-3
図2。 エネルギー意識したスケジューリング

チームは、トレースベースのシミュレーションにより、設計を検証した。彼らは、システムの使用率とスケジューリングの公平性にほとんど影響を与えずに最大23%もの電気代を削減できることを実証した。HPCセンターは、しばしば最も安価なエネルギー契約にもかかわらず数百万ドルを費やしていることを考えると、このような節約は、TCOの面で数十万の減少に繋げることができる。彼らはまた、トレースベースシミュレーションから、いくつかの興味深い発見をした。

・電気料金節約の量は、電気価格比、電力プロファイル比、およびスケジューリング頻度によって影響される。
・ワークロード特性は、電気料金の節約の観点から、その設計性能に影響を与えることができる。
・GreedyとKnapsackのポリシーの両方が、システムの利用率にほとんど、あるいはまったく影響を与えずに電気代を削減することが可能であり、
・典型的なHPCワークロードのために、10〜30のジョブのスケジューリングウィンドウで十分である。

20131116-F1-4

 

20131116-F1-5

図3。GreedyとKnapsackスケジューリングポリシーを使用して2系統(SDSC-BLUE:ANL-BGPと右から左)の電気料金節約

チームはまた、アルゴンヌの48ラックIBM Blue Gene/Q、Mira上でエネルギー認識スケジューラを使用したケーススタディを示す。彼らは、システムのトレースを収集し、これらから2012年12月にマシン上で実行されるジョブに関するジョブ電力プロファイルを抽出した。研究では、月々の電気代の節約は最大で9.98%と可能であることを示す。これは、アルゴンヌでこのマシンを稼働するために約100万ドルの年間電気料金を考えると、相当なものである。