世界のスーパーコンピュータとそれを動かす人々


5月 12, 2016

中国、エクサスケールを2020年までの目標に

HPCwire Japan

Tiffany Trader

中国の武漢で行われた第12回HPCコネクション・ワークショップにおいて、北京航空航天大学のDepei Qian教授が中国における第13次五カ年計画(2016-2020)においてシェイプアップされるHPC開発とエクサスケール計画に関する新たな情報を公開した。1996年よりQian教授は国家ハイテク研究発展計画(863計画)の専門家委員会の委員を務めている。現在、彼は高生産性コンピュータおよびアプリケーション・サービス環境における863主要プロジェクトのチーフサイエンティストである。

Qian教授は米国によって課されているプロセッサおよびソフトウェア技術における輸出規制にも関わらず、2台の100ペタフロップス(ピーク)システムの取り組みが継続していると認めた: 広州国立スーパーコンピューターセンターにインストールされているTianhe-2の次期システム、および上海近郊の無錫にある江南コンピュータ技術研究所に設置予定の今後のSunwayシステムである。公式発表ではこれらのシステムは「年末までに」準備できるということだが、どちらか、もしくは両方のシステムが6月のISC’16会期中に紹介されるかもしれないとの憶測もある。

ISCの火曜日のセッションにおいて、中国無錫国立スーパーコンピュータセンターのディレクターであるGuangwen Yang教授の「The New Sunway Supercomputer System at Wuxi.」と題した講演が予定されている。Yang博士はシステムを構成するハードウェアおよびソフトウェア要素とそれにインストールされるアプリケーションについて説明を行う予定だ。この講演の通知では、システムはこの夏に公式に発表されると記述されている。

中国はベストの直前でカードをプレイすることで知られており、現在のスーパーコンピューティング・スターであるTianhe-2を2年前倒しで完成している。54.9ペタフロップスの理論最大性能と33.86ペタフロップスのLINPACK性能で、Tianhe-2(「天の川」を意味)は2013年6月にTOP500リストに登場して以来、世界最高の大型コンピュータとなっている。

Tianhe-2の第二フェーズの実装スキームは2014年7月に評価され承認されている。当初の計画ではアップグレードパスとして次世代のIntel Xeon Phi(Knights Landing)プロセッサを使う予定であったが、輸出制限が米国によって行われたため、中国の国産チップ開発の取り組みを加速させる刺激となったのだ。新計画では中国製のプロセッサに依存している。「新FeiTengプロセッサの開発が進行中であり、我々はTianhe-2システムのアップグレードのためのプロセッサを待っているのです。」とQuin教授は述べている。

2番目の100ペタフロップス・システム(Sunway)は次世代の中国製ShenWeiチップを使い、1ペタフロップスの性能の汎用クラスタシステムに実装される。この構成は多種多様なアプリケーション要件を満たすように設計されているのだ。

両システムとも中国の第12次五カ年計画(2011-2015)の援助の下で開発されている。また、このプログラム下において、中国はCNGrid(中国の国家HPC環境)用に新たな運用モデルとメカニズムを探求しており、アプリケーションを促進するためにCNGrid上にクラウドライクなアプリケーション群を開発している。

CNGrid

CNGridのサービス環境は中国全体の計算とストレージの主要なリソースとなっている。現在、この環境は、当該環境の運用のために使われているソフトウェア・パッケージであるCNGridスイートによって可能となっている、とQianは指摘している。全体で14ノードあり、8ペタフロップスを超える総合演算能力と、15ペタバイト以上のストレージがある。このオーガナイザーは400を超えるソフトウェア・アプリケーションとツールを導入しており、また1,000以上のプロジェクトを支援するために、この環境を利用している。

領域指向のアプリケーション群は、利用者にサービスを提供するためにCNGridの上に確立されている。現在3つのアプリケーション群が開発中である:工業製品設計と最適化、創薬、およびデジタルメディアだ。

中国はまた、核融合シミュレーション、航空機設計用CFD、創薬、デジタルメディア用レンダリング、大型機械用構造力学、そして電磁場環境用シミュレーションをサポートする多くの並列ソフトウェア開発の取り組みを行っている。並列度レベルは300,000コア以上が要求されており、30パーセント以上の効率である。

課題

20160502-F1 Depei-Qian-ASC16-China-Weakness

Qian教授は中国の主な弱点について、最も重要であるのはカーネル技術のギャップと、米国の禁輸措置への対処におけるTianhe-2のアップグレードに適したアクセラレータの欠如だと説明した。「現在、システムをアップグレードするために有効なアクセラレータがなく、それが中国政府の観点から見て重要な問題となっています。」と述べている。「我々は計画を変更して独自プロセッサに依存しなければならなかったのです。我々は、システムソフトウェア、国産プロセッサ、ツール・ソフトウェア、そしてまたアプリケーション・ソフトウェアを早急に必要としているのです。国産プロセッサ関連のエコシステム無しでは、我々はこの点で成功しないでしょう。」

また、新しいデバイスにおける弱点も指摘した。メモリ・ストレージやネットワークばかりでなく大規模な並列アルゴリズムやプログラム、システムソフトウェア、商用ソフトウェアなどだ。「これは中国における非常に特殊な現象です。」とQianは述べた。「現在、中国は輸入の商用アプリケーション・ソフトウェアに依存しており、そのソフトウェアは非常に高価で、また並列度で限界があり、規制によって制限されているのです。広州のセンターはベンダーから自由にシステムソフトウェアを購入することはできないのです。」3番目の弱点は多くの国に共有されていることだ:人材不足だ。「IT側もしくは領域側のみしか知らない人が多く、HPCで働く人が不足しているのです。我々はもっと能力があり、また学際的な人を必要としているのです。」とQianは述べている。

第13五カ年計画はエクサスケールが目標

第12次五カ年計画の下での継続的なスーパーコンピューティングの進捗状況を説明した後に、Qianは世界で最も野心的なエクサスケール・プログラムのひとつを開始した中国の第13次五カ年計画の真新しい要素について説明した。成功した場合には、このプログラムは2020年末までに35MWの電力制限内でエクサフロップス(ピーク)・スーパーコンピュータを完成させるのだ。

中国は自国の研究体制の見直しと100のプログラムを5つのトラックに再編する真っ只中にある:基礎研究プログラム;メガ研究プログラム;重要研究と開発プログラム;エンタープライズ指向型研究プログラム;研究センターと人材プログラムである。

このセッションの中でフォーカスされている新トラックは3番目の、重要研究と開発プログラムだ。HPCにおけるトラック3主要プロジェクトの提案は2015年9月に提出され、2016年2月に開始されている。

重要プロジェクトの主要な柱は、エクサスケール・コンピュータを開発し、技術移転によりコンピュータ産業と中国が制御するHPC技術セットを推進することである。主なタスクは次世代スーパーコンピューティングの開発、CNGridのアップグレートと転換、そして領域用HPCアプリケーションの開発である。環境、エネルギー、気候、医療、産業および科学に広学グランドチャレンジな問題に対処するために、堅牢なスーパーコンピューティング・プログラムが重要であると見られている。

20160502-F1 Depei-Qian-ASC16-Motivations-slide-768x547

 

Qian教授によると、ナンバーワン・プライオリティのタスクは、性能、エネルギー消費、プログラム可能性、信頼性およにコストをバランスする多目的に最適化されたアーキテクチャをベースとしたエクサスケール・スーパーコンピュータの開発である。

この目標を達成するために、中国は3-Dチップ・パッケージ、シリコン・フォトニクスおよびオンチップ・ネットワークを使用する新しいハイパフォーマンス・インターコネクトに関する研究に資金提供している。ヘテロなコンピュータ用のプログラミング・モデルは、プログラムの容易性とヘテロなアーキテクチャの性能の活用を強調している。

このプログラムにはエクサスケール・コンピュータ技術の検証のためのプロトタイプ・システムの開発が含まれている。計算機科学者は10,000台以上のノードと、電力要求がエクサスケールに向けての最大の障害のひとつであると知られていることからエネルギー効率技術をサポートできる可能性のあるエクサスケール・コンピュータ・アーキテクチャやインターコネクトを探求するのだ。

エクサスケール・プロトタイプは約512台のノードで、ノード当たり5-10テラフロップスで10-20 Gflops/wattを提供し、ポイントツーポイントの帯域幅が200 Gbps以上となる予定だ。MPIのレイテンシーは1.5 マイクロ秒以下となる必要があるとQianは述べている。開発にはまたシステム・ソフトウェアと効率を検証するために使われる3つの典型的なアプリケーションが含まれている。

ここからは、エネルギー効率に優れた演算ノードとハイパフォーマンス・プロセッサ/アクセラレータ設計のためのスキームを開始していく。

20160502-F1 Depei-Qian-ASC16-exascale-key-technology-slide

「これらの重要な技術開発に基づいて、最終的に我々はエクサスケール・システムを構築するのです。」とQianは語った。「我々の目標はピークでエクサフロップスを達成するという野心ではありません。我々はLINPACK効率で60パーセント以上の達成を見ています。メモリはむしろ制限されており、約10ペタバイトで、エクサバイト・レベルのストレージを搭載します。」

「我々は20メガワットのシステム目標に5年以内で到達できるとは考えておらず、我々の目標はシステムで約35メガワットです;これは30 Gflops/wattのエネルギー効率を意味しています。予測されているインターコネクトの性能は500 Gbps以上です。」

20160502-F1 Depei-Qian-ASC16-exascale-system-slide

エクサスケール・プログラムの最終目標は技術移転である。中国はエクサスケール・システムの技術をベースとしたハイエンドのドメイン指向のサーバを出すように取り組んで行くとQianは述べている。これらのサーバはノード、インターコネクト、スケーラブルI/O、ストレージ、エネルギー節約、信頼性、アプリケーション・ソフトウェアにおける進歩を活用するのだ。

教授はまた中国のソフトウェア戦略についても長々と話をした。「我々はアプリケーションと重要技術を区別することはできません、そのため、その方向での共同の取り組みがあるのです。」デモ・アプリケーションは数値原子炉、数値航空機、数値地球、数値エンジンに広がっている。

計画ではソフトウェアのいくつかを製品にして、少なくとも50のユーザで採用されることだ。この取り組みを支援するために、中国はHPCアプリケーション・ソフトウェアのために、3つの国家レベルの研究開発センターを設立する。

教授は、海外技術への依存を排除する中国の「自己制御」戦略が単にプロセッサや他のソフトウェアを参照するものではない、と強調した。「我々の計画に反映されている取り組みのひとつは、近代的なスケール・システムの開発能力を改善するためにシステム用の並列アルゴリズムと並列ライブラリを開発することです。」と彼は語った。

中国の改装されたプログラムの最後の新要素は教育用のプラットフォームを開発して、計算リソースとサービスを学生や大学院生に提供することだ。

新しい重要プロジェクトの提案公募は2016年2月19日に発行されている。提案は次の2ヶ月間で審査され、選定されたプロジェクトが公表される予定だ。