世界のスーパーコンピュータとそれを動かす人々


11月 5, 2015

“ASCI”20周年: David TurekがIBMを回顧する

HPCwire Japan

John Russell

20年前Bill Clinton大統領は、合衆国が核実験無しに米国の核兵器を維持することを発表した。もちろん、課題はそのような困難なタスクをどのように実際に実行していくかであった。手段は途方もなく成功した備蓄管理プログラム(SSP)と、いつの日か米国のスーパーコンピューティングを大きく推進することも含めた加速戦略的コンピューティング構想(ASCI)であった。

ホワイトハウスとDOEはイベントにおいて、国務長官John Kerry、エネルギー長官Ernest Moniz、および3国立研究所(ローレンスリバモア国立研究所、ロスアラモス国立研究所、サンディア国立研究所)のディレクターを代表した2人のパネルのコメントと共に、ASCI開始の創立記念日を迎えた。ASCIは2005年に高度シミュレーション・コンピューティング(ASC)プログラムに移っており、広く任務を行っている。

1999年に当時カリフォルニア工科大学とDOEで、現在アルゴンヌ・リーダーシップ・コンピューティング施設のディレクターであるPaul Messinaは次のように書いていた:

「ASCIの目標は絵空事ではありません。すでにASCIの資金で、コンピュータ業界はサンディア国立研究所に1台(Intel)、ロスアラモス国立研究所に1台(SGI-Cray)、そしてローレンスリバモア国立研究所に1台(IBM)の3システムがインストールされており、実アプリケーションで1テラフロップス以上を維持することができます。インストール当時、各コンピュータは全米科学財団(NSF)のスーパーコンピュータセンター、国立エネルギー研究スーパーコンピューティング・センター(NERSC)、そして他の研究所のものよりも20倍以上強力でした。しかしこれは始まりにすぎないのです。2002年までに、コンピュータ業界は2つのシステムより10倍強力なシステムを提供し、またその間に、LANL/LLNLコンピュータより3倍強力なコンピュータを提供する予定です。5年後の2004年までに、コンピュータは毎秒100兆回の計算ができるようになるでしょう。」[i]

現在もちろんトップのスーパーコンピュータはペタフロップス・マシンであり、新しい国家戦略的コンピューティング構想がエクサスケール・コンピューティングに向けたコースを辿っている。

このイベントではErnest Moniz、John Kerry、エネルギー副長官Elizabeth Sherwood-Randall博士、NNSA管理官Frank G. Klotz中将(退役)およびNNSA副管理官Madelyn Creedonが参列していた。またパネルディスカッションも開催された。

  • パネルI:冷戦から無実験体制へ – 課題と機会 –
  • パネルII:現在の備蓄の評価と20年後の予測

このイベントは、国際イラン核軍縮条約の実装としての米国の強さを示す絶好のタイミングであった。Kerryのコメントも最近のイランとの取引に関するものであった。

20151021-F1-dave-turek-headshot

IBMのエクサスケール・コンピューティング担当の副社長であるDavid Turekは、ASCI、スーパーコンピューティングおよびIBMにける刺激効果、そしてこのプログラムにおけるIBMの役割についてブログで述べている。

それはスーパーコンピューティングを何度も何度も再発明するのに必要なもの

私はいつもは記念日を祝うタイプではないが、それがスーパーコンピューティングにおける米国政府とIBMのコラボレーションである場合には例外だ。

今日は加速戦略的コンピューティング構想(ASCI)の20周年記念日である。これは米国の核兵器を保護するエネルギー省のプログラムであると同時に、IBMが最もコンピュータ領域が要求される中でのリーダーシップをとることを助けたのだ。

国立研究所の科学者の助けで、IBM社員のチームは5世代のスーパーコンピュータを生産し、世界で最高速のマシンのランキングに何度も入ってきた。我々が現在向かっているのは、ビッグデータと認識コンピューティングの時代のためにゼロから設計されたデータ中心のシステムである第6世代のコンピュータの開発である。

このプログラムはIBMが1990年代初頭に倒産仕掛けた後のリバウンドを助けることとなった。

ASCIの最初の契約を交わした時のことを覚えている。IBMとDOEの人達がIBMの会議室に集まっていた。その時意外にも、IBMの当時新CEOであったLou Gerstnerが突然入ってきて、ぶっつけ本番の発言を行ったのだ。彼は次のように言った。「IBMはハードな問題を解決することが使命です。これは最も困難な問題です。私たちは全力を尽くします。」

私は椅子に座っていて彼は私の後ろに立っていた。彼は両手を私の肩の上において言った、「彼がそれと実行する人間です。」

息を呑んだ。

核爆発をシミュレーショする能力で国々が実際の爆弾での試験を行う必要がないコンピュータを作ることでは実際には困難であることが分かった。

最初の数年間が最も厳しかった。

私はそれまでIBMでハードウェアおよびソフトウェアの経験を約20年持っていた。最も適切言うと、IBMのメインフレームをスーパーコンピュータに転換する作業に取り込まれたのだ。結果は出なかったが、そのプロセスの中で我々は何がハイパフォーマンス・コンピュータを作るために必要かについて多くを学んだ。我々はエネルギー省と取り交わす直前に、新しい技術戦略で我々のスーパーコンピューティング研究を再出発させたところであった。

迅速にASCIプロジェクト開発チームを作り上げるために、私はHudson Valley中のIBMのオフィスおおび研究室から人をピックアップした。何人かは20代でまだ青かったが、コンピューティングを最高するための神経を持っていた。

我々は多くの急速な選択を行った。我々はIBMが科学用ワークステーション事業のために開発したプロセッサとシステムを採用した。UNIXはオペレーティングシステムだった。すべてのプロセッサを繋ぐために新しいネットワークを開発しなければならなかった。我々はオープンソースソフトウェアをIBMで最初に使ったグループのひとつだった。我々はすべてを自分でコードするために迅速に動かなければならなかったのだ。

このような複雑なシステムを開発および製造するために新しいプロセスを開発する必要があった。数千、後には数百万のプロセッサだ。

各新世代毎に、要件は劇的に増加した。最初のマシンは演算性能で3テラフロップスを出した。現在の世代は20テラフロップスを出す。これは我々が個々の技術を発明するのでなく、完全に新しい計算アプローチを発明しなければならなかったことを意味している。

20151021-F1-IBM_Blue_Gene_P_supercomputer

例えば2000年代の初めに、IBMリサーチとローレンスリバモア国立研究所の科学者達は、数百万のシンプルで低電力のプロセッサを活かした新しいスーパーコンピューティング・アーキテクチャを作るために集まった。このアーキテクチャをベースとした最初のシステムはBlue Gene/Lと呼ばれ、信じられない程のエネルギー効率を持って日本の地球シミュレータの性能を10倍以上超え、スーパーコンピューティングにおける米国のリーダーシップの再獲得を助けたのだ。

現在、我々はさらに次の世代のスーパーコンピュータを国立研究所のために開発している。
現代の膨大な量のデータを効率的に処理する唯一の方法が再びコンピューティングを再考する原則に基づいている。すべてのデータを中央処理ユニットに転送する従来のアプローチをフォローするのでないデータ処理を考える必要があるのだ。

最初にこのソリューションを提案した際には、我々は実際に笑われてしまった。しかし今日、データ中心コンピューティングは時代が進むにつれて技術業界で受け入れられるようになってきた。

ASCIプロジェクトを通して、私が考える教訓が
コンピュータ業界で大規模開発プロジェクトにとって重要であることが分かった。最初に、ハードウェアおよびソフトウェア技術のすべてにおけるスペシャリストのチームを編成しなければならない。2番目に、大きな絵を見なければならない。単独でサーバコンピュータを考えてはいけない。計画すれば、最もコンピューティング・タスクの要求の高いことを処理できる大規模システムのサーバや他のコンポーネントを組み込むことができるのだ。

もうひとつ驚異的な経験から学んだ重要な教訓がある: 聡明で大胆不敵な人を採用し、ほぼ不可能なことをするように頼みなさい。チャンスを彼らがチャレンジにするのだ。

[i]は化学科学技術コンピューティングと通信技術の進歩の影響:ワークショップのレポート http://www.ncbi.nlm.nih.gov/books/NBK44974/