HPCの歩み50年(第145回)-2007年(k)-
Ken KennedyやJohn Backusが死去し、Jim Grayが行方不明になった。アメリカ議会はAmerica COMPETES Actを成立させた。NSFはUIUC(イリノイ大学)にBlue Watersというスーパーコンピュータの予算を付け、IBMと開発することになった。
世界の学界の動き
1) PlayStation 3によるFolding@home
Folding@homeは、2000年10月からStanford大学を中心に行われている分散コンピューティングのプロジェクトで、いわゆる「遊休資源グリッド」の代表格である。タンパク質のfolding(折りたたみ)を解析するものであるが、本格的なMD (molecular dynamics, 分子動力学)を数μsの長時間にわたって実行するのではなく、数psのMDを実行して、その結果を非常に多く集めて、統計的にfoldingが起こるまでの緩和時間を予測する計算である。最初はx86のプロセッサであったが,その後GPUも使われるようになった。
Wikipediaによると、2007年3月22日にはソニーのPS3 (PlayStation 3)でも参加ができるようになり、9月16日には1 PFlopsを達成したという報道があり話題となっていた。何台のPS3を使用したかは不明である。ピーク性能を合計しただけではないようである。もちろん、PS3で性能が出るような計算に目的を絞っている。具体的には水などの溶媒を連続体近似するImplicit Solvation Modelを使い、メモリを節約し、Cell B.E.の256 KBのローカルメモリで収まるようにして計算を行っているようである。これはGPUの場合と同様であるが、Cell B.E.はGPUより柔軟性があるので、溶媒を直接扱うExplicit Solvation Modelでも扱えるとのことである。
2) TRIPS Processor
Texas大学Austin校のBurger教授等は、2007年4月30日、TRIPS Processor(Tera-op Reliable Intelligently adaptive Processing Systems)のプロトタイプを公開した。TRIPSはEDGE (Explicit Data Graph Execution)というISA(命令セットアーキテクチャ)に基づき、膨大な数の実行ユニットを並列に実行できる。DARPAから$20Mの支援の下、IBM、Intel、Sun Microsystems社と共同研究を行っている。
3) SuperPI
SuperPIは、1995年に東京大学金田研究室の金田康正らが公開した、円周率計算プログラムであるが、2007年7月、Intel Core2で104万桁が10秒を切った。1992年に出たベクトルコンピュータ HITAC S-3800/480(1プロセッサ当たり 8GFLOPS)で実行すると,104万桁がCPU時間で約5秒,経過時間で約10秒程度であったが、すでにIntel Core2 は S-3800 を既に上回っているということのようである。金田・高橋らがSuperPI をリリースしたのが,1995年9月(Windows 95が出る前)であったが,当時の標準的な PC だった Pentium 90 MHz では,104万桁が約40分も掛かっていた。
4) Petascale本
“Petascale Computing: Algorithms and Applications”という本(616ページ)がCRC Pressから2007年12月22日に出版された。日本からは、MD-Grape関係の話を理研の泰地真弘人他が、またTSUBAMEの話を松岡聡が寄稿している。どういうわけか編集者のDavid A.Bader教授(Georgia工科大学)から頼まれたので、筆者も推薦文の一つを書いた。お礼に1冊いただいた。SC07では出版イベントがあったようである。
5) Tim Berners-Leeに英王室が功労勲章(The Order of Merit)を授与
WWW (World Wide Web)の発明者であるTim Berners-Lee氏に、イギリス王室は2007年6月13日功労勲章(The Order of Merit)を授与した。この勲章は、芸術や科学に特別な貢献をした人に贈られる同国で最上級の勲章と位置づけられており、同氏にとっては、2004年にナイトの爵位を授与されたのに続く栄誉となった。氏はロンドン出身で、CERNにおいて1990年11月12日に”WorldWideWeb: Proposal for a HyperText Project”を提案した。1992年のところに書いたように、筆者は1992年1月中旬に、南仏の保養地コート・ダジュールの一角で開かれたAIHENP 92 (2nd International Workshop on Software Engineering, Artificial Intelligence and Expert Systems, 1/13-18) La Londe Les Maures, Franceに参加したが、ここでTimがデモを行っていた。PCでも、Macでも、X terminalでも、Nextでも、dumb端末でも、どんな端末からでもアクセスできることを強調していた。また1992年9月にはAnnecy(フランス)でのCHEP 92 (Computing in High Energy Physics, 9/20-25) でCP-PACSプロジェクトについて講演したが、この会議でもTimはデモを行い、ヨーロッパとアメリカの10近い高エネルギー用のWWWサーバがすでに存在することを強調していた。しかし筆者は、両方とも見に行ったものの、その意味を全く理解出来なかった。線でつながっているんだから、データが表示されるのは当たり前ではないか、という程度の認識しかなかった。
6) Ken Kennedy死去
Rice大学のKen Kennedy教授が2007年2月7日に膵臓がんのために死去した。享年61歳であった。Kennedyは並列処理、特にHPF (High Performance Fortran)、Fortran D、MPIなどについて指導的な立場にあった。1997年から1999年にアメリカ大統領諮問機関PITACの共同議長を務めた。
7) Jim Gray行方不明
1998年のTuring賞受賞。Microsoft研究所所属。2007年1月28日に母親の散骨のためにサンフランシスコ近海のファラロン諸島にヨットで向かい、行方不明となった。62歳。1998年、「データベースおよびトランザクション処理に関する独創的な研究とシステム実装についての技術的リーダーシップに対して」チューリング賞が贈られた。彼を記念する論文集 “The Fourth Paradigm: Data-Intensive Scientific Discovery”(2009) において「データ科学(data-intensive science)」を、実験科学、理論科学、計算科学に続く「第4の科学」として提示し、データの収集、管理、解析のツールのために研究資金を投入することと、通信と情報発信のためのインフラストラクチャの整備を求めた。
8) John Backus死去
Fortranの開発者。Backus-Nauer Formの発明者。IBM社員。2007年3月17日にオレゴン州で死去。82歳。1977年「特にFORTRANの研究によって行われた、実用的な高水準プログラミングシステムの設計への深く、影響力のある恒久的貢献に対して。そして、プログラミング言語の仕様記述の形式的手法についての強い影響力のある出版に対して」Turing賞が贈られた。「プログラムを書くのが嫌いだったのでFORTRANを発明した」そうである。「平成や、ふぉーとらんは遠くなりにけり」。New York Times紙の訃報によれば、かれは変わり者で、IBM社の中でもジーンズで通したとか。
アメリカ政府の動き
1) 2008年度予算
Bush大統領は、2007年2月5日に2008会計年度(2007/10~2008/9)の予算教書を発表したが、NITRDの予算要求は2007年とほぼ同じ$3056Mであった。
2) HPC R&D Act
1991年に成立し、HPCCを発足させたthe High Performance Computing R&D Actの改訂が3月に下院を通過し、8月9日に成立した。その後、2017年1月6日にも改訂されている。
3) America COMPETES Act
この法律は民主党下院議員Bart Gordon,(テネシー州6区選出)が起草したもので、2007年5月10日に提出された。彼は2007年から2011年まで下院の科学技術委員会の委員長を務めていた。America COMPETES Act とは“America Creating Opportunities to Meaningfully Promote Excellence in Technology, Education and Science Act of 2007”というこじつけのようであるが、研究開発に投資することによってアメリカの競争力を増強しようという趣旨の法律である。議会を通り、2007年8月9日にG. W. Bush大統領が署名し法律Public Law No: 110-69となった。
その後、2010年5月29日に、下院はこの法律の権限を増強する方策を承認し、7月22日、上院の商業・科学・交通委員会はthe America COMPETES Reauthorization Act of 2010を承認し、上院本会議にかけた。2011年1月4日B. Obama大統領はthe America COMPETES Reauthorization Act of 2010 (P.L. 111-358)に署名した。
内容の詳細はNEDOの橋本正洋氏の記事を参照のこと。
4) NSF
NSF (National Science Foundation)は2007年8月7日声明を出し、NSFが”Track 1”として募集していた世界最強のスーパーコンピュータの購入と運用の予算を、NSB (National Science Board、1950年にできたNSFの監督機関)が承認したと発表した。このスーパーコンピュータは、PFlopsを超える性能により、世界で最もチャレンジングな科学技術上の難問を解決することが期待されている。同時に、現在のHPC資源と建設中のペタスケール資源とのギャップを橋渡しする比較的小さいがそれでも強力な”Track 2”システムも合わせて発表した。
a) Track 1
Illinois大学Urbana-Champaign校(UIUC)は、”Blue Waters”と呼ばれるPetascleのコンピュータを購入するために4.5年間に$208Mを授与する。これは今日の典型的なスーパーコンピュータと比べて500倍強力である。システムは2011年に運用状態に入ることを期待している。Blue WatersはThomas Dunning博士の指導の下NCSA (the National Center for Supercomputing Applications)が運用し、the Great Lakes Consortium for Petascale Computationに属する学界や産業界のパートナーが協力する。
b) Track 2
Track 2としてはTennessee大学Knoxville校のJICS (Joint Institute for Computational Science)に5年間$65Mの予算をつける。パートナーは、ORNL, TACC、NCARである。Thomas Zacharia (ORNL)の指導の下、1 PFlops弱のピーク性能のシステムを提供する。これは、現在のTeragridの能力の4倍である。このシステムは通常のTeragridのポリシーで運用される。
この予算提供は、昨年Texas大学Austin校のTACCに対し、Arizona州立大学、Cornell大学などと共同で5年間$59Mを提供したに続く第2弾である。NSFのTrack 2のイニシアティブは、4年間にわたって4件の最先端のコンピュータシステムを提供することを計画している。これらはすべてTeragridに組み込まれて運用される。
報道によると、Track 1の有力候補は次の4件だったようである。
主要参加者 | システム | 推定ピーク |
Carnegie Mellon U/PSC | Intel’s future terascale processors | 40 PFlops |
UCSD/SDSC/LBNL | IBM BG/Q | 20 PFlops |
UTK/ORNL | Cray Cascade | 20 PFlops |
UIUC/NCSA/Great Lakes Consortium | IBM PERCS | 10 PFlops |
こう見ると、一番性能が低い提案が採用されたわけで、ちょうど日本の計画とぶつかる。そもそもPERCSはPFlops/WとしてはBG/QやIntel Wonder machineより悪い。NCSAなんて今まで先端スーパーでは遅れを取っていたのになんで、などという批判的な報道があった。UIUCはTrack 2にも提案していたようで、そちらは採用されなかった。
各大学のセンターは明暗を分けた。Track 1のUIUC、Track 2のTACCとUT-JICSは勝ち組であるが、PSC (Pittsburgh Supercomputer Center)はTrack 1に落ち、SDSCはTrack 1と2の両方に落ちてしまったので、来年のTrack 2の3次募集に再挑戦するであろうが、それに落ちたらセンターの存続に関わるのではないか、と思われた。SDSCでは、Fran Berman所長の指導力が疑問視された。
NSFはCHREC (the Center for High-Performance ReconfigurableComputing、シュレックと読むらしい)を2007年1月に設立した。アカデミアと産業界の連携のもとリコンフィグラブル・コンピューティングの研究を行うセンターである。センター長はAlan George。
5) ORNL
ORNLは、2007年4月に、Jaguarの一部をXT4に更新し、ピーク性能を54 TFlopsから119 TFlopsに倍増した。全体で11,708個のdual-core AMD Opteronプロセッサを含む。 主記憶は46 TB、ディスクは750 TBである。6月のTop500では2位にランクした。今後、XT4をquadcoreに置き換える予定と発表した。2004年にも書いたが、ORNLのこのシステムの発展を示すテーブルを示す。
初出 | 順位 | 機種 | コア数 | Rmax (TFlops) | Rpeak (TFlops) |
2005/6 | 11 | Cray XT3 2.4 GHz | 3748 | 14.170 | 17.990 |
2005/11 | 10 | Jaguar-Cray XT3 2.4 | 5200 | 20.527 | 26.960 |
2006/11 | 10 | Jaguar-Cray XT3 2.6 dual core | 10424 | 43.480 | 54.2048 |
2007/6 | 2 | Jaguar-Cray XT4/XT3 | 23016 | 101.700 | 119.350 |
2008/6 | 6 | Jaguar-Cray XT4 2.1 quadcore | 30976 | 205.000 | 260.200 |
2008/11 | 2 | Jaguar-Cray XT5 2.3 quadcore | 150152 | 1059.0 | 1381.4 |
2009/11 | 1 | Jaguar-Cray XT5 2.6 6core | 224162 | 1759.0 | 2331.0 |
2012/6 | 6 | Jaguar-Cray XK6 2.2 16core + NVIDIA 2090 | 298592 | 1941.0 | 2276.09 |
6) NERSC
2001年1月から稼動していたSeaborg (IBM SP Power3 375 MHz 16way, 6656cores, Rmax=7.304 TFlops, Rpeak=9.984 TFlops)は2007年末に引退することになった。2001年8月からはSciDACやINCITEプログラムに2.5億CPU時間を提供し、3000人が利用した。
NERSCのHorst Simon所長は昨年辞意を示していたが、2007年10月29日、UCBerkeleyのコンピュータ科学教授のKatherine (Kathy) Yelick(線形計算のJames Demmel教授夫人)がNERSCの新所長に指名された。着任は2008年1月(2012年まで)。
7) DOE (INCITE)
DOEの主宰する公募制の資源提供プログラムINCITE (the Innovative and Novel Computational Impact on Theory and Experiment)は、2月、ANLのBlueGene/LとT.J.Watson Research CenterのBGWの計算時間1000万ノード時間を、9プロジェクトに割り当てた。5件は新しいプロジェクトで、4件は継続利用である。新しいプロジェクトは、「泡形成の分子メカニズム」(Procter & Gamble Co.)、「密閉ナノ空間での水のシミュレーション」(UCD, LLNL)、「液体ナトリウム冷却炉の熱伝導」(ANL, UI)、「材料の破壊のシミュレーション」(ORNL)、「ナノスケールでの光の操作」(Northwester大)である。継続プロジェクトは、「タンパク質構造の高精度予言」(Washington大)、「航空機エンジン燃焼の高忠実度シミュレーション」(Pratt & Whitney Co.)、「高緯度の炭素放出と気候変動」(Alaska大)、「Parkinson秒の分子理解」(UCSD)である。今回からは民間企業も入っている。
8) NNSA
2007年10月2日、Appro社は、LLNL, LANL, SNLの3研究所に合計$26.1Mで8台のLinuxクラスタAppro Xtreme-Xを納入する契約を結んだと発表した。これはquad-core Opteronを搭載したシステムで、ピーク性能の合計は438 TFlopsとなる。このシステムはNNSA (National Nuclear Security Administration)のASC(Advanced Simulation and Computin)とStockpile Stewardship Programのためのcapacity computingのために利用される。
次回は、アメリカの企業の動きである。
(画像:Ken Kennedy氏 出典:Wikipedia )