HPCの歩み50年(第144回)-2007年(j)-
ついにTop500にBlue Gene/Pが登場し、Green500の上位を独占した。FORTRANが世に現れてから50年ということで「Fortranの50年」というパネルが行われた。CellとNVIDIAが注目を浴びていた。
SC2007(続き)
7) Top500
Topの20件は以下の通り。前回の順位で括弧がついているのはシステムが増強されたか、チューニングが進んで性能が向上したことを示す。性能の単位はTFlops。
順位 | 前回 | 設置場所 | システム | コア数 | Rmax | Rpeak |
1 | (1) | LLNL | BlueGene/L | 212992 | 478.2 | 596.378 |
2 | – | FZJ(ドイツ) | JUGENE – Blue Gene/P | 65536 | 167.3 | 222.822 |
3 | – | SGI/NMCA | SGI Altix ICE 8200, Xeon quad core 3.0 GHz | 14336 | 126.9 | 172.032 |
4 | – | Computational Res. L.(インド) | EKA – Cluster Platform 3000 BL460c, Xeon 53xx 3 GHz | 14240 | 117.9 | 170.88 |
5 | – | 政府機関(スエーデン) | Cluster Platform 3000 BL460c, Xeon 53xx 2.66 GHz | 13728 | 102.8. | 146.43 |
6 | (3) | SNL | Red Storm | 26569 | 102.2 | 127.531 |
7 | 2 | ORNL | Jaguar – Cray XT4/XT3 | 23016 | 101.7 | 119.35 |
8 | 4 | IBM Watson Lab. | BGW – BlueGene | 40960 | 91.29 | 114.688 |
9 | – | NERSC | Franklin – Cray XT4, 2.6 GHz | 19320 | 85.368 | 100.464 |
10 | 5 | BNL | New York Blue – BlueGene | 36864 | 82.161 | 103.219 |
11 | 6 | LLNL | ASC Purple p5 575 1.9 GHz | 12208 | 75.76 | 92.781 |
12 | 7 | Rensselaer Polytechnic | BlueGene | 32768 | 73.032 | 91.75 |
13 | (9) | Barcelona S.C. | MareNostrum BladCenter JS21 Cluster | 10240 | 63.83 | 94.208 |
14 | 8 | NCSA | Abe – PowerEdge 1955 2.33 GHz | 9600 | 62.7 | 89.5872 |
15 | 10 | Leibniz RZ(ドイツ) | HLRB-II Altix 4700 1.6 Gz | 9728 | 56.52 | 62.2592 |
16 | (14) | 東工大 | TSUBAME Grid Cluster – ClearSpeed | 11644 | 56.43 | 102.021 |
17 | – | Edinburgh大学(英国) | HECToR – Cray XT4, 2.8 GHz | 11328 | 54.648 | 63.4368 |
18 | 11 | SNL | Thunderbird – PowerEdge 1850 2.6 GHz | 9024 | 53.00 | 64.9728 |
19 | 12 | CEA(フランス) | Tera-10 – NovaScale 5160 | 9968 | 52.84 | 63.7952 |
20 | 13 | NASA Ames | Columbia – Altix 1.5 GHz | 10160 | 51.87 | 60.96 |
トップは前回に引き続きLLNLのBlueGene/Lであるが、約60%プロセッサを増やし478.2 TFを達成した。驚いたのは4位にインドが登場したことである。Tata GroupのComputational Research Laboratoriesに入ったHPのシステムである。アメリカのマシンは合計284台。日本の最高位は東工大のTSUBAMEで、前回より2位下がった。
かつては日本がトップ20の半数を占めたことがあるのに、最近は全然振るわない。アメリカ、ドイツ、スエーデン、スイスだけでなく、インドにも負けている。2002年から2004年までトップを占めた地球シミュレータも今や30位である。
Green500も発表された。これは昨年始まった消費電力あたりの性能を競うリストである。公式には今回が初である。12位までを示す。
順位 | MFlops/W | 設置場所 | システム | Power | Top500 |
1 | 357.23 | Daresbury L.(英国) | Blue Gene/P | 31.1 | 121 |
2 | 352.24 | Max-Planck-G./IPP(ドイツ) | Blue Gene/P | 62.2 | 40 |
3 | 346.95 | IBM – Rochester(米国) | Blue Gene/P | 124.4 | 24 |
4 | 336.21 | FZ Jülich(ドイツ) | Blue Gene/P | 497.6 | 2 |
5 | 310.93 | ORNL | Blue Gene/P | 70.47 | 41 |
6tie | 210.56 | Harvard大学(米国) | eServer BlueGene | 44.8 | 170tie |
6tie | 210.56 | 高エネルギー機構(日本) | eServer BlueGene | 44.8 | 170tie |
6tie | 210.56 | IBM – Almaden Res. Center | eServer BlueGene | 44.8 | 170tie |
6tie | 210.56 | IBM Res. | eServer BlueGene | 44.8 | 170tie |
6tie | 210.56 | IBM T.J.Watson Res. Center | eServer Blu Gene | 44.8 | 170tie |
6tie | 210.56 | Renaissance Computing Institute (RENCI) | eServer BlueGene | 44.8 | 170tie |
6tie | 210.56 | University of Canterbury(ニュージーランド) | eServer BlueGene | 44.8 | 170tie |
Blue Gene/Pが上位を独占し、その次はBlueGene/Lで全然面白くない。同じBlue Gene/PでもシステムによってMFlops/Wに差があるようである。この頃はTop500からは独立していたので、それとは別に(例えば2008年2月)も発表されている。上位に変化はない。
8) HPC Challenge
HPC Challenge Award CompetitionはDARPA High Productivity Computing Systems (HPCS) ProgramとIDCの共催である。結果は以下の通り。Submitterは省略した。
(1) Class 1 Awards
G-HPL | Achieved | System | Affliation |
1st place | 259 TF | IBM BG/L | LLNL |
1st runner up | 94 TF | Cray XT3 | SNL |
2nd runner up | 67 TF | IBM BG/L | IBM T.J.Watson |
G-Random Access | Achieved | System | Affiliation |
1st place | 35.5 GUPS | IBM BG/L | LLNL |
1st runner up | 33.6 GUPS | Cray XT3 | SNL |
2nd runner up | 17.3 GUPS | IBM BG/L | IBM T.J.Watson |
G-FFT | Achieved | System | Affiliation |
1st place | 2870 GF | Cray XT3 | SNL |
1st runner up | 2311 GF | IBM BG/L | LLNL |
2nd runner up | 1122 GF | Cray XT3 Dual | ORNL |
EP-STREAM Triad | Achieved | System | Affiliation |
1st place | 160 TB/s | IBM BG/L | LLNL |
2nd runner up | 77 TB/s | Cray XT3 | SNL |
1st runner up | 55 TB/s | IBM Power 5 | LLNL |
(2) Class 2 Awards
Award | Recipient | Affiliation | Language |
Most Productive Research Implementation | Vijay Saraswat | IBM | X10 |
Most Productive Commercial Implementation |
Sudarshan Raghunathan |
Interactive Supercomputing |
Python/ Star-P |
9) 招待講演(水曜日)
水曜日のplenaryの招待講演は次の2つであった。
-Dr. Raymond L. Orbach Under Secretary for Science, Department of Energy
“The American Competitiveness Initiative: Role of High End Computation”
-Dr. George Smoot, University of California Berkeley and Lawrence Berkeley National Laboratory, 2006 Nobel Prize in Physics
“Cosmology’s Present and Future Computational Challenges”
Orbach氏は、エネルギー省の研究担当の次官であり、HPC推進派として知られている。今後、エネルギー省のHPC予算をどんどん増大していくという景気のよい講演であった。Smoot博士は、宇宙背景放射にわずかな異方性があることを発見し、ビッグバンが膨張するとともにこの異方性が成長して、宇宙の構造を作ったことを示して、John C. Matherとともに前年のノーベル物理学賞を受賞した。
10) 招待講演(木曜日)
木曜日のplenaryの招待講演は次の2つであった。
– Prof. Dr.-Ing. Michael M. Resch, Director, High Performance Computing Center Stuttgart (HLRS), University of Stuttgart, Germany
“HPC in Academia and Industry – Synergy at Work “
– David E. Shaw, D. E. Shaw Research, LLC and Center for Computational Biology and Bioinformatics,Columbia University
“Toward Millisecond-scale Molecular Dynamics Simulations of Proteins“
11) 原著論文
投稿論文数は不明であるが、採択された論文は54件である。日本からの発表は、
– Junichiro Makino, Kei Hiraki, Mary Inaba
“GRAPE-DR: 2-Pflops Massively-Parallel Computer with 512-Core, 512-Gflops Processor Chips for Scientific Computing”
だけであった。なお、平木敬、松岡聡両氏は日本からのプログラム委員であった。
12) パネル
7つのパネルがあった。のぞいたのは以下の3件。
(1) Fifty Years of Fortran
今年はFORTRANが世に現れてから50周年である。1957年4月15日にIBM704のために作られたそうである。Jim Grayの”In the beginning there was Fortran.” という名言(?)が紹介された。
David Paduaは、「現在のチャレンジは1957年と似ている。」と述べた。つまり、言語とコンパイラのコ・デザインの重要性を指摘した。
言語の方向性については全く相反する意見が出された。John Levesqueは「Fortran77に帰れ」と述べたのに対し、Richard Hansonは「もっと進化させよ。x=A.ix.b(連立一次方程式Ax=bを解くことらしい)とか」と逆の意見を述べた。
(2) Exotic Architecture
CellやGPU、FPGAなどをどう考えるかというパネル。司会はRob Pennington(NCSA)。それぞれの話題は以下の通り。
– Jack Dongarra, “Experiments with Linear Algebra Operations” Cellでのmixed precisionの話など。
– Wen-mei Hwu, “GPU accelerator and HPC Applications”
– Tarek El-Ghazawi, “FPGA vs. Multicore”
– Paul Woodard, “Scientific computation on the Cell Processor”
– Douglass Post, “APragmatist’s View ‘Nirvana or Monster?'”
内容は忘れたが、HPCwireによるとDongarraは、HPCエコシステムはハードウェアばかりに投資してバランスを欠いている、今後ソフトへの多額の投資が必要になると述べた。これに対し、ハードウェアへの投資も十分ではなく、展示会場を見ても(NECのベクトルやClearSpeedの他は)IntelやAMDのx86-64プロセッサを使ったCOTSばかりであるという反論があった。
(3) Return of HPC Survivor — Outwit, Outlast, Outcompute: “Xtreme Storage”
これは、金曜日午前のパネル。木曜日で展示が終わり、evening eventも終わると、金曜の朝に帰ってしまう人が多いので、金曜日には人寄せのパネルが企画されている。去年からの継続だが、今年のテーマはストレージである。司会はCherri M. Pancake (Oregon州立大学)で、Applause Meter(発言が聴衆にどれぐらい受けたかを計るメータ担当)は去年と同じAl Geist。
Jack Dongarra 「Googleに倣ってストレージに広告を付ければ誰でもいくらでもタダで使える。NSAにも覗かせて金を取る。熱が心配なら北極に置けばよい。場所が足りなくなったら、宇宙に置けばよい。」
Ewing Lusk 「iPod-nanoには8GBのメモリが付いている。将来、iPod-femtoが出来れば針の先に数TBのメモリが載る。これを体中につけて、帽子の太陽光発電で駆動する。」
13) ワークショップ
いくつかのワークショップも開かれた。ワークショップは、会場は会議側が提供するが、企画はそれぞれの自主に任されているようである。11日(日)にはAIP主催で3rd China HPC workshop, “HPC in China: Solution Approaches to Impediments for High Performance Computing” が開かれた。筆者は参加しなかったが、ATIPのニュースによると、38の発表があり、中国政府のHPC計画、中国の大学や研究所の研究、中国のHPC市場の状況、HPCベンダの展望などが議論された。
14) 今後の方向性
Mooreの法則に従ってトランジスタ数が18ヶ月に倍増するが、これをどう使うか。Out-of-order実行、分岐予測、投機的実行などを行っても、命令レベル並列性はそれほど増えない。結局、マルチコア、メニーコア、アクセラレータに使うことになるが、データに入出力が追いつかない(いわゆるmemory wall)。演算チップ内にメモリを置くことになるが、これをキャッシュ(プログラムから見えない)として使うか、バッファ(プログラムできる)として使うか。さらにチップ内並列処理をどう記述するか。
様々な空間的制約がある、チップ内のコア間の通信、キャッシュの容量・階層構造をどうするか、コヒーレンシの制御をどうするか、コアが増えると共有化キャッシュのポートが増え、作りにくくなる。などなど。
SC07では、Cell processor とNVIDIAが注目されていた。64ビットのフルサポートが問題である。ClearSpeedはあまり話題になっていない。ハードの進展はなく、応用の拡大に力を注いでいる模様。その後2008年には事業の縮小を余儀なくされた。
IntelはメニーコアのTera-scale processorに進むようだ。
15) DOE関係者との夕食会
ORNL副所長のThomas Zachariaからの呼びかけにより、日本側とDOE関係の何人かで今後の協力の可能性を探るため、会期中の11月14日(水曜日)の6時半から、Reno市内のBricks Restaurantで非公式の会食を行った。参加者は正確には覚えていないが、声をかけられたのはアメリカ側では、Horst Simon (LBNL)、Rick Stevens (ANL)、Michael Strayer (DOE)、Barbara Helland (DOE)、Charles H. Romine (OSTP)など。日本側では渡辺貞(理研)、姫野龍太郎(理研)、高田俊和(理研)、田中勝巳(理研)、佐藤三久(筑波大)、朴泰祐(筑波大)、松岡聡(東工大)、石川裕(東大)、中島浩(京大)、中村宏(東大)、関口智嗣(産総研)、筆者(工学院大)など。最初は理研関係者とは別の会合を持つ計画であったが、結局一緒の会合となった。またアメリカ側としては、日本の次世代スーパーコンピュータの”funding agency”の関係者や、その”program manager”を呼びたかったようであるが、日米の制度の違いですれ違った。日本側参加者は、守秘義務には神経を使った。会合で具体的な話がまとまったわけではないが、ステーキを食べながら有益な意見交換ができた。
次回は世界の学界の動きとアメリカ政府の動きである。
(画像:SC07ロゴ)