新HPCの歩み(第259回)-2007年(ℓ)-
|
ついにTop500にBlue Gene/Pが登場し、Green500の上位を独占した。FORTRANが世に現れてから50年ということで「Fortranの50年」というパネルが行われた。CellとNVIDIAが注目を浴びていた。日本側とDOE関係の何人かで今後の協力の可能性を探るため、非公式の夕食会で意見を交わした。 |
SC2007(続き)
![]() |
|
8) Top500
Top500は1993年6月に始まったので今回がちょうど30回目のリストである。これを記念してHans Meuerは15年間の総括を行っている(Hans Meuer 2008/1/20)。Linpackで順位付けすることにいろいろ議論はあるが、同一基準で長い期間にわたって統計を取り続けていることは意義深い。(HPCwire 2008/2/29)
Topの20件は以下の通り。前回の順位で括弧がついているのはシステムが増強されたか、チューニングが進んで性能が向上したことを示す。性能の単位はTFlops。
|
順位 |
前回 |
設置場所 |
システム |
コア数 |
Rmax |
Rpeak |
|
1 |
(1) |
LLNL |
BlueGene/L |
212992 |
478.2 |
596.378 |
|
2 |
– |
FZJ(ドイツ) |
JUGENE – Blue Gene/P |
65536 |
167.3 |
222.822 |
|
3 |
– |
SGI/NMCA |
SGI Altix ICE 8200, Xeon quad core 3.0 GHz |
14336 |
126.9 |
172.032 |
|
4 |
– |
Computational Res. L.(インド) |
EKA – Cluster Platform 3000 BL460c, Xeon 53xx 3 GHz, |
14240 |
117.9 |
170.88 |
|
5 |
– |
政府機関(スエーデン) |
Cluster Platform 3000 BL460c, Xeon 53xx 2.66 GHz |
13728 |
102.8. |
146.43 |
|
6 |
(3) |
SNL |
Red Storm |
26569 |
102.2 |
127.531 |
|
7 |
2 |
ORNL |
Jaguar – Cray XT4/XT3 |
23016 |
101.7 |
119.35 |
|
8 |
4 |
IBM Watson Lab. |
BGW – BlueGene |
40960 |
91.29 |
114.688 |
|
9 |
– |
NERSC |
Franklin – Cray XT4, 2.6 GHz |
19320 |
85.368 |
100.464 |
|
10 |
5 |
BNL |
New York Blue – BlueGene |
36864 |
82.161 |
103.219 |
|
11 |
6 |
LLNL |
ASC Purple p5 575 1.9 GHz |
12208 |
75.76 |
92.781 |
|
12 |
7 |
Rensselaer Polytechnic |
BlueGene |
32768 |
73.032 |
91.75 |
|
13 |
(9) |
Barcelona S.C. |
MareNostrum BladCenter JS21 Cluster |
10240 |
63.83 |
94.208 |
|
14 |
8 |
NCSA |
Abe – PowerEdge 1955 2.33 GHz |
9600 |
62.7 |
89.5872 |
|
15 |
10 |
Leibniz RZ(ドイツ) |
HLRB-II Altix 4700 1.6 Gz |
9728 |
56.52 |
62.2592 |
|
16 |
(14) |
東工大 |
TSUBAME Grid Cluster – ClearSpeed |
11644 |
56.43 |
102.021 |
|
17 |
– |
Edinburgh大学(英国) |
HECToR – Cray XT4, 2.8 GHz |
11328 |
54.648 |
63.4368 |
|
18 |
11 |
SNL |
Thunderbird – PowerEdge 1850 2.6 GHz |
9024 |
53.00 |
64.9728 |
|
19 |
12 |
CEA(フランス) |
Tera-10 – NovaScale 5160 |
9968 |
52.84 |
63.7952 |
|
20 |
13 |
NASA Ames |
Columbia – Altix 1.5 GHz |
10160 |
51.87 |
60.96 |
トップは前回に引き続きLLNLのBlueGene/Lであるが、約60%プロセッサを増やし478.2 TFを達成した。驚いたのは4位にインドが登場したことである。Tata GroupのComputational Research Laboratoriesに入ったHPのシステムである。アメリカのマシンは合計284台。日本の最高位は東工大のTSUBAMEで、前回より2位下がった。
9) Top500(日本)
日本設置マシンの100位以内は下記の通り。
|
順位 |
前回 |
設置場所 |
システム |
コア数 |
Rmax |
Rpeak |
|
16 |
14 |
東京工業大学 |
TSUBAME Grid Cluster |
11088 |
48.88 |
78.7968 |
|
30 |
20 |
海洋研究開発機構 |
地球シミュレータ |
5120 |
35.86 |
40.96 |
|
52tie |
37tie |
産総研CBRC |
Blue Protein – BlueGene |
8192 |
18.2 |
22.9376 |
|
52tie |
37tie |
高エネルギー機構 |
KEK/BG MOMO |
8192 |
18.2 |
22.9376 |
|
52tie |
37tie |
高エネルギー機構 |
KEK/BG Sakura |
8192 |
18.2 |
22.9376 |
|
70 |
51 |
東大 |
SR1100-J2 |
128 |
15.811 |
18.8416 |
|
79 |
- |
九州大学 |
PRIMERGY RX200S3 |
1536 |
15.09 |
18.432 |
|
81 |
59 |
海洋研究開発機構 |
Altix 4700 1.6 GHz |
2560 |
14.598 |
16.384 |
かつては日本がトップ20の半数を占めたことがあるのに、最近は全然振るわない。アメリカ、ドイツ、スエーデン、スペインだけでなく、インドにも負けている。2002年から2004年まで5回トップを占めた地球シミュレータも今や30位である。
10) Green500
Green500も発表された。これは昨年始まった消費電力あたりの性能を競うリストである。公式には今回が初である。12位までを示す。
|
順位 |
MFlops/W |
設置場所 |
システム |
Power |
Top500 |
|
1 |
357.23 |
Daresbury L.(英国) |
Blue Gene/P |
31.1 |
121 |
|
2 |
352.24 |
Max-Planck-G./IPP(ドイツ) |
Blue Gene/P |
62.2 |
40 |
|
3 |
346.95 |
IBM – Rochester(米国) |
Blue Gene/P |
124.4 |
24 |
|
4 |
336.21 |
FZ Jülich(ドイツ) |
Blue Gene/P |
497.6 |
2 |
|
5 |
310.93 |
ORNL |
Blue Gene/P |
70.47 |
41 |
|
6tie |
210.56 |
Harvard大学(米国) |
eServer BlueGene |
44.8 |
170tie |
|
6tie |
210.56 |
高エネルギー機構(日本) |
eServer BlueGene |
44.8 |
170tie |
|
6tie |
210.56 |
IBM – Almaden Res. Center |
eServer BlueGene |
44.8 |
170tie |
|
6tie |
210.56 |
IBM Res. |
eServer BlueGene |
44.8 |
170tie |
|
6tie |
210.56 |
IBM T.J.Watson Res. Center |
eServer Blu Gene |
44.8 |
170tie |
|
6tie |
210.56 |
Renaissance Computing Institute (RENCI) |
eServer BlueGene |
44.8 |
170tie |
|
6tie |
210.56 |
University of Canterbury(ニュージーランド) |
eServer BlueGene |
44.8 |
170tie |
Blue Gene/Pが上位を独占し、その次はBlueGene/Lで全然面白くない。同じBlue Gene/PでもシステムによってMFlops/Wに差があるようである。この頃はTop500からは独立していたので、それとは別に(例えば2008年2月)も発表されている。上位に変化はない。(Verginia Tech News 2007/11/7)
11) HPC Challenge
HPC Challenge Award CompetitionはDARPA High Productivity Computing Systems (HPCS) ProgramとIDCの共催である。結果は以下の通り。Submitterは省略した。
(1) Class 1 Awards
|
G-HPL |
Achieved |
System |
Affliation |
|
1st place |
259 TF |
IBM BG/L |
LLNL |
|
1st runner up |
94 TF |
Cray XT3 |
SNL |
|
2nd runner up |
67 TF |
IBM BG/L |
IBM T.J.Watson |
|
G-Random Access |
Achieved |
System |
Affiliation |
|
1st place |
35.5 GUPS |
IBM BG/L |
LLNL |
|
1st runner up |
33.6 GUPS |
Cray XT3 |
SNL |
|
2nd runner up |
17.3 GUPS |
IBM BG/L |
IBM T.J.Watson |
|
G-FFT |
Achieved |
System |
Affiliation |
|
1st place |
2870 GF |
Cray XT3 |
SNL |
|
1st runner up |
2311 GF |
IBM BG/L |
LLNL |
|
2nd runner up |
1122 GF |
Cray XT3 Dual |
ORNL |
|
EP-STREAM Triad |
Achieved |
System |
Affiliation |
|
1st place |
160 TB/s |
IBM BG/L |
LLNL |
|
2nd runner up |
77 TB/s |
Cray XT3 |
SNL |
|
1st runner up |
55 TB/s |
IBM Power 5 |
LLNL |
(2) Class 2 Awards
|
Award |
Recipeint |
Affiliation |
Language |
|
Most Productive Research Implementation |
Vijay Saraswat
|
IBM
|
X10
|
|
Most Productive Commercial Implementation |
Sudarshan Raghunathan |
Interactive Supercomputing |
Python/ Star-P |
12) 招待講演(水曜日)
水曜日のplenaryの招待講演は次の2つであった。
-Dr. Raymond L. Orbach Under Secretary for Science, Department of Energy
“The American Competitiveness Initiative: Role of High End Computation”
-Dr. George Smoot, University of California Berkeley and Lawrence Berkeley National Laboratory, 2006 Nobel Prize in Physics
“Cosmology’s Present and Future Computational Challenges”
Orbach氏は、エネルギー省の研究担当の次官であり、HPC推進派として知られている。今後、エネルギー省のHPC予算をどんどん増大していくという景気のよい講演であった。Smoot博士は、宇宙背景放射にわずかな異方性があることを発見し、ビッグバンが膨張するとともにこの異方性が成長して、宇宙の構造を作ったことを示して、John C. Matherとともに前年のノーベル物理学賞を受賞した。
13) 招待講演(木曜日)
木曜日のplenaryの招待講演は次の2つであった。
– Prof. Dr.-Ing. Michael M. Resch, Director, High Performance Computing Center Stuttgart (HLRS), University of Stuttgart, Germany
“HPC in Academia and Industry – Synergy at Work “
– David E. Shaw, D. E. Shaw Research, LLC and Center for Computational Biology and Bioinformatics, Columbia University
“Toward Millisecond-scale Molecular Dynamics Simulations of Proteins”
14) 原著論文
投稿論文数は不明であるが、採択された論文は54件である。日本からの発表は、
– Junichiro Makino, Kei Hiraki, Mary Inaba
“GRAPE-DR: 2-Pflops Massively-Parallel Computer with 512-Core, 512-Gflops Processor Chips for Scientific Computing”
だけであった。なお、平木敬、松岡聡両氏は日本からのプログラム委員であった。
15) パネル
7つのパネルがあった。のぞいたのは以下の3件。
(1) Fifty Years of Fortran
今年はFORTRANが世に現れてから50周年である。1957年4月15日にIBM704のために作られたそうである。Jim Grayの”In the beginning there was Fortran.” という名言(?)が紹介された。
David Paduaは、「現在のチャレンジは1957年と似ている。」と述べた。つまり、言語とコンパイラのコ・デザインの重要性を指摘した。
言語の方向性については全く相反する意見が出された。John Levesqueは「Fortran77に帰れ」と述べたのに対し、Richard Hansonは「もっと進化させよ。x=A.ix.b(連立一次方程式Ax=bを解くことらしい)とか」と逆の意見を述べた。
(2) Exotic Architecture
CellやGPU、FPGAなどをどう考えるかというパネル。司会はRob Pennington (NCSA)。それぞれの話題は以下の通り。
– Jack Dongarra, “Experiments with Linear Algebra Operations” Cellでのmixed precisionの話など。
– Wen-mei Hwu, “GPU accelerator and HPC Applications”
– Tarek El-Ghazawi, “FPGA vs. Multicore”
– Paul Woodard, “Scientific computation on the Cell Processor”
– Douglass Post, “A Pragmatist’s View ‘Nirvana or Monster?'”
内容は忘れたが、HPCwireによるとDongarraは、HPCエコシステムはハードウェアばかりに投資してバランスを欠いている、今後ソフトへの多額の投資が必要になると述べた。これに対し、ハードウェアへの投資も十分ではなく、展示会場を見ても(NECのベクトルやClearSpeedの他は)IntelやAMDのx86-64プロセッサを使ったCOTSばかりであるという反論があった。(HPCwire 2008/4/4)これに対してDongarraがソフトウェアの重要性について反論を書いている。(HPCwire 2008/4/11)
(3) Return of HPC Survivor — Outwit, Outlast, Outcompute: “Xtreme Storage”
これは、金曜日午前のパネル。木曜日で展示が終わり、evening eventも終わると、金曜の朝に帰ってしまう人が多いので、金曜日には人寄せのパネルが企画されている。去年からの継続だが、今年のテーマはストレージである。司会はCherri M. Pancake (Oregon州立大学)で、Applause Meter(発言が聴衆にどれぐらい受けたかを計るメータ担当)は去年と同じAl Geist。
Jack Dongarra 「Googleに倣ってストレージに広告を付ければ誰でもいくらでもタダで使える。NSAにも覗かせて金を取る。熱が心配なら北極に置けばよい。場所が足りなくなったら、宇宙に置けばよい。」
Ewing Lusk 「iPod-nanoには8GBのメモリが付いている。将来、iPod-femtoが出来れば針の先に数TBのメモリが載る。これを体中につけて、帽子の太陽光発電で駆動する。」
16) ワークショップ
いくつかのワークショップも開かれた。ワークショップは、会場は会議側が提供するが、企画はそれぞれの自主に任されているようである。11日(日)にはAIP主催で3rd China HPC workshop, “HPC in China: Solution Approaches to Impediments for High Performance Computing” が開かれた。筆者は参加しなかったが、ATIPのニュースによると、38の発表があり、中国政府のHPC計画、中国の大学や研究所の研究、中国のHPC市場の状況、HPCベンダの展望などが議論された。
17) Disruptive Technologies
SC06ではExotic Technology Initiativeというイベントが行われたが、今回は展示会場の一角で、現在の技術とは隔絶しているが、今後5年から15年で実現する可能性のある変わった技術を公募し、Disruptive Technologies Activityが行われ、優秀なものが選ばれ展示された。Hisa Andoの報告によると、「IBM社の光プリント配線基板」や「Nantero社のカーボンナノチューブを用いたメモリ」「Luxtera社の40 Gb/sの光ケーブル」などが展示された。(Mynavi News 2007/12/10)
あわせてパネルも2回開かれたようだが、前記のExotic Architectureはその一つであろうか。筆者の記憶には残っていない。
18) 今後の方向性
Mooreの法則に従ってトランジスタ数が18ヶ月に倍増するが、これをどう使うか。Out-of-order実行、分岐予測、投機的実行などを行っても、命令レベル並列性はそれほど増えない。結局、マルチコア、メニーコア、アクセラレータに使うことになるが、データに入出力が追いつかない(いわゆるmemory wall)。演算チップ内にメモリを置くことになるが、これをキャッシュ(プログラムから見えない)として使うか、バッファ(プログラムできる)として使うか。さらにチップ内並列処理をどう記述するか。
様々な空間的制約がある、チップ内のコア間の通信、キャッシュの容量・階層構造をどうするか、コヒーレンシの制御をどうするか、コアが増えると共有化キャッシュのポートが増え、作りにくくなる。などなど。
SC07では、Cell processor とNVIDIAが注目されていた。64ビットのフルサポートが問題である。ClearSpeedはあまり話題になっていない。ハードの進展はなく、応用の拡大に力を注いでいる模様。その後2008年には事業の縮小を余儀なくされることになる。
IntelはメニーコアのTera-scale processorに進むようだ。
19) DOE関係者との夕食会
ORNL副所長のThomas Zachariaからの呼びかけにより、日本側とDOE関係の何人かで今後の協力の可能性を探るため、会期中の11月14日(水曜日)の午後6時半から、Reno市内のBricks Restaurantで非公式の会食を行った。参加者は正確には覚えていないが、声をかけられたのはアメリカ側では、Horst Simon (LBNL)、Rick Stevens (ANL)、Michael Strayer (DOE)、Barbara Helland (DOE)、Charles H. Romine (OSTP)など。日本側では渡辺貞(理研)、姫野龍太郎(理研)、高田俊和(理研)、田中勝巳(理研)、佐藤三久(筑波大)、朴泰祐(筑波大)、松岡聡(東工大)、石川裕(東大)、中島浩(京大)、中村宏(東大)、関口智嗣(産総研)、筆者(工学院大)など。最初は理研関係者とは別の会合を持つ計画であったが、結局一緒の会合となった。またアメリカ側としては、日本の次世代スーパーコンピュータの”funding agency”(つまり文部科学省)の関係者や、その”program manager”を呼びたかったようであるが、日米の制度の違いですれ違った。日本側参加者は、守秘義務には神経を使った。会合で具体的な話がまとまったわけではないが、ステーキを食べながら有益な意見交換ができた。
次回はアメリカ企業の動きのその一である。Cray社は、XT3に続いてXT4を多数出荷した。IBM社はPOWER6を正式発表した。前年ATI社を買収したAMD社はSan Franciscoにおける記者発表において”Teraflop in a Box”のデモを行った。
![]() |
![]() |
![]() |





