世界のスーパーコンピュータとそれを動かす人々


11月 27, 2017

HPCの歩み50年(第144回)-2007年(j)-

小柳 義夫 (高度情報科学技術研究機構)

ついにTop500にBlue Gene/Pが登場し、Green500の上位を独占した。FORTRANが世に現れてから50年ということで「Fortranの50年」というパネルが行われた。CellとNVIDIAが注目を浴びていた。

SC2007(続き)

7) Top500
Topの20件は以下の通り。前回の順位で括弧がついているのはシステムが増強されたか、チューニングが進んで性能が向上したことを示す。性能の単位はTFlops。

順位 前回 設置場所 システム コア数 Rmax Rpeak
1 (1) LLNL BlueGene/L 212992 478.2 596.378
2 FZJ(ドイツ) JUGENE – Blue Gene/P 65536 167.3 222.822
3 SGI/NMCA SGI Altix ICE 8200, Xeon quad core 3.0 GHz 14336 126.9 172.032
4 Computational Res. L.(インド) EKA – Cluster Platform 3000 BL460c, Xeon 53xx 3 GHz 14240 117.9 170.88
5 政府機関(スエーデン) Cluster Platform 3000 BL460c, Xeon 53xx 2.66 GHz 13728 102.8. 146.43
6 (3) SNL Red Storm 26569 102.2 127.531
7 2 ORNL Jaguar – Cray XT4/XT3 23016 101.7 119.35
8 4 IBM Watson Lab. BGW – BlueGene 40960 91.29 114.688
9 NERSC Franklin – Cray XT4, 2.6 GHz 19320 85.368 100.464
10 5 BNL New York Blue – BlueGene 36864 82.161 103.219
11 6 LLNL ASC Purple p5 575 1.9 GHz 12208 75.76 92.781
12 7 Rensselaer Polytechnic BlueGene 32768 73.032 91.75
13 (9) Barcelona S.C. MareNostrum BladCenter JS21 Cluster 10240 63.83 94.208
14 8 NCSA Abe – PowerEdge 1955 2.33 GHz 9600 62.7 89.5872
15 10 Leibniz RZ(ドイツ) HLRB-II Altix 4700 1.6 Gz 9728 56.52 62.2592
16 (14) 東工大 TSUBAME Grid Cluster – ClearSpeed 11644 56.43 102.021
17 Edinburgh大学(英国) HECToR – Cray XT4, 2.8 GHz 11328 54.648 63.4368
18 11 SNL Thunderbird – PowerEdge 1850 2.6 GHz 9024 53.00 64.9728
19 12 CEA(フランス) Tera-10 – NovaScale 5160 9968 52.84 63.7952
20 13 NASA Ames Columbia – Altix 1.5 GHz 10160 51.87 60.96

 

トップは前回に引き続きLLNLのBlueGene/Lであるが、約60%プロセッサを増やし478.2 TFを達成した。驚いたのは4位にインドが登場したことである。Tata GroupのComputational Research Laboratoriesに入ったHPのシステムである。アメリカのマシンは合計284台。日本の最高位は東工大のTSUBAMEで、前回より2位下がった。

かつては日本がトップ20の半数を占めたことがあるのに、最近は全然振るわない。アメリカ、ドイツ、スエーデン、スイスだけでなく、インドにも負けている。2002年から2004年までトップを占めた地球シミュレータも今や30位である。

Green500も発表された。これは昨年始まった消費電力あたりの性能を競うリストである。公式には今回が初である。12位までを示す。

順位 MFlops/W 設置場所 システム Power Top500
1 357.23 Daresbury L.(英国) Blue Gene/P 31.1 121
2 352.24 Max-Planck-G./IPP(ドイツ) Blue Gene/P 62.2 40
3 346.95 IBM – Rochester(米国) Blue Gene/P 124.4 24
4 336.21 FZ Jülich(ドイツ) Blue Gene/P 497.6 2
5 310.93 ORNL Blue Gene/P 70.47 41
6tie 210.56 Harvard大学(米国) eServer BlueGene 44.8 170tie
6tie 210.56 高エネルギー機構(日本) eServer BlueGene 44.8 170tie
6tie 210.56 IBM – Almaden Res. Center eServer BlueGene 44.8 170tie
6tie 210.56 IBM Res. eServer BlueGene 44.8 170tie
6tie 210.56 IBM T.J.Watson Res. Center eServer Blu Gene 44.8 170tie
6tie 210.56 Renaissance Computing Institute (RENCI) eServer BlueGene 44.8 170tie
6tie 210.56 University of Canterbury(ニュージーランド) eServer BlueGene 44.8 170tie

Blue Gene/Pが上位を独占し、その次はBlueGene/Lで全然面白くない。同じBlue Gene/PでもシステムによってMFlops/Wに差があるようである。この頃はTop500からは独立していたので、それとは別に(例えば2008年2月)も発表されている。上位に変化はない。

8) HPC Challenge
HPC Challenge Award CompetitionはDARPA High Productivity Computing Systems (HPCS) ProgramとIDCの共催である。結果は以下の通り。Submitterは省略した。

(1) Class 1 Awards

G-HPL Achieved System Affliation
1st place 259 TF IBM BG/L LLNL
1st runner up 94 TF Cray XT3 SNL
2nd runner up 67 TF IBM BG/L IBM T.J.Watson

 

G-Random Access Achieved System Affiliation
1st place 35.5 GUPS IBM BG/L LLNL
1st runner up 33.6 GUPS Cray XT3 SNL
2nd runner up 17.3 GUPS IBM BG/L IBM T.J.Watson

 

G-FFT Achieved System Affiliation
1st place 2870 GF Cray XT3 SNL
1st runner up 2311 GF IBM BG/L LLNL
2nd runner up 1122 GF Cray XT3 Dual ORNL

 

EP-STREAM Triad Achieved System Affiliation
1st place 160 TB/s IBM BG/L LLNL
2nd runner up 77 TB/s Cray XT3 SNL
1st runner up 55 TB/s IBM Power 5 LLNL

 

(2) Class 2 Awards

Award Recipient Affiliation Language
Most Productive Research Implementation Vijay Saraswat IBM X10
Most Productive Commercial
Implementation
Sudarshan
Raghunathan
Interactive
Supercomputing
Python/
Star-P

 

9) 招待講演(水曜日)
水曜日のplenaryの招待講演は次の2つであった。

-Dr. Raymond L. Orbach Under Secretary for Science, Department of Energy
“The American Competitiveness Initiative: Role of High End Computation”
-Dr. George Smoot, University of California Berkeley and Lawrence Berkeley National Laboratory, 2006 Nobel Prize in Physics
“Cosmology’s Present and Future Computational Challenges”

Orbach氏は、エネルギー省の研究担当の次官であり、HPC推進派として知られている。今後、エネルギー省のHPC予算をどんどん増大していくという景気のよい講演であった。Smoot博士は、宇宙背景放射にわずかな異方性があることを発見し、ビッグバンが膨張するとともにこの異方性が成長して、宇宙の構造を作ったことを示して、John C. Matherとともに前年のノーベル物理学賞を受賞した。

10) 招待講演(木曜日)
木曜日のplenaryの招待講演は次の2つであった。

– Prof. Dr.-Ing. Michael M. Resch, Director, High Performance Computing Center Stuttgart (HLRS), University of Stuttgart, Germany
“HPC in Academia and Industry – Synergy at Work “
– David E. Shaw, D. E. Shaw Research, LLC and Center for Computational Biology and Bioinformatics,Columbia University
“Toward Millisecond-scale Molecular Dynamics Simulations of Proteins“

11) 原著論文
投稿論文数は不明であるが、採択された論文は54件である。日本からの発表は、

– Junichiro Makino, Kei Hiraki, Mary Inaba
“GRAPE-DR: 2-Pflops Massively-Parallel Computer with 512-Core, 512-Gflops Processor Chips for Scientific Computing”

だけであった。なお、平木敬、松岡聡両氏は日本からのプログラム委員であった。

12) パネル
7つのパネルがあった。のぞいたのは以下の3件。

(1) Fifty Years of Fortran
今年はFORTRANが世に現れてから50周年である。1957年4月15日にIBM704のために作られたそうである。Jim Grayの”In the beginning there was Fortran.” という名言(?)が紹介された。

David Paduaは、「現在のチャレンジは1957年と似ている。」と述べた。つまり、言語とコンパイラのコ・デザインの重要性を指摘した。

言語の方向性については全く相反する意見が出された。John Levesqueは「Fortran77に帰れ」と述べたのに対し、Richard Hansonは「もっと進化させよ。x=A.ix.b(連立一次方程式Ax=bを解くことらしい)とか」と逆の意見を述べた。

(2) Exotic Architecture
CellやGPU、FPGAなどをどう考えるかというパネル。司会はRob Pennington(NCSA)。それぞれの話題は以下の通り。

– Jack Dongarra, “Experiments with Linear Algebra Operations” Cellでのmixed precisionの話など。
– Wen-mei Hwu, “GPU accelerator and HPC Applications”
– Tarek El-Ghazawi, “FPGA vs. Multicore”
– Paul Woodard, “Scientific computation on the Cell Processor”
– Douglass Post, “APragmatist’s View ‘Nirvana or Monster?'”

内容は忘れたが、HPCwireによるとDongarraは、HPCエコシステムはハードウェアばかりに投資してバランスを欠いている、今後ソフトへの多額の投資が必要になると述べた。これに対し、ハードウェアへの投資も十分ではなく、展示会場を見ても(NECのベクトルやClearSpeedの他は)IntelやAMDのx86-64プロセッサを使ったCOTSばかりであるという反論があった。

(3) Return of HPC Survivor — Outwit, Outlast, Outcompute: “Xtreme Storage”
これは、金曜日午前のパネル。木曜日で展示が終わり、evening eventも終わると、金曜の朝に帰ってしまう人が多いので、金曜日には人寄せのパネルが企画されている。去年からの継続だが、今年のテーマはストレージである。司会はCherri M. Pancake (Oregon州立大学)で、Applause Meter(発言が聴衆にどれぐらい受けたかを計るメータ担当)は去年と同じAl Geist。

Jack Dongarra 「Googleに倣ってストレージに広告を付ければ誰でもいくらでもタダで使える。NSAにも覗かせて金を取る。熱が心配なら北極に置けばよい。場所が足りなくなったら、宇宙に置けばよい。」

Ewing Lusk 「iPod-nanoには8GBのメモリが付いている。将来、iPod-femtoが出来れば針の先に数TBのメモリが載る。これを体中につけて、帽子の太陽光発電で駆動する。」

13) ワークショップ
いくつかのワークショップも開かれた。ワークショップは、会場は会議側が提供するが、企画はそれぞれの自主に任されているようである。11日(日)にはAIP主催で3rd China HPC workshop, “HPC in China: Solution Approaches to Impediments for High Performance Computing” が開かれた。筆者は参加しなかったが、ATIPのニュースによると、38の発表があり、中国政府のHPC計画、中国の大学や研究所の研究、中国のHPC市場の状況、HPCベンダの展望などが議論された。

14) 今後の方向性
Mooreの法則に従ってトランジスタ数が18ヶ月に倍増するが、これをどう使うか。Out-of-order実行、分岐予測、投機的実行などを行っても、命令レベル並列性はそれほど増えない。結局、マルチコア、メニーコア、アクセラレータに使うことになるが、データに入出力が追いつかない(いわゆるmemory wall)。演算チップ内にメモリを置くことになるが、これをキャッシュ(プログラムから見えない)として使うか、バッファ(プログラムできる)として使うか。さらにチップ内並列処理をどう記述するか。

様々な空間的制約がある、チップ内のコア間の通信、キャッシュの容量・階層構造をどうするか、コヒーレンシの制御をどうするか、コアが増えると共有化キャッシュのポートが増え、作りにくくなる。などなど。

SC07では、Cell processor とNVIDIAが注目されていた。64ビットのフルサポートが問題である。ClearSpeedはあまり話題になっていない。ハードの進展はなく、応用の拡大に力を注いでいる模様。その後2008年には事業の縮小を余儀なくされた。

IntelはメニーコアのTera-scale processorに進むようだ。

15) DOE関係者との夕食会
ORNL副所長のThomas Zachariaからの呼びかけにより、日本側とDOE関係の何人かで今後の協力の可能性を探るため、会期中の11月14日(水曜日)の6時半から、Reno市内のBricks Restaurantで非公式の会食を行った。参加者は正確には覚えていないが、声をかけられたのはアメリカ側では、Horst Simon (LBNL)、Rick Stevens (ANL)、Michael Strayer (DOE)、Barbara Helland (DOE)、Charles H. Romine (OSTP)など。日本側では渡辺貞(理研)、姫野龍太郎(理研)、高田俊和(理研)、田中勝巳(理研)、佐藤三久(筑波大)、朴泰祐(筑波大)、松岡聡(東工大)、石川裕(東大)、中島浩(京大)、中村宏(東大)、関口智嗣(産総研)、筆者(工学院大)など。最初は理研関係者とは別の会合を持つ計画であったが、結局一緒の会合となった。またアメリカ側としては、日本の次世代スーパーコンピュータの”funding agency”の関係者や、その”program manager”を呼びたかったようであるが、日米の制度の違いですれ違った。日本側参加者は、守秘義務には神経を使った。会合で具体的な話がまとまったわけではないが、ステーキを食べながら有益な意見交換ができた。

次回は世界の学界の動きとアメリカ政府の動きである。

(画像:SC07ロゴ)

left-arrow   50history-bottom   right-arrow