世界のスーパーコンピュータとそれを動かす人々


3月 18, 2026

新HPCの歩み(第272回)-2008年(k)-

小柳 義夫 (高度情報科学技術研究機構)

第10回目となるCluster 2008はつくば国際会議場(で開催された。ISC2008では直前にRoadrunnerがLinpackで1 PFlops越えを達成したので、その話題で持ちきりであった。急遽、パネル討論会が企画され松岡聡もパネリストに。2回目のGreen500の上位はCell B.E.とBlue Gene/Pのオンパレードであった。

国際会議(続き)

20) Lattice 2008(Willamsburg)
第26回のInternational Symposium on Lattice Field Theory(通称Lattice 2008)は、2008年7月14日~19日に米国バージニア州Willamsburgで開催された。会議録は、オンラインでPoS上に公開されている。

21) HOT CHIPS 20 (2008)(Stanford大学)
1989年から始まり、Stanford大学またはその周辺で開催されて来た高性能半導体の国際会議HOT CHIPSは、20回目のHOT CHIPS 20 (2008)をStanford大学のMemorial Auditoriumにおいて、2007年8月24日~26日に開催した。基調講演2件とパネル討論は以下の通り。

基調講演

Making Cars Drive Themselves

Sebastian Thurn, Stanford University

パネル討論

Ready, Fire, Aim – 20 years of hits & misses at Hot Chips

Session Chair: Nick Tredennick

基調講演

SunPower’s History and Technology

Richard Swanson, SunPower

 

22) Euro-Par 2008(カナリア諸島)
第14回目となるEuro-Par 2008 – Parallel Processing, 14th International Euro-Par Conferenceは、2008年8月26日~29日にスペインのLas Palmas de Gran Canaria(カナリア諸島ラス・パルマス県)で開催された。会議録はSpringer社からLNCS 5168およびLNCS 5415として出版されている。

23) IFIP 2008(Milano)
第20回目となるIFIP Congress 2008は、2008年9月7日~10日にイタリアのMilanoで開催された。会議録は十数巻に分かれてSpringerから出版されている。

24) EuroPVM-MPI 2008(Dublin)
15回目となるEuroPVM-MPI 2008(15th European PVM/MPI Users’ Group Meeting)は、2008年9月7日~10日にアイルランドのDublinで開催された。7件の招待講演と1件のチュートリアルが行われた。

招待講演

The Next Frontier

George Bosilca

Fault Tolerance for PetaScale Systems: Current Knowledge, Challenges and Opportunities

Franck Cappello

Managing Multicore with OpenMP (Extended Abstract)

Barbara Chapman

MPI Must Evolve or Die

Al Geist

MPI and Hybrid Programming Models for Petascale Computing

William D. Gropp

Some Aspects of Message-Passing on Future Hybrid Systems

Rolf Rabenseifner

From Parallel Virtual Machine to Virtual Parallel Machine: The Unibus System

Vaidy Sunderam

チュートリアル

EuroPVM/MPI Full-Day Tutorial. Using MPI-2: A Problem-Based Approach

William Gropp, Ewing Lusk

 

Proceedingsは、‟Recent Advances in Parallel Virtual Machine and Message Passing Interface”のタイトルで、Springer社からLNCS 5205として出版されている。

25) ICPP 2008(Portland)
第37回目となるICPP 2008 (International Conference on Parallel Processing)は、2008年9月8日から12日にオレゴン州Portlandで開催された。3回目の4年周期の3年目である。主催はIACC (The International Association for Computers and Communications)で共催はPortland State UniversityとThe Ohio State Universityである。2件の基調講演が行われた。

Stream Programming : Parallel Processing Made Simple

Bill Dally, Stanford University

The Future of Multi-core: Intel’s Tera-scale Computing Research

Jim Held, Intel

 

電子版会議録は、IEEE XploreIEEE/CSに置かれている。

26) Cluster 2008(つくば)
第10回目となるCluster 2008 (2008 IEEE International Conference on Cluster Computing)は、2008年9月29日~10月1日に、つくば国際会議場(エポカルつくば)で開催された。組織委員長は石川裕(東大)、プログラム委員長は佐藤三久(筑波大学)であった。基調講演、招待講演、パネルは以下の通り。

Keynote

Clouds, Clusters and ManyCore: The Revolution Ahead

Daniel A. Reed, Microsoft

Panel

Will the First Exascale Machine be a Commodity Cluster, or Something Else?

Moderator: Satoshi Matsuoka, Titech

Invited

Designing Next Generation Clusters with InfiniBand and 10GE/iWARP: Opportunities and Challenges

D. K. Panda, Ohio State U.

 

会議録はIEEEから出版されている。iWAPT 2008、HiperIO 2008、HAC 2008(International Workshop on Hybrid Architecture Computing 2008)などのWSが併設され、最終日10月1日に開催された。

27) The Grace Hopper Celebration of Women in Computing (GHC)(Hyannis)
第8回のThe Grace Hopper Celebration of Women in Computing 2008は、2008年10月1日~4日にコロラド州Keystone Resortで“We Build a Better World”をテーマに開催された。主催はAnita Borg Institute。参加者は1446人。

28) 第9回Teraflop workshop(東北大学)
第9回Teraflop workshopが、2008年11月12日~13日に東北大学で開催された。主催は東北大学情報シナジーセンター、HLRS、GSIS、NECである。プログラムは残っていない。

29) SC08(Austin)
SC08(2008年11月15日~21日, Austin Convention Center)については別に記す。

30) ICPADS 2008(Melbourne)
ICPADS 2008 (2008 14th IEEE International Conference on Parallel and Distributed Systems)は2008年12月8日~10日にオーストラリアのMelbourneで開催された。会議録はIEEEから発行されている。

ISC2008

第23回目となるISC 2008 (International Supercomputing Conference)は、2008年6月17日~20日にドイツのDresdenで開催された。私は出席しなかったが、参加者は1375名、展示は80件とのことである。Dresdenは3回目でこれが最後となった。

1) Roadrunnerパネル
直前の6月9日にLANLのRoadrunnerがLinpackで1 PFlops越えを達成したので、その話題で持ちきりであった。急遽、これを祝してパネル討論会“First Panel Discussion on Breaking the Petaflop/s Barrier”を18日(水)午後6時~7時に企画した。

モデレータ:Prof. Hans Meuer

パネリスト:Dr. Andrew White (LANL)

Dr. Don Grice (IBM)

Dr. Horst Simon (LBNL)

松岡聡博士 (東京工業大学)

Dr. Michael Resch (HLRS (Stuttgart))

Dr. Jack Dongarra (Tennessee)

Dr. Erich Strohmaier (LBNL)

 

また、“Is HPC Going Green?”というパネル討論会も行われた。

2) 基調講演
3件の基調講演が行われた。

(a) 松岡聡
  水曜日(6月18日)の基調講演は松岡聡(東京工業大学)で、”Commodity Prevails-Democratization of Supercomputing”と題して講演した。
その中で、「Roadrunnerが重要なのは、1 PFlopsの達成だけでなく、同時にcommodity cluster及びヘテロマシンが初のNo.1になったことだ。」と、Roadrunnerの特異性を強調した。

(b) Justin Ratner
  木曜日(6月19日)の基調講演はIntelのJustin Ratnerで、“Multicore/Manycore Platforms Bring Supercomputing to the Masses”という講演を行った。

(c) John Salmon
  金曜日(6月20日)の基調講演はD.E. Shaw ResearchのJohn Salmonで、“Toward Millisecond-Scale Molecular Dynamics Simulation of Proteins”という講演を行った。Antonの話をしたのであろう。

3) Tom Sterling
2004年から直近一年間の総括講演を行っているThomas Sterlingは、この一年を“Run-up to Petaflops”と総括した。

4) Top500(2008年6月、世界)
31回目のTop500であるが、日本時間18日、しばらくweb siteが閉まっていると思っていたら、17時過ぎに発表になった。20位までは以下の通り。前回の順位に括弧がついているのは、アップグレードまたはチューニングによって性能向上があったことを示す。

順位

前回

設置場所

機種名

cores

Rmax

Rpeak

1

LANL

Roadrunner-QW22/LS21, Cell 8i 3.2GHz

122400

1026

1375.78

2

1

LLNL

BlueGene/L

212992

478.2

596.378

3

NICS,Tennessee

Kraken XT5 – QC 2.3 GHz

66000

463.3

607.2

4

ANL

Intrepid – Blue Gene/P

163840

450.3

557.056

5

TACC, Texas

Ranger – SunBlade x6420, Opteron QC

62976

326.0

503.808

6

(7)

ORNL

Jaguar – Cray XT4 QC 2.1 GHz

30976

205.0

260.2

7

(2)

FZJ

JUGENE – Blue Gene/P

65536

180.0

222.822

8

(3)

NMCAC, N.M.

Encanto – Altix ICE 8200 QC 3.0 GHz

14336

133,2

172.032

9

(4)

TATA SONS, India

EKA – Cluster Platform 3000, HP

14384

132.8

172.608

10

IDRIS, France

Blue Gene/P

40960

112.5

139.264

11

Total Exploration

Altix ICE 8200EX, Xeon QC 3.0 GHz

10240

106.1

122.88

12

5

政府機関 Sweden

Cluster Platform 3000, HP

13728

102.8

146.43

13

6

SNL

Red Storm – Opteron DC 2.4 GHz

26569

102.2

127.531

14

EDF R&D, France

Frontier2 BG/L – Blue Gene/P

32768

93.0

111.411

15

8

IBM Watson

BGW – Blue Gene

40960

91.29

114.688

16

9

NERSC

Franklin – Cray XT4, 2.6 GHz

19320

85.368

100.464

17

東京大学

T2K Open Supercomputer

12288

82.984

113.05

18

10

Stony Brook/BNL

New York Blue – Blue Gene

36864

82.161

103.219

19

ECMWF

Power 575, p6 4.7 GHz

8320

80.3

156.416

20

MPI/PP

VIP – Power 575, p6 4.7 GHz

6720

80.3

126.336

 

当初の発表では3位のKrakenがなく、この表ではその下から1番ずつ繰り下がっている。例えばT2K(筑波)は20位だったのだが、21位になってしまった。19位と20位はGFlopsの位まで全く一致しているが、コア数が違うのでおかしい。ECMWFの方は実測していないのではないか。もし測れば、99 TFlops前後で14位あたりに入ったのではないか。インドのシステムがTop10に入ったのは2回目である。アメリカ製でないシステムの最高位は東大のT2Kのようである。

今回特記すべきこととして、quad-core processorが急速に登場していることが挙げられる。各社合わせて283のシステムがこれを利用している。Dual coreは203システム、single coreは11システム。9コアのCell B.E.を利用したシステムは3件である。Red Stormは13位に落ちてしまったが、quad-core Opteronに代えてピークで250 TFlopsを超える予定である。

ベンダ別では、

順位

システム数順

 

性能順

 

1

IBM

210 (42%)

IBM

48%

2

HP

183 (36.6%)

HP

22.4%

3

Dell

27 (5.4%)

 

 

4

SGI

22 (4.4%)

 

 

5

Cray

16 (3.2%)

 

 

 

今回500位のシステムの性能は前回では200位に相当する。これほどの数のシステムが脱落したのはTop500史上初めてである。

今回電力当たりの性能もリストされている。最も高効率なのは、IBMのQS22 Cellで488 MFlops/W、次はIBM Blue Gene/Pで376 MFlops/Wである。IntelのHarpertownのquad-coreもこれに次いでおり、IBM BladeCenter HS21は256 MFlops/W、SGI Altix ICE 8200EXは240 MFLops/W、Hewlett-Packard Cluster Platform 3000 BL2x220は227 MFlops/Wであり、いずれもBlueGene/Lの210 MFlops/Wをすでに越えている。

設置場所の国・地域別では、

国または地域

今回

前回

アメリカ合衆国

257

ヨーロッパ

184

149

 内 イギリス

53

48

 内 ドイツ

46

31

アジア

48

58

 内 日本

12

10

 内 インド

6

9

 内 台湾

3

11

 

5) Top500(2008年6月、日本)
100位までの日本設置マシンは以下の通り。

順位

前回

設置場所

機種名

cores

Rmax

Rpeak

17

東京大学

T2K Open Supercomputer – 日立

12288

82.984

113.05

21

筑波大学

T2K Open Supercomputer – Appro

10000

76.46

92.0

25

(16)

東京工業大学

TSUBAME Grid Cluster with CompView TSUBASA – Sun Fire x4600/x6250

12344

67.7

109.728

35

京都大学

T2K Open Supercomputer/Kyodai – Fujitsu Cluster HX600, 

6656

50.51

61.235

50

30

JAMSTEC

地球シミュレータ

5120

35.86

40.96

77

国立天文台

Cray XT4 QuadCore 2.2 GHz

3248

22.93

28.582

 

東京工業大学のTSUBAMEはRmaxは上がったが順位は落ちてしまった。地球シミュレータは50位に落ちてしまったが、次年度にはSX-9に置き換えてRpeak=131 TFlopsになる予定である。

6) Green500
昨年から正式に始まった消費電力当たりの演算性能を競う2008年6月のGreen500の上位10位は以下の通り。第2回目である。Top500とは独立に、2008年2月にも非公式のリストが発表されている。

順位

MFlops/W

設置場所

システム

Power (kW)

Top500

1tie

488.14

IBM Germany

Monte Capanne – BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz,

22.76

325

1tie

488.14

Fraunhofer ITWM (独)

Cell – BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz,

18.97

456

3

437.43

LANL

Roadrunner – BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz

2345.5

1

4tie

371.75

ANL

Blue Gene/P Solution

31.5

305tie

4tie

371.75

Dublin Institute for Advanced Studies

Schrdinger – Blue Gene/P Solution

31.5

305tie

4tie

371.75

Daresbury Laboratory (英)

Blue Gene/P Solution

31.5

305tie

7tie

371.67

MPI/IPP (独)

Genius – Blue Gene/P Solution

94.5

52tie

7tie

371.67

Stony Brook/BNL

New York Blue – Blue Gene/P Solution

63

75tie

7tie

371.67

ASTRON/University Groningen

Blue Gene/P Solution

94.5

52tie

7tie

371.67

IBM Rochester

Blue Gene/P Solution

126

38

7tie

371.67

ORNL

Blue Gene/P Solution

63

75

 

Cell B.E.とBlue Gene/Pとで上位が占められてしまった。RoadrunnerがTop500でトップを取り、Green500でも3位というのは驚異的である。

この表を見て、同じBlue Gene/Pであっても、ノード数の違うマシンに対し、MFlops/Wが5桁も一致するとは考えられない。全部は実測していないのではないか。とすると表で4位tieと7位tieとに実質的な差違があるとは思えない。

次はSC08 (Austin)である。目玉はアクセラレータとエクサフロップスであった。

 

left-arrow   new50history-bottom   right-arrow