新HPCの歩み(第272回)-2008年(k)-
|
第10回目となるCluster 2008はつくば国際会議場(で開催された。ISC2008では直前にRoadrunnerがLinpackで1 PFlops越えを達成したので、その話題で持ちきりであった。急遽、パネル討論会が企画され松岡聡もパネリストに。2回目のGreen500の上位はCell B.E.とBlue Gene/Pのオンパレードであった。 |
国際会議(続き)
20) Lattice 2008(Willamsburg)
第26回のInternational Symposium on Lattice Field Theory(通称Lattice 2008)は、2008年7月14日~19日に米国バージニア州Willamsburgで開催された。会議録は、オンラインでPoS上に公開されている。
21) HOT CHIPS 20 (2008)(Stanford大学)
1989年から始まり、Stanford大学またはその周辺で開催されて来た高性能半導体の国際会議HOT CHIPSは、20回目のHOT CHIPS 20 (2008)をStanford大学のMemorial Auditoriumにおいて、2007年8月24日~26日に開催した。基調講演2件とパネル討論は以下の通り。
|
基調講演 |
Making Cars Drive Themselves |
Sebastian Thurn, Stanford University |
|
パネル討論 |
Ready, Fire, Aim – 20 years of hits & misses at Hot Chips |
Session Chair: Nick Tredennick |
|
基調講演 |
SunPower’s History and Technology |
Richard Swanson, SunPower |
22) Euro-Par 2008(カナリア諸島)
第14回目となるEuro-Par 2008 – Parallel Processing, 14th International Euro-Par Conferenceは、2008年8月26日~29日にスペインのLas Palmas de Gran Canaria(カナリア諸島ラス・パルマス県)で開催された。会議録はSpringer社からLNCS 5168およびLNCS 5415として出版されている。
23) IFIP 2008(Milano)
第20回目となるIFIP Congress 2008は、2008年9月7日~10日にイタリアのMilanoで開催された。会議録は十数巻に分かれてSpringerから出版されている。
24) EuroPVM-MPI 2008(Dublin)
15回目となるEuroPVM-MPI 2008(15th European PVM/MPI Users’ Group Meeting)は、2008年9月7日~10日にアイルランドのDublinで開催された。7件の招待講演と1件のチュートリアルが行われた。
|
招待講演 |
|
|
The Next Frontier |
George Bosilca |
|
Fault Tolerance for PetaScale Systems: Current Knowledge, Challenges and Opportunities |
Franck Cappello |
|
Managing Multicore with OpenMP (Extended Abstract) |
Barbara Chapman |
|
MPI Must Evolve or Die |
Al Geist |
|
MPI and Hybrid Programming Models for Petascale Computing |
William D. Gropp |
|
Some Aspects of Message-Passing on Future Hybrid Systems |
Rolf Rabenseifner |
|
From Parallel Virtual Machine to Virtual Parallel Machine: The Unibus System |
Vaidy Sunderam |
|
チュートリアル |
|
|
EuroPVM/MPI Full-Day Tutorial. Using MPI-2: A Problem-Based Approach |
William Gropp, Ewing Lusk |
Proceedingsは、‟Recent Advances in Parallel Virtual Machine and Message Passing Interface”のタイトルで、Springer社からLNCS 5205として出版されている。
25) ICPP 2008(Portland)
第37回目となるICPP 2008 (International Conference on Parallel Processing)は、2008年9月8日から12日にオレゴン州Portlandで開催された。3回目の4年周期の3年目である。主催はIACC (The International Association for Computers and Communications)で共催はPortland State UniversityとThe Ohio State Universityである。2件の基調講演が行われた。
|
Stream Programming : Parallel Processing Made Simple |
Bill Dally, Stanford University |
|
The Future of Multi-core: Intel’s Tera-scale Computing Research |
Jim Held, Intel |
電子版会議録は、IEEE XploreとIEEE/CSに置かれている。
26) Cluster 2008(つくば)
第10回目となるCluster 2008 (2008 IEEE International Conference on Cluster Computing)は、2008年9月29日~10月1日に、つくば国際会議場(エポカルつくば)で開催された。組織委員長は石川裕(東大)、プログラム委員長は佐藤三久(筑波大学)であった。基調講演、招待講演、パネルは以下の通り。
|
Keynote |
Clouds, Clusters and ManyCore: The Revolution Ahead |
Daniel A. Reed, Microsoft |
|
Panel |
Will the First Exascale Machine be a Commodity Cluster, or Something Else? |
Moderator: Satoshi Matsuoka, Titech |
|
Invited |
Designing Next Generation Clusters with InfiniBand and 10GE/iWARP: Opportunities and Challenges |
D. K. Panda, Ohio State U. |
会議録はIEEEから出版されている。iWAPT 2008、HiperIO 2008、HAC 2008(International Workshop on Hybrid Architecture Computing 2008)などのWSが併設され、最終日10月1日に開催された。
27) The Grace Hopper Celebration of Women in Computing (GHC)(Hyannis)
第8回のThe Grace Hopper Celebration of Women in Computing 2008は、2008年10月1日~4日にコロラド州Keystone Resortで“We Build a Better World”をテーマに開催された。主催はAnita Borg Institute。参加者は1446人。
28) 第9回Teraflop workshop(東北大学)
第9回Teraflop workshopが、2008年11月12日~13日に東北大学で開催された。主催は東北大学情報シナジーセンター、HLRS、GSIS、NECである。プログラムは残っていない。
29) SC08(Austin)
SC08(2008年11月15日~21日, Austin Convention Center)については別に記す。
30) ICPADS 2008(Melbourne)
ICPADS 2008 (2008 14th IEEE International Conference on Parallel and Distributed Systems)は2008年12月8日~10日にオーストラリアのMelbourneで開催された。会議録はIEEEから発行されている。
ISC2008
第23回目となるISC 2008 (International Supercomputing Conference)は、2008年6月17日~20日にドイツのDresdenで開催された。私は出席しなかったが、参加者は1375名、展示は80件とのことである。Dresdenは3回目でこれが最後となった。
1) Roadrunnerパネル
直前の6月9日にLANLのRoadrunnerがLinpackで1 PFlops越えを達成したので、その話題で持ちきりであった。急遽、これを祝してパネル討論会“First Panel Discussion on Breaking the Petaflop/s Barrier”を18日(水)午後6時~7時に企画した。
|
モデレータ:Prof. Hans Meuer |
|
パネリスト:Dr. Andrew White (LANL) Dr. Don Grice (IBM) Dr. Horst Simon (LBNL) 松岡聡博士 (東京工業大学) Dr. Michael Resch (HLRS (Stuttgart)) Dr. Jack Dongarra (Tennessee) Dr. Erich Strohmaier (LBNL) |
また、“Is HPC Going Green?”というパネル討論会も行われた。
2) 基調講演
3件の基調講演が行われた。
(a) 松岡聡
水曜日(6月18日)の基調講演は松岡聡(東京工業大学)で、”Commodity Prevails-Democratization of Supercomputing”と題して講演した。
その中で、「Roadrunnerが重要なのは、1 PFlopsの達成だけでなく、同時にcommodity cluster及びヘテロマシンが初のNo.1になったことだ。」と、Roadrunnerの特異性を強調した。
(b) Justin Ratner
木曜日(6月19日)の基調講演はIntelのJustin Ratnerで、“Multicore/Manycore Platforms Bring Supercomputing to the Masses”という講演を行った。
(c) John Salmon
金曜日(6月20日)の基調講演はD.E. Shaw ResearchのJohn Salmonで、“Toward Millisecond-Scale Molecular Dynamics Simulation of Proteins”という講演を行った。Antonの話をしたのであろう。
3) Tom Sterling
2004年から直近一年間の総括講演を行っているThomas Sterlingは、この一年を“Run-up to Petaflops”と総括した。
4) Top500(2008年6月、世界)
31回目のTop500であるが、日本時間18日、しばらくweb siteが閉まっていると思っていたら、17時過ぎに発表になった。20位までは以下の通り。前回の順位に括弧がついているのは、アップグレードまたはチューニングによって性能向上があったことを示す。
|
順位 |
前回 |
設置場所 |
機種名 |
cores |
Rmax |
Rpeak |
|
1 |
- |
LANL |
Roadrunner-QW22/LS21, Cell 8i 3.2GHz |
122400 |
1026 |
1375.78 |
|
2 |
1 |
LLNL |
BlueGene/L |
212992 |
478.2 |
596.378 |
|
3 |
- |
NICS,Tennessee |
Kraken XT5 – QC 2.3 GHz |
66000 |
463.3 |
607.2 |
|
4 |
- |
ANL |
Intrepid – Blue Gene/P |
163840 |
450.3 |
557.056 |
|
5 |
- |
TACC, Texas |
Ranger – SunBlade x6420, Opteron QC |
62976 |
326.0 |
503.808 |
|
6 |
(7) |
ORNL |
Jaguar – Cray XT4 QC 2.1 GHz |
30976 |
205.0 |
260.2 |
|
7 |
(2) |
FZJ |
JUGENE – Blue Gene/P |
65536 |
180.0 |
222.822 |
|
8 |
(3) |
NMCAC, N.M. |
Encanto – Altix ICE 8200 QC 3.0 GHz |
14336 |
133,2 |
172.032 |
|
9 |
(4) |
TATA SONS, India |
EKA – Cluster Platform 3000, HP |
14384 |
132.8 |
172.608 |
|
10 |
- |
IDRIS, France |
Blue Gene/P |
40960 |
112.5 |
139.264 |
|
11 |
- |
Total Exploration |
Altix ICE 8200EX, Xeon QC 3.0 GHz |
10240 |
106.1 |
122.88 |
|
12 |
5 |
政府機関 Sweden |
Cluster Platform 3000, HP |
13728 |
102.8 |
146.43 |
|
13 |
6 |
SNL |
Red Storm – Opteron DC 2.4 GHz |
26569 |
102.2 |
127.531 |
|
14 |
- |
EDF R&D, France |
Frontier2 BG/L – Blue Gene/P |
32768 |
93.0 |
111.411 |
|
15 |
8 |
IBM Watson |
BGW – Blue Gene |
40960 |
91.29 |
114.688 |
|
16 |
9 |
NERSC |
Franklin – Cray XT4, 2.6 GHz |
19320 |
85.368 |
100.464 |
|
17 |
- |
東京大学 |
T2K Open Supercomputer |
12288 |
82.984 |
113.05 |
|
18 |
10 |
Stony Brook/BNL |
New York Blue – Blue Gene |
36864 |
82.161 |
103.219 |
|
19 |
- |
ECMWF |
Power 575, p6 4.7 GHz |
8320 |
80.3 |
156.416 |
|
20 |
- |
MPI/PP |
VIP – Power 575, p6 4.7 GHz |
6720 |
80.3 |
126.336 |
当初の発表では3位のKrakenがなく、この表ではその下から1番ずつ繰り下がっている。例えばT2K(筑波)は20位だったのだが、21位になってしまった。19位と20位はGFlopsの位まで全く一致しているが、コア数が違うのでおかしい。ECMWFの方は実測していないのではないか。もし測れば、99 TFlops前後で14位あたりに入ったのではないか。インドのシステムがTop10に入ったのは2回目である。アメリカ製でないシステムの最高位は東大のT2Kのようである。
今回特記すべきこととして、quad-core processorが急速に登場していることが挙げられる。各社合わせて283のシステムがこれを利用している。Dual coreは203システム、single coreは11システム。9コアのCell B.E.を利用したシステムは3件である。Red Stormは13位に落ちてしまったが、quad-core Opteronに代えてピークで250 TFlopsを超える予定である。
ベンダ別では、
|
順位 |
システム数順 |
|
性能順 |
|
|
1 |
IBM |
210 (42%) |
IBM |
48% |
|
2 |
HP |
183 (36.6%) |
HP |
22.4% |
|
3 |
Dell |
27 (5.4%) |
|
|
|
4 |
SGI |
22 (4.4%) |
|
|
|
5 |
Cray |
16 (3.2%) |
|
|
今回500位のシステムの性能は前回では200位に相当する。これほどの数のシステムが脱落したのはTop500史上初めてである。
今回電力当たりの性能もリストされている。最も高効率なのは、IBMのQS22 Cellで488 MFlops/W、次はIBM Blue Gene/Pで376 MFlops/Wである。IntelのHarpertownのquad-coreもこれに次いでおり、IBM BladeCenter HS21は256 MFlops/W、SGI Altix ICE 8200EXは240 MFLops/W、Hewlett-Packard Cluster Platform 3000 BL2x220は227 MFlops/Wであり、いずれもBlueGene/Lの210 MFlops/Wをすでに越えている。
設置場所の国・地域別では、
|
国または地域 |
今回 |
前回 |
|
アメリカ合衆国 |
257 |
? |
|
ヨーロッパ |
184 |
149 |
|
内 イギリス |
53 |
48 |
|
内 ドイツ |
46 |
31 |
|
アジア |
48 |
58 |
|
内 日本 |
12 |
10 |
|
内 インド |
6 |
9 |
|
内 台湾 |
3 |
11 |
5) Top500(2008年6月、日本)
100位までの日本設置マシンは以下の通り。
|
順位 |
前回 |
設置場所 |
機種名 |
cores |
Rmax |
Rpeak |
|
17 |
- |
東京大学 |
T2K Open Supercomputer – 日立 |
12288 |
82.984 |
113.05 |
|
21 |
- |
筑波大学 |
T2K Open Supercomputer – Appro |
10000 |
76.46 |
92.0 |
|
25 |
(16) |
東京工業大学 |
TSUBAME Grid Cluster with CompView TSUBASA – Sun Fire x4600/x6250 |
12344 |
67.7 |
109.728 |
|
35 |
- |
京都大学 |
T2K Open Supercomputer/Kyodai – Fujitsu Cluster HX600, |
6656 |
50.51 |
61.235 |
|
50 |
30 |
JAMSTEC |
地球シミュレータ |
5120 |
35.86 |
40.96 |
|
77 |
- |
国立天文台 |
Cray XT4 QuadCore 2.2 GHz |
3248 |
22.93 |
28.582 |
東京工業大学のTSUBAMEはRmaxは上がったが順位は落ちてしまった。地球シミュレータは50位に落ちてしまったが、次年度にはSX-9に置き換えてRpeak=131 TFlopsになる予定である。
6) Green500
昨年から正式に始まった消費電力当たりの演算性能を競う2008年6月のGreen500の上位10位は以下の通り。第2回目である。Top500とは独立に、2008年2月にも非公式のリストが発表されている。
|
順位 |
MFlops/W |
設置場所 |
システム |
Power (kW) |
Top500 |
|
1tie |
488.14 |
IBM Germany |
Monte Capanne – BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz, |
22.76 |
325 |
|
1tie |
488.14 |
Fraunhofer ITWM (独) |
Cell – BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz, |
18.97 |
456 |
|
3 |
437.43 |
LANL |
Roadrunner – BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz |
2345.5 |
1 |
|
4tie |
371.75 |
ANL |
Blue Gene/P Solution |
31.5 |
305tie |
|
4tie |
371.75 |
Dublin Institute for Advanced Studies |
Schrdinger – Blue Gene/P Solution |
31.5 |
305tie |
|
4tie |
371.75 |
Daresbury Laboratory (英) |
Blue Gene/P Solution |
31.5 |
305tie |
|
7tie |
371.67 |
MPI/IPP (独) |
Genius – Blue Gene/P Solution |
94.5 |
52tie |
|
7tie |
371.67 |
Stony Brook/BNL |
New York Blue – Blue Gene/P Solution |
63 |
75tie |
|
7tie |
371.67 |
ASTRON/University Groningen |
Blue Gene/P Solution |
94.5 |
52tie |
|
7tie |
371.67 |
IBM Rochester |
Blue Gene/P Solution |
126 |
38 |
|
7tie |
371.67 |
ORNL |
Blue Gene/P Solution |
63 |
75 |
Cell B.E.とBlue Gene/Pとで上位が占められてしまった。RoadrunnerがTop500でトップを取り、Green500でも3位というのは驚異的である。
この表を見て、同じBlue Gene/Pであっても、ノード数の違うマシンに対し、MFlops/Wが5桁も一致するとは考えられない。全部は実測していないのではないか。とすると表で4位tieと7位tieとに実質的な差違があるとは思えない。
次はSC08 (Austin)である。目玉はアクセラレータとエクサフロップスであった。
![]() |
![]() |
![]() |




