HPCの歩み50年(第155回)-2008年(h)-
ISC2008では松岡聡が基調講演を行った。2回目のGreen500の上位はCell B.E.とBlue Gene/Pのオンパレードであった。第10回目となるCluster 2008は、9月29日~10月1日に、つくば国際会議場(で開催された。
国際会議
1) SIAM PP 2008
SIAM PP 2008 (SIAM Conference on Parallel Processing for Scientific Computing)が2008年3月12日~14日にジョージア州AtlantaのThe Renaissance Atlanta Hotel Downtownで開催され、筆者も参加した。日本からもかなり参加した。Downtownと言っても本当の中心部ではなくジョージア工科大学の近くである。筆者が参加したのは、Horst Simonからパネル討論会”PP08: A Global Perspective on Research in Parallel Processing for Scientific Computing”(13日)に出ないかと言われたからである。パネルでは”A Global Perspective on Parallel Processing Research for Scientific Computing in Japan”という発題を行ったが、SIAM Newsの6月号にこのパネルが紹介されていた。その中で筆者の発題について:
Considering the quest over the last three decades to build the world’s fastest supercomputer, Yoshio Oyanagi of Kogakuin University in Tokyo mentioned key differences between Japan and the U.S. In particular, he contrasted the U.S. strategy of multiprocessors made up of scalar/super-scalar processors with the Japanese emphasis on vector architectures. In Japan, he pointed out, practical parallel processing for scientific computing was initiated by application developers, rather than by the computer science community. Oyanagi alluded to one consequence of the Japanese architectural approach: Application scientists, “spoiled” by vectorization, have found it difficult to adapt to massively parallel machines.
Looking to the future, he said that Japan’s next-generation (10 petaflop/s) machine is scheduled for completion in 2012, with a portion of it to be dedicated to international collaboration.
と書かれている。これでは、日本にはベクトルしかないみたいである。まあ、アメリカでの「受け」を狙ったところが取り上げられているので、自業自得であるが。
最終日、昼から雷雨気味であった。夕方、アメリカ人1人を囲んで日本人10名が近くの地ビール工場の見学に行き、帰ってきてほどなくまた雨が降り出した。稲妻もかなりひどく、もう一足遅ければずぶ濡れになったところである。5分ほどの停電もあった。ホテルのバーで飲んでいたら、(Goto BLASの)後藤氏が通りかかり、「竜巻だ」と言っていた。まあたいしたことはないだろうとたかをくくっていたが、CNNを見たら半端ではないようである。翌朝、飛行場に行くタクシーのドライバーに「夕べ竜巻があったんだって?」と言ったら、「ほらそこを見ろ。一直線に家が壊れているだろう。これが竜巻の跡だ。」とか言っていた。アメリカで竜巻は多いが、大都市部を襲うことは珍しいそうである。
CNNの記事によると、「病院などで確認した負傷者は少なくとも15人。竜巻は同市の北西部から南東部に進み、家屋の屋根をもぎ取るなどの破壊力を見せた。樹木がなぎ倒されて車両や家屋に当たり、ビルが損壊するなどの被害も出ている。同日夜10時まで竜巻警報が出ていたが、襲来したのは午後9時45分ごろだったという。CNN本社が入るビルも天井から水が漏れ、インターネット・ニュースの編集部門の窓ガラスが割れるなどの被害が出た。隣接するホテルの窓もほとんどが割れ、宿泊客が避難を強いられた。近くにあるオリンピック公園も大きな被害を受け、通りには竜巻が巻き込んだ樹木や宣伝板などの破片が散乱した。」ジョージア工科大学の学生寮には地下室への避難命令が出たそうである。
ちなみに、10年後に当たる先日3月7日~10日に早稲田大学でSIAM PP 2018が開催された。
2) CGO 2008
第6回目となるCGO-2008 (2008 International Symposium on Code Generation and Optimization)は、4月6日~9日にBostonのOmni Parker House Hotelで開催された。初日には5件のworkshopsと2件のtutorialsが規格された。3件の基調講演が行われた。
Vivek Sarkar, Rice University | Code Optimization of Parallel Programs |
Norm Rubin, AMD | Issues and Challenges in Compiling for Graphics Processors |
Robert Griesemer, Google | Parallelism by Design: Data Analysis with Sawzall |
3) IPDPS 2008
第21回目となるIPDPS 2008 (22nd International Parallel and Distributed Processing Symposium)は、2008年4月14日~18日にフロリダ州Miamiの Hyatt Regency Hotelで開催された。主催はIEEE/CS PCPP、共催はIEEE/CS TCCA、IEEE/CS TCDP、ACM SIGARCHである。22件のWorkshopsと1件のTutorialが行われた。基調講演は以下の3件である。
Joel Saltz, Ohio State U. | Translational Research Design Templates, Grid Computing, and HPC |
Katherine Yelick, NERSC | Programming Models for Petascale to Exascale |
Dror Feitelson, The Hebrew University of Jerusalem | Looking at Data |
会議録はIEEEからCD-ROMで発行されている。
4) Computing Frontier 2008
Computing Frontier 2008 (ACM International Conference on Computing Frontiers)は、2008年5月5日~7日に、例年通りイタリアの観光地Ischia島で開催された。主催はACM SIGMICROである。以下の基調講演が行われた。
Keynote 1 | Valentina Salapura, IBM | Scaling Up Next Generation Supercomputers |
Keynote 2 | Keshav Pingali, Texas大Austin校 | Data-parallel Abstractions for Irregular Programs |
Keynote 3 | Raffaele Tripiccione, Universita’ di Ferrara, Italy | JANUS: Reconfigurable High-Performance Computing for Physics |
5) IWOMP2008
4回目となるIWOMP2008 (4th International Workshop on OpenMP)は、2008年5月12日~14日にインディアナ州のWest Lafayetteで開催された。会議録はSpringerからLNCS 5004として出版されている。
6) CCGrid2008
第8回目となるCCGrid2008 (8th IEEE International Symposium on Cluster Computing and the Grid)は、2008年5月19日~22日にフランスのLyonで開催された。3件の基調講演が行われた。組織委員長はLaurent Lefevre and Craig Lee、プログラム委員長はThierry Priolであった。参加者は260人。
Jack Dongarra, U. of Tennessee/ORNL | Four Important Concepts to Consider when Using Computing Clusters and Grids |
Christine Morin, INRIA | Beyond Grid middleware: XtreemOS Vision |
Hamid Pirahesh, IBM | Impact of Cloud Computing on Emerging Software Systems and Solutions |
7) ICS 2008
第22回となるICS 2008 (the 22nd annual international conference on Supercomputing)は、2008年6月7日~12日にギリシャのIsland of Kos(エーゲ海にあるコス島、ギリシャ本土よりトルコに近い島)で開催された。主催はACM SIGARCH、共同議長はAvi Mendelson (Intel Corp)と Kyle Gallivan (Florida State Univ.)であった。以下の基調講演が行われた。
Mark Harris, NVIDIA | NVIDIA CUDA Software and Parallel Computing Architecture |
Tilak Agerwala, IBM Research | Challenges on the Road to Exascale Computing |
David E. Keyes, Columbia University | Petaflop/s, Seriously |
会議録はACMから出版されている。
8) ISC 2008
ISC 2008(2008年6月17日~20日、Dresden)については別に記す。
9) ISCA 2008
第35回目となるISCA 2008 (35th International Symposium on Computer Architecture)は、2008年6月21日~25日に中国の北京で開催された。主催はACM SIGARCHとIEEE/CS TCCAである。
電子版会議録はACM、IEEE、IEEE/CSに置かれている。
10) ICCS 2006
第8回目となるICCS 2008 (International Conference on Computational Scinece)は、2008年6月23日~25日にポーランドのKrakowで開催された。10件の基調講演が行われた。会議録はSpringerからLNCS 5101~5103として出版されている。
11) HPDC-17
第17回に当たるHPDC-17 (The 17th International Symposium on High Performance Distributed Computing)は、2008年6月23日~27日にBostonのRadisson Hotelで開催された。23日、24日には計5件のワークショップが開催された。基調講演は3件行われた。
Daniel A. Reed, Microsoft Research | Clouds and ManyCore: The Revolution |
Peter Vosshall, Amazon | Web-scale Computing: The Power of Infrastructure as a Service |
Andrew Grimshaw,m U. of Virginia | Why Grids Have Failed to Cross the Chasm? |
会議録はACMから出版されている。
12) ICPP 2008
第37回目となるICPP 2008 (International Conference on Parallel Processing)は、2008年9月8日から12日にオレゴン州Portlandで開催された。主催はIACC (The International Association for Computers and Communications)で共催はPortland State UniversityとThe Ohio State Universityである。2件の基調講演が行われた。
Bill Dally, Stanford University | Stream Programming : Parallel Processing Made Simple |
Jim Held, Intel | The Future of Multi-core: Intel’s Tera-scale Computing Research |
電子版会議録は、IEEE XploreとIEEE/CSに置かれている。
13) Cluster 2008
第10回目となるCluster 2008 (2008 IEEE International Conference on Cluster Computing)は、2008年9月29日~10月1日に、つくば国際会議場(エポカルつくば)で開催された。組織委員長は石川裕(東大)、プログラム委員長は佐藤三久(筑波大学)であった。基調講演、招待講演、パネルは以下の通り。
Keynote | Daniel A. Reed, Microsoft | Clouds, Clusters and ManyCore: The Revolution Ahead |
Panel | Moderator: Satoshi Matsuoka, Titech | Will the First Exascale Machine be a Commodity Cluster, or Something Else? |
Invited | D. K. Panda, Ohio State U. | Designing Next Generation Clusters with InfiniBand and 10GE/iWARP: Opportunities and Challenges |
会議録はIEEEから出版されている。iWAPT 2008、HiperIO 2008、HAC 2008(International Workshop on Hybrid Architecture Computing 2008)などのWSが併設され、最終日10月1日に開催された。
14) SC08
SC08(2008年11月15日~21日, Austin Convention Center)については別に記す。
15) ICPADS 2008
ICPADS 2008 (2008 14th IEEE International Conference on Parallel and Distributed Systems)は2008年12月8日~10日にオーストラリアのMelbourneで開催された。会議録はIEEEから発行されている。
ISC2008
第23回目となるISC 2008 (International Supercomputing Conference)は、2008年6月17日~20日にドイツのDresdenで開催された。私は出席しなかったが、参加者は1375名、展示は80件とのことである。Dresdenは3回目でこれが最後となった。
1) Roadrunnerパネル
直前の6月9日にLANLのRoadrunnerがLinpackで1 PFlops越えを達成したので、その話題で持ちきりであった。急遽、パネル討論会“First Panel Discussion on Breaking the Petaflop/s Barrier”を18日(水)午後6時~7時に企画した。パネリストは、LANLのDr. Andrew White とIBMの Dr. Don Grice を中心に、LBNLのDr. Horst Simon、東京工業大学の松岡聡、HLRS (Stuttgart)のDr. Michael Resch、Top500を主催するTennessee大学のDr. Jack DongarraとLBNLのDr. Erich Strohmaierである。モデレータはProf. Hans Meuer。
2) 松岡基調講演
松岡聡(東京工業大学)が”Commodity Prevails-Democratization of Supercomputing”と題して基調講演を行った。その中で、「Roadrunnerが重要なのは、1 PFlopsの達成だけでなく、同時にcommodity cluster及びヘテロマシンが初のNo.1になったことだ。」と、Roadrunnerの意義を強調した。
3) Top500
31回目のTop500であるが、日本時間18日、しばらくweb siteが閉まっていると思っていたら、5時過ぎに発表になった。20位までは以下の通り。前回の順位に括弧がついているのは、アップグレードまたはチューニングによって性能向上があったことを示す。
順位 | 前回 | 設置場所 | 機種名 | cores | Rmax | Rpeak |
1 | - | LANL | Roadrunner-QW22/LS21, Cell 8i 3.2GHz | 122400 | 1026 | 1375.78 |
2 | 1 | LLNL | BlueGene/L | 212992 | 478.2 | 596.378 |
3 | - | NICS,Tennessee | Kraken XT5 – QC 2.3 GHz | 66000 | 463.3 | 607.2 |
4 | - | ANL | Intrepid – Blue Gene/P | 163840 | 450.3 | 557.056 |
5 | - | TACC | Texas – Ranger – SunBlade x6420, Opteron QC | 62976 | 326.0 | 503.808 |
6 | (7) | ORNL | Jaguar – Cray XT4 QC 2.1 GHz | 30976 | 205.0 | 260.2 |
7 | (2) | FZJ | JUGENE – Blue Gene/P | 65536 | 180.0 | 222.822 |
8 | (3) | NMCAC,N.M. | Encanto – Altix ICE 8200 QC 3.0 GHz | 14336 | 133.2 | 172.032 |
9 | (4) | TATA SONS, India | EKA – Cluster Platform 3000, HP | 14384 | 132.8 | 172.608 |
10 | - | IDRIS, France | Blue Gene/P | 40960 | 112.5 | 139.264 |
11 | - | Total Exploration | Altix ICE 8200EX, Xeon QC 3.0 GHz | 10240 | 106.1 | 122.88 |
12 | 5 | 政府機関 Sweden | Cluster Platform 3000, HP | 13728 | 102.8 | 146.43 |
13 | 6 | SNL | Red Storm – Opteron DC 2.4 GHz | 26569 | 102.2 | 127.531 |
14 | - | EDF R&D, France | Frontier2 BG/L – Blue Gene/P | 32768 | 93.0 | 111.411 |
15 | 8 | IBM Watson | BGW – Blue Gene | 40960 | 91.29 | 114.688 |
16 | 9 | NERSC | Franklin – Cray XT4, 2.6 GHz | 19320 | 85.368 | 100.464 |
17 | - | 東京大学 | T2K Open Supercomputer | 12288 | 82.984 | 113.05 |
18 | 10 | Stony Brook/BNL | New York Blue – Blue Gene | 36864 | 82.161 | 103.219 |
19 | - | ECMWF | Power 575, p6 4.7 GHz | 8320 | 80.3 | 156.416 |
20 | - | MPI/PP | VIP – Power 575, p6 4.7 GHz | 6720 | 80.3 | 126.336 |
当初の発表では3位のKrakenがなく、この表ではその下から1番ずつ繰り下がっている。例えばT2K(筑波)は20位だったのだが、21位になってしまった。19位と20位はGFlopsの位まで全く一致しているが、コア数が違うのでおかしい。ECMWFの方は実測していないのではないか。インドのシステムがTop10に入ったのは2回目である。アメリカ製でないシステムの最高位は東大のT2Kのようである。
今回特記すべきこととして、quad-core processorが急速に登場していることが挙げられる。各社合わせて283のシステムがこれを利用している。Dual coreは203システム、single coreは11システム。9コアのCell B.E.を利用したシステムは3件である。Red Stormは13位に落ちてしまったが、quad-core Opteronに代えてピークで250 TFlopsを超える予定である。
ベンダ別では、
順位 | システム数順 | 性能順 | ||
1 | IBM | 210 (42%) | IBM | 48% |
2 | HP | 183 (36.6%) | HP | 22.4% |
3 | Dell | 27 (5.4%) | ||
4 | SGI | 22 (4.4%) | ||
5 | Cray | 16 (3.2%) |
今回500位のシステムの性能は前回では200位に相当する。これほどの数のシステムが脱落したのはTop500史上初めてである。
今回電力当たりの性能もリストされている。最も高効率なのは、IBMのQS22 Cellで488 MFlops/W、次はIBM Blue Gene/Pで376 MFlops/Wである。IntelのHarpertownのquad-coreもこれに次いでおり、
IBM BladeCenter HS21は256 MFlops/W、SGI Altix ICE 8200EXは240 MFLops/W、Hewlett-Packard Cluster Platform 3000 BL2x220は227 MFlops/Wであり、いずれもBlueGene/Lの210 MFlops/Wをすでに越えている。
設置場所の国・地域別では、
国または地域 | 今回 | 前回 |
アメリカ合衆国 | 257 | ? |
ヨーロッパ | 184 | 149 |
内 イギリス | 53 | 48 |
内 ドイツ | 46 | 31 |
アジア | 48 | 58 |
内 日本 | 12 | 10 |
内 インド | 6 | 9 |
内 台湾 | 3 | 11 |
100位までの日本は以下の通り。
順位 | 前回 | 設置場所 | 機種名 | cores | Rmax | Rpeak |
17 | - | 東京大学 | T2K Open Supercomputer – 日立 | 12288 | 82.984 | 113.05 |
21 | - | 筑波大学 | T2K Open Supercomputer – Appro | 10000 | 76.46 | 92.0 |
25 | (16) | 東京工業大学 | TSUBAME Grid Cluster with CompView TSUBASA – Sun Fire x4600/x6250 | 12344 | 67.7 | 109.728 |
35 | - | 京都大学 | T2K Open Supercomputer/Kyodai – Fujitsu Cluster HX600 | 6656 | 50.51 | 61.235 |
50 | 30 | JAMSTEC | 地球シミュレータ | 5120 | 35.86 | 40.96 |
77 | - | 国立天文台 | Cray XT4 QuadCore 2.2 GHz | 3248 | 22.93 | 28.582 |
東京工業大学のTSUBAMEはRmaxは上がったが順位は落ちてしまった。地球シミュレータは50位に落ちてしまったが、次年度にはSX-9に置き換えてRpeak=131 TFlopsになる予定である。
4) Green500
昨年から正式に始まった消費電力当たりの演算性能を競うGreen500の2008年6月の上位10位は以下の通り。第2回目である。Top500とは独立に、2008年2月にも非公式のリストが発表されている。
順位 | MFlops/W | 設置場所 | システム | Power (kW) | Top500 |
1tie | 488.14 | IBM Germany | Monte Capanne – BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz | 22.76 | 325 |
1tie | 488.14 | Fraunhofer ITWM (独) | Cell – BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz | 18.97 | 456 |
3 | 437.43 | LANL | Roadrunner – BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz | 2345.5 | 1 |
4tie | 371.75 | ANL | Blue Gene/P Solution | 31.5 | 305tie |
4tie | 371.75 | Dublin Institute for Advanced Studies | Schrdinger – Blue Gene/P Solution | 31.5 | 305tie |
4tie | 371.75 | Daresbury Laboratory (英) | Blue Gene/P Solution | 31.5 | 305tie |
7tie | 371.67 | MPI/IPP (独) | Genius – Blue Gene/P Solution | 94.5 | 52tie |
7tie | 371.67 | Stony Brook/BNL | New York Blue – Blue Gene/P Solution | 63 | 75tie |
7tie | 371.67 | ASTRON/University Groningen | Blue Gene/P Solution | 94.5 | 52tie |
7tie | 371.67 | IBM Rochester | Blue Gene/P Solution | 126 | 38 |
7tie | 371.67 | ORNL | Blue Gene/P Solution | 63 | 75 |
Cell B.E.とBlue Gene/Pとで上位が占められてしまった。この表を見て、同じBlue Gene/Pであっても、ノード数の違うマシンに対し、MFlops/Wが5桁も一致するとは考えられない。全部は実測していないのではないか。とすると表で4位tieと7位tieとに実質的な差違があるとは思えない。
次はSC08 (Austin)である。目玉はアクセラレータとエクサフロップスであった。
![]() |
![]() |
![]() |