世界のスーパーコンピュータとそれを動かす人々


3月 19, 2018

HPCの歩み50年(第155回)-2008年(h)-

小柳 義夫 (高度情報科学技術研究機構)

ISC2008では松岡聡が基調講演を行った。2回目のGreen500の上位はCell B.E.とBlue Gene/Pのオンパレードであった。第10回目となるCluster 2008は、9月29日~10月1日に、つくば国際会議場(で開催された。

国際会議

1) SIAM PP 2008
SIAM PP 2008 (SIAM Conference on Parallel Processing for Scientific Computing)が2008年3月12日~14日にジョージア州AtlantaのThe Renaissance Atlanta Hotel Downtownで開催され、筆者も参加した。日本からもかなり参加した。Downtownと言っても本当の中心部ではなくジョージア工科大学の近くである。筆者が参加したのは、Horst Simonからパネル討論会”PP08: A Global Perspective on Research in Parallel Processing for Scientific Computing”(13日)に出ないかと言われたからである。パネルでは”A Global Perspective on Parallel Processing Research for Scientific Computing in Japan”という発題を行ったが、SIAM Newsの6月号にこのパネルが紹介されていた。その中で筆者の発題について:

Considering the quest over the last three decades to build the world’s fastest supercomputer, Yoshio Oyanagi of Kogakuin University in Tokyo mentioned key differences between Japan and the U.S. In particular, he contrasted the U.S. strategy of multiprocessors made up of scalar/super-scalar processors with the Japanese emphasis on vector architectures. In Japan, he pointed out, practical parallel processing for scientific computing was initiated by application developers, rather than by the computer science community. Oyanagi alluded to one consequence of the Japanese architectural approach: Application scientists, “spoiled” by vectorization, have found it difficult to adapt to massively parallel machines.

Looking to the future, he said that Japan’s next-generation (10 petaflop/s) machine is scheduled for completion in 2012, with a portion of it to be dedicated to international collaboration.

と書かれている。これでは、日本にはベクトルしかないみたいである。まあ、アメリカでの「受け」を狙ったところが取り上げられているので、自業自得であるが。

最終日、昼から雷雨気味であった。夕方、アメリカ人1人を囲んで日本人10名が近くの地ビール工場の見学に行き、帰ってきてほどなくまた雨が降り出した。稲妻もかなりひどく、もう一足遅ければずぶ濡れになったところである。5分ほどの停電もあった。ホテルのバーで飲んでいたら、(Goto BLASの)後藤氏が通りかかり、「竜巻だ」と言っていた。まあたいしたことはないだろうとたかをくくっていたが、CNNを見たら半端ではないようである。翌朝、飛行場に行くタクシーのドライバーに「夕べ竜巻があったんだって?」と言ったら、「ほらそこを見ろ。一直線に家が壊れているだろう。これが竜巻の跡だ。」とか言っていた。アメリカで竜巻は多いが、大都市部を襲うことは珍しいそうである。

CNNの記事によると、「病院などで確認した負傷者は少なくとも15人。竜巻は同市の北西部から南東部に進み、家屋の屋根をもぎ取るなどの破壊力を見せた。樹木がなぎ倒されて車両や家屋に当たり、ビルが損壊するなどの被害も出ている。同日夜10時まで竜巻警報が出ていたが、襲来したのは午後9時45分ごろだったという。CNN本社が入るビルも天井から水が漏れ、インターネット・ニュースの編集部門の窓ガラスが割れるなどの被害が出た。隣接するホテルの窓もほとんどが割れ、宿泊客が避難を強いられた。近くにあるオリンピック公園も大きな被害を受け、通りには竜巻が巻き込んだ樹木や宣伝板などの破片が散乱した。」ジョージア工科大学の学生寮には地下室への避難命令が出たそうである。

ちなみに、10年後に当たる先日3月7日~10日に早稲田大学でSIAM PP 2018が開催された。

2) CGO 2008
第6回目となるCGO-2008 (2008 International Symposium on Code Generation and Optimization)は、4月6日~9日にBostonのOmni Parker House Hotelで開催された。初日には5件のworkshopsと2件のtutorialsが規格された。3件の基調講演が行われた。

Vivek Sarkar, Rice University Code Optimization of Parallel Programs
Norm Rubin, AMD Issues and Challenges in Compiling for Graphics Processors
Robert Griesemer, Google Parallelism by Design: Data Analysis with Sawzall

 

3) IPDPS 2008
第21回目となるIPDPS 2008 (22nd International Parallel and Distributed Processing Symposium)は、2008年4月14日~18日にフロリダ州Miamiの Hyatt Regency Hotelで開催された。主催はIEEE/CS PCPP、共催はIEEE/CS TCCA、IEEE/CS TCDP、ACM SIGARCHである。22件のWorkshopsと1件のTutorialが行われた。基調講演は以下の3件である。

Joel Saltz, Ohio State U. Translational Research Design Templates, Grid Computing, and HPC
Katherine Yelick, NERSC Programming Models for Petascale to Exascale
Dror Feitelson, The Hebrew University of Jerusalem Looking at Data

 

会議録はIEEEからCD-ROMで発行されている。

4) Computing Frontier 2008
Computing Frontier 2008 (ACM International Conference on Computing Frontiers)は、2008年5月5日~7日に、例年通りイタリアの観光地Ischia島で開催された。主催はACM SIGMICROである。以下の基調講演が行われた。

Keynote 1 Valentina Salapura, IBM Scaling Up Next Generation Supercomputers
Keynote 2 Keshav Pingali, Texas大Austin校 Data-parallel Abstractions for Irregular Programs
Keynote 3 Raffaele Tripiccione, Universita’ di Ferrara, Italy JANUS: Reconfigurable High-Performance Computing for Physics

 

5) IWOMP2008
4回目となるIWOMP2008 (4th International Workshop on OpenMP)は、2008年5月12日~14日にインディアナ州のWest Lafayetteで開催された。会議録はSpringerからLNCS 5004として出版されている。

 

6) CCGrid2008
第8回目となるCCGrid2008 (8th IEEE International Symposium on Cluster Computing and the Grid)は、2008年5月19日~22日にフランスのLyonで開催された。3件の基調講演が行われた。組織委員長はLaurent Lefevre and Craig Lee、プログラム委員長はThierry Priolであった。参加者は260人。

Jack Dongarra, U. of Tennessee/ORNL Four Important Concepts to Consider when Using Computing Clusters and Grids
Christine Morin, INRIA Beyond Grid middleware: XtreemOS Vision
Hamid Pirahesh, IBM Impact of Cloud Computing on Emerging Software Systems and Solutions

 

7) ICS 2008
第22回となるICS 2008 (the 22nd annual international conference on Supercomputing)は、2008年6月7日~12日にギリシャのIsland of Kos(エーゲ海にあるコス島、ギリシャ本土よりトルコに近い島)で開催された。主催はACM SIGARCH、共同議長はAvi Mendelson (Intel Corp)と Kyle Gallivan (Florida State Univ.)であった。以下の基調講演が行われた。

Mark Harris, NVIDIA NVIDIA CUDA Software and Parallel Computing Architecture
Tilak Agerwala, IBM Research Challenges on the Road to Exascale Computing
David E. Keyes, Columbia University Petaflop/s, Seriously

 

会議録はACMから出版されている。

8) ISC 2008
ISC 2008(2008年6月17日~20日、Dresden)については別に記す。

9) ISCA 2008
第35回目となるISCA 2008 (35th International Symposium on Computer Architecture)は、2008年6月21日~25日に中国の北京で開催された。主催はACM SIGARCHとIEEE/CS TCCAである。

電子版会議録はACMIEEEIEEE/CSに置かれている。

10) ICCS 2006
第8回目となるICCS 2008 (International Conference on Computational Scinece)は、2008年6月23日~25日にポーランドのKrakowで開催された。10件の基調講演が行われた。会議録はSpringerからLNCS 5101~5103として出版されている。

11) HPDC-17
第17回に当たるHPDC-17 (The 17th International Symposium on High Performance Distributed Computing)は、2008年6月23日~27日にBostonのRadisson Hotelで開催された。23日、24日には計5件のワークショップが開催された。基調講演は3件行われた。

Daniel A. Reed, Microsoft Research Clouds and ManyCore: The Revolution
Peter Vosshall, Amazon Web-scale Computing: The Power of Infrastructure as a Service
Andrew Grimshaw,m U. of Virginia Why Grids Have Failed to Cross the Chasm?

 

会議録はACMから出版されている。

12) ICPP 2008
第37回目となるICPP 2008 (International Conference on Parallel Processing)は、2008年9月8日から12日にオレゴン州Portlandで開催された。主催はIACC (The International Association for Computers and Communications)で共催はPortland State UniversityとThe Ohio State Universityである。2件の基調講演が行われた。

Bill Dally, Stanford University Stream Programming : Parallel Processing Made Simple
Jim Held, Intel The Future of Multi-core: Intel’s Tera-scale Computing Research

 

電子版会議録は、IEEE XploreIEEE/CSに置かれている。

13) Cluster 2008
第10回目となるCluster 2008 (2008 IEEE International Conference on Cluster Computing)は、2008年9月29日~10月1日に、つくば国際会議場(エポカルつくば)で開催された。組織委員長は石川裕(東大)、プログラム委員長は佐藤三久(筑波大学)であった。基調講演、招待講演、パネルは以下の通り。

Keynote Daniel A. Reed, Microsoft Clouds, Clusters and ManyCore: The Revolution Ahead
Panel Moderator: Satoshi Matsuoka, Titech Will the First Exascale Machine be a Commodity Cluster, or Something Else?
Invited D. K. Panda, Ohio State U. Designing Next Generation Clusters with InfiniBand and 10GE/iWARP: Opportunities and Challenges

 

会議録はIEEEから出版されている。iWAPT 2008、HiperIO 2008、HAC 2008(International Workshop on Hybrid Architecture Computing 2008)などのWSが併設され、最終日10月1日に開催された。

14) SC08
SC08(2008年11月15日~21日, Austin Convention Center)については別に記す。

15) ICPADS 2008
ICPADS 2008 (2008 14th IEEE International Conference on Parallel and Distributed Systems)は2008年12月8日~10日にオーストラリアのMelbourneで開催された。会議録はIEEEから発行されている。

ISC2008

第23回目となるISC 2008 (International Supercomputing Conference)は、2008年6月17日~20日にドイツのDresdenで開催された。私は出席しなかったが、参加者は1375名、展示は80件とのことである。Dresdenは3回目でこれが最後となった。

1) Roadrunnerパネル
直前の6月9日にLANLのRoadrunnerがLinpackで1 PFlops越えを達成したので、その話題で持ちきりであった。急遽、パネル討論会“First Panel Discussion on Breaking the Petaflop/s Barrier”を18日(水)午後6時~7時に企画した。パネリストは、LANLのDr. Andrew White とIBMの Dr. Don Grice を中心に、LBNLのDr. Horst Simon、東京工業大学の松岡聡、HLRS (Stuttgart)のDr. Michael Resch、Top500を主催するTennessee大学のDr. Jack DongarraとLBNLのDr. Erich Strohmaierである。モデレータはProf. Hans Meuer。

2) 松岡基調講演
松岡聡(東京工業大学)が”Commodity Prevails-Democratization of Supercomputing”と題して基調講演を行った。その中で、「Roadrunnerが重要なのは、1 PFlopsの達成だけでなく、同時にcommodity cluster及びヘテロマシンが初のNo.1になったことだ。」と、Roadrunnerの意義を強調した。

3) Top500
31回目のTop500であるが、日本時間18日、しばらくweb siteが閉まっていると思っていたら、5時過ぎに発表になった。20位までは以下の通り。前回の順位に括弧がついているのは、アップグレードまたはチューニングによって性能向上があったことを示す。

順位 前回 設置場所 機種名 cores Rmax Rpeak
1 LANL Roadrunner-QW22/LS21, Cell 8i 3.2GHz 122400 1026 1375.78
2 1 LLNL BlueGene/L 212992 478.2 596.378
3 NICS,Tennessee Kraken XT5 – QC 2.3 GHz 66000 463.3 607.2
4 ANL Intrepid – Blue Gene/P 163840 450.3 557.056
5 TACC Texas – Ranger – SunBlade x6420, Opteron QC 62976 326.0 503.808
6 (7) ORNL Jaguar – Cray XT4 QC 2.1 GHz 30976 205.0 260.2
7 (2) FZJ JUGENE – Blue Gene/P 65536 180.0 222.822
8 (3) NMCAC,N.M. Encanto – Altix ICE 8200 QC 3.0 GHz 14336 133.2 172.032
9 (4) TATA SONS, India EKA – Cluster Platform 3000, HP 14384 132.8 172.608
10 IDRIS, France Blue Gene/P 40960 112.5 139.264
11 Total Exploration Altix ICE 8200EX, Xeon QC 3.0 GHz 10240 106.1 122.88
12 5 政府機関 Sweden Cluster Platform 3000, HP 13728 102.8 146.43
13 6 SNL Red Storm – Opteron DC 2.4 GHz 26569 102.2 127.531
14 EDF R&D, France Frontier2 BG/L – Blue Gene/P 32768 93.0 111.411
15 8 IBM Watson BGW – Blue Gene 40960 91.29 114.688
16 9 NERSC Franklin – Cray XT4, 2.6 GHz 19320 85.368 100.464
17 東京大学 T2K Open Supercomputer 12288 82.984 113.05
18 10 Stony Brook/BNL New York Blue – Blue Gene 36864 82.161 103.219
19 ECMWF Power 575, p6 4.7 GHz 8320 80.3 156.416
20 MPI/PP VIP – Power 575, p6 4.7 GHz 6720 80.3 126.336

 

当初の発表では3位のKrakenがなく、この表ではその下から1番ずつ繰り下がっている。例えばT2K(筑波)は20位だったのだが、21位になってしまった。19位と20位はGFlopsの位まで全く一致しているが、コア数が違うのでおかしい。ECMWFの方は実測していないのではないか。インドのシステムがTop10に入ったのは2回目である。アメリカ製でないシステムの最高位は東大のT2Kのようである。

今回特記すべきこととして、quad-core processorが急速に登場していることが挙げられる。各社合わせて283のシステムがこれを利用している。Dual coreは203システム、single coreは11システム。9コアのCell B.E.を利用したシステムは3件である。Red Stormは13位に落ちてしまったが、quad-core Opteronに代えてピークで250 TFlopsを超える予定である。

ベンダ別では、

順位 システム数順   性能順  
1 IBM 210 (42%) IBM 48%
2 HP 183 (36.6%) HP 22.4%
3 Dell 27 (5.4%)    
4 SGI 22 (4.4%)    
5 Cray 16 (3.2%)    

 

今回500位のシステムの性能は前回では200位に相当する。これほどの数のシステムが脱落したのはTop500史上初めてである。

今回電力当たりの性能もリストされている。最も高効率なのは、IBMのQS22 Cellで488 MFlops/W、次はIBM Blue Gene/Pで376 MFlops/Wである。IntelのHarpertownのquad-coreもこれに次いでおり、

IBM BladeCenter HS21は256 MFlops/W、SGI Altix ICE 8200EXは240 MFLops/W、Hewlett-Packard Cluster Platform 3000 BL2x220は227 MFlops/Wであり、いずれもBlueGene/Lの210 MFlops/Wをすでに越えている。

設置場所の国・地域別では、

国または地域 今回 前回
アメリカ合衆国 257
ヨーロッパ 184 149
 内 イギリス 53 48
 内 ドイツ 46 31
アジア 48 58
 内 日本 12 10
 内 インド 6 9
 内 台湾 3 11

 

100位までの日本は以下の通り。

順位 前回 設置場所 機種名 cores Rmax Rpeak
17 東京大学 T2K Open Supercomputer – 日立 12288 82.984 113.05
21 筑波大学 T2K Open Supercomputer – Appro 10000 76.46 92.0
25 (16) 東京工業大学 TSUBAME Grid Cluster with CompView TSUBASA – Sun Fire x4600/x6250 12344 67.7 109.728
35 京都大学 T2K Open Supercomputer/Kyodai – Fujitsu Cluster HX600 6656 50.51 61.235
50 30 JAMSTEC 地球シミュレータ 5120 35.86 40.96
77 国立天文台 Cray XT4 QuadCore 2.2 GHz 3248 22.93 28.582

 

東京工業大学のTSUBAMEはRmaxは上がったが順位は落ちてしまった。地球シミュレータは50位に落ちてしまったが、次年度にはSX-9に置き換えてRpeak=131 TFlopsになる予定である。

4) Green500
昨年から正式に始まった消費電力当たりの演算性能を競うGreen500の2008年6月の上位10位は以下の通り。第2回目である。Top500とは独立に、2008年2月にも非公式のリストが発表されている。

順位 MFlops/W 設置場所 システム Power (kW) Top500
1tie 488.14 IBM Germany Monte Capanne – BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz 22.76 325
1tie 488.14 Fraunhofer ITWM (独) Cell – BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz 18.97 456
3 437.43 LANL Roadrunner – BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz 2345.5 1
4tie 371.75 ANL Blue Gene/P Solution 31.5 305tie
4tie 371.75 Dublin Institute for Advanced Studies Schrdinger – Blue Gene/P Solution 31.5 305tie
4tie 371.75 Daresbury Laboratory (英) Blue Gene/P Solution 31.5 305tie
7tie 371.67 MPI/IPP (独) Genius – Blue Gene/P Solution 94.5 52tie
7tie 371.67 Stony Brook/BNL New York Blue – Blue Gene/P Solution 63 75tie
7tie 371.67 ASTRON/University Groningen Blue Gene/P Solution 94.5 52tie
7tie 371.67 IBM Rochester Blue Gene/P Solution 126 38
7tie 371.67 ORNL Blue Gene/P Solution 63 75

 

Cell B.E.とBlue Gene/Pとで上位が占められてしまった。この表を見て、同じBlue Gene/Pであっても、ノード数の違うマシンに対し、MFlops/Wが5桁も一致するとは考えられない。全部は実測していないのではないか。とすると表で4位tieと7位tieとに実質的な差違があるとは思えない。

次はSC08 (Austin)である。目玉はアクセラレータとエクサフロップスであった。

 

left-arrow   50history-bottom   right-arrow