世界のスーパーコンピュータとそれを動かす人々


7月 17, 2018

HPCの歩み50年(第170回)-2009年(j)-

小柳 義夫 (高度情報科学技術研究機構)

ISC2009においてTop500が発表されたが、日本設置のマシンは20位までから姿を消した。総数も、前回の17台からとうとう史上最低の15台になってしまった。SC09の日本からの参加者は、会議も上の空で事業仕分けへの対策に走り回った。Intel社が招待講演でメニーコアのLarrabeeのデモを行い、1チップで1 TFlops (SP)が出ると述べたが、直後に開発の中止が伝えられた。

ISC2009

1) 全体像

 

第24回目となるISC2009は、2009年6月23日~26日にCongress Centre Hamburgで開催された。Hamburg開催は初めてである。筆者はインフルエンザ騒ぎなどもあり出席しなかったが、出席者は1670人、展示は119件であった。[写真は、国際会議場とこれに隣接するRadison Blu Hotelである。屋根にCCHの文字が見える。向こう側はAlster湖。]

Exhibitionは今年からSCの真似をして18:00からGala Openingになった。展示会場もかなり広くなり、相対的にブースも大きくなって、展示物がSCのように増えかなり意味のある展示会となった。SCでは飲み物券2枚が配られて厳格に管理されているが、今回シャンパンやカクテルがふんだんにふるまわれたとのことである。元禁酒国アメリカと、ヨーロッパの違いであろうか?

基調講演はSun Microsystems社のAndreas von Bechtolsheimである。エクサフロップスに到達するにはどんな技術要件があるかについて論じた。

IDCは、あと数年で全サーバの出荷台数のうち、HPC向けが50%を超えるであろうと予測した。Webサーバやビジネスシステムが仮想化によりどんどんハードを必要としなくなる反面、HPCでは仮想化してもハードは減らないからである。現在10年近く経ったが、はたしてどうなったか?

恒例のThomas Sterlingの”HPC Achievement & Impact”講演は昨年まで月曜午前のOpeningイベントであったが、今年から火曜の17:30になった。

2) Top500(世界)
第33回のTop500が出たが、日本にとっては惨憺たる有様だった。20位までを記す。前回の順位に括弧がついているのは、アップグレードまたはチューニングによって前回より性能向上があったことを示す。

順位 前回 設置場所 機種名 cores Rmax Rpeak
1 1 LANL Roadrunner-QW22/LS21, Cell 8i 3.2 GHz 129600 1105 1456.7
2 2 ORNL Jaguar – Cray XT5 QC 2.3 GHz 150152 1059 1381.4
3 (12) FZJ JUGENE – Blue Gene/P 294912 825.5 1002.7
4 3 NASA/Ames Pleiades – SGI Altix ICE 8200EX, Xeon QC 3.0/2.66 GHz 51200 487.005 608.829
5 4 LLNL BlueGene/L 212992 478.2 596.378
6 5 NICS; Tennessee Kraken XT5 – QC 2.3 GHz 66000 463.3 607.2
7 6 ANL Intrepid – Blue Gene/P 163840 450.3 557.056
8 7 TACC, Texas Ranger – SunBlade x6420, Opteron QC 62976 433.2 579.379
9 LLNL Dawn – Blue Gene/P 147456 415.7 501.35
10 FZJ JUROPA – Sun Constellation 26304 274.8 308.283
11 8 NERSC Franklin – Cray XT4 QuadCore 2.3 GHz 38642 266.3 355.506
12 9 ORNL Jaguar – Cray XT4 QuadCore 2.1 GHz 30976 205 260.2
13 10 SNL Red Storm, XT3/4; 2.4/2.2 GHz dual/quad-core 38208 204.2 284
14 KAUST Shaheen – Blue Gene/P 65536 185.2 222.822
15 11 上海スーパーコンピュータセンタ Magic Cube – Dawning 5000A, QC Opteron 1.9 Ghz; 30720 180.6 233.472
16 Tronto大学 GPC – iDataPlex 30240 168.6 306.0
17 13 NMCAC, N.M. Encanto – Altix ICE 8200 QC 3.0 GHz 14336 133.2 172.032
18 14 TATA SONS, India EKA – Cluster Platform 3000, HP 14384 132.8 172.608
19 LLNL Juno – Appro XtremeServer 18224 131.6 162.2
20 15 GENCI-CINES Jade – SGI Altix ICE 8200EX, Xeon quad-core 3.0 GHz 12288 128.4 146.736

 

これまで全体の1位、2位、3位およびヨーロッパ、アジアの1位が表彰されてきたが、今回はNo.1 in Middle Eastが新設され、14位のKAUST (King Abdullah University of Science and Technology)が表彰された。欧州で初めて複数台Top10にランクインしたことも注目された。

Krakenの所属が the National Institute for Computational Sciences at the University of Tennesseeと書かれているが、実際には、ORNL のJaguarと同じ部屋に並んでいる。もし両者をつなげば、1.5 PFlopsということになる。Krakenのキャビネットの扉には、名前の由来である北欧伝承の海の怪物である大タコの絵が描かれている。Krakenを設置したため、例のJaguarの絵が隠れてしまい、以前の写真のようには見えなくなった。日本はトップ20に入らず、ランクで中国に負けただけでなく、サウジアラビアにもインドにも負けたということになる。

国別の順位では、米国が台数ベースでも、Linpackの総計算力ベースででも世界の半分以上を占めており、次いで独、英、仏と続いている。一方アジアでは、台数ベースでは、日本は15台で、21台の中国に次いで第6位ではあるが、Linpackの総計算力ベースでは、3.86%対3.49%と辛うじて中国を押さえ第5位にランクされた。Linpack総性能での順位で示す。

順位 台数 台数シェア 性能 性能シェア
1 291 58.20% 13720810 60.69%
2 29 5.80% 2113110 9.35%
3 44 8.80% 1248013 5.52%
4 23 4.60% 1004743 4.44%
5 日本 15 3.00% 873109 3.86%
6 中国 21 4.20% 788125 3.49%
7 カナダ 8 1.60% 358741 1.59%
8 スエーデン 10 2.00% 343447 1.52%
9 ロシア 5 1.00% 261682 1.16%
10 インド 6 1.20% 247285 1.09%
合計   500   22607996  

 

他方500位は順調に2008/11の12.60TFから17.09TFに上昇し、2008/11のマシンのうち、277位以下(半分弱)が落ちるという従来の傾向を踏襲している。

3) Top500(日本)
日本設置のマシンは以下の通り。

順位 前回 設置場所 機種 コア数 Rmax Rpeak
22 JAMSTEC Earth Simulator 2 – SX-9/E/1280M160 1280 122.4 131.072
28 JAXA FX-1 12032 110.6 121.282
40 理研 PRIMERGY RX200S5 8256 87.89 96.76
41 (30) 東京工業大学 TSUBAME Grid Cluster with CompView TSUBASA 31024 87.01 163.188
42 28 東京大学 T2K Open Supercomputer (Todai Combined Cluster) 12288 82.984 113.05
47 (33) 筑波大学 T2K Open Supercomputer – Appro Xtreme-X3 Server 10369 77.28 95.385
65 核融合科学研 Plasma Simulator – SR16000 4096 77.0 645.00
69 東大医科研 SHIROKANE – SunBlade x6250 5760 54.21 69.12
78 52 京都大学 T2K Open Supercomputer/Kyodai 6656 50.51 61.235
93 物材機構 Altix ICE 8200EX 4096 42.69 45.8752
261 135 国立天文台 Cray XT4 QuadCore 2.2 GHz 3248 22.93 28.582
279 国立天文台 GRAPE – DR 8192 22.0 84.5
391tie 208tie 産総研CBRC Blue Protein – Blue Gene 8192 18.665 22.9376
391tie 208tie 高エ研 KEK/BG Sakura – Blue Gene 8192 18.665 22.9376
391tie 208tie 高エ研 KEK/BG MOMO – Blue Gene 8192 18.665 22.9376

 

日本は、地球シミュレータ2, JAXA-FX1,理研新クラスタ・ 東大医科研などいろいろ新マシンが登場したにもかかわらず、前回の17台からとうとう史上最低の15台になってしまった。更に2009/11において259位以下だった5台が落ちてしまった。大学・研究所系では今年の10月期に導入される新たなマシンとしては名古屋大しかないが、名古屋は高々ピーク30TFlopsのFX-1なので、下手すると載らないかも。すると、企業の新しいシステムが載らない限り、いよいよ2009年11月期は10台に減少しそうである。

昨年のところに書いたように、Grape-DRは今回Top500に初めて登場し、Rmax=21.96 TFlops、Rpeak=84.48 TFlopsで279位にランクされている。プロセッサはGRAPE-DR 16C 330 MHzとあるので、32演算器を1コアとしているらしい。総コア数8192とあるので、動かしたチップ数は512で、2006年時点での計画の1/4と推定される。クロック周波数もかなり落としてある

4) Green500
Top500と同時に、第4回目となるGreen500が発表された。これは、Top500に載ったマシンの消費電力あたりのLinpack性能を競うものである。現在2009年6月のGreen500はwebに残っていないが、手元の記録からTop20を示す。

順位 設置場所 機種 MF/Watt Top500
1 Warsaw大学(ポーランド) BladeCenter QS22 Cluster 536.24 422
2tie LANL BladeCenter QS22/LS21 Cluster 458.33 61
2tie IBM Poughkeepsie BladeCenter QS22/LS21 Cluster 458.33 61
4 LANL BladeCenter QS22/LS21 Cluster 444.94 1
5 国立天文台 GRAPE-DR 428.91 277
6 Groningen大学 Blue Gene/P Solution 371.672 124
7tie IBM – Rochester Blue Gene/P Solution 371.667 84
7tie IBM – TJ Watson Res Center Blue Gene/P Solution 371.667 84
7tie MPI/IPP(ドイツ) Blue Gene/P Solution 371.667 84
7tie SAITC(ブルガリア) Blue Gene/P Solution 371.667 245
7tie Moscow State University Blue Gene/P Solution 371.667 245
7tie ORNL Blue Gene/P Solution 371.667 245
7tie Stony Brook/BNL Blue Gene/P Solution 371.667 36
14 EDF R&D(フランス) Blue Gene/P Solution 368.89 36
15 IDRIS(フランス) Blue Gene/P Solution 368.30 24
16 KAUST(サウジアラビア) Blue Gene/P Solution 367.40 14
17 LLNL Blue Gene/P Solution 366.58 9
18 FZJ(ドイツ) Blue Gene/P Solution 363.98 3
19 ANL Blue Gene/P Solution 368.98 7
20 HWW/Stuttgart大学(ドイツ) NEC HPC 140Rb-1 Cluster 273.06 77

 

5位のGRAPE-DRと20位のNECクラスタをのぞけば全てIBMで、そのうちCellを用いたシステムが4件、Blue Gene/Pが14件である。ノード数も違うBlue Gene/Pが6桁目まで同一のMF/Wattで登録されているが、実測されたものかどうかは疑わしい。GRAPE-DRは、当初の計画よりクロックを下げて、電力消費を減少させている。

SC09

1) はじめに
SC09: The International Conference for High Performance Computing, Networking, Storage and Analysis (通称 Supercomputing 2009) は、21年目の今年、オレゴン州PortlandのOregon Convention Centerにおいて11月14日(土)から20日(金)まで”Computing for a Changing World”の標語の下に開かれた。会議名は時々変わるが、ここ3年と同じで、”Analysis” を名乗っている。SCシリーズの国際会議で、ポートランドは3回目の開催である。第1回目は1993年で私も出席したが、第2回目の1999年は出られなかった。会議場は同一であるが、増改築されたとのことである。参加者は10200人、technical参加者は4100人とのことである。

筆者も未完の参加報告を書いたが、前述の「次世代スーパーコンピュータシンポジウム2009」のポスターセッションの最優秀賞のMarlon Arce Acuna氏および優秀賞受賞者の松永康佑氏および阿部穣里氏がSC09レポーターとして出張し、参加報告を書いている。
 ポートランドはオレゴン州最大の都市である(州都はSalem)が、観光的にはめぼしいものはなく、比較的落ち着いた街である。市電(MAX、一種のlight rail)が発達していて、しかも会議場を含め市の中心部は無料区間になっているので、交通は便利である。「エコ」の街と言われているそうだ。空港からダウンタウンまでも一本でつながり、わずか$2.30である。SCでは、ホテルと会場の間にひっきりなしにバスを走らせるのが通例であるが、今回は特に遠いホテル以外はバスサービスをしなかった。

この季節は一種の雨期だそうで、傘が要るほどではないがしとしと雨が降ったりやんだりして陽の光を見たのは1日だけであった。1993年のSC93ではConference Bagの中に傘が入っていたことを覚えている。今回は傘ではなく、プラスチックの水筒が入っていて、ペットボトルではなく水道の水を飲めと言うことらしい。気温はこの時期の東京より若干低い程度であるが、雨と風のために結構寒い感じがした。

今年のSCの全体的な印象として、顕著な目玉はなかった感じである。多少目立ったテーマとしては、去年と同じであるが

 a) アクセラレータ
 b) エクサフロップス

であろう。各社の目玉は企業展示の項で述べる。

かたや、中国・インドの進出が話題になっている。6月と同様に、今回のTop500では、日本の最高位が31位の地球シミュレータ(ES2)であったのに対し、中国はなんと堂々5位を占め、韓国のKISTIが14位、サウジアラビアのKAUSTが18位、インドも前回から出ているがComputational Research Laboratories, TATA SONSのクラスタが26位を占めている。日本は、次世代が出来たとしても、どうなってしまうのであろうか。

日本にとって喜ばしいニュースは、三浦謙一氏(NII)がSeymour Cray賞を受賞したことである。また、Gordon Bell賞のCost/Performance部門で浜田剛氏(長崎大)が受賞した。Fernbach賞は Car-Parinelloの共同受賞であった。

その他の話題としては、10 Gbpsのネットワークが急速に普及しつつあり、100 Gpbsへの展望も語られ始めている。並列計算機の相互接続網としては、レイテンシがどこまで下げられるかが興味のあるところである。あと、銅線でどの距離までつなげるかも問題である。

最近グリッドが当然技術となって、あまり声高には語られないが、むしろ「クラウド」への言及が多い。クラウドは、グリッドの資源提供者側を隠蔽する技術であるが、ある種のメーカの言は、昔のメインフレームを思わせるところがある。

2) 事業仕分け
次世代スーパーコンピュータ開発のところで書いたように、今回は、事業仕分けによる「13日の金曜日の虐殺」の直後であり、日本からの参加者は重苦しい気持ちでPortlandに向かった。15日(日)夜(現地時間)に会場近くのBenson Hotelで富士通のUsers’Meetingが開かれたが、みな意気消沈してまるでお通夜であった。その中でも、富士通の重役が「国の次世代スーパーコンピュータプロジェクトが中止されても、スーパーコンピュータの開発は続けます。」と決意を表明されたのは救いであった。とにかく筆者は会議も上の空で、何があったかメモも十分ではない。

このニュースは海外でもかなり知られていて、いろんな人から「どうなっているのか」「新しいニュースはあるか」などと聞かれた。πの計算などでも有名なLBNLのさる方は、「そのメンバはみんな反科学なのか。日本にも、進化を否定する創造主義者(creationists)のような人がいるのか。」と言っていた。いかにもアメリカ人らしい発想である。また 別の人は、「アメリカは$1Bを毎年スーパーコンピュータのために投資し、EU諸国はHPCへの投資を倍増しようとしているときに、日本はいったい何を考えているのだ」と言っていた。「地球シミュレータでもそうだが、それ以前のマシンの数十倍のマシンを一つだけ作る、というやり方は間違っている。」とも言われた。傾聴に値する意見ではあるが、大学や研究所のコンピュータまで考えればそれほど超絶しているわけではない。国家的プロジェクトである独自技術開発を含むマシンだけを見るとそのように見えるのかも知れない。

3) 会議の運営
私は、第1回、第4回、第12回、第19回は欠席した。この会議は元々アメリカの国立研究所の関係者を中心に発足したところに特徴がある。当初はアメリカの国内会議の印象が強かったが、第10回のころから次第に国際的な会議に成長してきた。今年は、アメリカ人以外の登録者(technical programの登録ではないと思うが)は70カ国1878人であった。アメリカ関係では、50の州とDCおよびプエルトリコから1名以上の参加があった。詳しくは、Fun and Interesting Fact about SC09を参照。

日本の研究者もこの会議の運営に大きく貢献している。SCxyの全般を企画するSteering Committeeには昨年から松岡聡(東工大)が加わっている。

プログラム委員会関係では、Technical Program Chairの下にいくつかの組織がある。

A) Technical Paper ChairはAndrew Chen (Intel) とともに松岡が務めている。
  1) Application Areaには委員として青木尊之(東工大)、松田秀雄(大阪大)、中島研吾(東大)
  2) Architecture/Network Areaには委員として中島浩(京都大)、清水剛(富士通研)
  3) Grid Areaには委員として伊達進(大阪大学)と田中良夫(産総研)
  4) System Software Areaでは佐藤三久(筑波大)がArea Chairの一人を務め、委員として石川裕(東大)、丸山直也(東工大)、住本真司(富士通研)
  5) Storage Areaでは委員として建部修見(筑波大)
B) Tutorial Committeeには、委員として石川裕(東大)と末安直樹(富士通)、
C) Poster では、Architecture Area Chairを朴泰佑(筑波大)が務め、委員として工藤知宏(産総研)と中村宏(東大)がいる。

おそらく日本からの委員としてはこれまで最大の数であろう。

4) 全体の流れ
毎回、それほど変わっているわけではない。Technical programの主要部は17日(火)からであるが、会議そのものは14日(土)から始まっている。15日(日)と16日(月)にはチュートリアル(28件(提案は71件、全日は12件、半日は16件)が行われていた。会議に附属して、独立に組織されたいくつかのワークショップも開催された。15日(日)には5件、16日(月)には6件、20日(金)には3件があった。

16日(月)夜7時の展示会場における Gala Openingsから会議の中心部分が始まる。このとき展示会場が参加者に初めて公開されその場でおつまみ程度の軽食が提供される。例年、おつまみがすぐなくなってしまい、特に展示関係者にはなかなか口にできないが、一昨年からは一般公開より少し前から食べ物や飲み物を提供していて、展示関係者には好評であった。

展示は、企業展示も研究展示もますます盛り上がっている。とくに企業展示はチュートリアルとともにこの会議の最大の収入源である。展示は16日(月)の夜から19日(木)の4時までの実質3日間であるが、その設営も撤収もなかなか大変である。

火曜日の朝からtechnical programが始まる。火水木の8:30~10:00はplenaryで、18日(火)は開会式と招待講演、19日(水)と20日(木)にはそれぞれ招待講演が2件あった。10時からはコーヒーブレークで、展示会場も10時からオープン。飲み物とともにベーグル、菓子パン、果物なども提供される。朝が早いので、これで朝食代わりにしている人も多い。

10:30から17:00まではいろいろなプログラムが多数並列に設定されている。最近はポスター発表も重要視されている。投稿は150件以上あったが、厳正な審査の結果、通常のポスターが65件、学生のポスターが12件採択された。今年は、水曜の10:30からポスター発表者の短いプレゼンテーション(インデクシング)があった。このほか、8件のelectronic postersもあった。火曜日5時15分から7時までPosters Receptionがあった。

金曜は展示もなく、早めに帰ってしまう人も多いので、毎年客寄せに苦労する。今年は、20日(金)にATIP主催でHPC in Indiaというワークショップが開かれた。

5) ゴア元副大統領が基調講演
今回の目玉は19日(木)のAl Gore元副大統領の基調講演“Building Solutions: Energy, Climate and Computing for a Changing World”であった。Gore氏は、1993年から2001年までBill Clinton大統領のもとで副大統領を務め、計算科学とインターネットの推進に大きな役割を果たした。2000年にはブッシュ(子)と大統領を争い、僅差で惜敗した。「不都合な真実」の著者でもある。

ゴア氏の講演は満員で、しかも入り口で一人一人名札を確認して紙バンドを腕に巻くなど警戒も厳重であった。なにしろ筆者は「13日の金曜日の虐殺」のことで頭がいっぱいであり、何を話したか記憶にない。報道によると、「気候変動のような危機は、人間は直接に感じることが出来ない。スパコンを使うことにより、将来、それがどのような危機を引き起こすかを示すことができ、それが政治を動かすという点で大きな意義がある」と述べたようである。オゾンホール拡大の発見から、原因となるフロンなどの回収や新規使用の禁止で環境の回復に成功した例を挙げ、温暖化に対しても、今すぐに行動を起こす必要があると述べた。

6) IntelのRattner氏の開会講演
Intel社の副社長兼CTOであるJustin R. Rattnerは11月17日(火)に“The Rise of the 3D Internet – Advancements in Collaborative and Immersive Sciences”と題してOpening Addressを行った。壇上にLarrabeeによる SGEMM Performance test (4K by 4K Matrix Multiply)のFlopsメータ(アナログの針のメータ)を置き、オーバークロックによりTFlops (single precision) を越えるという「実演」をおこなった。本当に実測していたかどうかは明らかでない。氏は、「シングルチップでTFlopsを越えた初めての公開デモである」と豪語した。

後で述べるように、Intel社は12月初めにLarrabeeの開発を中止すると発表することになる。

ちなみに、18日(水)にあったもう一つの総合講演は、the Institute for Systems Biologyの創立者・所長であるLeroy Hood医学博士による“Systems Medicine, Transformational Technologies and the Emergence of Predictive, Personalized, Preventive and Participatory (P4) Medicine”であった。

7) エクサスケール・パネル
筆者は出なかったが、20日(金)の10時30分から、“The Road to Exascale: Hardware and Software Challenges”というパネルが開催された。モデレータはWilliam J. Camp (Intel Corporation)。パネリストは以下の4人。いずれもプレゼンのスライドが残っている。

SC’09 Exascale Panel (スライド Steve Scott (Cray)
Software at Exascale (スライド Marc Snir (Univ. of Illinois)
Energy at Exaflops (スライド Peter Kogge (Univ. of Notre Dame)
The Road to Exascale: Hardware and Software Challenge (スライド Jack Dongarra (Univ. of Tennessee)

 

8) Awards
最初に述べたように、Seymour Cray Computer Science and Engineering Awardは三浦謙一氏が受賞した2006年に理研の渡辺貞氏も受賞しており、日本人として2人目である。Sidney Fernbach Awardは第一原理分子動力学のR. CarとM. Parrinelloが共同受賞した。

ACM Gordon Bell Prizeは、9件のfinalistsが最終候補に選ばれていたが、以下が受賞した。

a) Performance Category:Joseph A. Bank et al.
  Millisecond-Scale Molecular Dynamics Simulations on Anton
b) Low Price/Performance Category: Tsuyoshi Hamada, Tetsu Narumi, Keigo Nitadori, Kiyoshi Oguri, Makoto Taiji, Kenji Yasuoka, Rio Yokota
  42 Tflops Hierarchical N-body Simulations on GPUs with Applications in both Astrophysics and Turbulence
c) Special Category: Rajapopal Ananthanarayanan et al.
  The Cat is Out of the Bag: Cortical Simulations with 109 Neurons, 1013 Synapses

9) Papers
原著論文での日本からの発表は以下の2件である。

a) Akira Nukada and Satoshi Masuoka (Titech), “Auto-Tuning 3-D FFT Library for CUDA GPUs”
b) Takashi Soga (Tohoku Univ.) et al., “Performance Evaluation of NEC SX-9 using Real Science and Engineering Applications”

 

次回は、SC09の展示やTop500について記す。

left-arrow   50history-bottom   right-arrow