HPCの歩み50年(第184回)-2010年(j)-
6月のTop500には、中国深圳のNebulae(星雲)が2位に入り注目されたが、20位以内には中国のスーパーコンピュータが3件も入っている。ISCの期間中に、Intel社はMIC (Many Integrated Core)アーキテクチャに基づく新しい製品“Knights Corner”を発表した。
ISC2010
1) はじめに
第25回目となるISC (International Supercomputing Conference) 2010は、2010年5月30日~6月3日に、昨年同様Hamburgの国際会議場で開催された。筆者は出席しなかった。Wikipediaによると、2010年3月30日にHamburgで25周年を祝う集会が行われたそうである。最初はマンハイム大学のHans Meuer教授が提唱した小規模な会議(Mannheim Supercomputer Seminar)で、参加者はユーザとベンダを合わせて81名だったそうである。
開会式で、最初からの主宰者であるHans Meuterは第1回の会議に出席していた6名の名前を挙げた。
Dr. Werner Butscher, HPC specialist at Prakla Seismos.
Dr. Wolfgang Gentzsch, HPC specialist at DLR.
Dr. Hans Meuer, computing center director and professor at Mannheim University.
Dr. Kenichi Miura, HPC expert at Fujitsu.
Helmut Mühl-Kühner, managing director of Convex in Germany.
Dr. Wolfgang Nagel, research assistant at FZ Juelich.
Erich Schnepf, HPC specialist at Siemens AG.
三浦謙一氏は、25年前は富士通の社員であった。
参加者数は空前の1998人で、展示は151件であった。基調講演はIntelのKirk B. Skaugenが“Petascale to Exascale Extending Intel’s HPC Commitment”と題して行った。
水曜日(6月2日)の基調講演は恒例のThomas Sterlingによる“HPC Achievement and Impact – 2010”であった。
2) Intel社
今回、もっともニュース性のある発表をしたのはIntel社であった。同社は、2009年11月のSC09で仰々しくLarrabeeチップのデモを行ったが、その舌の根も乾かない12月初め、Larrabeeプロジェクトの中止を発表した。ISCの直前、Intelの広報担当者Bill Kircos氏は5月25日、同社サイト内のブログ投稿で、「われわれは(中略)Larrabeeプログラムと多コアチップに関するIntelの研究から派生した事業機会に取り組んでいる」と述べ、「このサーバ製品ラインの展開は(中略)高性能コンピューティングなどのセグメントに最適化されている」と書いている。同社のKirk Skaugen副社長は、ドイツHamburgで5月30日に開幕するISC ’10でより詳しい情報を提供する予定だ。ただし、ゲーム向けのグラフィックプロセッサを発売する計画はない、と強調した。
「最初の製品は“Knights Corner”というコード名のチップで、22 nmテクノロジで製造され、50以上のIntelコアを含む。XeonプロセッサとMIC製品とは、ツール、ソフトウェア、アルゴリズム、プログラミング技術を共有する。この製品には、これまでIntel社が開発してきたLarrabeeやSCC (Single-chip Cloud Computer)などのメニーコア技術が継承されている。」と連続性を強調した。
3) Top500(世界)
5月31日、開会式に続いて恒例のTop500が発表された。Topは前回同様ORNLのJaguarであったが、2位に中国深圳の国立スーパーコンピュータセンターに設置されたコンピュータNebulae(星雲)が入り注目された。これはIntelのCPU「Xeon X5650」をベースに、NVIDIAのGPU「Tesla C2050」を組み合わせた中国Dawning(曙光)製システムである。前回5位の、天津国立スーパーコンピュータセンターに設置されている国防科学技術大学(NUDT)「Tianhe-1(天河1号)」は7位となった。20位までには合計3件入っている。これに対し、DoD, DoE がだいぶピリピリしているという噂である。NVIDIAに対して各方面からプレッシャーがかかり始めているとのことである。今やGPUは、PCの周辺装置ではなく、CPU以上にTop500を制している。
第35回のTop500の20位までを記す。前回の順位に括弧がついているのは、アップグレードまたはチューニングによって前回より性能向上があったことを示す。
順位 |
前回 |
設置場所 |
機種名 |
cores |
Rmax |
Rpeak |
1 |
1 |
ORNL |
Jaguar – Cray XT5-HE 6-core 2.6 GHz |
224162 |
1759.0 |
2331.0 |
2 |
- |
国家超級計算深圳中心 |
Nebulae – Dawning TC3600 Blade System, Xeon X5650 6C 2.66GHz, Infiniband QDR, NVIDIA 2050 |
120640 |
1271.0 |
2984.3 |
3 |
2 |
LANL |
Roadrunner-QW22/LS21, Cell 8i 3.2 GHz |
122400 |
1042.0 |
1375.78 |
4 |
3 |
NICS, Tennessee |
Kraken Cray XT5-HE – 6-core 2.6 GHz |
98928 |
831.7 |
1028.85 |
5 |
4 |
FZJ |
JUGENE – Blue Gene/P |
294912 |
825.5 |
1002.7 |
6 |
(6) |
NASA/Ames |
Pleiades – SGI Altix ICE 8200EX, Xeon QC 3.0/Hehalem EP 2.93 GHz |
81920 |
772.7 |
973.291 |
7 |
5 |
国防科学技術大 |
天河1号 – Xeon E5540/E5450 + Radeon |
71680 |
563.1 |
1206.19 |
8 |
7 |
LLNL |
BlueGene/L |
212992 |
478.2 |
596.378 |
9 |
8 |
ANL |
Intrepid – Blue Gene/P |
163840 |
458.611 |
557.056 |
10 |
(10) |
SNL |
Red Sky – Sun Blade x6275 |
42440 |
433.5 |
497.396 |
11 |
9 |
TACC, Texas |
Ranger – SunBlade x6420, Opteron QC |
62976 |
433.2 |
579.379 |
12 |
11 |
LLNL |
Dawn – Blue Gene/P |
147456 |
415.7 |
501.35 |
13 |
12 |
Moscow State U. |
Kinibisiv – T-Platforms Xeon 5570 |
35360 |
350.1 |
414.419 |
14 |
13 |
FZJ |
JUROPA – Sun Constellation |
26304 |
274.8 |
308.283 |
15 |
14 |
KISTI(韓国) |
TachyonII – Sun Blade x6048 |
26232 |
274.8 |
307.439 |
16 |
(20) |
Edinburgh大(英国) |
HECToR – Cray XT6 12C 2.1 GHz |
43660 |
274.7 |
366.744 |
17 |
15 |
NERSC |
Franklin – Cray XT4 QuadCore 2.3 GHz |
38642 |
266.3 |
355.506 |
18 |
- |
GENCI-CINES(仏) |
Jade – SGI Altix ICE 8200EX |
23040 |
237.8 |
267.878 |
19 |
- |
中国科学院過程工程研究所 |
Mole-8.5 – Mole-8.5 Cluster, Xeon X5520 4C 2.27 GHz, NVIDIA 2050 |
33120 |
207.3 |
1138.4 |
20 |
16 |
ORNL |
Jaguar – Cray XT4 QuadCore 2.1 GHz |
30976 |
205.0 |
260.2 |
今後、問題となりそうなのはピーク性能Rpeakの定義である。例えばNehalem は、コアの標準周波数は決まっているが、turbo mode があって、コア数を減らす代わりに、標準状態よりも周波数を上げることができるし、周辺の状況(温度等)によっては、コア数を維持したままでも turbo が可能になる。今後このようなCPUが増えてくると考えられる。現状では、Rpeak は標準状態の周波数をベースに計算されているが、HPL 測定は周波数をアップした状態で実行していることが多いであろう。
4) Top500(日本)
日本設置のマシンは以下の通り。かつては100位まででも相当な数があったのに、500位まで入れてもこの程度である。
順位 |
前回 |
設置場所 |
機種 |
コア数 |
Rmax |
Rpeak |
22 |
- |
日本原子力研究開発機構 |
BX900 Xeon X5570 2.93GHz, Infiniband QDR |
17072 |
191.4 |
200.08 |
37 |
31 |
JAMSTEC |
Earth Simulator 2 – SX-9/E/1280M160 |
1280 |
122.4 |
131.072 |
42 |
36 |
JAXA |
FX-1 |
12032 |
110.6 |
121.282 |
53 |
45 |
東京大学 |
T2K Open Supercomputer (Todai Combined Cluster) |
15104 |
101.7 |
139.0 |
56 |
47 |
理研 |
PRIMERGY RX200S5 |
9048 |
97.94 |
106.042 |
64 |
56 |
東京工業大学 |
TSUBAME Grid Cluster with CompView TSUBASA |
31024 |
87.01 |
163.188 |
71 |
62 |
筑波大学 |
T2K Open Supercomputer – Appro Xtreme-X3 Server |
10369 |
77.28 |
95.385 |
91 |
81 |
核融合科学研 |
Plasma Simulator – SR16000 |
4096 |
77.0 |
645.00 |
96 |
84 |
東大医科研 |
SHIROKANE – SunBlade x6250 |
5760 |
54.21 |
69.12 |
107 |
92 |
気象研究所 |
Hitachi SR16000 L2/121 |
3871 |
51.21 |
72.7936 |
111 |
95 |
京都大学 |
T2K Open Supercomputer/Kyodai |
6656 |
50.51 |
61.235 |
137 |
- |
電力中央研究所 |
SGI Altix ICE 8200EX, Xeon X5560 quad core 2.8 GHz |
4096 |
42.69 |
45.8752 |
138 |
114 |
物材機構 |
Altix ICE 8200EX |
4096 |
42.69 |
45.8752 |
189 |
143 |
自動車会社 |
HPE Cluster Platform DL4x170h |
4592 |
37.39 |
48.858 |
229tie |
- |
サービスプロバイダ |
xSeries x3650M2 Cluster, Xeon QC E55xx 2.26 Ghz, GigE IBM |
7216 |
34.65 |
65.4347 |
229tie |
- |
サービスプロバイダ |
xSeries x3650M2 Cluster, Xeon QC E55xx 2.26 Ghz, GigE IBM |
7216 |
34.65 |
65.4347 |
301 |
207 |
統計数理研究所 |
PRIMERGY RX200S5 Cluster |
2880 |
31.18 |
33.753 |
383 |
243 |
名古屋大学 |
Fujitsu FX-1 |
3072 |
28.51 |
30.965 |
SC10
1) はじめに
第23回目となるSC10: The International Conference for High Performance Computing, Networking, Storage and Analysis (通称 Supercomputing 2010) は、ルイジアナ州New OrleansのErnes N. Morial Convention Centerにおいて11月13日(土)から19日(金)まで”The Future of Discovery”のテーマの下に開かれた。会議名は時々変わるが、2007年以来同じで、”Analysis” を加えている。SCシリーズの国際会議で、ニューオーリンズは初めての開催である。
ミシシッピ川に添って作られたウナギの寝床のようなばかでかい会議場で、長さは1キロをはるかに超えている。Orlandの会議場もかなり長かったが、0.8キロ程度であった。それよりかなり長い。SCより大きな薬学関係の会議が同時に開催されていたが、それでもまだスペースが余っていた。会議場の中を歩くだけで疲れてしまった。
New Orleansは、2005年にハリケーン・カトリーナが襲来し甚大な被害を受けたが、市の中心部を見る限りはその影はない。盛り場のフレンチクオーターでは人々が華やかに行き交い、夜にはデキシーランドジャズがストリートで演奏されていた。2010年4月には沖合のBPの掘削装置から大量の原油が噴出し大きな影響を与えたが、街中が油臭いようなことはなかった。
今年のSC10の中心トピックはずばり”Heterogeneous Computing”であった。Top500のトップ4件のうち3件がGPGPUによるものであり、またテクニカルペーパーでもGPU関係の発表が多かった。総合講演の一つは、NVIDIAのBill Dallyであった。展示会場でもNVIDIAのブースは活気が溢れていた。
ただ、GPGPUのブームが今後も(エクサフロップスまで)続くか疑問との声もある。その理由として、
a) プログラミングの難しさ。CUDAで多少は易しくなったが、特定のアーキテクチャに依存したプログラミングが広く受け入れられるか疑問である。
b) GPUの開発はPCでの画像処理という桁違いの需要により支えられているが、IntelのSandy BridgeやAMDのOntarioやLlanoのように、画像処理がCPUチップに吸収されると、ビジネスモデルとして成立しない。
c) Tileraとか、IntelのSCC (Single-chip Cloud Computer)や MIC (Many Integrated Core)のような本格的なメニーコアが登場するとGPUは勝ち目がないのではないか。
これに対してBill DallyはGPUにCPU機能を吸収することによりエクサフロップスに挑戦すると豪語していた。
去年は、中国・インドの進出が話題になっていたが、今回のTop500では初めて中国の計算機がトップを占めた。National Supercomputing Center in Tianjin(天津)のTianhe(天河)1Aの2.566 PFlopsである。前回の1位(今回の2位)のJaguar (ORNL)の1.759 PFlopsと比べて5割近い上昇である。3位も中国で、National Supercomputing Centre in Shenzhen(深圳)のNebulaeの1.271 PFlops であった。東工大のTsubame 2は1.192 PFlopsで4位であった。日本の上位10位入りは、2006年11月のTsubame以来4年ぶりである。 1年前にTianhe 1(天河一号)が発表されたばかりで、まともに利用されないうちに1Aに改造したのではないか、という見方もあった。
日本にとってもう一つ喜ばしいニュースは、Green500の2位に東工大のTSUBAME 2が、4位に理研の「スーパーコンピュータ京」がランクされたことである。Grape-DRもエントリし受理されていたが、リストになく、本来なら2位になるはずということで、関係者は訂正を申し入れていた。
日本の学界の「GRAPE-DR」ところで述べたように、12月23日になってGRAPE-DR側の抗議が受け入れられ、2+位にランクされた。
また、濱田.(長崎大学)は、昨年Gordon Bell賞のコスト・パフォーマンス部門を受賞したが、今年もGordon Bell賞において、2nd Honorable Mention(佳作に相当)を受賞した。本賞ではないが喜ばしいことである。
さらに、HPC Challenge Awardsでは、地球シミュレータがClass 1のG-FFT部門で優勝し、Class 2では筑波大学のグループがXcalable MPでHonorable Mentionを受賞した。いずれも喜ばしいことである。
恒例の筆者の報告もあるが、東京大学情報基盤センターの實本英之らの「SC10参加報告」も面白い。そのほか、NICT関係者による「Super Computing 2010 (SC10) 参加報告」、『計算工学』誌16巻(2011)掲載の片桐孝洋による「SC10参加報告」、JAXAの「SC10研究展示の出展報告」などがある。
2) 日本の寄与
日本の研究者もこの会議の運営に大きく貢献している。SCxyの全般を企画するSteering Committeeには2009年から松岡聡(東工大)が加わっている。
プログラム委員会関係では、Technical Program Chairの下にいくつかの組織がある。
a) Application Areaには中島研吾(東大)がChairとして、委員として岩下武志(京都大)が加わっている。
b) Clouds and Gridsには、合田憲人(情報研)が委員として加わっている。
c) Performance には、朴泰佑(筑波大)が委員として加わっている。
d) Storage には竹房あつ子(産総研)が委員として加わっている。
e) System Softwareには、松岡聡(東工大)と田浦健次朗(東大)が加わっている。
f) Tutorial Committeeには石川裕(東大)が加わっている。
3) Social Events
![]() |
|
恒例により、18日(木)の夜は、展示会場の隣にあるMaldigras Worldでevening eventが行われた。 Mardigras(直訳すれば「太った火曜日」)はカーニバルの一種で、断食の始まる「灰の水曜日」の前日に思いきり食べるお祭りである。New Orleansのものは有名で、Floatと呼ばれる山車が町中をめぐる。Mardigras Worldはそれを一年中見せてくれる。
このほかこれも恒例だが、いくつかの企業が、お客様を招待するパーティが火曜日と水曜日に多数あった。 写真はSGIのパーティ。
4) 企業展示
主催者発表によると、今年は386000ft2の広さの会場に338の展示があった。企業展示187件、研究展示144件である(合計は合わないが)。
例年のごとくTechnical programとは独立にExhibitor Forumが3並列で火水木にあり、展示出展企業が30分ずつ講演した。このほか、各展示ブースでは企業展示でも研究展示でも、プレゼンテーションがひっきりなしに行われており、とてもつきあいきれない。
(1) NVIDIA
今年最も元気のあった展示の一つである。展示会場にtheaterを設けていろんなプレゼンが行われていた。同社からのメールによると、姓のアルファベット順で以下の通り。
a) Takayuki Aoki, Tokyo Institute of Technology
b) Ben Bergen, Los Alamos National Laboratory
c) Bill Dally, NVIDIA
d) Jack Dongarra, University of Tennessee
e) Robert Farber, Pacific Northwest National Laboratory
f) Wu-chun Feng, Virginia Tech
g) Wei Ge, Chinese Academy of Sciences
h) Mark Govett, National Oceanic Atmospheric Administration
i) Andy Keane, NVIDIA
j) Satoshi Matsuoka, Tokyo Institute of Technology
k) Paul Navratil, Texas Advanced Computing Center
l) Thomas Schulthess, Swiss National Supercomputing Centre
m) John Stone, University of Illinois at Urbana-Champaign
n) Jeff Vetter, Oak Ridge National Laboratory
(2) IBM
今年の目玉はBlueGene/Qのボードであった。これによりLLNLは20 PFlopsのSequoiaを2012年に建設する予定である。 京はその前に1位を取れるか?
(3) 富士通
京スーパーコンピュータを中心に、x86ベースのサーバも展示していた。
(4) NEC
SX9を中心にSMPサーバなどを展示。
(5) 日立
SR16000などを展示
(6) 日立電線
今年初めての出展である。1本25 Gbpsの光ファイバー通信システムを展示していた。これを4対にして100 Gbpsの接続が可能になるとのこと。
(7) Intel社
Intel社もいつもの通り広いスペースを取り展示を出していた。Gala Openingでは、地元のSuper Bowl MVP and New Orleans Saints quarterback, Drew Breesを呼んできて派手なパフォーマンスをやっていたようだ。同社からの宣伝メールによると、彼とインテルのデータセンターのグループマネージャのKirk Skaugenとで、インテルの情報技術を用いて選手の安全、とくに頭部の怪我や脳震盪を防止する可能性について議論したそうである
(8) SGI社
SGI社はPrism XLシステムに、Tilera社の64 coreのメニーコアを付加できるオプションを発表し注目された。暗号処理、画像処理、信号処理、ネットワークのパケット監視、web配信、メディア変換など整数の負荷の多い処理では、GPGPUよりメニーコアの方が適している、という触れ込みであった。
5) 研究展示
全体で144件であったが、そのうち日本からの研究展示は以下の26件(PC Cluster Consortiumを除く)であった。今年初めて出展したところはない。
・ National Institute of Advanced Industrial Science and Technology (AIST)
・ Center for Computational Sciences, University of Tsukuba
・ CMC (Cybermedia Center), Osaka University
・ Doshisha University
・ GRAPE Projects
・ Hokkaido University
・ Information Technology Based Laboratory (ITBL)
・ Japan Agency for Marine-Earth Science and Technology (JAMSTEC)
・ Japan Advanced Institute of Science and Technology (JAIST)
・ Japan Atomic Energy Agency (JAEA)
・ Japan Aerospace Exploration Agency (JAXA) (写真はJAXAのSC10出展報告から)
![]() |
・ Kansai University
・ Kyoto University(去年は高等教育研究開発推進センターの名前で出ていた)
・ Kyushu University
・ Nara Institute of Science and Technology (NAIST)
・ National Institute of Informatics (NII)(「e-サイエンス実現のためのシステム統合・連携ソフトウェアの研究開発」プロジェクトの「研究コミュニティ形成のための資源連携技術に関する研究」の成果も展示)
・ National Institute of Information and Communications Technology (NICT)
・ PC Cluster Consortium(企業展示に分類)
・ Research Organization for Information Science & Technology (RIST)
・ Research Organization of Information and Systems (情報システム研究機構)統数研が中心
・ RIKEN
・ Saitama Institute of Technology
・ Saitama University
・ T2K Open Supercomputer Alliance(「e-サイエンス実現のためのシステム統合・連携ソフトウェアの研究開発」プロジェクトの「シームレス高生産・高性能プログラミング環境」の成果も展示) (集合写真は實本らのレポートから)
![]() |
・ The University of Tokyo 平木研究室
・ Tohoku University
・ Tokyo Tech (Tokyo Institute of Technology)
6) Technical Papers
SCというとどうしても展示やイベントなど華やかなものに注目があつまるが、レベルの高い査読による原著論文(technical papers)は言うまでもなく重要な部分である。
論文投稿総数は253、そこから51編が選ばれた。採択率は20%である。日本が関連した発表としては、次の3件である。
Jun Doi – IBM Tokyo Research Laboratory, Yasushi Negishi – IBM Tokyo Research Laboratory, “Overlapping Methods of All-to-All Communication and FFT Algorithms for Torus-Connected Massively Parallel Supercomputers” |
Akira Hosoi – Fujitsu, Takumi Washio – University of Tokyo, Jun-ichi Okada – University of Tokyo, Yoshimasa Kadooka – Fujitsu, Kengo Nakajima – University of Tokyo, Toshiaki Hisada – University of Tokyo, “A Multi-Scale Heart Simulation on Massively Parallel Computers” |
Takashi Shimokawabe – Tokyo Institute of Technology, Takayuki Aoki – Tokyo Institute of Technology, Chiashi Muroi – Japan Meteorological Agency, Junichi Ishida – Japan Meteorological Agency, Kohei Kawano – Japan Meteorological Agency, Toshio Endo – Tokyo Institute of Technology, Akira Nukada – Tokyo Institute of Technology, Naoya Maruyama – Tokyo Institute of Technology, Satoshi Matsuoka – Tokyo Institute of Technology, “An 80-Fold Speedup, 15.0 TFlops, Full GPU Acceleration of Non-Hydrostatic Weather Model ASUCA Production Code” |
3番目の論文はBest Student PaperのFinalistに入っていたが、受賞は逃した。
SC10の続きは次回。ATIP 2010 Workshop on HPC in ChinaではHPC分野における中国の急進出が議論された。将来はピーク性能10 PFlops システム完成を2012-2013年に計画している。
![]() |
![]() |
![]() |