HPCの歩み50年(第217回)-2012年(k)-
ISCは4年連続のHamburg開催となった。Green500は20位までBlueGene/Qが独占した。Top500のトップを日本、続いてアメリカに取られた中国は、一気に挽回を狙っている。

ISC12
今年のISC (International Supercomputing Conference)は、2009年以来4回目のHamburg開催となった(これが最後)。日程は、2012年6月17日~21日。筆者はこのところISCやSCの報告をさぼっているが、東京大学情報基盤センターの鴨志田良和・大島聡史の「ISC’12参加報告」を参照。
1) HPC in Asia Workshop(6月17日、日曜日)
ISCでのHPC in Asia Workshopは2011年から開催され、2011年では理研の渡辺貞氏と中国のYutong Lu氏とが火花を散らしたことは昨年のところに書いた。今年は2回目である。参加者はヨーロッパやアメリカからも含めて約90名で、アジア太平洋地域各国のHPC事情の報告、アジアの巨大システムの運用、ポスター発表、パネルディスカッションなどが行われた。主催者の一つであるATIPのレポートなどから概略を紹介する。
オーガナイザの朴泰祐教授(筑波大学)の開会のあいさつの後、まず各国のHPC事情が発表された。
(a) 中国
100 PFlops級のピーク性能を持つスーパーコンピュータを複数開発している。CAS(Chinese Academy of Sciences、中国科学院)では、スーパーコンピュータのアプリケーションを開発する際、巨大なコンピュータの特性を活用して、科学研究を加速するために「コデザイン」を推進している。これでは「コデザイン」と言っても、アーキテクチャからアプリケーションへの一方通行ではないか。アプリケーションからアーキテクチャへのフィードバックはないのであろうか。
(b) 韓国
2011年5月に制定された、国家超高性能コンピュータ活用及び育成に関する法律(超高性能コンピュータ法)の意義を強調し、現在政府の政策への実現が進められていると報告された。
(c) 台湾
台湾におけるHPC環境やアプリケーションは長い歴史を持つが、現在変革の時期にかかっている。特に、昨年NCHC (National Center for High-performance Computing、國家高速網路與計算中心)にスーパーコンピュータ(Acer AR585 F1 Cluster, Opteron 12C 2.2GHz, QDR infiniband、コア数26244、Rmax=177.1 TFlops、Rpeka=231.9 TFlops、2011年6月のTop500で42位)が設置されて以来、科学技術アプリケーションの重要性が認識されるようになった。現在、重点的なアプリケーションの改良が進められている。また台湾におけるクラウドコンピューティングの現状も紹介された。
(d) 日本
「京」コンピュータが設置され、2012年の第4四半期までには正式な運用を開始する。「京」の可能性を最大限に引き出すための多くの計算科学プロジェクトが進められている。ポスト「京」に関する議論も始まった。日本の「ポストペタスケール」の方向性についての議論が行われ、「計算科学研究ロードマップ白書」と「HPCI技術ロードマップ白書」が2012年3月に公表された。「将来のHPCIシステムのあり方の調査研究」も近々開始される。
(d) シンガポール
シンガポールでは20年間、科学研究においてHPCが重要な役割を果たしてきた。重要な3機関としては、シンガポール国立大学(NUS)、南洋理工大学(NTU)とA*STARであり、その他の大学、研究センター、省庁も関係している。シンガポールの問題点は、長期的視点にたった統一的なHPC計画がないことである。
(e) インド
インドは今年からこのワークショップに加わった。インド国内でのHPC活動の概要が紹介され、インド政府がHPC研究を推進する新しいイニシアチブも紹介された。このイニシアチブの中での、種々の研究教育機関の役割が議論された。
このほか、アジアの大システムとして、「京」と「天河1号A」の現在の状況についての講演があった。パネルディスカッションでは、各国の代表がパネリストとなって、アジアにおけるHPC分野の国際協力について議論した。
2) 基調講演
月曜日(6月18日)の基調講演はEADS and Airbus, FranceのGuus Dekkersで、航空機の設計におけるスーパーコンピュータシミュレーションの重要性を強調した。火曜(6月19日)の基調講演は、SamsungのByungae Soで、メモリ技術について話した。水曜(6月20日)の基調講演は2004年以来恒例となっているThomas Sterlingの1年間のHPCの回顧の講演があった。Tomは、この一年を“The Million Core Computer”と総括した。木曜(6月21日)の基調講演はLRZのArndt BodeがSuperMUCについて紹介した。
3) Top500(世界)
日本からの参加者にとって気掛かりだったのは、2011年の6月と11月に首位を占めた「京」コンピュータが首位を保てるかどうかであった。大方の予想は、IBM社がLLNL向けに開発しているSequoia (BlueGene/Q)に抜かれるだろうということであった。日本のマスコミは3日前の6月15日ごろから騒がしかった。IBM社は、2004年11月から2009年6月まで10期連続で首位を独占してきたが、10 PFlops競争でイリノイ大学NCSAのBlue Watersから撤退し、ここ一二年は中国と日本の後塵を拝してきた。ここはぜひともSequoiaで挽回を果たしたいところであろう。
IBMが気にしていたのは、ORNLのTitanである。すでに動いているJaguarをアップグレードする予定で、完成は少し先と見られているが、中間段階でデータを出すかもしれない。
18日に発表されたTop500(第39回)の上位20位までは以下の通り。性能の単位はTFlops。前回の順位にカッコがついているのは、システム増強またはチューニングにより性能向上があったことを示す。
順位 |
前回 |
設置場所 |
機種名 |
cores |
Rmax |
Rpeak |
1 |
- |
LLNL |
Sequoia – BlueGene/Q |
1572864 |
16324.8 |
20132.7 |
2 |
1 |
理研AICS |
「京」コンピュータ |
705024 |
10510.0 |
11280.4 |
3 |
- |
ANL |
Mira – BlueGene/Q |
786432 |
8162.4 |
10066.3 |
4 |
- |
Leibniz RZ |
SuperMUC – iDataPlex IBM/Lenovo |
147456 |
2897.0 |
3185.1 |
5 |
2 |
国家超級計算天津中心 |
Tianhe-1A – NUDT TH MPP, X5670 2.93Ghz 6C, NVIDIA GPU, FT-1000 8C |
186368 |
2566.0 |
4701.0 |
6 |
(3) |
ORNL |
Jaguar – Cray XK6, Opteron 6274 |
298592 |
1941.0 |
2627.6 |
7 |
- |
CINECA |
Fermi – BlueGene/Q |
163840 |
1725.5 |
2097.2 |
8 |
- |
FZ Julich |
JUQUEEN – BlueGene/Q |
131072 |
1380.4 |
1677.7 |
9 |
- |
GENCI |
Curie thin nodes – Bullx B510 |
77184 |
1359.0 |
1667.2 |
10 |
4 |
国家超級計算深圳中心 |
Nebulae – Dawning TC3600 Blade System, Xeon X5650 6C 2.66GHz, Infiniband QDR, NVIDIA 2050 |
120640 |
1271.0 |
2984.3 |
11 |
(7) |
NASA/Ames |
Pleiades-SGI Altix ICE X/8200EX/ 8400EX |
125980 |
1243.0 |
1731.8 |
12 |
(28) |
量子科学技術研究開発機構 |
Helios – Bullx B510, Xeon E5-2680 |
70560 |
1237.0 |
1524.1 |
13 |
- |
Daresbury Lab(英国) |
Blue Joule – BlueGene/Q |
114688 |
1207.8 |
1468.0 |
14 |
5 |
東京工業大学 |
TSUBAME 2.0 – HP ProLiant SL390s G7 Xeon 6C X5670, NVIDIA GPU, Linux/Windows |
73278 |
1192.0 |
2287.6 |
15 |
6 |
SNL |
Cielo – Cray XE6 8core 2.4 GHz |
142272 |
1110.0 |
1365.8 |
16 |
8 |
NERSC |
Hopper – Cray XE6 12-core 2.1 GHz |
153408 |
1054.0 |
1288.6 |
17 |
9 |
CEA(仏) |
Tera-100 – Bull bullx super-node S6010/S6030 |
138368 |
1050.0 |
1254.5 |
18 |
- |
東京大学 |
Oakleaf-FX – PRIMEHPC FX10 |
76800 |
1043.0 |
1135.4 |
19 |
10 |
LANL |
Roadrunner-QS22/LS21, Cell 8i 3.2 GHz |
122400 |
1042.0 |
1375.78 |
20 |
- |
U. Edinburgh |
DiRAC – BlueGene/Q |
98304 |
1035.3 |
1258.3 |
想定通り「京」は2位になった。アメリカ合衆国のスーパーコンピュータがトップを取ったのは2009年6月以来で、久しぶりであった。今年は新規の上位登場が多く、前回10位までしか今回の20位以内に残っていない。上の表にあるように、トップ20はすべて1 PFlopsを越えている。前回の性能総計は74.2 PFlopsであったが、今回は123.4 PFlopsである。500番目は60.8 TFlopsで、これは前回の332番目に相当する。
Leibniz計算センター(LRZ)のSuperMUC (IBM)が4位、Daresbury研究所のBlue Joule (BlueGene/Q) 13位、CEAのTera-100が17位、Edinburgh大学のDiRAC (BlueGene/Q) 20位獲得など、ヨーロッパの活躍が目立った。
京が2位に後退したことを受け、富士通の山本正已社長は「資源の少ない日本で経済の持続的発展を図るには、卓越した科学技術によるイノベーション創出が不可欠」と指摘し、スパコンはその中核となる技術基盤であり、国に対して「将来にわたり継続して開発・利用ができるよう、引き続き整備していくことを期待する」とのコメントを発表した。(6月18日Reuters)
4) Top500(日本)
日本設置のマシンは以下の通り。
順位 |
前回 |
設置場所 |
機種 |
コア数 |
Rmax |
Rpeak |
2 |
1 |
理研AICS |
「京」コンピュータ |
705024 |
10510 |
11280.4 |
12 |
(28) |
量子科学技術研究開発機構 |
Helios – Bullx B510, Xeon 8C 2.7 GHz |
70560 |
1237.0 |
1524.1 |
14 |
5 |
東京工業大学 |
TSUBAME 2.0 – HP ProLiant SL390s G7 Xeon 6C X5670, Nvidia GPU, Linux/Windows |
73278 |
1192.0 |
2287.63 |
18 |
- |
東京大学 |
Oakleaf-FX – PRIMEHPC FX10 |
76800 |
1043.0 |
1135.4 |
36 |
- |
高エネルギー加速器研究機構 |
SAKURA – BlueGene/Q |
49152 |
517.6 |
629.1 |
41 |
- |
筑波大学 |
HA-PACS – Xtream-X GreenBlade 8204 |
20800 |
421.6 |
778,1 |
69 |
- |
東北大学金材研 |
Hitachi SR16000 Model M1 |
10240 |
243.9 |
306.4 |
73 |
- |
京都大学 |
Camphor – Cray XE6 |
30080 |
239.4 |
300.8 |
84 |
52 |
日本原子力研究開発機構 |
BX900 Xeon X5570 2.93 GHz, Infiniband QDR |
17072 |
191.4 |
200.08 |
106 |
- |
九州大学 |
PRIMEHPC FX10, |
12288 |
166.7 |
181.7 |
110 |
72 |
東大物性研 |
SGI Altix ICE 8400EX Xeon X5570 4-core 2.93 GHz, Infiniband |
15360 |
161.8 |
180.019 |
126 |
- |
京都大学 |
Laurel – Xtreme-X , Xeon E5-2670 |
9280 |
135.4 |
193.0 |
141 |
- |
某金融会社 |
xSeries x3650M3, Xeon X56xx |
22272 |
125.5 |
237.0 |
145 |
94 |
JAMSTEC |
Earth Simulator 2 – SX-9/E/1280M160 |
1280 |
122.4 |
131.072 |
146 |
95 |
北海道大学 |
SR16000 M1/176, POWER7 8C 3.83 GHz |
5504 |
121.6 |
168.9 |
160 |
101 |
JAXA |
FX-1 |
12032 |
110.6 |
121.282 |
181 |
118 |
東京大学 |
T2K Open Supercomputer (Todai Combined Cluster) |
15104 |
101.7 |
139.0 |
183 |
- |
東京大学医科研 |
HA8000-tc/HT225, Opteron 6276 |
16128 |
100.6 |
148.4 |
190 |
125 |
理研 |
PRIMERGY RX200S5 |
9048 |
97.94 |
106.042 |
270 |
- |
富士通沼津工場 |
PRIMEHPC FX10 |
6144 |
84.4 |
90.8 |
280 |
- |
国立遺伝研 |
Cluster Platform SL230s/SL250s |
5616 |
82.9 |
116.8 |
295 tie |
- |
某サービスプロバイダ |
xSeries x3650M3 Cluster, Xeon E5649 |
14256 |
80.3 |
144.3 |
295 tie |
- |
某サービスプロバイダ |
xSeries x3650M3 Cluster, Xeon E5649 |
14256 |
80.3 |
144.3 |
312 |
185 |
筑波大学 |
T2K Open Supercomputer – Appro Xtreme-X3 Server |
10369 |
77.28 |
95.385 |
337 tie |
- |
某サービスプロバイダ |
xSeries x3650M3 Cluster, Xeon E5649 |
13560 |
76.4 |
137.2 |
337 tie |
- |
某サービスプロバイダ |
xSeries x3650M3 Cluster, Xeon E5649 |
13560 |
76.4 |
137.2 |
342 |
205 |
国立環境研 |
GOSAT Research Computation Facility – Asterism ID318, Intel Xeon E5530, NVIDIA C2050 |
5760 |
75.9 |
177.1 |
356 |
214 |
某通信会社 |
HD DL 160 Cluster G6, Xeon X5650 |
13620 |
74.7423 |
144.917 |
367 |
221 |
京大基礎物理学研究所 |
Hitachi SR16000 XM1/108 Power7 3.3 GHz, Infiniband |
3456 |
73.35 |
91.2384 |
448 tie |
280 tie |
サービスプロバイダ |
xSeries x3650M3, IBM |
11628 |
65.524 |
123.722 |
448 tie |
28 0tie |
サービスプロバイダ |
xSeries x3650M3, IBM |
11628 |
65.524 |
123.722 |
448 tie |
280 tie |
サービスプロバイダ |
xSeries x3650M3, IBM |
11628 |
65.524 |
123.722 |
456 |
(328) |
長崎大学 |
DEGIMA – Intel i5, ATI Radeon |
9900 |
64.8 |
138.9 |
459 |
-
|
某サービスプロバイダ |
xSeries x3650M2 Cluster, Xeon |
14432 |
64.6 |
130.9 |
476 |
- |
某通信会社 |
HP DL160 Cluster G6, Xeon E5645 |
12640 |
62.8 |
121.3 |
5) Green500
電力あたりの演算性能でランキングをとったGreen500も発表された。現在、Green500のWeb pageには2013年以降しか残っていない。Wikipediaによると今回20位までBlueGene/Qが独占したとのことである。MFlopg/Wは2100.88から2099.46まであるが、その差に意味があるのか、実測したのかなど疑問も残る。東京大学情報基盤センターのOakleaf-FXは866.3 MFlops/Wで43位となったそうである。
6) Graph 500
2010年11月から始まったGraph 500の結果が発表された。エントリは90件。上位11件は以下の通り。
No. |
前回 |
Machine |
Installation Site |
Number of nodes |
Number of cores |
Problem scale |
GTEPS |
1 |
- |
Mira (IBM) |
DOE/SC/Argonne National Laboratory |
32768 |
524288 |
38 |
3541 |
1 |
- |
Sequoia (IBM) |
LLNL |
32768 |
524288 |
38 |
3541 |
3 |
- |
(IBM – Power 775, POWER7 8C 3.836 GHz) |
DARPA Trial Subset, IBM Development Engineering |
1024 |
32768 |
35 |
508.05 |
4 |
- |
Oakleaf-FX (Fujitsu – PRIMEHPC FX 10) |
Information Technology Center, The University of Tokyo |
4800 |
76800 |
38 |
358.1 |
5 |
4 |
HP Cluster Platform (NEC/HP – SL390s G7 (three Tesla cards per node)) |
GSIC Center, Tokyo Institute of Technology |
1366 |
16392 |
35 |
317.09 |
6 |
- |
(IBM – BLUE GENE/Q) |
Brookhaven National Laboratory |
1024 |
16384 |
34 |
294.293 |
7 |
- |
Vesta (IBM – Vesta/BlueGene/Q) |
DOE/SC/Argonne National Laboratory |
1024 |
16384 |
34 |
292.363 |
8 |
- |
Pleiades (SGI – ICE-X, dual plane hypercube FDR infiniband, E5-2670) |
NASA-Ames / Parallel Computing Lab, Intel Labs |
1024 |
16384 |
34 |
270.33 |
9 |
2? |
XE6 (Cray – XE6) |
NERSC/LBNL |
4817 |
115600 |
35 |
254.074 |
10 |
1 |
NNSA/SC (IBM – Blue Gene/Q Prototype II) |
NNSA and IBM Research, T.J. Watson |
4096 |
65536 |
32 |
236 |
11 |
- |
TSUBAME 2.0 (CPU only) (NEC/HP) |
GSIC Center, Tokyo Institute of Technology |
1366 |
16392 |
36 |
202.68 |
次回はSC12の1回目である。展示、開会式、基調講演、招待講演など。
![]() |
![]() |
![]() |