TOP500トレンド 2013年11月
11月にTOP500が発表されて少し時間が経過したがさらなる解析をしてみよう。
TOP10のシステムについて6月との比較を表1に示す。
大きな変化はないが、スイスのPiz Daintが6位に浮上してきた。このシステムは前回42位であったが相当なシステム増強をしたことにより、6位に浮上してきた。その他については変化はなく、TOP10においてはIBM BlueGene/Qが4システムで前回と変わらず、アクセラレータ利用は4システム(Phi:2、NVIDIA:2)でこれも前回と変わっていない。
順位 | 2013年6月発表 | 2013年11月発表 | ||||
1 | Tianhe-2 NUDT/NUDT |
中国 | 33,862,700 | Tianhe-2 NUDT/NUDT |
中国 | 33,862,700 |
2 | Titan ORNL/Cray XK7 |
アメリカ | 17,590,000 | Titan ORNL/Cray XK7 |
アメリカ | 17,590,000 |
3 | Sequoia LLNL/IBM BGQ |
アメリカ | 17,173,224 | Sequoia LLNL/IBM BGQ |
アメリカ | 17,173,224 |
4 | K Computer RIKEN/Fujitsu |
日本 | 10,510,000 | K Computer RIKEN/Fujitsu |
日本 | 10,510,000 |
5 | Mira ANL/IBM BGQ |
アメリカ | 8,586,612 | Mira ANL/IBM BGQ |
アメリカ | 8,586,612 |
6 | Stampede TACC/DELL |
アメリカ | 5,168,110 | Piz Daint CSCS/Cray XC30 |
スイス | 6,271,000 |
7 | JUQUEEN FZJ/IBM BGQ |
ドイツ | 5,008,857 | Stampede TACC/DELL |
アメリカ | 5,168,110 |
8 | Vulcan LLNL/IBM BGQ |
アメリカ | 4,293,306 | JUQUEEN FZJ/IBM BGQ |
ドイツ | 5,008,857 |
9 | SuperMUC LRZ/IBM iDataplex |
ドイツ | 2,897,000 | Vulcan LLNL/IBM BGQ |
アメリカ | 4,293,306 |
10 | Tianhe-1A NSCT/NUDT |
中国 | 2,565,000 | SuperMUC LRZ/IBM iDataplex |
ドイツ | 2,897,000 |
表1 TOP10前回との比較
TOP500全体としては理論最大性能がペタフロップスとなったのは前回の33システムから40システムに増加しており、着実にペタフロップス・マシンが普及している事が見える。今回ペタフロップスとなった7システムは、スイス:Piz Daint(6位)、アメリカ:Cascase(13位)、イギリス:Archer(19位)、アメリカ:Garnet(25位)、ドイツ:Max-Planck(31位)、日本:九大(36位)、アメリカ:RPI(38位)
アクセラレータを利用したシステムは53システムあり、全体の約1割となっている。(前回54システム)内訳は、AMD:2、Xeon Phi:12、NVIDIA:37、Phi&Nvidia:2
TOP500においては、毎回新たな高性能なシステムの出現により、既存システムは毎回ランクを落としたり、リストから消滅していく。今回新たにリストに掲載されたシステムは127システムあり、全体の約四分の一が入れ替わった事になる。その中でもランクを上げるシステムも存在している。今回ランクアップしたシステムは22システム存在した。ランクアップした上位システムは次のようなものがある。
システム | 国名 | 今回順位 | 前回順位 |
Piz Daint | スイス | 6 | 42 |
TSUBAME | 日本 | 11 | 21 |
Pleiades | アメリカ | 16 | 19 |
Garnet | アメリカ | 25 | 88 |
RPI | アメリカ | 38 | 76 |
Endevaor | アメリカ | 43 | 71 |
Triolith | スウェーデン | 79 | 96 |
Palmetto2 | アメリカ | 81 | 115 |
Airain | フランス | 96 | 192 |
Tomado | ロシア | 127 | 249 |
表2 今回ランクアップした主なシステム
最後にTOP500リストに入る最低ラインはRmaxで118 TFLOPS必要だった。(前回97 TFLOPS)
============================
日本のスパコン
============================
さて、日本の状況はどうだろうか?表3にTOP500中の日本のスパコンを示す。
順位 | 前回順位 | 機関名 | システム | アクセラレータ | 性能GFLOPS |
4 | 4 | 理化学研究所 | K Computer | 10,510,000 | |
11 | 21 | 東京工業大学 | TSUBAME 2.5 | NVIDIA K20x | 2,843,000 |
24 | 20 | IFERC | Helios | 1,237,000 | |
30 | 26 | 東京大学 | Oakleaf-FX | 1,043,000 | |
36 | 新規 | 九州大学 | HA8000-tc | NVIDIA K20/K20x+ Xeon Phi | 905,370 |
54 | 47 | 電力中央研究所 | SGI ICE X | 582,100 | |
57 | 50 | KEK | SAKURA | 536,633 | |
58 | 51 | KEK | HIMAWARI | 536,633 | |
73 | 62 | 筑波大学 | HA-PACS | NVIDIA 2090 | 421,600 |
74 | 63 | 国立天文台 | Aterui | 420,400 | |
108 | 新規 | 名古屋大学 | PRIMERGY CX400 | Xeon Phi | 317,900 |
134 | 新規 | 筑波大学 | HA-PACS TCA | NVIDIA K20x | 277,100 |
152 | 118 | 核融合研 | Plasma Simulator | 253,000 | |
155 | 121 | 京都大学 | Camphor | 251,700 | |
162 | 124 | 東北大学金属研 | SR16000 | 243,900 | |
168 | 129 | 分子研 | PRIMERGY CX250 | 237,900 | |
178 | 138 | 通信会社 | HP DL160 | 227,236 | |
211 | 162 | 原研 | BX900 | 191,400 | |
229 | 178 | IT企業 | HP B460c | 186,782 | |
264 | 208 | 九州大学 | FX10 | 166,700 | |
272 | 213 | 東京大学物性研 | SGI ICE 8400EX | 161,800 | |
311 | 新規 | 東京工業大学 | TSUBAME-KFC | NVIDIA K20x | 150,400 |
364 | 274 | 電力会社 | IBM iDataPlex | 139,255 | |
378 | 283 | 京都大学 | Laurel | 135,400 | |
443 | 319 | 通信会社 | HP DL360p | 126,446 | |
459 | 335 | 金融企業 | IBM xSeries | 125,503 | |
472 | 342 | 海洋研 | Earth Simulator | 122,400 | |
476 | 345 | 北海道大学 | SR16000 | 121,600 |
表3 TOP500中の日本のスパコン順位
今回の日本のエントリ数は前回の30から28に減少した。内訳は新規システムが4、リストから消えたシステムが6システムだ。新規のシステムでは、九州大学のHA8000-tcが本年11月より稼働、名古屋大学にはHPCI用に設置された552ノードシステムが設置されている。また筑波大学では同大学が進めているスパコン開発のプロトタイプがランクインした。東京工業大学のTSUBAME-KFCはコンテナ型の省電力システムで、GREEN500で首位のシステムだ。前回から消えた6システムは、九州大学のCX400システム(まだ運用中のようだが・・・)、JAXA FX1、JAIST Cray、東大T2K、東大医科研HA8000、理研RICCであった。
============================
国別対抗ランキング
============================
TOP500リストの各値を国別に集計してみると、その国のスパコンの傾向が見えてくる事がある。国としてスパコンに力を入れると、やはりそれは数字として現れる。何が見えてくるかは各回で異なるのだが、さて今回は何が見えてくるだろう。
国別エントリ数
===========
国名 | 今回エントリ数 | 前回エントリ数 |
アメリカ | 264↑ | 252 |
中国 | 63↓ | 66 |
日本 | 28↓ | 30 |
イギリス | 23↓ | 29 |
フランス | 22↓ | 23 |
ドイツ | 20↑ | 19 |
インド | 12↑ | 11 |
カナダ | 10↑ | 9 |
エントリ数のランキングは相変わらずアメリカー中国ー日本の順位であり、ヨーロッパは全体としてかなりのエントリを持っている事がわかるだろう。その中でインドが少しずつではあるが着実にエントリ数を増やしているようだ。今回エントリ数が増加した国は、アメリカ+12、カナダ+1、ドイツ+1、香港+1、インド+1、アイルランド+2、韓国+1、オランダ+1、スイス+1。逆に減少した国は、イギリス-6、中国-3、ロシア-3、日本-2、スウェーデン-2、フランス-1、イタリア-1、ポーランド-1、サウジアラビア-1、スペイン-1。
コア数
===========
国名 | Core数(前回値) | 伸び率 | Acclerator Core数(前回値) |
伸び率 |
アメリカ | 9,837,537 (9,058,352) |
+8.6% (+10.5%) |
1,072,792 (884,351) |
+21.3% (+23.9%) |
中国 | 4,925,804 (4,818,068) |
+2.2% (+200.2%) |
2,978,392 (2,944,428) |
+1.2% (+1325.7%) |
日本 | 1,558,880 (1,386,354) |
+12.4% (-0.2%) |
247,800 (76,978) |
+222.0% (+4.5%) |
ドイツ | 1,033,252
(939,626) |
+10.0% (+7.4%) |
9,240 (5,768) |
+60.2% (0%) |
フランス | 720,416 (722,376) |
-0.3% (+16.4%) |
9,100 (9,380) |
-3.0% (0%) |
イギリス | 627,120 (639,312) |
-1.9% (+12.7%) |
3,584 (5,952) |
-39.8% (0%) |
全体 | 20,720,693 (19,346,396) |
+7.1% (+30.0%) |
4,585,300 (4,131,481) |
+11.0% (+248.5%) |
前回は中国のTianhe-2の登場により、コア数は全体的に驚異的な伸びを示したが、今回は通常通りの平均した伸び率となったようだ。Tianhe-2のため、相変わらずアクセラレータのコア数では中国が断トツで1位である。日本は前回若干コア数が減少したが今回はコア数、アクセラレータコア数共に平均よりも伸びている。
その中イギリスのアクセラレータが減少しているが、これは単にシステムが入れ替わり以前のアクセラレータ搭載システムがエントリから消滅し、新たにアクセラレータを搭載したシステムがエントリしたために単にコア数が減少しただけだ。
システム性能
===========
国名 | Rpeak GFLOPS (前回値) |
伸び率 | Rmax GFLOPS (前回値) |
伸び率 | 実行効率 |
アメリカ | 169,500,200 (152,700,502) |
+11.0% (+18.3%) |
118,261,596 (106,833,638) |
+10.7% (+20.0%) |
69.8% (70.0%) |
中国 | 89,432,561 (85,176,357) |
*5.0% (+274.3%) |
48,549,093 (47,485,018) |
+2.2% (+284.5%) |
54.3% (55.7%) |
日本 | 28,925,862 (24,500,641) |
+18.0% (+4.9%) |
22,472,218 (20,307,189) |
+10.7% (+4.4%) |
77.7% (82.9%) |
ドイツ | 16,426,807 (13,521,056) |
+21.5% (+9.0%) |
13,696,834 (11,351,754) |
+20.7% (+11.5%) |
83.4% (84.0%) |
フランス | 11,228,571 (10,880,921) |
+3.2% (+37.9%) |
9,489,912 (8,938,486) |
+6.2% (+394.%) |
84.5% (82.1%) |
イギリス | 11,380,215 (11,031,508) |
+3.2% (+17.4%) |
9,058,329 (8,082,237) |
+12.1% (+11.3%) |
79.6% (73.3%) |
全体 | 364,558,528 (325,851,464) |
+11.9% (+42.1%) |
250,080,467 (223,654,338) |
+11.8% (+37.9%) |
68.6% (68.6%) |
性能に関してもコア数同様に前回中国のTianhe-2の登場によって飛躍的に全体性能が増加したが、今回は理論性能で+11.9%、実行性能で+11.8%と落ち着いた伸びとなっている。
性能全体では理論性能で現在364 PFLOPSであり、 1EXA-FLOPSまではまだ時間がかかりそうだ。右欄に平均実行効率を示した。アクセラレータ付きが多いと基本的に実行効率は下がる。今回日本はアクセラレータを付加したシステムが増えたために実行効率も落ちている。
実行効率トップ10
==============
今回の500システム中で実行効率が高かった上位10システムは次の通り。
順位 | 国 | 機関名 | システム | TOP500順位 | 実行効率 |
1 | ドイツ | Universitaet Eriangen | Emmy – NEC LX2400 | 210 | 97.1% |
2 | アメリカ | SGI | SGI ICE X | 387 | 96.6% |
3 | 日本 | 原研 | BX900 | 211 | 95.7% |
4 | ドイツ | T-Systems | CASE-2 SGI ICE X | 159 | 95.3% |
5 | アイルランド | Irish Centre for High-End Computing | Fionn – SGI ICE X | 358 | 95.2% |
6 | ドイツ | Universitaet Paderborn | OCuLUS | 224 | 94.5% |
7 | アメリカ | TOTAL | Laure – SGI ICE X | 140 | 94.5% |
8 | 日本 | 海洋研 | Earth Simulator | 472 | 93.4% |
9 | 日本 | 理研 | K Computer | 4 | 93.2% |
10 | イタリア | Centro Euro | IBM iDataPlex | 316 | 93.1% |
このリストから言える事は実行効率ではアメリカが独占しているという訳ではないということだ。もちろん中国も入っていない。首位はドイツのシステムだが、NEC社製だ。またTOP500上位のシステムはK computerしか入っていない。しかも日本製は4システムも10位 内に入っている。これは日本がいかにシステムの設計の技術力の高いかを伺える。もちろんSGI ICE Xも10位内に4システム入っている。
以上、今回のTOP500の状況を分析してみた。来年にはTOP500のベンチマークにHPCGと呼ばれる方法も導入され、LINPACKとHPCGの2つのリストが出てくる予定だ。次回2014年6月がどうなるか楽しみだ。