HPCの歩み50年(第206回)-2011年(r)-
中国の快進撃は続く。今年はトップを日本に譲り渡したが、次を狙って開発を続けている。中国科学院やそのスピンアウト系、民間系、国立国防科学技術大学系など複数の流れが互いに競争しているところがすごい。
中国の動き
1) 中国科学院(Godson)
Godson (龍芯 Loongson) CPUの話題は、すでに書いたように、CAS(中国科学院)傘下のICT (Institute of Computing Technology)が開発しているMIPSベースのプロセッサであり、2002年に始まり、2006には64ビットとなった。2007年には、336個のGodson-2Fを用いて構築したKD-50-Iは、1 TFlopsの性能を出した。
2011年2月20日~24日にSan Franciscoで開催されたISSCC 2011において、Godsonの設計者Weiwu Huは、Godson-3Bプロセッサの発表を行った。プロセスは 65nm 、8コアで、40Wの電力で128 GFlopsのピーク性能を持つ。クロックは1.05 GHzと遅くなっており、MFlops/Wは3200で、Green500で1位のBG/Qよりよいように見えるが、これは純粋にCPUだけの消費電力で、メモリや通信などを入れたらもっと悪いと思われる。浮動小数演算は、SIMD instruction dual issueである。memory interface の他に HyperTransport を持っているが、スペックは HT 1.0で古い。
Hu氏は、「夏に完成するDawning(曙光)の300 TFlopsマシンに使われる」と述べたが、実際には使われなかったようである。次の2013年のGodson-3Cでは、16コアで512GFを狙っている。28nmテクノロジで2 GHz のクロックと推測される。
Hot Chipsのところで書いたように、中国科学院計算技術研究所は、2011年8月17日~19日にStanford大学で開催されたHot Chips 23において、「Godson-T」と呼ぶメニーコアプロセサを発表した。Godson-Tプロセサは格子状に並んだ8×8のプロセサコアをメッシュネットワークで接続し、上下左右の辺に置かれた各4個の2次キャッシュバンク、4つの角に接続されたI/Oコントローラ、そして右下に置かれたSynchronization Managerというブロックもメッシュに接続した構造となっている。それぞれのコアは、MIPS64のユーザモードの命令セットをベースとし、それにSIMD拡張や同期の高速化命令などを追加した命令セットとなっている。このGodson-TはIntelの48コアのSingle Chip Cloud (SCC)実験チップに近い性格のものと考えられる。ただし、実用化の進むGodson-3とは異なり、Godson-Tはリサーチプロジェクトの位置づけである。
中国は、今後数世代で、自国製のチップの開発を進め、中国のHPCのトップからボトムまでGodsonで固めることを計画している。2012年か13年にはLinpack 10 PFlopsのマシンを、その2年後には100 PFlpsのマシンを導入する計画である。
2) 国家スーパーコンピュータ天津センター
2010年10月に公表された国家スーパーコンピュータ天津センター(国家超級計算天津中心)のTianhe-1A(天河一号A)(Rmax=2.507 PFlops)は、2010年11月のTop500で堂々の1位にランクした。
天津センターでは、同システムの全面的な利用がスタートしてからわずか1年あまり、すでに▽石油探査▽バイオ医薬▽アニメ・映画・テレビのレンダリング(映像生成)▽ハイエンド機器製造における設計とシミュレーション▽地理情報–という5つの応用プラットフォームを構築し、石油探査、バイオ医薬、航空宇宙、ハイエンド機器製造、土木設計、天気予報、海洋環境、新エネルギー、新材料、基礎科学研究、アニメ・映画・テレビのレンダリングなど様々な重要分野に向けサービスを提供しており、平均利用率は60%から70%と、世界トップクラスに達していると述べている。
国家スーパーコンピュータ天津センターは、2011年5月18日、核融合エネルギーの研究にスーパーコンピュータ「天河1号A」の使用を許可する契約を初めて結んだ。利用登録を行った機関は現在までに100近くに上る。新華社のウェブサイト「新華網」が19日付で伝えた。
2011年6月9日、「分子シミュレーション」というアプリケーションで1.87 PFlopsを出したと発表した。1100億個の原子の振る舞いを計算したということで、古典的分子動力学ではないかと思われる。とにかくGPUを含め、アプリでも有効だということは慶賀すべきであろう。もちろんアプリの場合はフロップスより実質的な計算の内容の方が重要である。NVIDIA社によると、2000行のCUDA言語をもちいたとのことである。
3) 国家スーパーコンピュータ長沙センター
昨年の2010年11月28日に国家スーパーコンピュータ長沙センター(国家超級計算長沙中心)が湖南省の湘南大学で着工したと書いたが、2011年7月、第1期工事が終り、正式な運用が始まった。「天津市に続き、中国で2番目の国家スパコンセンターだ。」と中国新聞網が7月10日付で伝えた。設置したスーパーコンピュータは、「天河一号A-HN/2048×2 Intel Hexa Core Xeon X5670 2.93GHz + 2048 Nvidia Tesla M2050@1.15GHz/私有高速网络80Gbps」(Rmax=771.7 TFlops)で、湖南(HN, Hunan)版の天河一号Aである。10月1日までに3 PFlops、今後5年以内に10 PFlopsに改良する計画である。
4) 国家スーパーコンピュータ深圳センター
人民日報海外版によると、2011年11月16日、スーパーコンピュータ「星雲」が、国家スーパーコンピュータ深圳センター(国家超級計算深圳中心)で稼働を開始した。 「星雲」は中国科学院計算技術研究所が開発し、スパコン開発製造大手の曙光公司天津産業基地で製造されたコンピュータで、中国の完全自主開発によるもの(と言っているが、Intel CPU (Xeon X5650 6C 2.66GHz)とNVIDIAのGPU (2050)を用いている)。Rmax=1271 TFlopsで、PFlops越えは中国では初めて、世界では3台目。2010年6月のTop500では、世界2位である。
5) 国家スーパーコンピュータ済南センター(神威藍光)
2011年10月27日~29日に中国山東省済南(Jinan)の国際会議場で開かれたHPC China 2011に参加し、神威藍光の実物を見学した話は、会議の方で紹介した。
中国の山東省科学院は同省済南市に、10月27日、国家スーパーコンピュータ済南センター(国家超級計算済南中心)を設立した。3月にセンター建設を開始したそうでかなり早い完成である。中国で初めて CPUとシステムソフトウエアの全てに国産品を採用したスパコン「神威藍光」(Sunway Blue Light)を設置した。ピーク性能は約1 PFlopsであり、世界で国産CPUによって同水準のスパコンを開発したのは米国、日本に続く3カ国目となる。
パンフレットには、
我国首台全部採用国産CPU ○建的千万億次計算机系統 -採用国内第一款16核通用処理機 申威1600 -全套国産自主軟件 -LINPACK効率 74.4% -系統能耗比 741MFlops/W -単机○組装密度1024CPU |
などとあった。現代中国語は、兆や京の数詞を使わず、1Pは千万億、Exaは百億億などと表すらしい。○は判読不明な漢字(簡体字)である。CPUは中国製の申威「ShenWei SW1600」チップ8704基が使われている。16 core, 0.9-1.1 GHz, 124.8-140.8 GFである。「採用自主命令集(Instruction setは自前)」とも書いてあったが、DEC Alpha-likeとのことである。懐かしい。このプロセッサは、命令セットは別であるが、「京」のCPUのクロックを半分にして、コアを倍にしたようなものである。CPUチップ当たりのピーク性能はほぼ同一。水冷(しかもかなり低温)のところもよく似ている。筐体全体はrace track で、PAXやSigma-1を思い出した。ネットワークは、Infinibandのfat tree のようである。これは「京」とは異なる。Linpack効率74.4%はかなり低く、16コアを詰め込むためにかなりの無理をしているようである。レジスタ制御か、キャッシュの容量か、メモリバンド幅か、Out-of-Orderの有無か、分岐予測か、要因はいろいろ考えられる。
Jack Dongarra教授は、WIREDに対して、「この最新型スパコンから明らかになったのは、中国で世界最速のコンピュータに搭載できるようなマルチコア・プロセッサの大規模な開発が進められている、ということだ」と語っている。「これらのプロセッサの国外展開にあたり、中国がどんな戦略で望んでくるかを考えずにはいられない」実は、われわれが済南センターを訪問した時、同行したKahaner氏に対し、Dongarra教授から、神威藍光が本当に動いているのを見てきてほしい、と依頼していたようである。
27日に偉い人を招いて盛大な式典をやり、それに合わせてHPC China 2011をやったらしい。その日の午後、私を含め数人が訪問したのは既報のとおり。中国が自製のCPUでPFlops級のコンピュータを完成させたことは、New York Timesなどでも驚きをもって報じられた。しかし、これは序盤に過ぎなかった。
6) 上海スーパーコンピュータセンター
人民日報の2011年9月20日号によると、中国の航空機エンジンの完成品構造分析工程研究センターと構造完全性工程研究センター、上海スーパーコンピュータセンター(上海超級計算中心)中航工業商発分センターが19日、上海市で同時に設立された。計画によると、国産大型機のエンジン「CJ-1000A」(中国語名「長江」)は2016年にテスト製品が完成し、2020年に引き渡しが行われる予定である。
7) 清華大学地球シミュレータ
人民日報が201年4月18日伝えるところでは、地球システムの研究を強め、地球規模の気候変動研究分野における中国の発言権を高めるべく、清華大学と中国サーバ大手の浪潮集団は15日、地球シミュレータの建設をスタートした。今後はこのシステムを通じて、気候変動に関する政府間パネル(IPCC)第5次報告書へ向けた気候シミュレーション、予測などの計算や、海流・大気・地殻のシミュレーション研究を実施し、気候変動の対策制定、環境保護・資源の合理的な利用に向けた政策決定の根拠を提供し、地球規模の気候研究のために重要な参考データを提供していく。
8) Inspur
2011年3月、浪潮集団(Inspur Group)は、国防科学技術大学が開発したFeiteng(飛騰)CPUチップ(Galaxy FT-1000)によるサーバを発表した。SPARCv9互換である。
9) China HPC TOP100
China HPC TOP100は、2002年に始まったが、最初は中国国内だけで流通していたようである。当時Top500に載っている中国のマシンはわずか5台であった。2004年には、David Keyes教授が、China HPC TOP100に基づいて、“Supercomputing in China”という講演を行った。いつからかは不明だが、英語版もできてTop500と情報交換を行った。2007年にRenoで開催されたSC2007のHPC in China workshopでChina HPC TOP100について講演した。
さて、2011年版のChina HPC TOP100が2011年4月26日発表された(下に示す現在の表は、神威藍光などその後の発展も入っているようである)。
(1) 合計は9.6 PFlops
(2) 相互接続は、59台がGigE、37台がInfiniBand
(3) プロセッサは、80台がIntel、19台はAMD。残る1台は申威1600か。
(4) 81台はquad-core CPUを用いている。
(5) トップ10の7台は中国製
中国はHPCにものすごい投資をしているようである。10位までを示す。Top500は、2011年11月のTop500での順位を示す。性能の単位はTFlopsである。コア数やRmaxなど微妙なずれがある。
順位 |
Top500 |
設置場所 |
製造 |
機種 |
Cores |
Rmax |
Rpeak |
1 |
2 |
国家超級計算天津中心 |
国防科大 |
天河一号A/7168×2 Intel Hexa Core Xeon X5670 2.93GHz + 7168 Nvidia Tesla M2050@1.15GHz+2048 Hex Core FT-1000@1GHz/私有高速网络80Gbps |
202752 |
2566 |
4701 |
? |
4 |
国家超級計算深圳中心 |
曙光 |
Nebulae – Dawning TC3600 Blade System, Xeon X5650 6C 2.66GHz, Infiniband QDR, NVIDIA 2050 |
120640 |
1271 |
2984.3 |
2 |
14 |
国家超級計算済南中心 |
注(1) |
神威蓝光/8575×16 Core 申威1600@975MHz/QDR Infiniband |
137200 |
795.9 |
1070.16 |
3 |
16 |
国家超級計算長沙中心 |
国防科大 |
天河一号A-HN/2048×2 Intel Hexa Core Xeon X5670 2.93GHz + 2048 Nvidia Tesla M2050@1.15GHz/私有高速网络80Gbps |
53248 |
771.7 |
1343.2 |
4 |
|
国家超級計算深圳中心 |
曙光 |
曙光星雲/ Dawning TC3600 Blade/2560x (2 Intel Hexa Core X5650 + Nvidia Tesla C2050 GPU)/QDR Infiniband |
52416 |
749.2 |
1296.32 |
5 |
|
網絡公司 |
IBM |
xSeries x3650M3/Intel Xeon X56xx 2.53 GHz/Giga-E |
113040 |
636.985 |
1143.965 |
6 |
21 |
中国科学院過程工程研究所 |
中科院過程所 |
Mole-8.5 Cluster/320×2 Intel QC Xeon E5520 2.26 Ghz + 320×6 Nvidia Tesla C2050/QDR Infiniband |
33120 |
496.5 |
1138.44 |
7 |
|
深圳星雲計算中心 |
曙光 |
曙光星雲/Dawning TC3600 Blade/3040 x 2 Intel Hexa Core X5650/QDR Infiniband |
36480 |
342.3 |
389.168 |
8 |
|
電信公司 |
IBM |
xSeries x3650M3/Intel Xeon X56xx 2.93 GHz/Giga-E |
36336 |
204.7544 |
425.856 |
9 |
|
網絡公司 |
IBM |
xSeries x3650M2 Cluster/Intel Xeon QC E55xx 2.53 GHz/Giga-E |
34688 |
196.28 |
351.044 |
10 |
58 |
上海超級計算中心 |
曙光 |
魔方/曙光5000A/1920×4 AMD QC Barcelona 1.9GHz/DDR Infiniband/WCCS+Linux |
30720 |
180.6 |
233,472 |
注(1) 国家並行計算机工程技術研究中心
Top500との対応は十分確認できていない。深圳にあるTop500の4番と、China Top100の4番とはRmaxが全然違うが、同一マシンかもしれない。
10) アメリカ政府の勧告
ASCIIデジタルによると、アメリカ下院情報特別委員会は、中国の通信インフラ機器ベンダであるHuawei(華為)Technologies社とZTEの2者に対して、2011年初めに暫定調査をおこなったが、11月から本格的な調査を開始した。その結果、2012年10月8日には、アメリカの企業に対して、国家保安上のリスクを理由に、両社の機器を導入しないよう勧告した。この話は、2019年の今まで尾を引いている。
他のアジアの動き
1) 韓国
2011年5月、韓国で国家超高性能コンピュータ活用及び育成に関する法律(超高性能コンピュータ法)が制定された。同様の法はアメリカにはあるが、日本にはない。これは韓国の国家行政機関である未来創造科学部(Ministry of Science, ICT and Future Planning, 2013)の前身の一つである教育科学技術部が推し進めたものであり、これにより2016年にHPC Agency Projectを開始するとしている。このプロジェクトでは2025年までに30 PFlopsのスーパーコンピュータを建設することを目指している。なお、未来創造科学部は、2017年7月20日に科学技術情報通信部に名称を変更した。Record Chinaによると、同部は、2018年2月23日に開催された第6回国家超高性能コンピューティング委員会で、1PFlopsの演算が可能なスーパーコンピュータを5年以内に自主開発するという「第2次国家超高性能コンピューティング育成基本計画」を策定した。
ベンチャー企業の終焉
1) Transtech Parallel Systems社
1986年2月18日、イギリスで設立され、小粒度の同期により、マルチスレッド実行を支援する、組み込みシステムを製造していたTranstech Parallel Systems, Inc.は、2011年4月26日、解散した。同社は、1993年8月には、Paramid Supercomputerを発売し、1994年3月にはParamid GF1 Parallel Supercomputerを発表した。これは64個までのIntel i860-XPプロセッサを用いた分散メモリ並列コンピュータである。ノード間の相互接続のためにtransputer T805を用いる。各ノードは32 MBのメモリを持つ。最大16ユーザの並行利用が可能であった。
2) Novell社
Novell社(Novell, Inc.)は、1979年ユタ州のProvoでNovell Data Systems Inc.として設立され、LANの出現に貢献し、NetWareなどで世界中のコンピューティングの在り方を変えていった。しかし、ネットワークがPCに標準的にインストールされるようになると、Novell社は急激にシェアを失った。Novell社は永らく他の様々な企業による買収のターゲットになっていると噂されていた。
Novell社は2010年11月、Attachmateによる買収に同意し、Novell社を2つの部署で運用し、かつその1つをSUSEとすることを計画しているとアナウンスした。この統合は2011年8月に完了し、Attachmate社はNovell社を買収するために現金で1株につき$6.10を支払った。Novell社は完全にThe Attachmate Groupの所有となり、Attachmate Corporationを親会社とする子会社となった。
3) Motorola社
マイクロプロセッサの主要メーカの一つであったMotorola社(1928年創業)は、2011年1月4日をもって、携帯端末やset top box事業のMotorola Mobility社と、その他の事業のMotorola Solutionsとに分割された。半導体部門は2004年にFreescale Semiconductor社として分離独立している。
4) 情報数理研究所
科学技術系ソフトウェアで受託開発などを行なっている「株式会社情報数理研究所」が2011年9月6日、東京地方裁判所へ自己破産を申請し、14日、破産手続きの開始決定を受けた。いわゆる倒産である。情報数理研究所は、1974年の創立以来、先端技術を追求するソフトウェア開発企業として、科学技術ソフトウェア分野でのサービス、製品提供を中心に、主に研究所や官公庁関係に対する分析ツールの提供や一部システムの運営業務を担ってきた。負債額は約5億円。創業者磯野彬は、筆者のいた素粒子論研究室の1年後輩であり、その後も多少の付き合いはあった。官公庁大学を相手にしている企業の震災の後の売り上げが激減しているとのことである。
次は2012年であるが、その前に、「大学計算機センター事始め」を4回に分けて連載する。これは先日7月10日に開催された「大型計算機センター法制化50周年記念シンポジウム」での講演を増補したものである。その後に2012年の話を書く予定である。2012年は「京」コンピュータの共用が始まり、6月にはSequoiaがTop500の首位を取り、11月にはTitanがトップを取る。Intel社はついにXeon Phiを発表する。