世界のスーパーコンピュータとそれを動かす人々


8月 20, 2018

HPCの歩み50年(第173回)-2009年(m)-

小柳 義夫 (高度情報科学技術研究機構)

NVIDIA社は倍精度演算を強化しECCを付加したFermiを発表した。Huang CEOは「今やCPUはコプロセッサに主役を譲ったと信じる。」と豪語した。ClearSpeed社は市場から姿を消した。最初のBlue Gene/PがドイツのJülichで動き始めた。中国では独自チップのスーパーコンピュータ開発が現実味を帯びてきた。

アメリカ企業の動き(続き)

10) NVIDIA社
2009年3月3日にSan Franciscoで開催されたMorgan Stanley’s Technology Conferenceにおいて、NVIDIA社のMichael Haraは独自のx86製品を開発することを検討中であると発表した。これまで伝えられていたTegraではARMベースのCPUが考えられていたが、これはx86コアである。しかしNVIDIAは自分のx86サーバを売り出すつもりはないとのことである。

まあ、現在のGPGPUの高性能はメモリが別でメモリバンド幅が数倍あることによるわけで、CPUと一緒にするとそのメリットがなくなってSIMDと同じになってしまうのでは、という観測もあった。この話の裏には、NVIDIA社がNehalem以降のQPI用のバスライセンスをもっていないので、Nehalemが低価格になったときにGPU統合のチップセットができない、それなら自前で両方作ろうということではないか、という見方もあった。

2009年9月30日~10月2日に、San JoseにおいてNVIDIA社主催のGPU Technology Conferenceが開催され、40カ国から約1000人が参加した。CEO のJen-Hsun Huangは次期GPU製品であるTesla Fermiを発表した。6月ごろから噂話が流れていたが、Tesla Fermiの主な仕様は、512コア、単精度1.5 TFlops、倍精度 768 GFlops、メモリ3 GB(ECC使用時は2.6 GB)である。全てのメモリアドレス空間を統合し、C++をフルサポートしたことも新しい。メモリは2010年中に4倍に伸びるとの話である。Fermiは40 nmテクノロジで製造され、30億トランジスタを搭載する。従来、SP (Streaming Processor)とかshader processorとか呼ばれていたコアは、CUDA Coreに名前が変更された。HPCの観点からは、倍精度性能が一挙に10倍になったことおよびECC機能が付加されたことは注目される。出荷は2010年2月の予定。プログラミング環境としても、PGIやCrayが独自のコンパイラを開発している。Huang CEOは「今やCPUはコプロセッサに主役を譲ったと信じる。」と述べた。

9月30日の夕刻行われた”Breakthroughs in High Performance Computing”のセッションにおいて、Cray社のSteve Scott CTOはこう述べた。「ORNLは、Jaguarスーパーコンピュータが、現在AMD Istanbulで2.3 PFlops (peak)に増強中であるが、今後Fermiを搭載することにより20 PFlopsのレンジまで達する」。Cray社は、最先端スーパーコンピューティングの分野で、Fermiに言わばお墨付きを与えた形となった。2012年にNVIDIAのK20xを搭載したORNLのマシンは、Titanと名付けられた。

2009年11月10日、NVIDIA社は、予定していたFermiを搭載したグラフィックカードが2009年内には登場しないことを明らかにした。

11) ClearSpeed社
販売不振が伝えられていたが、2009年3月16日付けでClearSpeed社のChris Piercy社長からメールが来て、自分が同社を去り、今後の連絡はUK OfficeのRussel David COOにしてくれと書いてあった。2009年7月にはLondon証券取引所で上場廃止になり、2010年にはアメリカの事業所を閉鎖した。

12) Kuberre Systems社
2009年3月12日付けHPCwireによると、Convey社に続いてKuberre Systemsという会社がFPGAを使ったHPCコンピュータを出すとのことである。本社はマサチューセッツ州で、2001年に創業した金融サービス会社である。システム名はHANSA(Hardware Accelerator for Numerical and Systems Analysis)とのことで、使い方が煩瑣ではないかと心配した。主たる目的は金融における大規模計算である。Convey社のHC-1と同様、FPGA資源をアプリから仮想化している。HANSAは1~16枚のFPGAボードを搭載することができ、各ボードは4個のFPGAと16 GBのメモリを搭載している。

13) Microsoft社
Microsoft社のオペレーティングシステム (OS) Windows Vistaの後継版として開発されていたWindows 7は、2009年7月22日に開発が完了し、9月1日にはボリュームライセンス契約者への提供が開始され、10月22日には一般への発売が開始された。

14) Google社
Google社は、2009年7月7日、同社のofficial blogにおいて、Google Chrome OSと呼ぶPC用のOS (Operating System)を開発していることを初めて公表した。このOSはx86とARMのCPU上で動作し、Linuxをベースに新しいWindow SystemとGoogleのweb browserであるGoogle Chromeを搭載したものである。アプリはGoogle社のwebからインストールされ、それ以外のアプリはインストールできない。Google社はすでにOSとしてAndroidを開発しているが、これは携帯電話や組み込み用である。2011年6月15日、Samsung電子からChromeを搭載したノートパソコンChromebookが発売された。

15) Mooreの法則の終焉
アナリストのHIS iSuppli社は2009年6月「Mooreの法則は5年のうちに成立しなくなるであろう。その理由は技術的なものでなく、ファウンドリの費用である。」と述べた。「45 nm fabの値段はすでに$1B(1000億円)を越えている。AMDのファウンドリのパートナーのGlobalfoundriesは、32 nm fabのために4200億円を使い、Intelもファウンドリを32 nmに更新するために7000億円を使った。リミットは20 nm以下、たぶん18 nmであろう。」

その後10年近く経ったが、速度が若干鈍化したとはいえMooreの法則は続き、今や5 nmが語られている。

ヨーロッパの動き

1) Forschungszentrum Jülich
2008年9月頃、FZJ (Jülich研究センター)を運営するHelmholtz協会(Helmholtz-Gemeinschaft Deutscher Forschungszentren)から依頼されて、FZJの外部評価に参加することになった。この協会は16の研究センターから構成される。Helmholtz協会は、Max Planck協会やFraunhofer協会と並ぶドイツの研究機構である。評価委員会は3月25日午後からということで、3月24日朝、成田空港に向かったがDHL機の炎上事故で長い方の滑走路が閉鎖されていた。翌日に予約変更して出発したが、会議には1時間ほど遅刻しただけで済んだ。西海岸行きの777は、ぎりぎり第二滑走路から飛び立てたようである。これに乗ろうとしたM氏は、Anchorageで途中給油すると脅かされたそうであるが、結局直行できたとか。これは余談。

評価委員会のメンバは以下の通り。

委員長:Horst Simon LBNL(米)
Rosa M. Badia Barcelona Supercomputer Centre(スペイン)
Kurt Binder Mainz大学(独)
Hans-Joachim Bungartz München工科大学(独)
Guillaume Colin de Verdière Commissariat à l’énergie atomique(仏)
Richard Kenway Edinburgh大学(英)
Louis Komzsik Siemens PLM Software(米)
Douglas Kothe ORNL(米)
Volker Lindenstruth Heidelberg大学(独)
Wolfgang Nagel Dresden工科大学(独)
Yoshio Oyanagi 工学院大学(日)
Thomas Schulthess CSCS(スイス)
Edward Seidel Louisiana州立大学(米)
Raj. Thampuran iHPC(シンガポール)

 

会議はAachenのホテルで行われたが、26日にはJRZを訪問した。かなりのド田舎にある。JUGENE (BlueGene/P)はごく一部だけ設置されていた。評価・勧告のテーマは大きく分けて2つあり、「計算科学と数学的手法」および「グリッド技術とそのインフラストラクチャ」であった。それに加えて[大規模施設としてのスーパーコンピュータ]についても評価を行った。研究は多岐にわたり、そのレベルは非常に高かった。ただ、エクサスケールに向けてIBM一社だけと共同研究するというので、筆者はもっと広い観点で考えた方がよい、と発言した。

これも余談であるが、3月27日の朝帰宅のためホテルを出たが、AachenからFrankfurtへの直通の鉄道が停電で大回りの経路をとることになった。ドイツでもそんなことがあるのか。私は間に合ったが、一緒に行ったシンガポールのThampuran氏は乗り遅れて予約変更など大変であった。

2009年5月26日、FZJでJUGENE (Blue Gene/P)が稼働し、ヨーロッパ初のPFlops級のスーパーコンピュータとなった。2009年6月のTop500では、コア数294912、Rmax=825.5 TFlops、Rpeak=1002.7 TFlopsで3位にランクされている。JUROPA (Jülich Research on Petaflop Architectures, Sun Blade server with Nehalem, 2208 nodes, 207 TFlops peak)とHPC-FF (High Performance Computing — for Fusion, 1080 nodes with two Nehalem EP quadcore, 101 TFlops peak)も稼働しており、3機体制となった。

2) CSCS
スイス国立スーパーコンピュータセンターCSCS (Centro Svizzero di Calcolo Scientifico) は、2009年6月4日、ピーク141.8 TFlopsのMonte Rosa (Cray XT5)を稼働させた。2009年6月のTop500では、コア数14740、Rmax=117.6 TFlops、Rpeak=141.5 TFlopsで23位に位置している。その後増強し、2009年11月のTop500では、コア数22032、Rmax=168.7 TFlops、Rpeak=211.5 TFlopsで21位にランクしている。

3) Intel Labs Europe
2009年11月18日、大規模コンピューティングの課題を研究するため、Intel Labs Europeがフランスの3つの機関と協力することが明らかになった。3つの機関とは、フランス原子力庁(CEA)、大型集中計算施設(GENCI)、ベルサイユ・サン・カンタン大学である。Intel社は3年間の提携に数百万ドル規模の資金を投じると同社は述べている。Intel社のSteve Pawlowski氏は、声明の中で「フランスはヨーロッパにおける高性能コンピューティング研究を牽引する重要な役割を担ってきた。われわれがこの3つの機関と協力することを選んだのは、エクサスケールでの高性能コンピューティングにおいて世界的水準のソフトウェア能力を有しているからだ」と述べた。

2009年現在、Intel社は欧州委員会から独占禁止法違反で€1.06B ($1.58B)の制裁金を課せられ、上訴中である。

4) ロシア
文部科学省科学技術政策研究所の『科学技術動向』2009年9月号の記事「ロシアにおけるスーパーコンピュータの開発強化の動き」によると、2009 年7 月28 日に開催されたロシアの安全保障理事会において、ロシアのメドベージェフ大統領は、ロシアの競争力強化を目標に、国内でのスーパーコンピュータの需要と利用を高めるべきであると述べた。ロシアが保有するスーパーコンピュータのシステム数と性能合計は、増加傾向にあるが、米国の1/50 以下、ドイツ・英国・フランス・日本・中国などの1/3 以下である。これに対し、メドベージェフ大統領は、ロシアの競争力の強化を目標に、ロシア国内でのスーパーコンピュータの需要と利用を高めるべきであると述べた。全ロシア実験物理学学術調査研究所は、2011年迄に1 PFlopsのスーパーコンピュータの開発を明らかにしており、ロシア政府から25 億ルーブル(約75 億円)が拠出される予定である。

中国の動き

1) 自主開発
科学技術政策研究所発行の『科学技術動向』2009年2月号の記事「中国におけるスーパーコンピュータの自主開発への動き」によれば、中国では、スーパーコンピュータの導入と開発が強化されているとのことである。今までTOP500リストに登場した中国の15システムをみると、中国製は2システムのみで、しかもそれらには米国製のCPUチップが採用されていた。

しかし、この状況にも変化が見られる。2008年12月3日に中国企業の曙光信息産業有限公司は、中国科学院計算技術研究所と共同開発中のペタFlops級スーパーコンピュータ「曙光6000」に、中国製のCPUチップ(名称は「龍芯」、英語名:Loongson)を採用する計画を明らかにした。中国製のスーパーコンピュータに初めて自国製のCPUチップが採用されることになる。このCPUチップは、65 nmの微細化プロセスルールで製造した4つのコアを内蔵するもので、すでにチップは完成し、近く量産に入るとのことである。このCPUチップに関しては、2008年8月に開催された国際会議「HOT CHIPS 20」において、アーキテクチャに関する論文が中国科学院計算技術研究所から発表されている。2009年6月、MIPS Technologies社と正式なライセンス契約を結んだ。

以上の動きに続いて、2008年12月18日には、中国内の10社が発起機関となる中国高性能計算機産業連盟が設立された。国の安全と経済にスーパーコンピュータが果たす役割は大きいとの認識から、スーパーコンピュータ分野の自主革新を支援することを目的としている。連盟の設立の背景としては、国防・情報セキュリティ・石油探鉱・天気予報・バイオ製薬・科学計算・商業計算などの分野で、スーパーコンピュータを使用する要望が多いが、中国のスーパーコンピュータ市場の大半は外国企業に占められている現状がある(工業・情報化部局(工業和信息化部科技司)による報道)。今後の中国の動きに注目したい。

2009年4月28日、江蘇省常熟市で龍芯コンピュータの初めての政府調達契約を締結した。

2) 深圳(しんせん)
JSTの中国総合研究交流センター第17回研究会(2009年6月25日)の発表「中国の電子情報通信」(鄧納)によると、2009年6月4日、中国科学技術部が国家スーパーコンピュータ深圳センターの設立を正式に認可したと公表した。2億元を投資し、2010年末までに深圳で1 PFlopsの演算能力を持つスーパーコンピュータの運用をスタートする計画である。

3) 天河1号
湖南省長沙市の国防科学技術大学は、2009年10月29日にスーパーコンピュータ天河一号(Tianhe-1)を発表した。CPUとしてはIntel社のXeon E5540/E5450 6144個を採用し、GPUとしてAMDのATI Radeon HGD 4870X2を5120個加えている。面白い組み合わせである。ノードは2個のIntel Xeonプロセッサと2個のAMD GPUで構成されている。Rpeak=1206.2 TFlops、Rmax=563.1 TFlopsで2009年11月のTop500で堂々5位にランクされた。中国初のピーク1 PFlops越えのマシンである。Rmax/Rpeak=0.467という値はかなり低く、アプリの開発はかなり苦労するものと予想される。国防科学技術大学のZhou Xingming教授は、今後何千もの中国製のチップを付加して性能を上げ、Rmaxで800 TFlopsを実現する、と述べた。この中国製チップはGodson-3ではないかと推測されたが、実際は違った。

天河一号は、天津市濱海新区と国防科学技術大学が共同で立ち上げた国家スーパーコンピュータ天津センター(天津国家超級計算中心)のホストコンピュータである。2010年1月13日には、1/16が移設され、試験運用を開始したとの報道があった。重点ユーザとして天津市気象局、中海油データセンタ、国家アニメ漫画産業総合示範園区、天津国際生物医薬聯合研究院などが参加しているとのことである。しかし、中国のInspur社により再構築が進められ、2010年11月までには天河1Aに転換してトップを取っているので、天河一号として実際どの程度使われたかは不明である。もしかしたら、最初からGPUをRadeonからNVIDIAに取り換えて、天津に搬出していたのかもしれない。この推測が正しければ、天河一号はTop500の5位という記録達成だけが目的のシステムであったということになる。

4) 中国科学院
中国科学院の胡偉武が、2001年より率いてきた龍芯プロジェクトは、MIPSベースの命令セットアーキテクチャを採用しているが、MIPS Technologiesが特許をもついくつかの命令を欠いているということでライセンスを得ていなかった。今後中国国外に販売する場合にはMIPS Technologiesの特許に抵触する可能性があることから、2009年6月15日、中国のICT (Institute of Computing Technology)はMIPS Technologies社とMIPS32およびMIPS64アーキテクチャについて正式にライセンス契約を結んだと発表した

5) 曙光公司
新華社のオンライン版新華網が2009年7月6日に伝えたところによると、曙光信息産業有限公司は5日、中国科学院計算技術研究所と共同で開発中の高性能スパコン「曙光6000」の開発は順調に進んでおり、来年には発表され、国家華南スパコンセンターに導入される予定である。JSTのScience Portal Chinaが伝えた。

同社によると、「曙光6000」の演算処理速度は最高で1 PFlopsを超えるとされる。同スパコンは初めて国産CPU「Loongson(龍芯)」を使用。これまでの国産スパコンでは最も核心となるCPUでは独自の製品を採用したことがなかった。歴軍(Li Jun)総裁によると、「曙光6000」は現在順調に開発が進められており、2010年に発表予定。これが完成すれば、国産CPUの採用によって技術的な障害がなくなり、スーパーコンピュータのクラスタリング構造がペタフロップス時代に適応した改造を実現するという2つの飛躍が遂げられることになる。歴総裁はまた、「第11次五カ年計画」期間中に、中国科学院計算技術研究所がマルチコア・マルチスレッドプロセッサの高性能CPUを打ち出せば、1000 TFlopsの「曙光6000」に 応用できるだけでなく、低消耗の高性能サーバも構築でき、スパコンの全国産化が早まると紹介した。

景気のいい話であるが、眉につばをつけて聞いたほうがよいであろう。

6) 中国Top100
2009年11月に中国設置のスーパーコンピュータTop100が発表され、これまで7年連続で台数首位を占めていたHewlett-Packard社が曙光公司に敗れた。内訳は以下の通り。中国の会社が製造したのは半数弱であり、いずれもCPUはアメリカ製である。

会社 台数
曙光 27機種
IBM 26機種
HP 23機種
浪潮 (Inspur) 6機種
DELL 4機種
聯想 (Lenovo)・神威 (CLAMP)・宝徳 各3機種
国防科技大 2機種
SUN・北京計算センター・SGI 各1機種

 

7) 成都
2009年12月7日付けの人民日報英語版によると、四川省の成都(Chengdu)にスパコンセンターが出来るとのことである。曙光信息産業有限公司は成都市政府と協力して、5000万元を投資し、成都ハイテク工業団地の中に中国第2のスーパーコンピュータセンターを建設するとのことである。設置する計算機Dawning 6000Aは、中国製の龍芯3号(Godson-3)プロセッサを搭載し、1 PFlopsの性能をもつ。

上海に2008年9月に100 TFlopsの性能をもつDawning 5000Aが設置されて以来、中国中でスーパーコンピュータやクラウドサーバが続々設置されている。

2009年12月31日付けの朝日新聞は、「成都クラウド・コンピューティング・センター」の第1期工事が12月28日、正式に竣工したと報じている。これは、国内で初めて企業が投資、運営、管理を行い、政府調達サービスの形で運営されるスーパーコンピュータセンターであり、スパコンセンターの新しい商業化運営モデル構築の先駆けとなるとのことである。同センターの建設は、成都市政府と曙光信息産業有限公司が今年4月の成都第7回中国国際IT協力座談会で、政府と企業のウィンウィン運営モデルを実現しようと協議が行われ、合意に達したものである。

両者は同じものを指しているようである。

次回は2009年の最終回であるが、2009年に破産や身売りで姿を消した企業について述べる。

(画像:NVIDIA Tesla C2050 出典:NVIDIA社HP )

left-arrow   50history-bottom   right-arrow