世界のスーパーコンピュータとそれを動かす人々


11月 7, 2016

HPCの歩み50年(第102回)-2003年(h)-

小柳 義夫 (高度情報科学技術研究機構)

プロセッサでは64ビットアーキテクチャの競争が激化している。Itanium2を搭載したサーバが出始めた。Crayはスタンドアローンのベクトルコンピュータとしては最後のCray X1を出荷した。半導体技術も高誘電体材料の利用により、微細化がどんどん進んでいく。

世界の学界の動き(その他)

1) PS2 Cluster
1999年3月3日にソニー・コンピュータエンタテインメント社からPS2 (PlayStation 2)の概要が発表されHPC関係者の話題となったことは前に述べた。プロセッサのEmotion EngineはMIPSアーキテクチャベースの128ビットRISCマクロプロセッサで、東芝とソニーとの共同開発である。ベクトルユニットはVPU0がFMAユニット4台、VPU1がFMAユニット5台装備され、FPUと合わせ単精度ながら6 GFlopsのピーク性能をもつ。これが4万円で売られるので、4000万円で1000台買って6 TFlopsなどという皮算用が脳裏をよぎった。まあメモリは小さい。発売されたのは翌2000年3月4日。

2003年にイリノイ大学のNCSAおよびDepartment of Computer Scienceは、2003年5月30日、70台のPlayStation 2を結合したLinuxクラスタを構築することにNSFの援助により成功したと発表した。Linux Kit for PS2(2002年2月13日発売)を使用し、主としてPS2の128ビットCPUであるEmotion Engineの持つ2基のベクトル演算ユニットを利用する。メモリバンド幅がネックのようである。またLinux KitをインストールしたPS2を70台(報道によっては65台)をイーサーネットで接続し、クラスタを構成した。

日本でも東工大の青木尊之研究室で20台のPS2 Linux kitでクラスタを構成し、研究をおこなった。SOR Poissonソルバにおいて、inline assemblerで直接VUOを4並列で動作させ、単体で1.5 GFlopsの速度(単精度)を出し、HPCS2002で報告した。ただ、主記憶が32 MBのRDRAMだけで少なく、ネットワークも遅く、クラスタとして実用的とは言えないという結論であった。

2) Goto BLAS
BLAS (Basic Linear Algebra Subprograms)は、1979年に公開された線形演算の基本操作を実行するライブラリインタフェースであり、LAPACKやScaLAPACKはBLASを使って書かれている。実装にはオープンなもの、特定のCPUに特化したものなどいろいろある。

Texas大学Austin校のRobert A. van de Geijnの客員研究員であったKazushige Gotō (後藤和茂)は、IntelのPentium III、Pentium 4、Alpha Processor、POWER3およびPOWER4のための高性能なBLASの実装を発表し、その性能の高さが評判になった。Pentium 4(2.25 GHz)で3.9 GFlops(87%)、POWERやAlphaでも90%の性能を実現した。TLBミスを最小化したのがミソのようである。最初はDGEMMだけであったが、2003年1月、完全なBLASのセットを公開した。これはGotoBLASと呼ばれた。2010年に開発は終了したが、OpenBLASに引き継がれた。

3) FFTW Ver. 3
FFTW (The Fastest Fourier Transform in the West)は、1997年3月24日Matteo FrigoとSteven G. Johnson (MIT)によって公開された。自動チューニングによるライブラリの一つである。そのVer.3が2003年4月に公開された。

4) Mooreの法則
Intel社のGordon Moore名誉会長(74)は、2003年2月10日からサンフランシスコで開催されている「2003 ISSCC (IEEE International Solid-State Circuits Conference)」において講演し、いわゆるMooreの法則について「今後10年は生き続ける」として、さらなる技術革新が進むとの考えを明らかにした。Moore氏は68年に共同創業者の一人としてIntel社を設立し、75年から87年までCEOを務めた。同氏は1965年、チップ上のトランジスタの集積度が「1年で倍増する」との予測を発表し、1975年には「2年で倍増する」と修正した。現在Mooreの法則と呼ばれている「トランジスタの集積度は18ヶ月で倍増する」という命題は、両者の平均である。Moore氏は「自分は決して18カ月と言ったことはない。1年または2年と言っただけだ」と語った。

Moore氏は「技術はより複雑で費用がかさむようになっているが、解決法は存在する。チップ上にこれ以上はトランジスタを増やせないというような状態になっても、何とかして数十億のトランジスタを埋め込んでいくことになるだろう。それが創造性の限界ということにはならないと思う」と述べた。

現在の問題は、トランジスタパーツが原子サイズの限界に近づきつつあることで、ゲートリーク電流が増えて、結果として半導体チップの消費電力が増えてしまう。Moore氏は、この問題への解決策としては、ゲート絶縁膜に使う高誘電率(High-k)材料の開発が進んでいることに触れた。High-kは比誘電率が高いために、従来のSiO2膜より物理的な膜厚を増やし、リーク電流を抑制できると述べた。High-kでリーク電流は1/100以下になると言う。

またMoore氏はトランジスタ構造自体も変わる必要があり、Intelが研究しているトライゲート(Tri-Gate)トランジスタや、ダブルゲートトランジスタのような、三次元構造のトランジスタ技術が重要になるであろうと述べた。

5) FT-MPI
Tennessee大学のJack DongarraらはFault Tolerant MPI (FT-MPI)の開発を進めてきた。これはMPI 1.2の独立な実装で、ユーザレベルやシステムレベルでの耐故障性を実現している。2003年9月に発表された。

6) von Neumann生誕100周年
大数学者で大物理学者、かつ大計算科学者のJohannes Ludwig von Neumann (1903年12月28日 – 1957年2月8日)は、今年生誕100周年を迎えた。2月10日にSan Diegoで開かれたSIAM(アメリカ応用数理学会)の計算科学技術研究会では、夜8時から記念の集会を開いた。講演者は、伝記作家William Aspreay、von Neumannの令嬢Marina v.N. Whitman(経済学者)、Peter Lax、Pete Stuwartであった。

出席した中島研吾(RIST)の話によると、遅い時間にもかかわらず300人ほどが出席し、10時過ぎまで熱心な議論が続いた。オーガナイザでもあるGene Golubは「SIAM Conference on Computational Science and Engineering」 こそvon Neumannの業績を称えるのに相応しい会議であると述べた。

7) Kasparov
アゼルバイジャン生まれのチェスプレーヤーGarry Kimovich Kasparovは1996年にDeep Blueと対戦し、3勝2敗3引き分けで勝利し、1997年には1勝2敗3引き分けで僅差で逆転された。2003年1月26日から、ニューヨークにおいてDeep Juniorと全6回のマッチを行った。1回目はKasparovの勝ち、2回目は引き分け、と進んだが、結果は1勝1敗4引き分けで引き分けとなった。どちらも強いですね。

8) ノーベル物理学賞
スウェーデン王立科学アカデミーは10月7日、2003年のノーベル物理学賞をロシアと米国の国籍を持つ米アルゴンヌ国立研究所のDr. Alexei A. Abrikosov名誉研究員(75)、ロシア人でP・N・レベジェフ物理学研究所のDr. Vitaly L. Ginzburg前理論研究グループ長(87)、英国と米国の国籍を持つ米イリノイ大のAnthony J. Leggett教授(65)の3氏に授与すると発表した。授賞理由は「超伝導と超流動の理論に対する先駆的な貢献」。Leggett教授の晴子夫人は日本人であると報じられた。

アメリカの企業の動き

1) IBM社
ASCI Purpleに使われるはずのPOWER5の技術情報が小出しに出て来た。2003年2月21日にNew Orleansで開催されたIBM PartnerWorld conferenceにおいて、IBM server groupのBill Zeitlerは、「POWER5サーバは現在のPOWER4サーバより4倍高性能になる」と述べた。POWER5サーバのプロトタイプが既に3週間稼動しているとのことである。ASCI Purpleは12544個のPOWER5プロセッサ(64-wayサーバを196個結合する)からなる。クロックは発表されなかったが、2 GHzならちょうどピーク100 TFlopsになる計算である。

2003年7月には、POWER5がIBMのPoughkeepsie研究所で順調に稼動し、性能テストでPOWER4の4倍の性能が出ることが期待される、来年には出荷する、と発表された。4倍というが、根拠ははっきりしない。

2003年8月17日~19日にStanford大学で開催されたHot Chips: A Symposium on High Performance Chips (HC15)において、Ron Kalla et al.の“POWER5: IBM’s Next Generation POWER Microprocessor”で発表した。130 nmテクノロジで銅配線SOI、Dual processor core, 8-way superscalar, SMT (Simultanious multithreaded) coreが売りであった。完全なデータは2003年10月14日に、Microprocessor Forumで発表された。

2002年10月30日、新任のPalmisano会長は“On Demand Computing”という新しいテクノロジに$10Bを投入するという電撃的な発表を行ったことは昨年のところで述べた。その最初の契約として、石油の探査や貯蔵を行う米PGS (Petroleum Geo-Services) 社と契約を結んだことが2003年1月10日に発表された。IBM社は同社のコンピュータ処理能力の1/3を提供する。石油業界は原油価格の下落のため、技術予算の削減を迫られているという。IBM社のサービスを利用することによりPGS社は、より大規模な演算処理能力を持つ新たなデータ処理能力を必要なときだけ随時手に入れることになる。

2) Intel社(x86)
2003年2月、Intel社は次世代のPentium 4であるPrescottの概要を発表した。90 nmのプロセス技術で製造され、2004年1月1日にリリースされた。L1データキャッシュを16 KBに、L2 データキャッシュを1 MBに倍増し、クロックは4~5 GHzをターゲットとしていることが発表された。他の改良点としては、Improved Hyper-Threading Technology、13種の新命令の追加、プリフェッチと分岐予測の改良、省電力制御など。

2003年11月27日、Intel社長のOtelliniは、2004年Q2には3.6 GHzに、Q3には3.8 GHzに、Q4に4 GHzのPentium 4を発売すると豪語したが、4 GHzチップは後に2005年前半まで延期され、ついに2004年10月14日、4 GHz版の開発を完全に中止することを発表した。最高は2005年初めに登場した3.8 GHz版(キャッシュは2 MB)であった。Intel社はキャッシュサイズの増強によって性能を引き上げる、と弁明した。

サーバ用のXeonでは、2003年3月にGallatinを発売した。テクノロジーは130 nmで、クロックは2.4 GHz、L2キャッシュは512 KB、L3キャッシュは1024 KB。2003年7月には3.066 GHzのものを、10月には3.2 GHzのものを発売した。2004年2月には、3.2 GHzでL3が2048 MBのプロセッサを発売した。Gallatin MP(4コア)では、2002年11月から1.5 GHzのものが発売されていたが、2003年6月には2 GHzや2.5 GHzや2.8 GHzのプロセッサが発売された。

3) Intel社(Itanium)
2003年1月、Intel社はdual coreのItaniumプロセッサ(Montecito)を2004年に発売すると発表した。Itaniumシリーズは64bitプロセッサとしては遅れをとったが、IBMのPOWER4/5や、Sun Microsystems社のUltraSparc 4に対し優位を保つことを狙っていた。

第2世代のItanium 2であるMadisonは2003年6月末に登場した。プロセスは0.13μm、消費電力は130W、クロックは1.3~1.6 GHzである。3次キャッシュは最大6 MB(後に9 MB)。

Itaniumを搭載する最大のシステムは、LLNLのThunderで、4114プロセッサの1.4 GHzのItanium 2をQuadricsで接続する。ピークは23.6 Tfops。2003年11月稼動予定。これまでの最大であったPNNLの1540婦御セッサの1 GHzのItanium 2クラスタを越える。日本では、産総研で512プロセッサの1.3 GHzのItanium 2(と2116プロセッサの2 GHzのOpteron)をMyrinet2000で接続する予定。

2004年にはItniumに早くも暗雲が立ちこめることになる。

4) Intel社(その他)
Intel社は、ソフトウェアツールを開発しているドイツの会社Pallas GmbHのHPC部門を買収したことが2003年8月末に明らかになった。価格は公表されていないが、Intel社はPallasの23名の従業員と クラスタのモニターやチューニングのためのソフトウェアを取得した。Pallasの開発したVampirやVampirtraceはクラスタのノードが効率よく動作しているかどうかを測定するツールである。Top500のトップ5件のうち4件(つまり地球シミュレータ以外)はPallasの製品を使っていると言われている。その他の顧客としてはDaimlerChrysler、T-Mobile、IBMなどが挙げられる。

2003年12月15日、Intel Fortran Compiler 8.0およびIntel C++ Compiler 8.0が発売された。Ver. 8ということなので、もっと前があるようだが、Intelがいつからコンパイラを発売しているのかは不明である。

半導体製造の基本技術としては高誘電率材料の発展がある。半導体の微細化が進み100 nmを切るようになると、チップの中でのリーク電流が増加し、消費電力の見視できない部分w占めるようになる。1990年代からシリコン酸窒化膜が用いられてきたが、さらによい材料が要求されていた。2003年11月、Intel社はこの問題を解決する新しい材料を発見したと発表し、注目を浴びた。物質の名称は明らかにしなかったが、2007年には実用化すると予想した。2007年初め、Intel社はハフニウムを用いた高誘電率(High-κ)酸化膜を45 nmのテクノロジに使用したと発表した。IBM社も同じ頃ハフニウムを用いた高誘電率材料を開発したと発表した。

5) AMD社
AMD (Advanced Micro Devices)社が、“SledgeHammer”と呼ばれていた64-bitプロセッサを“AMD Opteron”と名付けたと発表したのは2002年4月24日であった。2003年4月22日、予定より少し早くOpteronが発売された。これはx86の64ビット拡張であるx86-64という命令セットアーキテクチャに基づく。従来の32ビットx86と上位互換であり、32ビットのソフトも高速に実行される。IA64も原理的にはx86と互換であるが性能は相当に低下する。テクノロジは130 nm SOIで、クロックは1.4~2.4 GHz、L1 cacheはデータ・命令各64 KB、L2 cacheは1024 KB、MMX、拡張3DNow!、SSE, SSE2、AMD64をサポートする。

同じ命令セットのデスクトップ用のAthlon 64およびAthlon 64FXは少し遅れて2003年9月23日に発売された。テクノロジーは130 nm。

Opteronの発売に対し、IBM社はOpteronのサーバを製造すると述べ、Microsoft社はOpteronに最適化したWindowsを約束した。多くのベンダもOpteronに賛同した。AMDの33年の歴史の中で、これまではIntelの後を追いかけていたが、今度は別の道を歩み、従来の32ビットのプログラムを性能劣化なく走らせられるようにした。しかし、IBM、Sun Microsystems、Hewlett-Packardの3社が支配し、IntelもItaniumで参入する64ビットサーバ市場に果たして食い込めるか、Athlonとの二兎を追って大丈夫か、経営状態がよくないのではないか、と心配する向きもあった。

数学ライブラリを販売しているNAG (the Numerical Algorithms Group)は、Opteron やAthlon 64プロセッサに最適化したライブラリACML (theAMD Core Math Library)をAMDと共同して開発すると発表した。このライブラリにはBLAS、LAPACK、FFTなどが含まれる。2003年の第2四半期に発表する予定。NAG社はAMDは行ける、と判断したようである。

2003年12月、AMD社は、Fujitsu Siemens Computers社がOpteron 200シリーズを搭載したCELSIUS V810ワークステーションを発売すると発表した。既存の32-bitアプリと、より高度な64-bitアプリの両方を実行できるところがミソである。

6) Cray社
アメリカでただ一つとなったベクトル計算機Cray X1は2002年11月14日に正式発表された。同社の2003年2月の発表によると、$62MのX1の受注があるという。2月末から出荷が始まり、10月に終了する。アメリカ政府機関が主要な顧客であった。4月に、Cray X1の32プロセッサ機の1つが、NCSI(Network Computing Services, Inc.)により初めて検収されたと報告した。このマシンは軍関係の計算流体力学や構造計算や戦場の天気予報などに使われる。

2004年6月のTop500に載っているCray X1の一覧を挙げる。

順位 設置場所 設置年 コア数 Rmax
20 ORNL 2004 504 5895
47 米国政府機関 2003 252 2932.9
153 Cray社内 2004 124 1448.42
153 US Army PC Res. Center 2003 124 1448.42
153 Alaska大学ARSC 2003 124 1448.42
271 米国政府機関 2004 80 937
406 Boeing 2004 60 706.35
406 ERDC MSRC 2003 60 706.35
406 米国政府機関 2003 60 706.35

 

さてここで大事件が起こった。IBMの副社長の一人(HPC担当)で、IBMのHPCのセールスマンとしてよく日本にも来ていたPeter J. Ungarroが2003年8月Crayの副社長(世界市場担当)に横滑りした。Ungarroは1990年にWashington州立大学でB.A.を取得した後、1991年からIBMに勤めていた。かれはやがてCEOとなり、Crayを「HPCのIBM」のような役割に変えていくことになる。噂では、Seattle勤務に興味があったとのことである。

Cray社は10月、SNLに建設中のASC Red Stormの商品版を2004年から発売すると発表した。これはAMD OpteronをHyperTransport技術に基づく低レイテンシ、高バンド幅の3次元ネットワークで接続したMPPである。これは現在市場にあるSMPシステムのクラスタよりも効率的で価格性能比もよい。「小さな問題や、大問題でも単純ならSMPクラスタでも扱えるかも知れない。しかし、この新しいMPP製品は、何千プロセッサになっても、バンド幅とプロセッサ性能とのバランスがよく、単一の構成のコンピュータのように機能する」とUngarroは高らかに宣言した。

7) SGI
アメリカのSGI社(Silicon Graphics Inc.)は、2003年1月7日、Itanium 2を64個搭載したLinux共有メモリサーバ「Altix 3000」を発表した。これはMIPSプロセッサとIrix OSを用いていたSGI Origin 3000の後継機である。64プロセッサまで搭載可能はAltix 3700 と、12プロセッサまで搭載可能はAltix 3300がある。また、いくつかのAltix 3000をノードとして結合し、ハイエンドの共有メモリサーバとして使えるようにする予定。年内には8ノード、すなわち512プロセッサをサポートする予定だが、将来的には2048プロセッサまで拡張する予定。SGI社は初代のItanium(コード名Merced)を用いたSN1を開発していたが、製品としては日の目を見なかった。これまでOrigin 2000を利用していた東大地震研究所は、3ノード、計108プロセッサ(64+32+12)のAltixシステムを購入した。オーストラリアのQueensland大学は72プロセッサ(64+8)のシステムを購入した。

2003年8月、SGI社は、Altix 3000シリーズのサーバが、Linux magazineの「Product of the Year」に選定されたと発表した。1月には、LinuxWorld Conference and Expo2003で「Best of Show」の表彰を受けている。

社長およびCEOのBob Bishopは、SGI社は経営再建のため、400人(10%)の人員を削減し、第3四半期において$10Mの経費節減を図ると発表した。経営が苦しいのであろう。

8) Hewlett-Packard社
2003年1月、HP(Hewlett-Packard)社はAlpha 21364 (EV7)とこれを用いたAlphaServer GS1280を発表した。同時に、Alpha RetainTrust programを発表し、Tru64 UNIXとOpenVMSをずっと守るので、ISVも安心してソフトを開発してくださいということであろう。ただし長期的にはItaniumというのがHPの方針である。HPのAlphaServerファミリーとしては、ハイエンドは GS1280 enterprise server、部門用は ES80 departmental server、個人用は ES47 workgroup systemsという棲み分けである。GS1280は8月に出荷が始まった。年内にはより強力なGS1280システムが製作されている。2004年には、改良されたEV79 Alphaプロセッサの登場が予定されている。

Itaniumサーバとしては、2003年7月に「HP Integrity NonStopサーバ」を発表した。この製品名の由来は(旧Compaq社が1997年に吸収した)旧タンデムコンピューターズ社のIntegrityシリーズに由来する。これは、PA-RISCプロセッサ搭載のHP 9000サーバやAlphaServerや旧タンデム社のMIPSプロセッサ搭載のNonStopサーバの後継機に当たる。

グリッドコンピューティング関係では、2003年9月4日(米国時間)に戦略を発表し、企業向け製品を、今後18ヶ月から24ヶ月以内にグリッド標準規格であるGlobus ToolkitとOGSA (Open Grid Service Architecture)に対応させることにより、顧客が分散したITリソースを簡単に使用や管理ができるよう支援すると述べた。

“The Terminator”などに出演した映画俳優Arnold Alois Schwarzeneggerは、カリフォルニア州知事選挙に共和党から出馬し、2003年10月7日に当選した。Hewlett-Packard社のCEOで、2002年Compaq Computer社との合併承認などで辣腕を振るったCarly Fiorina女史は、2003年10月8日に声明を発表し、次期カリフォルニア州知事Arnold Schwarzeneggerの政権移行作業チームのメンバーに選任されたことを公表した。HP社には政治活動への伝統があり、共同創始者David Packardは1960年代末に共和党政治に関与し、ニクソン政権の一員として国務副長官に就任した。しかし結局2年半しか持たなかった。Fiorina本人についてもかねてから政界入りの可能性が取りざたされていた。2005年2月にHPのすべての役職を辞したのち、2008年の米大統領選挙でJohn Sidney McCain III上院議員の経済顧問を務めた。2009年にはカリフォルニア州からの連邦上院議員へ出馬し(落選)、2015年には翌年の米国大統領候補に出馬を表明した(辞退)。Fiorinaの政治への関心はこのころから始まっていたのであろうか。

アメリカ企業の続き、およびヨーロッパや中国などの動きは次回。

(タイトル画像:SGI Altix 3700 出典:Texas A&M Universityホームページより)

left-arrow   50history-bottom   right-arrow