世界のスーパーコンピュータとそれを動かす人々


提 供

1月 18, 2016

HPCの歩み50年(第70回)-1999年(c)-

小柳 義夫 (高度情報科学技術研究機構)

PETAFLOPS II会議が開かれ、アーキテクチャとして3つの可能性が示された。SC99においてGRAPE-5がGordon-Bell賞のPrice Performanceカテゴリで1位を獲得した。日本で初めての計算物理の国際会議ICCP5が金沢で開催された。

世界の学界の動き

1) Mannheim Supercomputer Seminar
Hans Meuer教授が主催するMannheim Supercomputer Seminarは第14回を1998年6月10~15日にMannheimで開催した。参加者230人。基調講演はGordon Bell (Microsoft社)。この年から展示が開設され、初回は12件の展示があった。ISCと改名するのは2001年。

6月10日に発表された第13回目のTop500リストでは、1位にASCI Red (SNL, Rmax=2.121 TFlops、Pentium IIに差し替えたもの)、2位にASCI Blue Mountain (LANL, Rmax=1.608 TFlops)、8位にASCI Blue Pacific CTR (Rmax=0.547)が入り、4位に東大のSR8000/128 (Rmax=0.873 TFlops)が位置している。Top 10 に入る条件はRmax > 0.5 TFlops、Top 500 に入る条件はRmax > 24.7 GFlopsとのことである。CP-PACSは18番まで落ちた。

2) Supercomputing 99
SC99–International Conference for High Performance Computing, Networking, Storage and Analysis は1999年11月14~19日にオレゴン州Portlandで開催された。12回目である。Portlandは1993年の第6回に続き2回目の開催である。冒頭に書いたように、筆者はバチカンの教皇庁文化評議会総会に出かけたので、残念ながら欠席した。通算3回目の欠席である。記録によると、総参加者5100人、テクニカル登録者2124人、展示は149件、論文投稿223件、採択65件とのことである。電総研、融合研、筑波大、東工大、お茶大、東大、地球シミュレータ、新情報、九州大学、ベストシステムズからの参加者が合同レポート(電総研研究速報、TR-2000-2 「SC99報告」)を書いているが、現在はインターネット上から消えている。RWCP 10年史には、RWCPがSC99において並列分散コンピューティング技術によるシームレスコンピューティングシステムの研究展示を行ったことが報告されている。

招待講演は、Andrew A. Chien (UCSD)、Dona Crawford (SNL)、Mark Ellisman (UCSD)、Chris Johnson (Univ. of Utah)であった。State-of-the-Field talksの講演者は、Vinton G. Cerf (MCI WorldCom)、Greg Papadopoulos (Sun Microsystems)、Daniel A. Reed (NCAR)、Salvatore J. Stolfo (Columbia University)であった。

研究展示については、この年から点数制で場所決めをすることになったようである(企業展示は不詳)。未来開拓「計算科学」からは岩崎・牧野プロジェクトと吉村プロジェクトが共同で出展した。

3) Gordon Bell賞

1999gbkawai-small
Gordon Bell賞を受賞したGrape-5画像提供:理化学研究所計算科学研究機構 牧野淳一郎様

例年通り、SC99で発表された。

a) Performanceカテゴリ
1位:A.A. Mirin他(LLNL, U. Minnesota, IBM) “1.18 TFlop/s on short run on 5832 CPU’s on ASCI Blue Pacific, 1.04 TFlop/s sustained on one-hour run, 600 GFlop/s on one-week run on 3840 CPU’s”

b) Price Performanceカテゴリ
1位:A. Kawai他(東大) “144 Glops / $ 1 M on custom-built GRAPE-5 32-processor system”

c) Specialカテゴリ
共同1位:W. K. Anderson他(NASA Langley, ANL, LLNL) “156 GFlop/s on 2048 nodes of ASCI Red, using one CPU per node for computation”
共同1位:H. M. Tufo他(U. Chicago, ANL) “319 GFlop/s on 2048 nodes of ASCI Red, using two CPU’s per node for computation”

4) Sidney Ferbach賞
この年のSidney Fernbach賞は、Michael L. Norman(NCSA, U. Illinois UC)に、 “For his leading edge research in applying parallel computing to challenge grand problems in astrophysics and cosmology.”に対して贈られた。

5) Top500
SC99に合わせて発表されたTop500リストでは、ASCI Red、ASCI Blue Pacific(めでたく)、ASCI Blue Mountainが上位3位を占め、東大のSR8000は5位に落ちた。京都大学のVPP800は15位、TCATのSR8000は16位など。

6) HPCN Europe
High Performance Computing and Networking Europe 1999は、第7回目を4月12~14日にAmsterdamのRAI Conference Centerで開催された。基調講演はRalf Gruber (EPFL, Switzerland)、Carl Kesselman (Caltech, USA)およびPieter Adriaans (Syllogic BV, the Netherlands)であった。

7) 第2回Petaflops会議
DARPA, NASA, NSF, DOE, NSA, NIH等の支援のもと、1999年2月15~19日、Santa BarbaraのDoubletree Hotelを会場に、PETAFLOPS II (2nd Conference on Enabling Technologies for Peta(fl)ops Computing)が開かれた。組織委員長はPaul Messina (Caltech)、プログラム委員長はThomas Sterling (Caltech/JPL)であった。1994年の前回と異なり公開の会議ということだったので、筆者も日本学術振興会未来開拓「計算科学」研究推進委員会からの調査ということで参加した。参加者は100人ほど。筆者の報告も参照のこと。数週間かかっていたシミュレーションが数時間でできるようになると、シミュレーションを設計作業のサイクルに組み込むことが可能になることの重要性が強調された。これは“Human-in-the-Loop”と名付けられた。

応用分野の研究者より、アーキテクチャ屋が元気だったのが印象的であった。アーキテクチャとしては3つの選択肢が提示された。

a) COTS (Commodity off the Shelf)路線
IBMのTilak Agerwalaは、POWER路線の延長でPetaflopsができると述べた。POWER4は180nm、1 GHzで4 GFlopsだから、2008年には2 GHz (8 GFlops)、ノード当たり128 CPUとすると、512ノードで半Petaflopsになる。電力は3~4 MWであろう。メモリレイテンシはサイクル当たり10倍悪くなり、バンド幅も5~10倍悪くなる。プロセッサもメモリも階層構造を持ち、データの局所性が問題となる。
b) PIM (Processor-in-Memory)路線
これに対しNotre DameのPeter Koggeは、Processor in Memoryが解決策だと述べた。演算速度は急速に増大するがメモリレイテンシやバンド幅が大問題になる。そこで、logicとmemoryをチップ内に同居させることが考えられる。PIMにすればレイテンシは10倍、バンド幅は100倍改善される。「メモリが足りなくなったらどうするのだ」「プロセッサを遊ばせればよい」などのやりとりもあった。
c) HTMT (Hybrid Technology Multi-Threaded)路線
Thomas Stirlingは、超伝導、PIM、光接続、ホログラム記憶など異種の技術を組み合わせてPetaflopsを実現しようという構想を示した。演算はヘリウム温度の演算器で、250 nmで200 GHzが実現でき、30cm角の立方体でPetaflopsが実現できる。液体窒素温度にはSRAM PIMを置き、室温部にはDRAM PIMをつなぐとか。外部記憶はホログラム記憶装置。これをHTMTと名付けた。どう見ても工学的に実現可能とは思えない荒唐無稽の提案であったが、参加者の間では「夢がある」と絶大な人気であった。Stirlingの話術によるところも大きいかも知れない。当時「PetaflopsといえばHTMT」と誤解していた人もいたようである。

その後の歴史を考えると、最初にLINPACKで1 PFLopsを実現したのはRoadrunner (LANL, 2008)であるが、Cell processorはまあ一種のPIMといえないこともない。その後はJaguar (ORNL, 2008)はOpteronのクラスタであるから、COTS路線と言ってよい。つまり、HTMTだけが実現しなかったことになる。当たり前であるが。

未来開拓のパンフレットを持っていったらあっという間にはけた。また、「地球シミュレータ」についての質問をいろいろ受けた。海外の関心も高かったようである。

最終日をサボってSan Diegoに飛び、Sun MicrosystemsのE10000の工場を訪問した。

8) ICCP5
ICCP5 (The 5th International Conference on Computational Physics)は、1999年10月11~13日に金沢の石川県地場産業振興センターで開催された。筆者の短い報告もある。出席者は約300名であった。樋渡保秋(金沢大学理学部)と筆者が共同組織委員長を務めた。この国際会議のシリーズは、Drexel UniversityのDa Hsuan Feng(馮達旋)教授の主導のもと、アジアを中心に開かれており、筆者も1993年のICCP2(北京)には出席した。筆者はその後出席していなかったが、樋渡教授が積極的に日本に誘致した。これを受けて、1997年末から組織委員会を設置して準備を進めた。組織委員会は会議の前日まで計13回開催した。最終の14回目は終了後の2000年3月11日、六本木「花ごよみ」において、反省会を兼ねて開催した。アメリカ物理学会とヨーロッパ物理学会が共同して開催しているCCP (Conference on Computational Physics)とどう合流するかが議論された。

なお、石川県、金沢市、文部省、日本万博協会、井上財団の助成を受けた他、多くの企業から寄付をいただいた。

会議録はProgress of Theoretical Physics (Kyoto)から出ている。

9) SUPerG
StarFireのユーザ会とも言うべきSUPerG (Sun Users Performance Group Customer Event)が10月17~20日にオーストラリアのSydneyのANA Hotelで開催され参加した。筆者にとってオーストラリアは初めてであった。全世界から300人ほどのE10000 (Starfire)のユーザが集まり、E10000に関する技術が論じられた。HPCよりビジネス利用の方が主流であった。最後のセッションではE10000の開発責任者であるShahin Khanは、Ultra SPARC III (600 MHz)を72台搭載したサーバを開発中と述べた。

10) Cornell Theory Center (CTC)
NSFのPACIプロジェクトに採択されなかったCTCは8月、500 MHzのIntel Pentium III Xeon 4個から構成されるDellのPowerEdge serversを64台接続したクラスタを設置した。OSはWindows NTであった。Cornell関係者によると、これにより金のかからないスーパーコンピューティングのための使いやすい環境を提供し、大きなプロジェクトも容易に管理できるようになる、とのことであった。

11) SETI@home

インターネットに接続されたPCの遊休時間を使うvolunteer computingのソフトの代表格であるSETI@homeはUC BerkeleyのSpace Science Laboratoryから1999年5月17日に公開された。SETI (Search for Extra-Terrestrial Intelligence)は地球外知的生命体からの信号を検出するための観測データの分析であり、SETI@homeはそれを有志のPCの遊休時間を使って実行するものである。

Volunteer computingは、1996年に始まったMersenne素数の探索が最初と言われ、その後いくつかの研究プロジェクトが始まったが、SETI@homeはメディアの関心を引き一番有名な例となった。Volunteer gridとかcommunity computingとも呼ばれる。これがあまりに有名になったので、”Grid”と言えば”Volunteer grid”だという誤解も生じた。

12) CSCS外部評価
どちらかというと個人的なことになるが、スイスのCSCS (Centro Svizzero di Calcolo Scientifico, Swiss Centre for Scientific Computing, 現在はSwiss National Supercomputing Centre)は外部評価を行うことになり、筆者も外部委員を依頼された。電総研のS氏の紹介だったと思う。CSCSは1991年創立のスイス全国共同利用のコンピュータセンタであり、ETH Zürich の一組織である。所在地はイタリア語圏Lugano地方のMannoであったが、その後2012年にLuganoのダウンタウンのCornaredo地域に移転した。

委員長はETH Zürich理事会副理事長のDr. Stephan Bieri、外部評価委員は、スイス国内からBern大学のProf. Th. Stocker、ヨーロッパからドイツBaden-Württemberg州の科学文化大臣のDr. W. PetersとOslo大学のProf. Knut Faegriとイタリア数理解析研究所のDr. Mario Arioli、アメリカからSDSC所長のProf. Sid Karinと元Cray ResearchのDr. Irene Qualters、それに筆者であった。委員会はマッジョーレ湖畔AsconaのCastello del Soleという瀟洒なリゾートホテルで5月30日から6月4日まで開催された。Zürichで前後に各1泊した。ZürichとAsconaの間は1時間に1本の割合で特急が走っていた。筆者やSidは夫人同伴であった。夜な夜な豪華な夕食や高級なワインが出された。でも食後夜10時に再集合なんていうこともあり欧米人のタフさに驚いた。スイスはユーロを導入していないのに、あらゆる領収書にスイスフラン表記と並んでユーロ表記が並んでいたのでビックリした。

会議では、CSCSからのプレゼンとともに、ユーザ8人のヒアリング、ベンダ(NEC, IBM, HP and SUN)からのプレゼンもあった。一日はCSCSを訪問した。このときはNEC SX-4(12プロセッサ、8 GB)とHP Exemplar(4 GB)が稼動していた。分かったことは、CSCSの発足に際してシステムを購入する予算は連邦政府が出したが、運用の費用はETHが用意せよという方針で、ユーザからの利用料金でまかなうことになった。ところが利用料金について、全国共同利用にもかかわらず、連邦立のETHと他の県立大学(cantonal universities)とのあいだに差別があり、県立大学の研究者から大きな不満が出ていた。Geneve大学にいたRoberto Car教授(Car-Parrinello法で有名)が1999年にPrinceton大学に移ったのはそのためとも言われる。評価委員会は連邦予算による継続的な支援が不可欠であると答申し、4月末までに新しいコンセプトに基づいた利用料金体系を策定するよう求めた。筆者は反対したが、多くの委員からはもうベクトルの時代ではないので、SX-4の次はスカラ高並列コンピュータを入れるべきとの意見も出た。あと議論になったのは、CSCSの研究機能である。CSCSは「サービスセンタから研究センタへ」というスローガンを掲げていたが、現実には人材不足で、人材育成とともに現実的な事業計画が必要であることを強調した。CSCSのセンタ長が当時空席で、その決定も大問題であった。

8月にはイギリスで最終答申策定の会議が開かれたが、筆者は出席しなかった。

13) iHPC外部諮問パネル
シンガポール政府が1998年4月iHPC (Institute for HPC)を設立したことは既に述べた。1999年6月に所長のDr. Lam Khim Yongから外部諮問パネルのメンバとなることを要請された。会合は1年に1回程度ということであった。メンバは、Dr. David Kahaner (ATIP), David Roger Lones Owen (Swansea University, UK), Alfred Brenner (Inst Defense Analysis, USA), Richard S. Hirsh (NSF), Jean L. Lambla (Thomson)と筆者であった。

9月14~16日に第1回が開かれた。当時は、シンガポールにおける唯一のHPC資源提供機関であり、大学、研究所、軍などの研究がここに集まっていた。運営方針から、研究テーマまで広く議論を行った。メンバの一人が、「外部評価をやって、“予算を増額せよ”という答申が出なかったら、委員の選択を誤ったのだ。」と言ったので、大笑いした。ここでも、毎晩色々なホテルで豪華な夕食会が催された。

標準化

1) HPF
HUG ’99 (The 3rd Annual HPF User Group Meeting)が1999年8月1~2日にCaliforniaのRedondo Beachで開催された。プログラム委員長はPiyush Mehrotra (ICASE, Hampton)、プログラム委員には妹尾義樹(日本電気)の名前も見える。

2) InfiniBand
サーバにおけるバスアーキテクチャとしてInfiniBandの規格が制定された。System I/Oアーキテクチャとしては、Intel社を中心としたNGIO (Next Generation I/O)と、Compaq社、HP社、IBM社のFIO (Future I/O) とが提案されており、主導権争いを行っていたが、1999年春、最終的には両陣営が歩み寄り、SIO (System I/O)として統合された。1999年10月にInfiniBandと名付けられた。現在、HPCではクラスタの相互接続ネットワークとして使われることが多い。

3) Grid Forum

Grid Computingへの関心は次第に高まっていたが、前年1998年のSC98におけるBoF (Birds of a Feather)セッションにおいて、グリッド開発者のフォーラムを作ることが提案された。この議論に基づき、Ian Foster (ANL)とWilliam Johnston (LBNL)は1999年6月にNASA Ames Research CenterにおいてGrid Forumを開催した。主としてアメリカから100名ほどが集まり、Charlie Catlett (ANL)を座長に指名した。1999年10月には第2回のGrid Forumを開催した。ヨーロッパでも同様なグループ (eGrid)が1998年に発足し、アジア太平洋地域でもApGrid Partnershipが始まった。これらの各地の組織は2001年3月にAmsterdamで集まり、GGF (Global Grid Forum)が始まった。

世界の企業の動きは次回。IBM社はRS/6000 SP POWER3を発表する。

(タイトル画像: GRAPE-5 画像提供:理化学研究所計算科学研究機構 牧野淳一郎様)

left-arrow 50history-bottom right-arrow