世界のスーパーコンピュータとそれを動かす人々


9月 24, 2024

新HPCの歩み(第203回)-2003年(f)-

小柳 義夫 (高度情報科学技術研究機構)

ヨーロッパではCERNを中心に、実用的なデータグリッドが構築されている。インドではPARAM Padmaを正式に発表した。台湾のNCHCでは初めてクラスタでスーパーコンピュータを構築した。NCARの主催するCAS2K3 WorkshopがAnnecyで開かれ、地球シミュレータとPOWERとの比較議論がなされた。

その他の政府の動き

1) CERN Grid
欧州合同原子核研究所CERN (the European Organization for Nuclear Research)は、グリッドの初期から積極的に取り組んできたが、2003年4月、LHC実験に備えて、これまでにないような大量のデータ管理システムを構築するためIBMと協力すると発表した。IBMで研究していたStorage Tankを拡張して、異機種・異OSの下にあるデータを単一のファイル・ネームスペースを使ってアクセスする新しい技術を開発する。CERNはヨーロッパのグリッドの中心的存在になりつつある。(EurekAlert!2003/4/2

2) カナダのリサーチグリッド
カナダのWestGrid (Western Canada Research Grid)プロジェクトのインフラ構築のため、Hewlett Packard, IBM, SGIの3社が選ばれ、合計$44M(たぶん米ドル)の契約が結ばれた。WestGridは、Edmonton とVancouverの2州、8個の機関(University of British Columbia, Simon Fraser University, New Media Innovation Centre, TRIUMF physics laboratory, University of Alberta, University of Calgary, University of Lethbridge and The Banff Centre)を接続し、カナダ中の研究者からアクセス可能にする。これらは、BC (BCNet), Alberta (NeteraNet)および Canada (CA*net)によって接続される。(HPCwire 2003/5/23)

3) C-DAC (インド)
インド電子省のC-DAC (Centre for Development of Advanced Computing)は、自前のスーパーコンピュータの開発を続けて来たが、2003年4月PARAM Padmaを正式に発表した。設置場所はBangaloreの C-DAC Knowledge Parkで、筆者は昨年末のHPC Asia 2002で見学してきた。正式発表が遅れたのは大臣(情報技術大臣Arun Shourie?)の都合とのことである。開発には$10Mの予算と130人の人員と3年の期間を要した。中身はIBMの4-way POWER4 SMPを独自開発のPARAMnetで結んで箱にいれたものである。ピーク性能は1.024 TFlopsで、インドでの初めてのテラフロップス超えのマシンであった。(HPCwire 2003/4/4) Padmaはヒンドゥー語で「蓮」の意。使用目的として、天気予報、バイオインフォマティクス、ロケットの発射と再突入のシミュレーション、ナノテク、流体力学、空気力学、地震波処理、株式市場、データマイニングなどが上げられているが、アメリカなどは軍用の計算(つまり水爆開発など)に用いられないか心配しているようである。(HPCwire 2003/1/10)(HPCwire 2003/4/4)

4) Bhabha Atomic Research Centre(インド)
2003年7月、MumbaiにあるThe Bhabha Atomic Research Centre (BARC)は、クラスタANUPAM-XENON/128を開発したと発表した。これは64台のdual Xeon servers(2.4 GHz、2GBメモリ、40 GB HDD)をノードとして結合したもので、Linpackで202 GFlopsの性能を持つ。相互接続網はScalable Coherent Interface (SCI)で、レイテンシは3.5 μs、バンド幅300 MB/sである。OSはLinuxである。

使用目的が気になるところであるが、材料、エレクトロニクス構造、分子動力学、放射化学、大気化学、非線形有限要素法、計算流体力学の大規模問題を解くとのことである。さらに、結晶構造解析、輻射流体力学、中性子輸送、γ線シミュレーション、電磁プラズマ、第一原理電子構造計算、構造解析、レーザー原子相互作用など。ちょっときな臭いか。

ANUPAMシリーズのクラスタスーパーコンピュータは、Aeronautical Development Agency (ADA) Banglore, Vikarm Sarabhai Space Centre, Thiruvanthapuram, National Centre for Medium Range Weather Forecasting (NCMRWF), New Delhi, Nuclear Power Corporation, Mumbai, IIT Mumbai, IIT Kanpur, UDCT Mumbai and SNDT Mumbaiなどでも使われているとのことである。(HPCwire 2003/7/11)

5) 台湾(NCHC)
台湾の新竹にあるNCHC(國家高速網路與計算中心)では、初めてスーパーコンピュータを製作しFormosa1と命名した。Pentium 4 Xeon 2.8 GHzを300コアGigabit Ethernetで接続したもので、2003年11月のTop500では、Rmax=973.00、Rpeak=1,680.00 (GFlops)で、135位にランクしている。

6) オーストラリア(AC3、気象庁)
オーストラリアでは10月、シドニーのac3 (The Australian Centre for Advanced Computing and Communications)は、155台のdual Xeon machines(Dell製)からなるシステムを設置した。メモリはノード当たり2 GB、相互接続はGigEである。OSはLinuxで、実効性能は1.07 TFlops。これは、Australian Research Councilからの補助金と、5大学の分担金により設置された。(HPCwire 2003/8/8) 2003年11月のTop500では、コア数304、Rmax=1.095 TFlops、Rpeak=1.860 TFlopsで、108位にランクしている。

オーストラリア気象庁(Australian Bureau of Metrology)は近々1.15 TFlopsのマシンを設置する予定。これはSX-6/144M18で、2004年11月のTop500では、コア数144、Rmax=1.130 TFlops、Rpeak=1.152 TFlopsで313位にランクしている。この他、Top500には見当たらないが、メルボルンにあるSwinburnge工科大学は、240個のIntel CPU(XeonかItaniumか不明)からなるテラフロップス級のクラスタを保有している。(HPCwire 2003/10/10)

世界の学界の動き

 
   

1) Mooreの法則
Intel社のGordon Moore名誉会長(74)は、2003年2月10日からサンフランシスコで開催されている第50回記念の「2003 ISSCC (IEEE International Solid-State Circuits Conference)」において基調講演“No Exponential is Forever:But “Forever” can be Delayed!”を行い、いわゆるMooreの法則について「今後10年は生き続ける」として、さらなる技術革新が進むとの考えを明らかにした。Mooreは1968年に共同創業者の一人としてIntel社を設立し、75年から87年までCEOを務めた。彼は1965年、チップ上のトランジスタの集積度が「1年で倍増する」との予測を発表し、1975年には「2年で倍増する」と修正した。現在Mooreの法則と呼ばれている「トランジスタの集積度は18ヶ月で倍増する」という命題は、いわば両者の平均である。Mooreは「自分は決して18カ月と言ったことはない。1年または2年と言っただけだ」と語った。(写真はWikipediaから)

Mooreは「技術はより複雑で費用がかさむようになっているが、解決法は存在する。チップ上にこれ以上はトランジスタを増やせないというような状態になっても、何とかして数十億のトランジスタを埋め込んでいくことになるだろう。それが創造性の限界ということにはならないと思う」と述べた。

現在の問題は、トランジスタパーツが原子サイズの限界に近づきつつあることで、ゲートリーク電流が増えて、結果として半導体チップの消費電力が増えてしまう。Moore氏は、この問題への解決策としては、ゲート絶縁膜に使う高誘電率(High-k)材料の開発が進んでいることに触れた。High-kは比誘電率が高いために、従来のSiO2膜より物理的な膜厚を増やし、リーク電流を抑制できると述べた。High-kでリーク電流は1/100以下になると言う。

またMooreはトランジスタ構造自体も変わる必要があり、Intelが研究しているトライゲート(Tri-Gate)トランジスタや、ダブルゲートトランジスタのような、三次元構造のトランジスタ技術が重要になるであろうと述べた。(HPCwire 2003/2/14)(PC Watch 2003/2/12)(朝日新聞 2003/2/12)

Gordon Moore氏は、2023年3月24日、94歳で亡くなられる。

2) CAS2K3 Workshop(地球シミュレータ vs. POWER)
HPCwire 2003/9/26によると、2003年9月7日~11日に、NCARの主催するCAS2K3 WorkshopがImperial Palace Hotel(Annecy, France)で開催され、世界中から気象学者とHPCの専門家90人が参加した。アメリカからの発表はほとんどIBMのシステムによるものであったが、ヨーロッパからは大規模なNEC SX-6を持つサイトからの発表もあった。NCARのDr. Richard Loft(2001年のGordon Bell賞受賞者)は、気象シミュレーションについて、地球シミュレータとIBM p690 (POWER4)とを比較すると、マシンの価格についても、電気代についても、前者の方が2倍優れていると結論した。これは、NCARの計算はバンド幅制約であり、POWER4のようなチップでは性能が出ないからである。「コモディティチップの方が安い」というのは神話に過ぎない。

これに対し、NERSCのBill Kramerは、「超新星爆発」「加速器科学」「電磁波プラズマ相互作用」「QCD」「宇宙背景放射データ解析」などのアプリではIBMのPOWER3マシンはよい効率を出していると反論した。

記事を書いているChristopher Lazouは、日本電気が、ベクトルとともにItaniumを用いたTX7サーバを販売しており、相手に合わせて最適な組み合わせを提案できるという利点を指摘した。その一例がDKRZ(ドイツ気象計算センター)への導入である。

3) PS2 Cluster
1999年3月3日にソニー・コンピュータエンタテインメント社からPS2 (PlayStation 2)の概要が発表されHPC関係者の話題となったことは前に述べた。プロセッサのEmotion EngineはMIPSアーキテクチャベースの128ビットRISCマクロプロセッサで、東芝とソニーとの共同開発である。ベクトルユニットはVPU0がFMAユニット4台、VPU1がFMAユニット5台装備され、FPUと合わせ単精度ながら6 GFlopsのピーク性能をもつ。これが4万円で売られるので、4000万円で1000台買って6 TFlopsなどという皮算用が脳裏をよぎった。まあメモリは小さい。発売されたのは翌2000年3月4日。

2003年にイリノイ大学のNCSAおよびDepartment of Computer Scienceは、2003年5月30日、70台のPlayStation 2を結合したLinuxクラスタを構築することにNSFの援助により成功したと発表した。Linux Kit for PS2 (2002年2月13日発売)を使用し、主としてPS2の128ビットCPUであるEmotion Engineの持つ2基のベクトル演算ユニットを利用する。メモリバンド幅がネックのようである。またLinux KitをインストールしたPS2を70台(報道によっては65台)をイーサーネットで接続し、クラスタを構成した。

日本でも東工大の青木尊之研究室で20台のPS2 Linux kitでクラスタを構成し、研究をおこなった。SOR Poissonソルバにおいて、inline assemblerで直接VUOを4並列で動作させ、単体で1.5 GFlopsの速度(単精度)を出し、HPCS2002で報告した。ただ、主記憶が32 MBのRDRAMだけで少なく、相互接続ネットワークも遅く、クラスタとして実用的とは言えないという結論であった。

4) Virginia Polytechnic Institute (Big Mac)
アメリカのVirginia Polytechnic Instituteでは、教員、技官、学生が力を合わせて1100台のPowerMac G5をMelanox Infiniband 4xで接続し、Linpackを走らせた。CPUはPowerPC 970、dual core 2 GHzである。愛称はBig Macである。10月初めでは7 TFlops台であったが、その後チューニングに力を入れ、11月初めのLinpack Reportでは10.28 TFlopsに達した。2003年11月のTop500では、Xと命名され、コア数2200、Rmax=10280.00 GFlops、Rpeak=17600.00 GFlopsで、堂々3位にランクしている。費用はわずか$5M(材料費だけであろうが)とのことである。(HPCwire 2003/10/24)

5) Goto BLAS
BLAS (Basic Linear Algebra Subprograms)は、1979年に公開された線形演算の基本操作を実行するライブラリインタフェースであり、LAPACKやScaLAPACKはBLASを使って書かれている。実装にはオープンなもの、特定のCPUに特化したものなどいろいろある。

Texas大学Austin校のRobert A. van de Geijnの客員研究員であったKazushige Gotō (後藤和茂)は、IntelのPentium III、Pentium 4、Alpha Processor、POWER3およびPOWER4のための高性能なBLASの実装を発表し、その性能の高さが評判になった。Pentium 4(2.25 GHz)で3.9 GFlops(87%)、POWERやAlphaでも90%の性能を実現した。TLBミスを最小化したのがミソのようである。最初はDGEMMだけであったが、2003年1月、完全なBLASのセットを公開した。これはGotoBLASと呼ばれた。

2月13日にはItanium 2(900 MHz)上の性能が発表された。サイズは不明である。(NA Digest 2003/2/16)

 

MFlops性能

ピーク比

SGEMM

3564

99.0%

DGEMM

3543

98.4%

CGEMM

3565

99.0%

ZGEMM

3546

98.5%

 

2004年8月、後藤和茂はTACC (Texas Advanced Computing Center)の研究員に採用される。2010年にGoto BLASの開発は終了したが、OpenBLASに引き継がれる。

6) FFTW Ver.3
FFTW (The Fastest Fourier Transform in the West)は、1997年3月24日Matteo FrigoとSteven G. Johnson (MIT)によって公開された。自動チューニングによるライブラリの一つである。そのVer.3が2003年4月に公開された。

7) FT-MPI
Tennessee大学のJack DongarraらはFault Tolerant MPI (FT-MPI)の開発を進めてきた。これはMPI 1.2の独立な実装で、ユーザレベルやシステムレベルでの耐故障性を実現している。2003年11月のSC2003で発表された。(HPCwire 2003/12/5)

8) David Baker(人工タンパク質の設計)
University of Washington School of MedicineのDavid Baker教授らのグループは、2003年、Top7と呼ばれる人工タンパク質をシミュレーションにより設計することに成功した。Daved Bakerは、AIによるタンパク質の構造予測システムAlphaFoldを開発したGoogle DeepMind社のDemis Hassabis CEOおよびJohn M. Jumper上席研究員とともに、2024年ノーベル化学賞を授与される。

9) Kasparov(コンピュータと「引き分け」)
アゼルバイジャン生まれのチェスプレーヤーGarry Kimovich Kasparovは1996年にDeep Blueと対戦し、3勝2敗3引き分けで勝利し、1997年には1勝2敗3引き分けで僅差で逆転された。2003年1月26日から、ニューヨークにおいてDeep Juniorと全6回のマッチを行った。1回目はKasparovの勝ち、2回目は引き分け、と進んだが、結果は1勝1敗4引き分けとなり、総合で引き分けとなった。

その後、11月には、ドイツ製のFritzというソフトウェアと、ニューヨークのX3D Technologies社製のバーチャルリアリティとを組み合わせたシステムと4番勝負で対戦した。1番勝負は、11月11日、3時間20分後、37手目で引き分けとなった。2番勝負はケーブルテレビESPN2で中継された。全体では、1勝1敗2引き分けだった。立体眼鏡をつけての試合はやりにくかったようだ。(HPCwire 2003/11/14) (Wikipedia:Garry Kasparov)

10) Dan ReedがNorth Carolina大学へ
UIUC(University of Illinois at Urbana-Champaign)に20年間勤め、そのうち2000年からの4年間はNCSA(National Center for Supercomputer Application)の所長であったDaniel A. Reedは、Illinois大学の職を辞し、University of North Carolina at Chapel Hillに2004年1月に新設される学際コンピュータ研究所の初代所長に任命されたことを発表した。この研究所は、Duke Universityと共同で運営する。本人によれば、「私が妻のAndreaと最初に出会ったのはNorth Carolinaにいたときだった」そうである。(HPCwire 2003/12/12)(HPCwire 2003/12/19

11) von Neumann生誕100周年
大数学者で大物理学者、かつ大計算科学者のJohannes Ludwig von Neumann (1903年12月28日 – 1957年2月8日)は、今年生誕100周年を迎えた。2月10日にSan Diegoで開かれたSIAM(アメリカ応用数理学会)の計算科学技術研究会では、夜8時から記念の集会を開いた。講演者は、伝記作家William Aspreay、von Neumannの令嬢Marina v.N. Whitman(経済学者)、Peter Lax、Pete Stuwartであった。

出席した中島研吾(当時RIST)の話によると、遅い時間にもかかわらず300人ほどが出席し、10時過ぎまで熱心な議論が続いた。オーガナイザでもあるGene Golubは「SIAM Conference on Computational Science and Engineering」 こそvon Neumannの業績を称えるのに相応しい会議であると述べた。

12) Atanasoff生誕100周年
International Symposium on Modern Computingが、2003年10月30日~11月1日にIowa State UniversityのSchuman Buildingで開催された。このシンポジウムは10月4日がJohn Vincent Atanasoff (1903年10月4日 – 1995年6月15日)の生誕100周年にあたることを記念して開かれたもので、Gordon Bellなどが講演した。AtanasoffはいわゆるABC (Atanasoff-Berry Computer, 1939)の開発者であり、2進法やBool論理によってディジタルで計算するというアイデアやコンデンサによるメモリ(DRAM!)に関してはENIACよりも前である。しかしABCは実用的な計算システムになったわけではない。1967年からの有名なHoneywell対Sperry Randの特許裁判では、彼のマシンが先例として取り上げられ、ENIACを継承するSperry Randによる特許の寡占は認められなかった。10月31日の朝食会ではこの裁判に関するパネルが開かれた。

次回は国際会議である。

left-arrow   new50history-bottom   right-arrow