世界のスーパーコンピュータとそれを動かす人々


10月 2, 2023

新HPCの歩み(第157回)-1998年(f)-

小柳 義夫 (高度情報科学技術研究機構)

第11回にあたる、SC98: High Performance Networking and Computing Conference 国際会議(通称 Supercomputing 98) はOrlandoで開催された。筆者は2年目のプログラム委員を務めた。発表されたTop500では、CP-PACSも14位に下落し、上位10位から日本のコンピュータが姿を消した。

SC98

 
   

1) はじめに
詳しくは筆者の報告および堀敦史(当時RWCP)の報告を参照。また、JIPDECの「ペタフロップスマシン技術に関する調査研究 III」の141ページ以下に、高木浩光による「付属資料1 SC98参加報告」がある。

第11回にあたる、SC98: High Performance Networking and Computing Conference 国際会議(通称 Supercomputing 98) は、10周年目の今年、南国フロリダ州 Orlandoの OCCC (Orange County Convention Center) で11月9日から13日まで開催された(educational program は7日から、チュートリアルは8日から)。ちなみに第1回SC88もOrlandoであった。組織委員長はCherri Pancake 教授(Oregon State Univ.)である。筆者は今回家内を同伴した。OCCCは巨大な展示場で、建物の脇を家内のレンタカーの距離計を見ながら走ったら、半マイル(800メートル)もあった。公開された参加者リスト(technical registration)では、参加は3123人、日本からは192人のようである。

100 kmほど真東に行けば、Kennedy Space Centerがある。ちょうど7日(土曜日)には、向井さんやグレンなどの乗ったスペースシャトルが降りてきたところであった。これまでは感謝祭の直前の週であったが、COMDEXと重なるので、1つ前の週にしたのか?

2) SCinet
初めてSCinetが設置されたのは1991年にAlbuquerque, NMで開催されたSC91からで、SC91の会場では、10 MbpsのLANと、245 Mbpsの対外接続を確保した。SC98では、LANとして1 Gbps ethernetを設置した。

3) プログラム委員会
筆者は昨年(1997)に続いてプログラム委員をつとめた。約40人中、所属がアメリカ合衆国でない委員は、ヨーロッパから2 人(Ulrich Lang, Stuttgart and Mateo Valero, Barcelona)、南米から1人( Alvaro Coutinho, Rio)、アジアから2人(Sangsan Lee, SERIと筆者)であった。昨年は3人だったのでだいぶ国際化した。去年のつながりで、パネルの委員も兼務した。

今年のプログラム委員長は Joanne Martin (IBM、1990年の第3回の組織委員長)であったが、去年の混乱から学んで、最初からextended abstractによって審査した。前年は欠席したが、今年は6月9日~10日に会場に隣接するOmni Rosen Hotel (Orlando)で開かれたプログラム委員会(いくつかの関連委員会も合同開催)に出席した。審議のやり方は年によって異なり、この年は3分野(compilers/ tools/languages, architecture, applications)に分かれ、分野ごとにほぼ独立に採否を決めた。筆者はapplication部門で、座長はHorst Simonであった。ちなみにcompilers/tools/languages分野の共同座長はDaniel Frye (IBM)とMary Zosel (LLNL)、Architecture分野の座長はValerie Taylor (Northwestern University)であった。プログラム委員会の全体会議では、最後に多少のやりとりをして、セッションを組んだ。

プログラム委員会の案内状に、「Disney Worldの訪問は予定されていません」とわざわざ書いてあった。暇な時間が少しあったが、Disneyではなく、近くのSea Worldに一人で出かけた。

プログラム委員会全体会議で、最終日の金曜日のプログラムをどうするか話題になった。展示は木曜日に終わってしまうので、例年金曜の出席者はかなり少ない。Orlandoともなれば、皆、Disneyかどこかへ言ってしまうだろう。誰かが、「いい考えがある。金曜日のプログラムをなくせばよい。」と言い出した。皆に、「そうしたら木曜午後の人数が減るだけだよ。」とからかわれていた。できるだけ興味を引きそうなパネルを3並列に用意したが、はたして何人来るか?

6月9日の晩に関係者全員の懇親会があった。筆者が「実は今日は私の結婚25周年記念日だ」と言ったら、アメリカ人たちがびっくりして、「奥さんに電話したか?」「お土産は買ったか? ホテルの売店にいろいろあるぞ。」などと心配してくれた。日本時間ではとっくに翌日になっていた。Margaret Simons女史 (LANL)が、「私も銀婚記念日には出張中だったわ」とか慰めてくれた。

次の1999年には、三浦謙一(富士通)が日本からのプログラム委員を務めることとなった。

余談であるが、プログラム委員会の帰りに見た機内映画のひとつが、大統領選挙を皮肉った “Wag the Dog”(尾が犬を振る)というコメディ映画 (1997)であった。日本での題名は『ウワサの深層/ワグ・ザ・ドック』であった。「犬が尾を振るのは、尾より犬の方が賢いからである。尾が犬より賢いと、尾が犬を振るようになる。」“Why does a dog wag its tail? Because a dog is smarter than its tail. If the tail were smarter, the tail would wag the dog.”

4) 歴史展示
今年は10周年目の会と言うことで、展示の一角に History of the Conference Exhibit が設けられた。担当は Alfred Brenner 氏(Institute for Defense Analyses、元 FNAL。日本のKEKの初期に1ヶ月ほどKEKに滞在したことがあるのでよく知っている)。10年間のSCのproceedings、Tシャツ、マグカップなどの記念品や、それぞれの時代のスーパーコンピュータの基板などが展示された。日本の3社の資料もかなり展示されていた。考えてみれば、この10年の歩みはあわただしい。1988年という時点では、IBMは汎用機 (VFはあったと思うが)とパソコンの会社であり、Sun だってSS1を出したくらいであろう。SGI だってまだグラフィック・ワークステーションの会社であった。多くのベンチャー会社が出現し消えていった (FPS、ETA、MasPar、TMC、KSR、SSS、CCC、…)。この10年間、潰れもせず、吸収も合併もされずにスーパーコンピュータを作り続けて来ているのは日本の3社だけである。私も、11回のうち9回の会議に出席しているので、大変思い出深かった。

最終日午前後半に、History Panel “The 10 Past and the 10 Future Years of HPC”が行われた。パネリストには錚々たる人物が並んでいた (Steve Wallach, Shahin Kahn、渡辺貞、Larry Smar、Burton Smith、Gary Smabyなど)。

5) 企業展示
本年は、10のハードウェアベンダ (Compaq/Digital、Dell、Fujitsu、HP/Convex、Hitachi、IBM、NEC/HNSX、SGI、Sun Microsystems、Tera) を始めとして、ソフトウェア、大容量記憶装置、ネットワーク、出版、学会など69の企業等が出展した。

IBMはASCI Blue Pacificのボード(PowerPC 604e)やPOWER3のボードやウェファーを展示していた。SPシリーズは1993年の発売以来、5000システム50000ノードを販売したと自慢していた。

SGIもASCI Blue Mountainの構成要素であるOrigin 2000を展示していた。その後継機も出るとか、この時点ではCrayの匂いがだんだん減っていくという雰囲気であった。

日本の会社では、日本電気がSX-5を、富士通はVPP700Eを、日立はSR8000を軸に出展していた。

10日2時から日立のExhibitor’s Forumがあり、SR8000の話だった。6~70人の聴衆が出席していた。前半の藍原によるアーキテクチャ (とくにPVPとネットワーク) の話はほとんど知っていることだったが、後半の Maxim SmithによるOS関連のHW(とくに、ノードに搭載している8基+1基のPowerアーキテクチャCPUの、カーネルとか同期機構とか)の話は大変目新しく、面白かった。同席した日立関係者も余りよく知らないようであった。Smithはこの分野では有名人のようで、日立のブースでもいろんな人が彼を訪ねてくるとのことであった。

6) 研究展示
大学・研究所関係では合計56の展示があった。NASA、ANL、ASCIなどの大研究所は例によって大規模で派手な展示を出していた。おもしろいのは、BNLやFNALなどの高エネルギー物理の研究所が、物理学のための計算機利用だけでなく物理そのものの展示を出していたことである。重イオンコライダなどといっても計算機屋の興味は引かないらしく、私が多少分かったようなことを言ったらいい鴨になってしまった。

BNLは、Columbia大学、理研と共同開発のQCDSPを1箱 (512ノード)を展示していた。これは、本年のGordon Bell 賞を受けた機械である。

ネットワーク時代らしい展示は The International Grid (iGRID) である。これはイリノイ大学シカゴ校とインディアナ大学との共同で、vBNSの高速ネットワークを活用して、世界中の様々な分野の研究者と、広域分散処理、バーチャルリアリティ、大型データベースなどの技術を使って共同研究を行うプロジェクトである。アメリカ国内だけでなく、カナダ、シンガポール、TransPACなどともつながっている。東大の IML (Intelligent Modeling Lab.)の広瀬教授のグループとも実演をすると言っていた。第2回はINET 2000 (Pacifico Yokohama)に合わせて開催され、第3回は2002年Amsterdamで開催された。

筆者は見なかったが、慶応義塾大学SFCの村井純教授は、APANの70 Mbpsの太平洋回線TRANSPACとvBNSを使って、慶応義塾大学SFCの「情報処理系論」の授業を展示会場から行ったとのことである。

日本からは、原子力研究所計算科学技術推進センター、電総研、九州大学、航技研、未来開拓(Parallel and Distributed Computing Environment)、RWCP、RIST、埼玉大学、筑波大学の9件であった。

中でも、RWCP (新情報処理研究組合) は、32台のAlphaクラスタや128台のPCクラスタを持ち込んでの熱演であった。関係者の揃いの黄色の法被 (?) も人目を引いた。どこかの安売りカメラ屋の店頭のようでもあった。

九州大学は、PPRAMについて展示した。応用の一つとして、長嶋雲兵らの分子軌道計算エンジンの模型も出展した。

航技研はもう何度目かであるが、今年は原研と1区画をシェアしていた。航技研は、NWT、NS-II、WANSなどを展示。原研は、計算科学技術推進センター活動全般の紹介と、流体/構造連成計算など。

RIST (高度情報科学技術研究機構) は、地球フロンティア計画および地球シミュレータ計画について、およびJAHPFの活動について紹介した。

埼玉大学も常連であるが、VRMLなどを用いた可視化による教育をテーマにしていた。

未来開拓のグループは早稲田の笠原さんなどを中心に、parallel and distributed compiler などの研究を紹介していた。

 
   

筑波大学 (CP-PACS) は今まで展示を出してこなかった。今年はTsukuba HPC Allianceと称して電総研と続きの場所を取り、両者が共同して展示の他に小さなセミナースペースを作って、関係者やゲストのセミナーを定期的に行っていた。こけら落としは、J. Dongarra 教授のプレゼンであった。筑波大学は、PAXの20年の歴史、CP-PACSのアーキテクチャ、応用、そして未来開拓のプロジェクトなどのパネルを示し、日本の本体とネットワークで繋いで、動作モニターとデモ計算を表示した。ネットワークもほぼ順調であった。電総研はすでに何度も出展しているが、今年は NinfとGlobal Computing Testbed を展示。Tsukuba HPC Alliance は、来訪者に名札を首から掛ける赤色の紐を配ったが結構評判がよかった。だいぶたくさん用意したが、すっかり売り切れてしまった。最近は、組織委員会が企業に紐を用意させている。写真は、SuperComputing’98 Photosから。

今年は、未来開拓関係で2件出展したことになる。

7) 基調講演
Bran Ferren (Walt Disney Imagineering、Walt Disney の子会社) の、”There’s No Bits Like Show Bits” というふざけたタイトルの基調講演があった。もちろん、1946年のミュージカル『アニーよ銃をとれ』の曲“There’s No Business Like Show Business”(ショウほど素敵な商売はない)のもじりである。Entertainment Industry においてHPCCが重要であるというようなことを言いたいのであろう。テクニカルな内容を期待した人にははずれだったが、アメリカ人などには好評であった。

8) Next Generation Internet (NGI)
10日10:30よりNGIのパネルに出席した。アメリカはもともと DARPA、DOE、NSFなど政府機関の主導でインターネットを立ち上げたが、その後民間プロバイダが多数出現すると、大学関係のネットワークは民営化された。しかし、インターネットが研究上の重要な道具となると、より高速で、しかも性能が保証されたネットワークが必要になる。アメリカではこのような方向に向かって、NGI、Internet2、Abilene という3つのプロジェクトが始まっている。

9) PITAC Report (Ken Kennedy)
11日(水曜日)の8:30からの plenary session は Challenge-of-the-Field Talk と銘打って、2つの講演があった。最初は、「情報技術に関する大統領諮問委員会 (PITAC)」の共同委員長である Rice大学の Ken Kennedy(もう一人の委員長は Bill Joy) の “High Performance Computing and Communications and the Presidential Information Technology Advisory Council: an inside perspective of the PITAC Interim Report” という話であった。内容はPITACの中間報告のサマリーで、insideと言ってもとくに新しいことはなかった。要約すれば、これまでの連邦政府の情報技術に対する振興策が近視眼的であり、長期的でリスクを含むような研究を推進してこなかったという批判である。今後、予算を年$2Bに倍増し、NSFを中心に大学の比重を増やせ、という提案を示している。

日本でも今年のはじめから、首相を議長とする科学技術会議に情報科学技術部会が設置され、情報科学技術に関するわが国の今後の施策を議論しているが、なかなかPITACの域にまでは到達しない。PITACとは逆に、大学は企業にすぐ役に立つような研究をせよ、などと言い出しかねない雰囲気である。とくに、部会の議論で具体的なデータに基づく評価というプロセスが踏めないし、専門的な議論をするには分野が広がりすぎている。専門のスタッフもアメリカとは違う。アメリカの底力を痛感した。

10) Top500(世界)
今年も例年通り、SC98の直前11月5日に第12回Top500 が発表された。今回のリストで注目すべきことは、上位10位から日本のコンピュータが姿を消していることである。20位まで見ても、2年前にはトップを占めたCP-PACS(筑波大学) がやっと14位に、カナダの大気環境局のSX-4/128M4 と、東北大学大型計算機センターの SX-4/128H4 が18位タイを占めているだけである。500位までの全リストの中の日本の機械の総数もRmax総和も減っている。

SGI/Crayの健闘が注目される。20位までの21件中なんと14件を占めている。この表では1 TFlopsを超えているのはASCI Redだけであるが、会期中の11月9日には、ORNLとNERSCは実用的な磁気コードで1 TFlopsを超える実効性能を出したと発表した。どこかのT3Eを使用したと思われる。11月10日には、LANLは1.6 TFlopsの実効性能(おそらくLinpack)を実測したと発表した。ASCI Blue Mountainであろう。これについてLIVEwire 1998/11/12に以下の記事があった。

SILICON GRAPHICS, INC.                                                                         11.12.98

                                                                   LIVEwire

===========================================================================

Silicon Graphics at SC ’98: Teraflops Gets Real

 

Nov. 9: Oak Ridge National Laboratory and NERSC announce sustained performance exceeding one teraflop on a real metallic magnetism code.

 

Nov. 10: The Department of Energy and Los Alamos National Laboratory announce real, sustained, world-record-breaking performance of 1.6 teraflops.

 

The age of real teraflops computing has arrived. And with breakthroughs in computation come related advances in visualization and data management – advances that herald a pervasive expansion of the uses of supercomputing.

 

Silicon Graphics is proud to lead supercomputing into the new century.

 

上位20位は以下の通り。性能はGFlops。前回の順位に括弧のついているのは、増強やチューニングで性能が向上したことを示す。T3Eは軽微なノード数増加が目立つ。「アメリカ政府の動き」のASCI Blue Pacificのところで述べたように、この時のTop500の発表当時の順位は、この表の太字下線のようになっていた。

順位

前回

設置場所

機種

コア数

Rmax

Rpeak

4

LANL

ASCI Blue Mountain

6144

690.9

3072.0

5

(4)

英国気象庁

T3E900

876

552.0

788.4

6

IBM(アメリカ)

ASCI Blue-Pacific CTR

3904

547.0

1296.1

7

LLNL

ASCI Blue-Pacific CTR

1952

547.0

892.4

8

Manchester大学CSAR

T3E1200

612

509.0

734.4

 

以下に、現在公表されているTop500リストに基づくTop20を示す。

順位

前回

設置場所

機種

コア数

Rmax

Rpeak

1

1

SNL

ASCI Red – Pentium Pro 200 MHz

9152

1338.0

1830.4

2

(2)

アメリカ政府某機関

T3E1200 – EV56 598 MHz

1084

891.0

1300.8

3

(3)

アメリカ政府某機関

T3E900 – EV5 450 MHz

1324

815.0

1191.6

4

LANL

ASCI Blue Mountain

6144

690.9

3072.0

5

(4)

英国気象庁

T3E900

876

552.0

788.4

6

IBM(アメリカ)

ASCI Blue-Pacific CTR

1952

547.0

1296.1

7

Manchester大学CSAR

T3E1200

612

509.0

734.4

8

LLNL

ASCI Blue-Pacific CTR

1344

468.2

892.4

9

(8tie)

Naval Oceanographic Office

T3E900

700

449.0

630.0

10

(5)

NASA/Goddard Space Flight C.

T3E – EV5 300 MHz

1084

448.6

650.4

11

Cray社

T3E1200

540

447,0

648,0

12

(8tie)

NERSC

T3E900

692

444.0

622.8

13

(11)

ドイツ気象庁

T3E900

4840

01.0

580.8

14

6

筑波大学計算物理学研究センター

CP-PACS/2048

2048

368.2

614.4

15

(7)

Max-Planck-Gesellschaft

T3E – EV5 300 MHz

812

355.0

487.2

16tie

(8tie)

Stuttgart大学(ドイツ)

T3E900

540

341.0

486.0

16tie

Pittsburgh Supercomputing C.

T3E900

540

341.0

486.0

18tie

12tie

Atmospheric Environmental Service(カナダ)

SX-4/128M4

128

244.0

256.0

18tie

12tie

東北大学

SX-4/128H4

128

244.0

256.0

20tie

(16tie)

SGI社(元Cray社)

T3E – EV5 300 MHz

540

234.0

324.0

20tie

(16tie)

FZJ(ドイツ)

T3E – EV5 300 MHz

540

234.0

324.0

 

11) Top500(日本)
日本国内設置のマシンで100位以内は以下の通り。

順位

前回

設置場所

機種

コア数

Rmax

Rpeak

14

6

筑波大学計算物理学研究センター

CP-PACS/2048

2048

368.2

614.4

18tie

12tie

東北大学

SX-4/128H4

128

244.0

256.0

22

14

東京大学

SR2201/1024

1024

232.4

307.2

23

15

航空宇宙研究技術所(日本)

Numerical Wind Tunnel

167

229.0

281.3

42tie

31tie

核融合科学研究所

SX-4/64M2

64

122.0

128.0

42tie

31tie

大阪大学

SX-4/64M2

64

122.0

128.0

48

37

九州大学

VPP700/56

56

110.0

123.2

49

38

高エネルギー物理学研究所

VPP500/80

80

109.0

128.0

52

41

日本原子力研究所

XP/S-MP 125

2502

103.5

125.1

70

(55)

防災科学技術研究所

T3E

172

74.5

103.2

75tie

56tie

国立環境研究所

SX-4/32

32

61.7

64.0

75tie

56tie

日本電気府中工場

SX-4/32

32

61.7

64.0

81tie

62tie

日本原子力研究所

VPP500/42

42

59.6

67.2

81tie

62tie

名古屋大学

VPP500/42

42

59.6

67.2

83tie

日立機械研究所

SR2201/256

256

58.7

76.8

83tie

65tie

RWCP(日本)

SR2201/256

256

58.7

76.8

83tie

65tie

東京大学ヒトゲノムセンター

SR2201/256

256

58.7

76.8

87

(73tie)

北陸先端科学技術大学院大学

T3E – EV5 300 MHz

134

58.2

80.4

93tie

70tie

遺伝研

VPP500/40

40

56.9

64,0

93tie

70tie

東京大学物性研

VPP500/40

40

56.9

64,0

 

会期中11日5:30からTop 500 BoFがあり、状況分析とともに、Linpackで性能を測定することについて賛成反対の議論がなされた。

12) Award Session
12日1:30より Awards Session があり、Best Paper Awards、Student Paper Awards、Fernbach Award、HPC Challenge そして Gordon Bell Prize が発表された。このセッションでは、歴代の組織委員長が壇上に上り、今回の諸委員長が前の席に座って、いかにも儀式という感じである。

(a) HPC Challenge
HPC Challenge Awardは筆者の知る限り、SC97から始まった。イベントとしてのHPC Challengeは1995年のSC95のI-WAYから始まっている。HPC Challenge (SC98 High Performance Computing Challenge)は、7月から募集が始まり、最先端のアプリケーションや超高速ネットワークなどの研究者がその成果をデモするものである。応募者は750~1000語のアブストラクトを提出し、書類審査で6~8のチームが本選に進み、月曜にはGala Openingでのポスター発表を行い、水曜日には審査員の前で20分の発表を行う。昨年とは異なり具体的な問題は与えられず、以下の4つのカテゴリーが設定されており、応募者は1つ以上のカテゴリーを指定する。締め切りは8月17日。(HPCwire 1998/7/17)

先端的アプリケーション

シミュレーションやその他の最先端のアプリケーションで、審査基準は、計算速度、並列度、新規性、ネットワーク資源の活用、全体的な革新性である。

高性能インフラストラクチャ

ネットワークのインフラ、並列実行時システムなどの最先端インフラストラクチャで、現実のアプリによって便利さと革新性を示す。

革新的環境

例として、問題解決環境、可視化システム、データマイニングシステムなど。

SCInet98に埋め込まれたネットワーク応用

このカテゴリーでは、SCInet98のフロアネットワークや資源を、いかに有効に活用するかで審査される。

 

審査員は以下の通り。

Jack Dongarra

University of Tennessee, Knoxville, Oak Ridge National Laboratory

Tom Kitchens

DOE

John Grosh

DoD High Performance Computing Modernization Office

Kay Howell

National Coordination Office for Computing, Information, and Communications

Chuck Koebel

National Science Foundation

Robyn MacFarlane

Eglin Air Force Base

 

Proceedings CDによると、10件が本戦に臨み、デモは2並列で行われた。残念ながら審査結果についてのまとまった資料はないが、Rice大学のCRPC Newsletterによれば、Ian Foster (ANL)、Carl Kesselman (USC)らのチームは、Globusを用いた分散グリッドテストベッド上での革新的な広域アプリケーションにより、HPC ChallengeのBest of Show賞を授与されたとのことである。また、Pittsburghのチームは”Most Insightful Application”賞を受賞した。Pittsburgh Supercomputing Centerに設置されたMRI装置に女性大学院生を入れ、脳のどの部分が活動しているかを、OrlandoのSC会場で、3次元動画でリアルタイムに表示したとのことである。(HPCwire 1998/11/26)

(b) Fernbach賞
計算科学分野に対する顕著な貢献を行った研究者を称えるSidney Fernbach賞は、”For fundamental contributions to the development of software methodologies used to solve numerical partial differential equations, and their application to substantially expand our understanding of shock physics and other fluid dynamics problem”に対し、Phillip Colella(LBNL)に授与された。

(c) Gordon Bell賞
例年とは異なり、今回はtechnical program中にGordon Bell sessionを置き、finalistsがプレゼンを行って審査を受ける、というプロセスはなかったようである。賞金はGordon Bell氏のポケットマネーから毎年$1000が拠出されてきたが、今年から$2500に増額された。

注目のGordon Bell Prize は、2種の賞からなり(年によって違う)、一つは絶対性能の高さを競う賞、もう一つは価格性能比で勝負する賞である。今年の絶対性能の部の大賞は、Balazs Ujfalussy他(ORNL、NERSC、Pittsburgh、H. H. Wills Physics Lab) の “High Performance First Principles Method for non-Equilibrium States in Magnets” であった。アメリカ政府の秘密の場所にあるCray T3E1200 LC1024を用いて、locally self-consistent multiple scattering methodにより、単位セル当たり1024個の鉄原子の集まりを、Curie温度以上でシミュレーションを行い、657 GFlopsを実現した。主要部分は密行列の連立1次方程式で、BLASを用いたとのこと。

絶対性能の部の第2位は、Mark P. Sears等(SNL、UC Berkeley、Intel)で、”Application of a High Performance Parallel Eigensolver to Electronic Structure Calculations”で、ASCI Red を用いて、ScaLAPACKライブラリの固有値問題で605GFlopsを記録した。応用は電子構造。

価格性能の部の大賞は、Don Chen等(MIT、Columbia、FSU、FNAL、OSU)の”QCDSP Machine: Design、Performance and Cost”であった。これは、Norman Christ を中心とするQCD専用機の一つで、TIのDSP(50MF)に2MBのメモリを抱かせたノードから成る。CP-PACSの競争相手である。このマシンは2台に分かれ、Columbia大学の方は、8192ノードで0.4TF、BNLにあるマシン(出資は日本の理研)は12288ノードで0.6TFである。BNLの研究展示には、BNLマシンの1筐体が動態展示されていた。

価格性能の部の2位は、M. S. Warren等(LANL)の、”Avalon: An Alpha/Linux Cluster Achieves 10 GFlops for $150k” である。70プロセッサのAlpha Cluster で、6千万個の粒子の分子動力学をSPaSMコードを用いて実行し、44時間の平均で実効性能10GFlopsに到達したという。

よく見たら、みんなDOE関連の研究である。一昔前には日本のNWTやGRAPEが続々入賞していたことを思うと隔世の感がある。

Peak Performance
First Prize: Balazs Ujfalussy, Xindong Wang, Xiaoguang Zhang, Donald M. C. Nicholson, William A. Shelton and G. Malcolm Stocks, Oak Ridge National Laboratory; Andrew Canning, Lawrence Berkeley National Laboratory; Yang Wang , Pittsburgh Supercomputing Center; Balazs L. Gyorffy, H. H. Wills Physics Laboratory, UK; “First principles calculation, of a unit cell (512 atoms) model of non-collinear magnetic arrangements for metallic magnets using a variation of the locally self-consistent multiple scattering method,” 657 Gflops on a 1,024-PE Cray T3E system (600 Mhz)

Second Prize: Mark P. Sears, Sandia National Laboratories; Ken Stanley, University of California, Berkeley; Greg Henry, Intel; “Electronic structures: a silicon bulk periodic unit cell of 3072 atoms, and an aluminum oxide surface unit cell of 2160 atoms, using a complete dense generalized Hermitian eigenvalue-eigenvector calculation,” 605 Gflops on the ASCI Red machine with 9200 processors (200 Mhz.)

Price/Performance
First Prize: Dong Chen, MIT; Ping Chen, Norman H. Christ, George Fleming, Chulwoo Jung, Adrian Kahler, Stephen Kasow, Yubing Luo, Catalin Malureanu and Cheng Zhong Sui, Columbia University; Robert G. Edwards and Anthony D. Kennedy, Florida State University; Alan Gara, Robert D. Mawhinney, John Parsons, Pavlos Vranas and Yuri Zhestkov, Columbia University; Sten Hansen, Fermi National Accelerator Laboratory; Greg Kilcup, Ohio State University; “3 lattice quantum chromodynamics computations,” 79.7 Gflops/$1M on a custom system with 2,048 PE’s using a Texas Instruments chip (32-bit floating point ops.)

Second Prize: Michael S. Warren, Timothy C. Germann, Peter S. Lomdahl and David M. Beazley, Los Alamos National Laboratory; John K. Salmon, Caltech; “Simulation of a shock wave propagating through a structure of 61 million atoms,” 64.9 Gflops/$1M using a 70 PE system of DEC Alpha’s (533 Mhz.)

 

表彰式のあと、Gordon Bell 本人がSeymour Cray をたたえる講演を行った。大変興味深い講演であった。

(d) その他
この会議のBest paperとして表彰されたのは、”An out-of-core implementation of the COLUMBUS massively-parallel multireference configuration interaction program”, Holger Dachsel et al. (PNNL)であった。Best Systems Awardは、”Automatically Tuned Linear Algebra Software [ATLAS]”, Jack J. Dongarra and R. Clint Whaley (Tennessee U.)に与えられた。詳細は、HPCwire 1998/12/18の記事を参照。

13) BoF
プログラムによると以下のBoF (Birds-of-a-Feather)セッションが開催された。GridのBoFが行われ、そこからGrid Forumが始まったとのことであるが、このプログラムには見当たらない。

テーマ

世話人

Internet Routing Architectures

Sam Halabi

Interoperable Message Passing Interface (IMPI)

Dr. William George

Performance Modeling and Analysis for Supercomputer Architectures

Marti Bancroft

TOP500 Supercomputer Sites

Jack J. Dongarra

The Parallel Tools Consortium (Ptools)

Sally Haerer

OpenMP: the C, C++ Specification

Tim Mattson

Abilene Project Status and Update

Paul Love

Component Architecture for High Performance Computing

Katarzyna Keahey

Single Queue Scheduling on IBM SP

Dave Jackson

 

14) Social Event
恒例の木曜日の晩のイベントは、南西に約8 kmのDisney Worldではなく、北に約5 kmのUniversal Studio Floridaを借り切って行われた。恥ずかしながら筆者は、Universal Studioがテーマパークであることを知らず、「映画の撮影所」かと誤解し、そんな所に行って何が面白いんだろう」などと思っていた。実際に行って不明を恥じた。そもそもUSは、カリフォルニア州の撮影所のアトラクションから発展したそうである。遅く行って、家内と食事をゆっくりしていたら、1-2の館にしか入れなかった。残念。

このほか、いくつかの企業が、お客様を招待するパーティーもあった。火曜日には、SGI、Sun Microsystems、Compaq が近くのホテルで別々に開き、水曜日は、IBMがDisney World よりずっと先、数十kmのPolk Cityにある Fantasy of Flight という航空博物館を借り切って盛大なパーティーを開いていた。これには1000人以上が参加したものと思われる。バスで案内されたが、延々走り続け、いったいどこまで行くのかと思った。

15) Panel “Is architecture research dead?”
プログラム委員会で議論した、最終日金曜日のパネルの一つである。筆者は朝寝坊をして、ゆっくり隣のホテルで家内と朝食などを食べていたので、最後の方しか聞いていない。結局、研究費がどうのという話ばかりで、肝心の中身の話がなく、こんな調子では本当にアーキテクチャの研究は死んでしまうのでは、というのが出席した人の感想であった。

16) Java Grande
別のパネルとして、午前の2セッションを通してHPCとJavaに関するパネルがあった。

“Java Grande I: Rationale, Status and the Forum”と
“Jave Grande II: Issues and Futures”

である。筆者は出なかったが、高木浩光のレポート(p. 145-148)から報告する。

前半のパネルでは、Javaを数値計算に利用する際の問題点として、(1)複素数、(2)クラスをまたがった最適化、(3) Operator overloadingのサポート、(4)精度に関する言語仕様、(5)真の多次元配列などが議論された。また、並列計算での利用の問題点も議論された。

後半のパネルでは、今後の展望について4つの講演があった。その一つでは、global computing, metacomputing, web computingの研究者が集まり、標準化を行うDatorr (Desktop Access TO Remote Resources)という活動が紹介された。

17) 閉会後
SC98は金曜日昼で終わったので、家内の車でDisney Worldに行き、半日だけ楽しんだ。東京ディズニーランドにさえ行ったことがないが、大変面白かった。とくに、アニメ映画の作成現場の見学があり、セル画を手で描いているというので、「コンピュータ・グラフィックスで作らないのか」と聞いたら、「今のところはこれが一番いい。将来はコンピュータを使うかもしれない。」という話だった。

CP-PACS関係者での夕食会が予定されていたので、急いで市内に戻ってきた。集合場所がCrab Houseというのでカニアレルギーの私としてはぎょっとしたが、アメリカ人にもカニを食べられない人がたくさんいるようで、カニ以外にもいろいろおいしいものが用意されていた。

翌朝は濃霧で、家内が借りたレンタカーを返還するのに道がわからず苦労した。

次回は、アメリカはじめ各国の企業の動きと、企業の創立や消滅である。Google社、VMware社、Avaki社、DDN社などがこの年発足した。大事件はDECのCompaqによる吸収である。

 

left-arrow   new50history-bottom   right-arrow