世界のスーパーコンピュータとそれを動かす人々


9月 11, 2023

新HPCの歩み(第154回)-1998年(c)-

小柳 義夫 (高度情報科学技術研究機構)

日本ではSX-5やSR8000が発表される。MPI-2の規格が公表される。HPF User Group MeetingがPortoで開催され、日本のHPF合同検討会からはHPF/JAの仕様案を発表した。Unixを標準化するProject Montereyも始まる。

日本の企業の動き

1) 日本電気(SX-4、SX-5、「地球シミュレータ」など)
1995年に出荷を始めたSX-4は順調に販売を進め、1998年2月末現在、受注が111台(総CPU数は873)、出荷が106台とのことである。

1999年2月、HNSX社はSX-4/32のNAS Parallel Benchmark Ver.1の結果を一般に公開した。この結果は、1997年10月に提出され、SC97では発表しているが、NASからの発表は遅れていた。以下にClass Bの結果示す。上段はSX-4での実行経過秒数。C90 ratioは、1プロセッサのC90の性能を1とした時の性能である。(HPCwire 1998/2/13)

CPU

1

2

4

8

16

32

EP
C90 ratio

86.48
1.69

43.25
3.38

21.63
6.77

11.05
13.24

5.50
26.57

2.78
52.66

MG
C90 ratio

19.27
1.75

9.67
3.49

4.87
6.94

2.48
13.62

1.30
25.98

0.78
43.31

CG
C90 ratio

87.19
1.41

43.95<
2.80

22.3
5.50

11.63
10.57

6.20
19.80

4.119

FT
C90 ratio

53.90
2.05

26.97
4.10

13.49
8.20

6.81
16.24

3.43
32.24

1.85
59.78

IS
C90 ratio

6.77
1.91

3.50
3.69

1.87
6.88

1.13
11.34

0.89
14.42


 

CPU

1

2

4

8

16

17

26

32

LU

C90 ratio

291.06
1.54

148.29
3.03

77.24
5.82

43.08
10.43

27.15
16.56

25.29
17.77


20.90
21.50

SP
C90 ratio

317.68
2.17

160.19
4.30

81.72
8.44

43.67
15.79

24.39
28.27

23.32
29.57

17.41
39.61


BT
C90 ratio

433.28
2.36

216.91
4.72

110.10
9.30

56.92
17.99

28.64
35.73

26.58
38.47

17.98
56.92

16.41
62.36

 
   

 

日本電気は1998年6月4日、ベクトル並列スーパーコンピュータSX-5発表した(HPCwire 1998/6/5)(写真はWikipediaから)。0.25μプロセスで4 nsのクロックサイクルを実現し、CPU当たり16本の乗加算パイプで8 GFlops、ノード当たり最大16 CPUで共有メモリ最大128 GB、最大32ノードまで接続可能で最大ピーク速度4 TFlopsであった。SX-4と比較して、ノード当たりのCPU数は32から減っている。OpenMPをサポートする。マルチノードの場合は日本電気独自のIXS接続(ノード間を8 GB/sで接続)のSX-5/Mと、HIPPI接続(100 MB/s)のSX-5/Hとがある。バンド幅は相当違う。下の表ではRmaxが同じになっているが、IXSとHIPPIとでLinpack性能に違いはないのだろうか。

1999年初頭に、4 CPUの小規模マシンが、分子科学研究所(岡崎)に初出荷される(HPCwire 1999/1/29)。主要なSX-5の設置先と初出のTop500での順位を示す。Beは1999年6月に発表されたエントリモデルで、パイプラインの本数を半分8本(4 GFlops/CPU)にしたもの。SX-5Sは、1999年に発表されるサーバタイプ。

設置機関

機種

Rmax

Rpeak

初出と順位

CNRS/IDRIS(フランス)

SX-5/38M3

280.0

304.0

2000/6 48位

Bureau of Meteorology / CSIRO HPCCC(オーストラリア)

SX-5/32M2

243.0

256.0

2000/11 77位tie

Meteorological Service of Canada (MSC)(カナダ)

SX-5/32M2

243.0

256.0

2000/6 57位tie

金属材料技術研究所

SX-5/32H2

243.0

256.0

2000/6 57位tie

韓国気象庁

SX-5/24M2

181.0

192.0

2000/6 99位tie

Atmospheric Environment Service (カナダ)

SX-5/16A

123.0

128.0

1999/11 71位tie

地球環境フロンティア研究センター(海洋科学技術センター)

SX-5/16A

123.0

128.0

1999/11 71位tie

CNRS/IDRIS(フランス)

SX-5/16A

123.0

128.0

1999/11 71位tie

韓国気象庁

SX-5/16A

123.0

128.0

1999/11 71位tie

東京工業大学学術国際センター

SX-5/16A

123.0

128.0

2000/6 98位tie

日本電気府中工場

SX-5/16A

123.0

128.0

1999/11 71位tie

ONERA国立航空宇宙研究所(フランス)

SX-5/16A

123.0

128.0

1999/11 71位tie

東北大学流体科学研究所

SX-5/16A

123.0

128.0

2000/6 98位tie

German Aerospace Laboratory (DLR)

SX-5/16Be

60.7

64.0

2000/11 442位

National Aerospace Laboratory (NLR)(オランダ)

SX-5/8B

59.6

64.0

1999/11 170位tie

Swiss Scientific Computing Center (CSCS)

SX-5/8A

59.6

446tie

2000/6 236位tie

Veritas DGC(アメリカ)

SX-5/8B

59.6

64.0

2000/11 446位tie

VW (Volkswagen AG)(ドイツ)

SX-5S/16H4

56.0

64.0

2000/6 265位tie

 

フランス、ドイツ、オランダの航空宇宙研究所はこぞってSX-5を導入し、エアバス社の航空機開発に協力した。競争相手はボーイング社のCrayであった。なお、ONERAには提携しているBull社がSX-5を設置した

日本電気は、1998年1月21日、ピーク32 GFlops以上、主記憶4 TB以上の「地球シミュレータ」の開発に着手したと発表した。このとき日本電気は「地球シミュレータ」用超高速計算機ウルトラコンピュータを開発するという言い方で記者発表している。しかし「ウルトラコンピュータ」という名前はあまりに一般的で、しかもNew York大学の昔のプロジェクト名と同じなので結局使われなかった。

同じ1月、日本電気はACOS OSを次世代のIntelチップ(500+ MHzのMerced)で稼働させる計画であり、サーバ用に独自のプロセッサを開発することを断念したと報道された。(HPCwire 1998/1/16) 9月には、日本電気はHewlett-Packard社と共同してIA-64のためのHP-UXを開発するとの発表があった。

1998年4月、パラレルACOSシリーズの新製品としてCMOS型演算プロセッサNOAH-4を採用し、最大32個搭載したPX7800SVとPX7600SVの2機種が発売された。

1998年8月、ワークステーションExpress5800/56WaとExpress5800/56Waを発表した。いずれもWindows NTをOSとして搭載している。前者は、Pentium II Xeonプロセッサを最大2個まで搭載可能。後者は、4個まで搭載可能である。

3月25日には、UnixをOSに採用したサーバのTX7シリーズ2機種を発表した。V2250 モデルはPA-RISCのPA-8200(249 MHz)を最大16個搭載、K380モデルはPA-8200(240 MHz)を最大6個搭載可能である。12月24日には、PA-8500(440 MHz)を最大32個搭載できるV2500を発表した。2001年以降はItaniumを搭載する。

 
   

2) 日立(SR8000)
日立は、SR2201に続いて、SR8000を1998年5月に発表し、12月に出荷した(写真はKEKのページから)。多次元クロスバネットワークなどSR2201の技術を引くものもあるが、いくつかの点で異なっていた。

(a) CPUのアーキテクチャがPA-RISCベースから64 bit PowerPCベースに変わった。サイクル当たり5命令発行のスーパースカラ、out-of-order実行。
(b) サイクル当たり浮動小数4演算発行
(c) Slide-Windowed Floating-Point RegisterによるPseudo Vector Processingはサポートするが、浮動小数レジスタは論理的には128個、物理的には160個。Pre-loadによりキャッシュをbypassしてレジスタに読み込む。
(d) データキャッシュ128 KBで、4-way set associative、pre-fetch可能
(e) ノードは、(ユーザから見て)8個のCPUから構成され、メモリを共有し、高速な同期機構を持つ。これを協調型マイクロプロセッサ機構COMPAS (CO-operative Micro-Processors in single Address Space)と呼ぶ。

日立はこれらの機能をもつCPUを独自に製造した。詳細はHOT CHIPS 11 (1999)で発表した。

1998年12月、SR8000 (128ノード)を東京大学大型計算機センターに設置した。1999年10月4日に金田康正は2,061億桁の円周率計算世界記録を樹立。2002年12月6日1兆2411億7730万桁に自己更新。

SR8000の設置状況を、2000年11月のTop500から示す。性能の単位はGFlops。ノード当たりのピーク性能は、SR8000が8 GFlops、SR8000 E1が9.6 GFlops、SR8000 F1が12 GFlopsである。

設置機関

機種

Rmax

Rpeak

順位

設置年

Leibniz Rechenzentrum(ドイツ)

SR8000-F1/112

1035

1344

7

2000

高エネルギー加速器研究機構(KEK)

SR8000-F1/100

917

1200

9

2000

東京大学大型計算機センター

SR8000/128

873

1024

13

1999

気象庁(日本)

SR8000-E1/80

691.3

768

18

2000

東京大学物性研究所

SR8000-F1/60

577

720

24

2000

産業技術総合研究所(TACC/AIST)

SR8000/64

449

512

37

1999

気象研究所(日本)

SR8000/36

255

288

73

1999

北海道大学大型計算機センター

SR8000/32

229

256

86tie

2000

統計数理研究所

SR8000/20

144

160

125

1999

Stuttgart大学(ドイツ)

SR8000/16

115

128

185

2000

 

3) 富士通(SPARC64-GP、SPARC64 III)
これらに続き、富士通も新しいベクトルコンピュータVPPxxxを発表するとの予想記事が日経コンピュータ1998年7月17日号に出たが、実際には1999年4月に発表される。  富士通は、8th International Parallel Computing Workshop (PCW’98)を1998年9月7日~8日にシンガポール国立大学(NUS)で開催した。棚橋隆彦(慶応)と菅原秀明(遺伝研)が招待講演を行った。11月25日には川崎工場で「第9回研究交流会(Parallel Computing Workshop, PCW’98 Japan)を開催した。

富士通はSPARC V9に準拠したプロセッサSPARC64-GPを開発し、1998年11月に、UnixサーバFUJITSU GP7000Fファミリーを、富士通とPFUから共同発表した。2000年名古屋大学大型計算機センターに導入される。

1998年、富士通とHAL Computer Systems社は、SPARC64 IIIをシングルチップで開発した。テクノロジは240nm、クロックは250 MHz~330 MHzである。

メインフレームでは、1998年1月、Fujitsu GS8000シリーズを発砲した。富士通のメインフレームでは、初めてCMOSを採用した。テクノロジは250nmである。

4) 日本IBM
4月2日~3日に、IBM大阪ソリューションセミナーとかいうイベントがあり、筆者は「HPCの現状と今後」という講演を行った。

5) 日本シリコングラフィックス社(社長交代)
1998年10月、日本シリコングラフィックス社の新社長に和泉法夫が就任した。和泉社長は、1970年上智大学理工学部機械工学科を卒業後、文学部社会学科に学士入学したという異色の経歴を持つ。1972年日本IBM社に入社して流通業界を担当した後、1985年日本タンデム・コンピューターズに転職、専務として活躍後、1997年、タンデム社のCompaq社との合併に伴い日本コンパック副社長を務めていた。

標準化

1) C++
C ++言語の最初の標準は1998年9月1日にISO/IEC 14882:1998として承認された。C++委員会は1997年11月に承認していた。通称C++98。

 
   

2) MPI-2
MPI-2の規格書が、The International Journal of High Performance Computing Applications (Sage Science Press)のVol. 12, No. 1/2 (1998)として出版された。この雑誌はJack DongarraがEditor-in-Chiefで、筆者もEditorial Boardの末席を汚していた(現在はEmeritus Editor)。MPI-1の規格書も同じ雑誌から出版されている。当時の書名は、International Journal of Supercomputer Applications (MIT Press)であった。Annex Bとして、MPI-1 C++ Language Bindingという文書が付属している。総計300ページ。

1999年11月にはWilliam Groppらによる解説書” Using MPI-2: Advanced Features of the Message-Passing Interface”が発行された(写真)。

3) HPF合同検討会
1997年に日本で発足したJAHPF(HPF合同検討会)は、第13回HPF合同検討会を1998年1月14日に、第14回を4月8日に、第15回を7月8日に、第16回を10月6日に開催した。

JAHPFは、1998年5月21日に、High Performance Fortran言語仕様書Version 2.0(1997年1月31日)の日本語訳を公開した。

4) HPF
前年HPF 2.0が公表されたが、HUG’98: The 2nd Annual HPF User Group meetingが、1998年6月25日~26日にポルトガルのPortoで開催された。VECPAR’98のサテライトとして組織された。プログラムは以下の通り。講演の題目が当時の問題意識を示している。日本からは、坂上仁志(姫路工業大学)、妹尾義樹(日本電気)、岡部寿男(京都大学)が参加し、招待講演を行った。

Thursday 25 June 1998

8.30 – 9.20: Welcome and keynote address

Welcome address

Barbara Chapman (VCPC, Austria)

HPF: Achievements, Problems and Prospects

Ken Kennedy (Rice U.)

9.20 – 10.35: Session 1: Porting Experiences

HPF for Regular, Block-structured, and Irregular Grid-based Applications

Eric de Sturler and Damian Loher (SCSC, ETH Zurich)

Design Studies of Wind Turbine Rotor Blades Using Full 3D Navier-Stokes Modelling and Parallel Computers

Jorgen Moth (The Danish Computing Centre for Research and Education)

Porting a 2D Acoustic Wave Modeling Application to HPF: Issues and Problems

Julien Zory (Ecole des Mines de Paris, France)

10.35 – 11.05: BREAK

11.05 – 12.45: Session 2: Integrating HPF with other models

OpenMP and HPF: Integrating Two Paradigms

Barbara Chapman (VCPC, Austria), Piyush Mehrotra (ICASE, USA)

Using KeLP-HPF for Dynamic Block-Structured Applications

John Merlin (VCPC, U. Vienna), Scott Baden (U. California at San Diego)

HPF Libraries and Services for Numerical Simulations in Computational Science

K.A. Hawick and P.D. Coddington (U. Adelaide)

CMSSL Libraries for HPF

Lennart Johnsson (U. Houston)

12.45 – 14.00: LUNCH

14.00 – 15.40: Session 3: The PHAROS project

Overview of the PHAROS project

Karl Solchenbach (Pallas GmbH, Germany)

SEMC3D code port to HPF

Henri Luzet (Semcap SA, France)

Porting to HPF: Experiences with DBETSY3D within PHAROS

Thomas Brandes (GMD, Germany), Kadri Krause (Debis Systemhaus, Germany)

Aerolog code port to HPF

Christian Borel (MATRA BAe Dynamics, France)

15.40 – 17.00: COFFEE BREAK and POSTER SESSION

17.00 – 18.00:  Panel discussion

Conference dinner at Circulo Universitario da Universidade do Porto

Friday 26 June

8.30 –  9.10: Invited presentation

HPF/JA: HPF Extensions for Real-World Parallel Applications

Yoshiki Seo (NEC Corp), Hidetoshi Iwashita (Fujitsu Ltd.), Hiroshi Ohta (Hitachi Ltd.), Hitoshi Sakagami (Himeji Inst. Tech.), Shun Takahashi (Hitachi Ltd.)

9.10 – 10.25: Session 4: HPF extensions and optimisations

Contact-Impact Kernels in HPF+

G. Lonsdale, A. Petitet, F. Zimmermann (NEC Europe Ltd), J. Clinckemaillie, S. Meliciani (ESI France)

Propositions for Handling Irregular Problems with HPF-2

Frederic Bregier, Marie Christine Counilh, Jean Roman (U. Bordeaux, France), Thomas Brandes (GMD, Germany)

Advanced Optimization Techniques for HPF

Vikram Adve, Rob Fowler, Guohua Jin, Ken Kennedy, John Mellor-Crummey (Rice U.)

10.25 – 10.55: BREAK

10.55 – 13.00: Session 5: Porting experiences & methodology

A Comparison of PETSc Library and HPF Implementations for a Structured-grid PDE Computation

M. Ehtesham Hayder (Rice U.), David E. Keyes (Old Dominion U. and ICASE), Piyush Mehrotra (ICASE)

Performance of Explicit Ocean Models on Shared and Distributed Memory Computers Using HPF

Steve Piacsek (Stennis Space Center, USA.), Michael Young (Naval Research Lab, Washington, D.C), Douglas Miles (PGI Inc)

  A Methodology for Converting Applications to HPF

Will Denissen, Vincent Korstanje, Peter Maarleveld (TPD-TNO, Delft),       Henk J. Sips (Delft U. of Technology)

The Real Benefits and Costs to Industry of the Ownership of HPF Codes

Tim Cooper (PAC, UK), Mike Delves (N.A. Software, UK)

HPF and OpenMP

Arild Dyrseth and Tor Sorevik (Parallab, U. Bergen)

13.00 – 14.15: LUNCH

14.15 – 15.45: Session 6: HPF Compilers and Tools

On the Development of HPF Tools as Part of the Aurora Project

T. Fahringer, P. Brezany, B. DiMartino, M. Pantano, A. Pozgaj, K. Sowa, B. Wender (U. Vienna)

Vendor presentations

 

The PGHPF HPF Compiler: Status and Future Directions

Douglas Miles, Vincent Schuster, Mark Young (PGI Inc)

DEEP: A Development Environment for HPF Programs

David J. McNamara, Brian Q. Brode, James J. Bonang, Chris R. Warber (Pacific-Sierra Research Corp)

Also NAS, Pallas, and others to be announced.

 

15.45 – 16.15: BREAK

16.15 – 18.00: Final discussion and close of meeting

 

Charles Koelbel(Rice U.)の会議まとめの一部を紹介する(hpff mailing list 1998/7/9)。

The very short summary is that, contrary to popular belief, HPF is not a dead language.  Comparisons to other systems (notably MPI) showed performance differences ranging from tens of percent in HPF’s favor to larger factors (up to 10 in some worst-case examples) against HPF; a factor of 2 (against HPF) was probably close to the median difference.

 

「多くの人々が考えているように、HPFは死んだ言語ではない」と言うこと自体、危機なのではないか。HPFで書いたプログラムは、MPIと比較して数十%の性能を示すものから、10倍遅いものもある。メディアン(中央値)としては2倍遅いというとことである。現在、様々な改良がなされており、プログラミング・コストという観点ではHPFに有利になりつつある。残念ながらHPCのコミュニティーに十分受け入れられているとは言えないが、この困難を改善するために、コンパイラの改良とともに、ツールやライブラリなどについていくつかの提案がなされた。

一番進んでいるPGI (Portland Group Inc.)は、彼らのコンパイラpghpfが多くのプラットフォームに対応していることを発表した。それによると、C-DAC PARAM, Cray-T3D, Intel-iPSC860, Intel-Paragon, Meiko-CS2, nCUBE-3, PVM, SGI-POWER Challenge, Transtech-Paramidなどで動いているそうである。

ウィーン大学を中心として、HPF 1.0を拡張するHPF+プロジェクトが進められていたが、1998年4月30日に終了した。

5) OpenMP
OpenMP for Fortranは1997年に公表されたが、C/C++のためのOpenMPは1998年10月に公表された。SC98では、KAI (Kuck & Associates Inc.)とともに、Compaq社、Hewlett-Packard社、IBM社、Intel社、Silicon Graphics社、Sun Microsystems社などは一斉にCやC++のためのAPI (Application Programming Interfaces)を発表した。

6) Gigabit Ethernet
Fast Ethernetの10倍の1 Gbpsの通信速度を実現するGigabit Ethernetは光ファイバーの規格(IEEE 802.3z)が1998年に、UTP (Unshielded twisted pair)の規格(IEEE 802.3ab)が1999年に制定された。SC2000では、SCinetがいち早く10 Gbps ethernetのデモを行っている。

 
   

7) Project Monterey
企業連合による標準化されたUnix OSの開発プロジェクトである。広範な32-bitおよび64-bitのプラットフォームの上で稼働させることを意図していた。このプロジェクトは1998年10月に発表され、IBM社、SCO社(Santa Cruz Operation)、Sequent社、Intel社が初期メンバであった。ロゴはWikipediaから。IBM社はPOWERおよびPowerPCのためのAixの情報を提供し、SCO社はIA-32用のUnixの情報を提供し、Sequent社はDYNIX/ptxにおけるマルチプロセッシングの情報を提供し、Intel社は当時未公開のIA-64の情報を提供し、あわせてISVがIA-64向けにソフトを移植するための資金提供をした。(HCwire 1998/10/30) Compaq社、Samsung社、Computer Associates社などは後に加わった。主要な目標はIA-64上のビジネスレベルの高信頼Unix OSを開発することであった。敵はWindows NTである。当時はUnixがサーバ市場を主導するとみられていた。しかし、他の同種のUnix標準化の試みと同様にこのプロジェクトもうまくいかなかった。

1999年にIBM社はSequent社を買収しccNUMA技術を直接手に入れる。また、SCO社は2001年にUnixビジネスをCaldera Systems社に売却する。2001年5月、本プロジェクトはIA-64用のAIX-5Lのβ版が完成したと発表したが、Itaniumそのものの発売が2年も遅れたため何の市場性もなかった。IBM社は2001年、Project Montereyは死んだと発表する。実は、Intel社、IBM社、Caldera Systems社などは、LinuxをIA-64に移植するというProject Trillianを並行して進めており、これは2000年2月に動くソフトが開発されている。2000年末に、IBMはLinuxをサポートすることを発表する。2003年3月7日にSCO社(正確にいうと、SCOから名前ごと会社を買ったCaldera Systems社が改称した会社)はIBM社を訴え、IBM社がSCOのコードを勝手に使ってLinuxを開発したと主張する。2006年11月30日、裁判所はこの訴えの大半を却下した。(日本語Wikipedia、『Project Monterey』『SCO』参照)

8) Linux
Linux OSは1991年に開発が開始されたが、その後次第に成長してきた。1997年ごろには商用目的への応用が注目され、ハイエンドシステムに必要な機能が付け加えられていった(Wikipedia 「Linux」)。1998年7月、Santa Clara Convention Centerにおいて、Silicon Valley Linux Users GroupおよびTaos Mountainの主催により、Linux pep rallyともいうべきパネル討論会が開催され、パネリストたちは、Linuxは現在のところMercedのサポートや重要なアプリケーションのサポートが欠けているが、二三年の内に解決されるだろうと述べた。(HPCwire 1998/7/24)

9) XML
1998年2月10日、W3CはXML (Extensible Markup Language、「拡張可能なマーク付け言語」) 1.0の規格を勧告した。SGMLからの意向を目的として、1996年ごろ開発された。

10) IPv6
1998年12月、RFC 2460 Internet Protocol, Version 6 (IPv6) Specificationとして主な仕様が確定した。翌1999年7月からIANAによりIPv6アドレスの割り振りが開始される。

次回はアメリカ政府の動き、日米スーパーコンピュータ摩擦、各地の政府関係の動き、世界の学界の動きなど。アメリカはクリントン大統領が先頭に立ってHPCの国家プロジェクトを推進する。米国連邦国際通商裁判所は、日本の二社がダンピングによってアメリカの産業に害を与えているというITCの判定を差し戻したが、ITCは日本のスーパーコンピュータ販売はアメリカの製造会社に損害をもたらすと再び判定する。

 

left-arrow   new50history-bottom   right-arrow