新HPCの歩み(第121回)-1994年(c)-
日本電気は初めてのCMOSを用いたベクトルコンピュータSX-4を発表する。クロックは遅くなったが最大512 CPUまで構成できる。日本IBM社の「パラレル研究分科会」ではSP1利用のワークショップを3月から7月まで行い、ユーザのプログラムをSP1に移植した。PGIはいち早くHPFコンパイラを出したが、HPFの将来は混沌として来た。 |
日本の企業の動き
1) 日立(HITACHI SR2001)
6月23日、日立製作所はスカラ並列スーパーコンピュータHITACHI SR2001を発表し受注を開始した。CPUとしてHewlett-Packard社のPA-RISCアーキテクチャのCPU (HARP-1)を自主開発し、3次元クロスバネットワークで結合した。8~128のCPUが搭載可能である。最大23 GFlops。SR2201/CP-PACSへの一里塚と思われる。日立は9月、新日本製鉄と契約を結び、同社が国内輸入総代理店となっているアメリカのParasoft社のParallelwareをSR2001と組み合わせて販売すると発表した。1991年のところに書いたように、Parasoft社は、1988年からExpressというマシン独立のメッセージ・パシング・インタフェースを販売している。
4月14日の日刊工業によれば、日立は、筑波大学と共同開発しているCP-PACSの技術を商品化し、最大300 GFlopsの超並列機を開発すると発表した。後のSR2201である。疑似ベクトルと呼んでいたので、海外には新しいベクトル計算機を開発する、と受け取られたようである。HPCwireの6月23日号は、「日立は1996年度に、1 TFlopsの超並列スーパーコンピュータを発売する」と報じている。実際にはピークで最大600 GFlopsであった。
4月28日、日立とIBMは大規模システムに関する技術協力関係の締結を発表し、CMOSベースのメインフレームとPOWER/PowerPCアーキテクチャに基づくRISC並列システムについて協力することとなった。とくにSP1については現存の日立の販売チャンネルをつかって販売すると発表された。IBM社はS/390のCMOSプロセッサを日立に提供したが、当初のCMOSは性能が低かったため、日立(とAmdahl社)はbipolarによる高速なIBM互換メインフレームを開発し成功した。その後、CMOSの性能がbipolarの性能を超えたため、日立は2000年に北米のメインフレーム市場から撤退する。
2) 日本電気(SX-4)
11月、日本電気はベクトル並列スーパーコンピュータSX-4シリーズを発表した。これは日本電気で初めてのCMOSを用いたベクトルコンピュータであり、クロックは8 nsとSX-3に比べて遅くなったが、シングルノード(共有メモリ)で32 CPUまで、マルチノードでは16ノード、512 CPU (ピーク1TFlops)まで構成できる。最大構成は東北大学およびカナダのAtmospheric Environment Serviceの128 CPU (ピーク256 GFlops)だと思う。このマシンは国内のみならずヨーロッパにかなり売れたようである。1998年11月のTop500から主要なSX-4の設置先を示す。
設置機関 |
CPU数 |
Rmax (GFlops) |
順位 |
設置年 |
東北大学 |
128 |
244 |
18位tie |
1997 |
大気環境省(カナダ) |
128 |
244 |
18位tie |
1998 |
大阪大学 |
64 |
122 |
42位tie |
1997 |
核融合研究所 |
64 |
122 |
42位tie |
1997 |
日本電気府中工場 |
32 |
61.7 |
75位tie |
1995 |
Stuttgart大学(ドイツ) |
32 |
61.7 |
75位tie |
1996 |
気象庁(オーストラリア) |
32 |
61.7 |
75位tie |
1997 |
国立環境研 |
32 |
61.7 |
75位tie |
1997 |
航空宇宙技術研究所 |
25 |
48.3 |
114位 |
1997 |
![]() |
|
NEC SX-4 出典:一般社団法人 情報処理学会 Web サイト「コンピュータ博物館」 |
これ以下では、20 CPUのマシンが、海洋研究機構、無機材研、豊田中央研究所に、16 CPUのマシンがデンマーク気象研究所、オランダ宇宙研究所、スイス科学計算センター、国立循環器病研究センターに、12 CPUのマシンが英国とフランスに入っている。またTop500の圏外であるが、日本電気は1998年9月21日に、シンガポールにあるアメリカの石油探査会社Veritas DGC Asia Pacific社にSX-4/8A(Rpeak=16 GFlops)を納入したと発表する。写真は情報処理学会コンピュータ博物館から。
メインフレームでは大型機ACOS PX7800を12月に発売した。CMOSのプロセッサをメモリ共有で16台まで搭載できる。
3) 富士通(PCW’94)
富士通はPCW’94 (Third Parallel Computing Workshop)を11月2日に川崎市中原の富士通研究所で開催し、AP1000の成果を中心に40編の論文が発表された。招待講演は村岡洋一(早稲田大)とL. Clarke (Edinburgh)であった。村岡は、RWCやJumpを含むいくつかの並列処理研究プロジェクトと、日本全国にまたがるATMネットワークについて話した。Clarkeは、EPCC (Edinburgh Parallel Computing Centre)の活動について語った。HPFに関するチュートリアルもあった。会議録から論文のタイトルを示す。
Towards Portable and Efficient Parallel Functional Language |
Gaetan Hains (Fujitsu Labs) |
Implementation of a Dataflow-Based Functional Language on AP1000 |
Shigeru Kusakabe et al. (Kyushu U) |
VPP Fortran and Parallel Programming |
Hidetoshi Iwashita et al. (Fujitsu Labs) |
Implementation and Evaluation of an HPF Compiler for the AP1000 |
Junichi Hagiwara et al. (Fujitsu Labs) |
AP1000+: Architectural Support for Parallelizing Compilers and Parallel Programs |
Kenichi Hayashi et al. (Fujitsu Labs) |
Architecture of Highly Parallel Computer AP1000+ |
Osamu Shiraki et al. (Fujitsu Labs) |
TINPAR: A Parallelizing Compiler for Message-passing Multiprocessors |
Ikuo Miyoshi et al. (Kyoto U) |
Pre-fetching tree-structured data in distributed memory |
Lex Weaver and Chris Johnson (ANU) |
The Parallel Utilities Library |
Lyndon J. Clarke et al. (EPCC) |
An Efficient Implementation of the Message Passing Interface (MPI) on the Fujitsu AP1000 |
David Sitsky et al. (ANU) |
A High-Speed Network Interface for the AP1000 |
Paul Mackerras (ANU) |
Accelerated Volume Rendering on the AP1000 |
Michael Kirk, Paul Mackerras ANU) |
Parallelization of FEM with multi-level substructure method |
Hideo Fukumori et al. (Waseda U) |
Neural Network-Based Direct FEM on a Massively Parallel Computer AP1000 (Part 2) |
Osamu AOKI and Genki YAGAWA U Tokyo) |
PADRE – A Parallel Document Retrieval Engine |
David Hawking (ANU) |
An Evaluation of a Partitioning and Mapping Method for Parallel Queuing Network Simulation |
Mineo Takai (Waseda U) |
Parallel back propagation training algorithm for MIMD computer with 2D-torus network |
Shin-ichiro Mori et al. (Kyoto U, U Trondheim) |
AP1000 and QCD-TARO Project |
M. Fujisaki et al (Fujitsu, ETH, U Heidelberg, Fukui U, Hiroshima U, Yamagata U) |
Monte Carlo Simulation of Radiation shielding by Parallelized MCNP4 |
Makoto TAKANO et al. (JAERI) |
Transient Excitons – An attempt at a Quantum Simulation of Population Dynamics |
Tadashi Takemori and Yoshikazu Motomura (U Tsukuba) |
Visualization of Nucleation Process in the Martensitic Transformation |
Koji Tonokawa et al. (U Tsukuba) |
Probabilistic Fracture Mechanics Analysis including coalescence effects of multiple crack |
Kiyoshi Sugioka et al. (U Tokyo) |
Knit Design Processing Based on Geometric Transformations and Genetic Algorithms |
Masashi Yamada et al. (Nagoya Inst. Tech.) |
Improvement of Communication Performance by Reduction of Traffic Conflict in a Parallel Computer |
Hiroyuki Kanazawa et al. (Fujitsu) |
TSP solver on AP1000 |
Mitsuo Ishii et al. (Fujitsu Labs) |
Parallel Pattern Matching in Sound Source Separation System on AP1000 |
Kazuhiro Nakadai et al. (U Tokyo) |
Global Climate Modelling on the AP1000 |
Gavin Michael (ANU) |
Atmospheric Modelling on the AP1000 |
J.W. Larson and J.A. Taylor (ANU) |
Study of Self Adaptive Behavior in Quasi-Ecosystem |
T. Takashina and S. Watanabe (U Electro-Communicationa) |
Performance Prediction of Neocognitron for image understanding on a massive parallel computer system |
Hideki Takahashi et al. (Tokyo U of Agriculture and Technology) |
A One-Sided Jacobi Algorithm for the Symmetric Engenvalue Problem |
B. B. Zhou, R. P. Brent (ANU) |
Prototyping Parallel LAPACK using Block-Cyclic Distributed BLAS |
Peter Strazdins (ANU) |
当時の川崎の富士通並列処理研究センターには64ノード、256ノード、512ノードの3台のAP1000が設置され、幕張にも64ノードのマシンがあった。登録されたユーザは海外137名を含め231グループ861人とのことである。
4) 富士通(M-1900)
メインフレームでは、1994年5月、これまでのM-1800モデルグループに続いて、M-1900、M-1700、M-1500の各モデルグループ(「新M-1000シリーズ」と通称)を発表した。M-1900はbipolar技術を用い、CPU数は最大8、主記憶は最大2048MBである。
5) ソニー・コンピュータエンタテインメント社(PlayStation)
HPCとは余り関係ないが、12月3日、家庭用ゲーム機PlayStation(初代)を発売した。チップはMIPS R3000A(33.8688 MHz)。開発の主導者は久夛良木健であった。ちなみに、PlayStation 2 (2000年)のCPUであるEmotion EngineもMIPSアーキテクチャ(ベクトル演算ユニットを搭載)である。PlayStation 3 (2006年)はIBM PowerPCベースのCell Processor、PlayStation 4 (2013年)のCPUはAMD Jaguar8コア、PlayStation 5(2020年)のCPUはAMD 8コア Zen 2である。後で述べるようにCell ProcessorはHPCに参入する。
6) キヤノン
キヤノンは1994年2月23日、Intel社に対抗して、PowerPCを搭載しWindows NTをOSとするデスクトップおよびサーバ機を開発すると発表した。同社は、NeXT Computer社の技術スタッフを引き継ぎ、1993年に設立された米国子会社FirePower Systems社(カリフォルニア州Menlo Park)を通してPowerPCを使った高性能ワークステーションを開発しているが、テネシー州にプラントを建設しPowerPCを用いたパソコンを製造する予定である。1996年7月31日、米国Motorola社はFirePower Systems社を買収すると発表した。キヤノンはPowerPC事業から撤退した。
7) 日本IBM社(「パラレル研究分科会」)
日本IBM社のHPCユーザーズ・フォーラムの「パラレル研究分科会」は第2回の定例会を箱崎で2月24日に開催した。SP1利用のワークショップは3月から7月まで行われた。参加者は、自社開発のソフトウェアをSP1上に移植した。二三日の作業で数倍以上の速度向上を実現したチームもあったが、逐次計算と結果が合わずデバッグに苦労したチームもあった。第3回定例会はHPFをテーマに3月30日に大和の東京基礎研究所で開催した。基礎研究所から開発中のHPFのデモもあった。
5月13日には箱崎で拡大定例会を開き、IBMのV. NaikがSP2およびNASベンチマークについて発表し、ワークショップの5チームからはSP1の利用報告がなされた。6月23日には東京理科大学(神楽坂)で定例会を開催し、日本Marc社の構造解析、ESIアジアの衝突解析、河村氏(理科大)の流体解析の並列化の報告がなされた。ワークショップでは、並列向きのアプリは一段落し、アルゴリズムの工夫が必要なアプリが課題となってきた。
前述のように、9月27日にIBMの箱崎AVホールでオープンなIBM HPC Forumが開催した。
標準化
1) MPI
分散メモリ上の並列処理の通信記述規格MPI (Message Passing Interface)は1991年から議論が始まった。MPIの規格の予備的原案は、1992年11月のMinneapolisのSC92で開かれたMPI Working Groupにおいて公表されたが、より公的なプロセスによって制定することになった。その後、6週間毎に会議を行い、1993年11月のPortlandのSC93でMPI1が公表された。パブリック・コメントを求め、これに基づいて修正したMPI-1.0は1994年6月に公表され、正式規格となった。Fortran版とC版の両方がある。この段階ではメッセージ・パシングの主要な機能について合意を得るため、いくつかの問題の議論は延期された。それでもコミュニケータやデータ型やトポロジなどの新しい概念を導入した。
2) HPF
SC94の直前、11月10日、HPF1.1が公表された。SC94のなかでは11月15日(火)の夕刻6時にHPF Forumが開かれた。この晩は企業各社のパーティが開催されていたので、出席者は多くなかった。主要な講演は以下の通り。
a) Ken Kennedy
状況報告を行った。現在、APR、DEC、Intel、KAI (Kuck and Associates)、Meiko、PGIがHPF製品を出荷。開発中なのは、ACE、Convex、Cray Computer、富士通、日立、IBM、Lahey、MasPar、NAG、 NASoftware、日本電気、nCUBE、Pacific-Sierra、TMCなど。その他、ACSET、Cray Research、HP、Sun、SGIなどが興味を示している。
うまくいかない可能性として、よいコンパイラはできるかも知れないが、複雑で遅くなる。機能を追加する必要があるが、欲張るとよくない。
b) Robert S. Schreiber, “HPF2: Scope of Activities”
そもそもHPF2なんてものを作るかどうか決まっていないが、いろんな提案がある。
c) Ian Foster, “Computational Control/Task parallelism”
タスク並列も書けるようにという提案。
d) Paul Havlak (Maryland), “HPF2 motivating applications”
18件のアプリをHPFで書いて分析した話。
1995年1月30日~31日に次のHPFFミーティングが開かれることが発表された。いよいよ状況は混沌としてきた感じであった。
この時点で有力なHPFコンパイラ・ベンダとしてはPGI (Portland Group Inc.)とAPR (Applied Parallel Research)が挙げられる。PGIは11月にHPFコンパイラpghpfを発売し、翌1995年6月にはORNLの計算科学センターにサイトライセンスを販売した。日本ではソフテック社が代理店となった。Pacific-Sierra Research Corporationはよく分からない会社(軍事会社?)であるが、Computer Products Group (Santa Monica)ではVASTという一連のソフトを売っていた。1993年頃にはVAST-90というFortran 77とFortran 90との相互変換ソフトを売っていたが、1994年ごろにはVAST-HPFやVAST/77toHPFというソフトを販売していた。
前にも述べたが、ドイツGMD (German National Center for Mathematics and Computer Science)のThomas BrandesとFalk Zimmermannは、HPFコンパイラであるADAPTOR (Automatic Data Parallelism Translator)を開発し無償で配布している。いつ頃から始めたかは分からないが、1994年にスイス南部のMonte Veritàで開かれた会議”Programming Environments for Massively Parallel Distributed System”において”Adaptor – A Transformation Tool for HPF Programs”という発表を行っている。前後関係は不明だが、前述のようにSup’Eur 94においてParallel Toolsの賞を受賞している。その後も開発を続け、1998年12月にはVer. 6.1 を公開している。2000年頃、GMDがFraunhofer Gesellschaft(フラウンホーファー協会)に統合されてからはそこのSCAIで公開されているようである。
3) W3C
WWWの創始者Timothy “Tim” John Berners-Leeは、1994年10月、CERNを離れてMITに着任した直後、W3C (World Wide Web Consortium)を設立し、WWWの仕様や指針、標準技術を策定・開発することを目標とした。HTML、XML、MathML、DOM等の規格を勧告する。HTMLは、従来IETFでRFCとして標準化されていたが、HTML 3.2以降はW3Cへと引き継がれた。
4) OSFとUIの合併
Unixの標準化について対立していたOSFとUIは、共通の敵であるMicrosoft社への対抗のため1994年3月合併した。名称としてはOSFが存続した。OSFは新たなExecutive Sponsorsとして富士通、AT&T社、GIS社(旧NCR)、Novell社、サンソフト社の4社が、Associate Sponsorsとして日本電気、ソニーなど6社が加盟した。またUnixの標準化組織COSE(1993年発足)の業務をPST (Pre-Structured Technology)としてOSFが担当することになった。これにより、Unixの業界統一が完了した。
OSFは日本事務所内に、日本独自の標準化活動を行うため、COSE日本SIGを母体として7月新組織を設立した。
しかし、敵はMicrosoft社だけではなかった。Linus Benedict Torvaldsは、1991年から後のLinuxの開発を始めており、GNU GPLライセンスによるUnixが稼働しつつあった。1994年にはRed Hat Linux 1.0 が公開された。1997年頃からはLinuxの商用目的への応用が注目されるようになる。
5) UTG
日本電気、富士通、米国Unisysなど国内外のハード・ソフト会社9社は、1994年2月23日に、Unixの所有権を持つアメリカのNovell社に対し、製品要求仕様を提示する非営利団体UTG (UnixWare Technology Group)を設立すると発表した。技術、マーケティング両面でのNovell社のUnix事業を支援し、要求を反映させることを目的としている。解散したUIに代わる組織であり、Novell社への圧力団体の役割も果たす。5月には14社の参加により正式に発足。
6) X Window
1993年に設立されたX Windows, Inc.は1994年5月16日にX11R6を公開した。
7) プロセッサ・アーキテクチャ
Sun Microsystems社は、同社が開発したRISCアーキテクチャSPARCを、1991年、IEEEの標準として申請していたが、1994年、「32ビットマイクロプロセッサアーキテクチャの標準IEEE Standard 1754-1994」がSPARC V8をベースに制定された(Wikipedia, “SPARC”)。これによりライセンス料が不要になり、組み込み用のプロセッサとして幅広く利用されることを期待している。
8) Fibre Channel
1994年、Fibre Channelの規格がANSIによって承認された。Fibre Channelは高速なネットワークであり、HIPPIを簡素化するために1988年ごろから検討されていた。
9) Beowulf cluster
この年、Thomas SterlingとDonald BeckerらはBeowulf clusterの概念を提唱した。汎用品のハード、汎用品のネットワーク、オープンなOSやミドルウェアによって構成されたWS/PCクラスタのことである。Beowulfとはイギリス文学最古の伝承の一つで、英雄Beowulfの冒険を語る叙事詩のことである。スーパーコンピュータという怪物を退治する英雄だからであろうか。
この頃から、世界中でWS/PCクラスタの重要性が認識されるようになり、計算科学諸分野の実用的な計算に有用であるという発表が相次いている。
翌年のICPP 95 (International Conference on Parallel Processing, Urbana-Champaign, USA, August 14-18, 1995)において、Donald J. Becker、Thomas Sterling等は、”BEOWULF: A parallel workstation for scientific computation” という発表を行っている。
性能評価
1) HINT Benchmark
10月、John Gustafson (Ames Laboratory, Iowa State University)らはHINTベンチマークを提案した。Hierarchical INTegrationから来ている。SLALOMと同じ思想で、一定時間にコンピュータが実行できる仕事の量で評価する。システムの全体的なバランスを評価するというふれこみであった。
次回はアメリカ政府の動き、とくに日米貿易摩擦について。またヨーロッパでもアジアでも、HPCの国家的なプロジェクトが始まる。
![]() |
![]() |
![]() |