世界のスーパーコンピュータとそれを動かす人々


提 供

10月 26, 2015

HPCの歩み50年(第60回)-1997年(c)-

小柳 義夫 (高度情報科学技術研究機構)

Fortran 95はマイナーな改定であったが、HPF、MPI、OpenMPなどの標準化が進められた。Co-Array Fortranが始まったのもこのころである。SC97やHPC Asia 97が開かれた。ヨーロッパのHPCNは先が危ぶまれた。

標準化

1) HPF 2.0
HPF Forumは、1997年1月31日にHPF 2.0を公表した。これは、The HPF 2.0 LanguageとHPF 2.0 Approved Extensionsから成る。前者はすべてのHPF実装において1年以内に実現することが期待される仕様で、プロシージャ呼び出しにおけるデータ分散の簡単化や、データ並列におけるREDUCTIONクローズや、新しいルーチンなどを含む。後者は高度な仕様であり、必ずしもすべてのコンパイラが実現することは期待されていない。INDIRECTマッピングやSHADOW領域(日本では袖とかのりしろとか呼ばれる)、動的なデータ分散(REALIGNなど)、ONクローズ、非同期I/Oなどである。

2月24~26日には、第1回のHPF User Group Conferenceが米国Santa Feで開かれた。

2) MPI-2.0
MPI Forumは4月25日にMPI-2.0を承認した。このForumは30以上のベンダやユーザの組織から成る。Ver. 2.0では、並列I/O、動的プロセス、一方的通信、C++とのバインディング、Fortran 90のサポートなどを含む。

3) Fortran 95
Fortran 90のマイナーな改訂版であるFortran 95が国際規格(ISO/IEC 1539-1:1997) として発行された。 HPFに由来するforallや、ユーザ定義のpureとelementalプロシージャが追加された。FORTRAN 77の大失策である、DOループの制御変数にREAL変数やDOUBLE PRECISION変数を許す仕様が削除された。DO X=0.0, 1.0, 0.1と書くと、内部表現によって11回反復になったり10回反復になったりするからである。これも77からの仕様であるが、IFブロックへの外からの飛び込みも禁止された。その他、恐らくFORTRAN 704からあったPAUSE文やFortran 66で導入されたHollerith定数(3HABCのような文字型データ)なども削除。ちなみに、Hollerith定数はパンチカードを使ったTabulating Machineの開発者で、IBMの前身の一つの創立者であるHerman Hollerithを記念して名付けられたものである。

対応する日本工業規格も改正原案作成委員会での作業を 1998年3月に終え, 6月の情報部会での審議も無事終えて,1998年 10月20日に制定された。

4) OpenMP
OpenMPは共有メモリ並列コンピュータを利用するための標準的基盤で、KAIのDavid Kuckのイニシアチブで開発された。The OpenMP Architecture Review Board (ARB)は1997年10月にOpenMP for Fortran 1.0を初めて公表した。SC97(後述)で大々的に発表された。1998年10月にはC/C++用のOpenMPを発表。OpenMP for Fortran 2.0は2000年に発表された。2002年にはC/C++用のVer. 2.0を発表など。

5) Co-Array Fortran
CAF (Co-Array Fotran)は分散メモリ上での並列処理を記述するためのFortranの拡張であるが、これもこの頃はじまった。R. W. Numrich (SGI) はScientific Programming 6, 275-284 (1997)に”F – -: A parallel extension to Cray Fortran”という論文を発表し、FORTRAN 77の最小限の拡張で並列処理を記述することを提唱した。F – -はF-minus-minusと読むそうである。続いてJ. L. Steidelとともに、Fortran 90の拡張として、SIAM News 30, 7, 1-8 (1997)に”F – -: A simple parallel extension to Fortran 90”を発表した。このアイデアはCray T3EのFortran 90コンパイラに実装された。Co-Array Fortranという語を用いたのは1998年頃からのようである。

6) NAS Parallel Benchmark
1997年に発表されたNPB 2.3はMPIで実装された。

Supercomputing 97

第10回目のSupercomputing国際会議は、名称を High Performance Networking and Computing と改め、San Jose Convention Centerで、11月15日から21日まで開かれた。筆者の報告も参照してください。

1) プログラム委員会
SC96のところで述べたように、この回ではプログラム委員を委嘱された。共同委員長はGreg Papadopoulos (Sun Microsystems)とMargaret Simmons (National Coordination Office For CIC)であり、筆者はSimmons女史から委員を頼まれた記憶がある。このときは、分野別の構成にはなっていなかった。USA以外の所属の委員は、筆者のほかヨーロッパから2名、Tony Hey (U of Southanmpton, UK)と Per Stenstrom (Chalmers U of Technology, Sweden)であった。アメリカの組織に所属していない研究者が委員に加わったのは初めてのことであった。Gregの弟のPhilip (ORNL)も委員だった。

この頃の問題点は、SCにおける原著講演が重要視されず、投稿論文の数も質も下がっていたことである。そこで、Simmonsは、投稿しやすくするために「500語のabstractで受け付ける」という画期的な提案をした。筆者は、「それでは公平な審査ができない」と反対した。私の反対は押し切られたが、案の定、論文募集が始まってから方針を変更し、abstractだけでもいいが、可能なら6ページ(図や表は別)のextended abstractも投稿することを強く勧める、という中途半端なガイドラインとなった。

Rather than the 500 word abstract plus URL submission format described in the hardcopy call for participation, we will accept and STRONGLY ENCOURAGE the submission of a 500 word abstract through the web submission form plus a six (6) page (typeset) extended abstract in PostScript. The extended abstract may include additional pages containing references, figures and data. Instructions for submission of the PostScript materials will be available on the submission form. The deadline for extended abstracts is still May 16, 1997.

残念なことは6月初めのプログラム委員会が、筆者が主催者である数値解析シンポジウムと重なってしまい、出られなかったことである。「テレビ会議でも」と言われたが、あずまや高原ではどうしようもなかった。聞くところによると、やはり500語のabstractだけでは内容がよくわからず、extended abstract付の投稿が主として採択されたとのことである。

結局日本からは3件採択された。

  • “Parallel Database Processing on a 100 Node PC Cluster: Cases for Decision Support Query Processing and Data Mining”(T. Tamura et al., 東大の喜連川グループ)
  • “A Scalable Mark-Sweep Garbage Collector on Large-Scale Shared-Memory Machines” (T. Endo et al., 東大の米澤グループ)
  • “Multi-client LAN/WAN Performance Analysis of Ninf: a High-Performance Global Computing System”(A. Takefusa et al., お茶大、東工大、東大)

2) インターネット20周年
昨年はENIAC完成50周年、IEEE Computer Society および ACM の創立50周年ということで、計算機の歴史展示が設けられたが、今年はインターネットの歴史という展示が作られた。20年前、1977年11月22日に、自動車から衛星を通して、大陸間でTCP/IP通信が成功したのだそうである。上に書いたように会議の正式名称にはNetworkingの方が先に出ていることからも分かるように、ネットワークの重要性はますます高まっていた。

3) 企業展示
日米貿易摩擦が激しくなっていたが、日本の3社(日本電気、富士通、日立)は堂々と参加し、スーパーコンピュータを宣伝していた。記憶は確かではないが、ASCI RedがTop500のトップを占めたのに、Intel社は企業展示を出していなかった。さるDOE関係者が筆者の前で、「いったいアメリカ政府はIntel社にいくら払っていると思っているんだ。展示も出さないとは。」と立腹していた。筆者に言われても困るが。

Sun MicrosystemsはEnterprise 10000によりHPCに参入し、Top500のリストにおいて台数ベースで4位に浮上した。前述のように東大の筆者の専攻も買った。これをさらに4台結合してLinpackで100 GFlopsを出したという報告もあった。会期後、佐藤秀夫さんやDangさん(日本サン)などとMenlo ParkとMountain Viewの開発現場を見学したが、数台のE10000と多数のWS、それに大規模なディスクシステムが動いているのは壮観であった。その帰り、Stanford大学近くのWine cellarでフランスワインのテイスティングを楽しんだ。ワイン談義を英語でやるのは大変だった。

4) 研究展示
60件のうち日本からは電総研(EM-XとNinf)、航技研、RWCP、埼玉大の4件だけであった。アメリカ人から「地球シミュレータはどうなったんだ」と聞かれた。こういう所に出ていないと、極秘にやっているように勘ぐられることになる。

5) Seymour Cray賞の創設
1996年10月に亡くなったSeymour Cray の貢献をたたえて新しい賞 “Seymour Cray Award” を設けることは昨年のSC96で発表されていたが、IEEE Computer Societyの会長 Barry W. Johnson (IBM) から公式に発表された。SGI/Crayはこのため、20万ドルを拠金した。この発表を受けて、Irene Qualters (president of Cray Research and senior vice president of SGI) は、Seymour を追悼して、「現在チームワークが重要視されているが、Seymour は個人の力の偉大さを示した。彼は、ユーザの observation を設計に生かすことを重要視した。」と述べた。この賞は、Seymour Cray によって示された創造性を最もよく体現した高性能計算システムに、革新的な貢献をした個人に贈られる。最初の受賞者は翌年発表される予定であったが、実際には1999年。

6) State-of-the-field talks
今年初めての試みとして、水と木の朝一番のセッションをState-of-the-field talksに当て、John L. Hennessy (Stanford)とKen Kennedy (Rice)が講演した。

Hennessyは”Perspectives on the Architecture of Scalable Multiprocessors: Recent Development and Prospects for the Future” と題してアーキテクチャのレビューをしたが、最新の技術状況が分かっていないと、あまり評判がよくなかった。かれは、5~10年以内にベクトルは消滅し、DSM(分散共有メモリ)のクラスタが主流になると予言した。

Kennedyは、”Programming Support Software for High Performance Computers”と題して、並列処理を抽象度の高いレベルで記述して、コンパイラで処理するのが今後の方向であると述べた。データ依存のコンパイルなどという概念も出し、中間言語での最適化の重要性を述べた。

7) Gordon Bell Prize
今年は日本からfinalistsに一つも残らず、ASCI Red関連のオンパレードであった。CP-PACSもがんばったが落選。Performance賞はLANLのグループで、ASCI Red 4096プロセッサによる3億粒子の重力多体系計算、費用性能比では、オーストラリアのグループの28個のDEC Alphaマシンと、LANLのPentium Pro16個のマシン。

8) QCDSP
筆者が座長をしているとき、別の会場でColumbia大学のQCDSPの発表があった。Teraflopsまで到達可能とのこと。現在1024 PUのマシンが稼働しているが、実効性能はまだ。最終的には8096 PUの予定。“ QCDSP: A Teraflop Scale Massively Parallel Supercomputer”(N. Christ et al.)

世界の学界の動き

1) HPC Asia 97
第2回目となるHPC Asia 97が4月28日から5月2日にソウルのHilton Hotelで開催された。韓国の情報通信省が主催と言うことで、かなり力が入っていた。1996年のところで書いたように、筆者はSteering Committee委員を務めた。ProceedingsはIEEE/CSから出版されている。この会議の創始者でありSteering Committeeの委員長でもあるDavid Kahanerが詳しい報告を書いている。筆者の報告もある。実は筆者にとって韓国訪問は初めてであった。

初日はチュートリアルであったが、並行してNECとHouston大学の主催により、The First Cenju Workshopが開かれた。中田登志之はワークショップの基調講演でCenju-4の開発について講演した。

会議では、基調講演1件、招待講演4件、原著講演137件、パネル(と円卓会議)が7件であった。韓国のSang Hyon Kyong前情報通信大臣が基調講演を行い、韓国のInformation Infrastructureを打ち出した。筆者は”Future Vision of Parallel Computing”という招待講演を行ったが、そのほかJack Dongarra、Steve Wallach (Convex)、情報通信省副大臣なども招待講演を行った。

参加者は720人で、国地域別は以下の通り。投稿論文の総数は181。ゴールデンウィークと重なったが、日本からの参加者もかなりあった。

参加者数 投稿論文数
531 Korea 92
65 Japan 15
50 USA 19
13 Taiwan 12
12 Singapore 8
8 Australia 7
8 India 9
33 Other 20 countries 20

5月1日のバンケットはなかなか豪勢で、金中子(Kim Joong-Ja)國楽藝術團の伝統ダンスは圧巻であった。

世界の学界の続きは次回。HPCN会議には暗雲が漂い始めた。

(タイトル画像: OpenMPロゴ)

left-arrow 50history-bottom right-arrow