世界のスーパーコンピュータとそれを動かす人々


8月 1, 2016

HPCの歩み50年(第93回)-2002年(i)-

小柳 義夫 (高度情報科学技術研究機構)

インドのBangaloreで開催されたHPC Asia 2002に出席したが、「カルチャーショック」の連続であった。HP社のFrank Baetkeは「生き残るアーキテクチャは少数であろう。残念ながら、AlphaやPA-RISCはItaniumに置き換えられるであろう。」と述べたが、後の歴史を見ると結局どれも生き延びることができなかった。

HPC Asia 2002

1) 概観
HPC Asia 2002 (The 6th International Conference/Exhibition on High Performance Computing in Asia Pacific Region) はシリーズの第6回として2002年12月16日から20日まで、インド南部バンガロア(Bangalore、Karnataka州の州都)のThe Leela Palace ホテルにおいて開かれた。バンガロアはインドのSilicon Valleyとも言われ、1000社以上のハイテク企業があるという。筆者は出席を予定してなかったが、SC2002において2004年に第7回HPC Asiaを日本でやるということになったので、急遽参加した。日本からは、筆者の他、村上和彰教授(九州大学)とその学生の中村君、さらに北陸先端の堀口教授のところの学生さんがいたようである。

前回から1年少ししか経っていないが、インドは気候が一番穏やかな季節ということでこの時期を選んだ。このころアメリカ在住のインド系の人がクリスマス休暇をかねてどっと帰省する季節でもある。そういうコンピュータサイエンティストを呼び込もうという意図もあったと思われる。実際参加者の多くは、地元のインドの人と、インド系でアメリカで働いている人であった。

主催者によると参加者は500人弱。なかなかの数である。インド国内の若手には旅費の援助をしたとのことである。韓国からはSeoul国立大学機械航空力学科のSeung Jo Kim(金承祚)教授が来ておられた。昨年のGordon Bell賞のcost/performance部門で入賞した方である。韓国の秋葉原みたいなところで部品を買い集めて航空力学の計算をしたという成果であった。珍しい国ではブラジル2名、ガーナ1名など。他人のことは言えないが、インド英語にはかなり閉口した。インドは初めてであった。筆者の「インド珍道中」記を含む詳しい会議報告を参照。

2) 企業展示
会議場の近くにいくつかの展示が行われていた。関税が高いと言うことで、外国からはHPCの実物はほとんどなかった。Principal sponsorというだけあって、一番広い場所を占めているのはIBMであった。Blue Gene/LやMaui HPC CenterやGrid solutionなどパネルが主であるが広い分野で展示を出していた。17日にはUngaro副社長も顔を見せていた。

TATA ELXSIはgold sponsorsの一つであるが、やはりTata Insiituteからのスピンアウトであった。Elxsiという80年代の並列サーバ会社(例によって倒産した)の名前が懐かしかったので聞いてみたら(Tata財閥はもともと出資者のひとつで)名前を買い取ったのだそうだ。現在の会社はハードではなくソフトやsolutionを売っている。酵素系のシミュレーションを行う製薬系のソフトなどの応用とともに、ポータブル自動並列化のソフトもある。帯行列に縁の付いた形の係数行列の方程式の並列化が売り物で、対角ブロックをプロセッサに割り付けるのだが、大きさが異なりロードバランスが悪いので、細かく分けた上で融合するというテクニックを開発したそうだ。右下のブロックはどうせごちゃごちゃになるので、LU分解による解法を用いる。

SGIはOrigin 3000をはじめとするhigh-productivity servers、Linux 、Virtual Realityなどとともに、CXFSファイルシステムによるデータ管理を提示した。

Sun Microsystemsも、パネルだけではあるがportal initiatieやweb serviceによる新しいビジネスコンセプトを提示し、それらのインフラとしての位置を強調していた。あと、FirelinkでSunFireをつないだ高性能システムを紹介していた。

Tektronixがロジアナを展示していたが、客は少なかった。また、CDC6400などという文字にびっくりしたが、California Digital Corporationという会社で、Itanium 2のサーバを出している。ARITHNETというtechnical servicesの会社もでていた。

企業スポンサーの中で、Hewlett Packard、Cray Inc.、Cisco Systems、Microsoft、MPO-TEKは展示を出していなかった。CrayはBurton Smith自ら開会式に乗り込み、Industiral TrackではBurton自ら講演した。

C-DAC (Centre for Developmento of Advanced Computing、インド電子省の研究所)自身も大きな展示を出していた。目玉は、PARAM Padmaというテラフロップス級のMPP、いわばインドの地球シミュレータである。12月に完成したとのこと。PARAMは8000、8600、9000、10000と進歩してきた。8000は91年で、トランスピュータT800が128台つなげられた1 GFの機械であった。10000はたしかSparc baseだったと思う。PARAM PadmaはPARAM 20Kとも言うべきもので、1 GHzのPower4に基づく。4-wayのSMP (p630)が54台、32-wayのSMP (p690)が1台から成り、この間をFast Ether, Gigaabit Ether、それにPARAMNet-II という独自のネットワーク(2.5 Gb /s、ソフトからのlatencyは10μs。光ファイバー)で結んでいる(現在のところ、p690にはPARAMNetはつながってない)。合計248個のPower 4プロセッサなので、ピーク性能は1005 GFということになる。メモリは0.5 TB。OSはAIX/LINUXとあるが、聞いてみたらコンパイラの関係で現在はAIXだが、将来は混合して使えるとのこと。ファイルシステムは900MHzのUltraSparc-IIIの4-way SMPを6セット使いQFSで0.4 TB、外部に5.1 TBのStorage Arrayを備えている。消費電力は160KVA、床面積は168平米、重量は9トン(空調の重量はなんと39トン)とある。どうも、p630クラスタの部分とp690の部分はファイル共用の別の計算機システムと見た方がよいようだ(後のC-DAC見学記参照)。LINPACK値を見てみたいものである。応用として、インド地方のmeso-scaleの気候シミュレーション、石油探査のための地震のシミュレーション、DNAの相同性解析などを展示していた。PARAM シリーズ全体では52台製作し、数台は外国(ロシア、シンガポール、カナダ、ドイツなど)にも売れている。C-DACはPARAMNet-IIを使ったLINUX Clusterも製造している。

3) 開会式
16日(月曜日)は朝からいくつかのtutorialsが行われた。夕方18時から2時間にわたるにぎにぎしい開会式が開かれた。重要人物は壇上に。インド人がこれほど儀式好きとは知らなかった。

(1) まず、サリー姿の女性が現れて開会の長々しい歌をヒンドゥー語(?)で歌った。中味は分からず。インド風のメロディ。
(2) 組織委員長のDr. Sharad Purohit (C-DAC)が歓迎の挨拶。HPCは今や贅沢ではなくむしろコスト削減であると強調。そのあとで、壇上の人物にPurohit氏から花束贈呈。
(3) Lamp Lighting Ceremony 点灯式。ゲストが集まって、ランプの8つの芯に蝋燭から点火。
(4) International Steering CommitteeのDr. David Kahanerが演説。HPC Asiaには二つの意味がある。一つはtechnical forumという意味、もう一つはindustry partnersの技術を共有すること。この二つの要素のバランスが大切。重要なのはnetwork of peopleである。
(5) Mr. R. K. Arora (C-DAC) この会議のcohostとしてC-DACのperspectiveを述べた。HPCは21世紀の技術である。アメリカの政策、ヨーロッパのESPRITプロジェクト、日本の地球シミュレータについてふれた。
(6) C. H. Mehta教授(IISC, Indian Institute of Science)。組織委員の一人。専門は有機化学。インドのソフトウェアの父、いや祖父だそうだ。なかなか哲学的な挨拶をした。
(7) V. S, Ramamoorthyによるtechnical programの開会式。何をやるのかと思ったら、銀紙の包装を破ってプログラムを取り出し、壇上のゲストに配布。続いてPresidantial Address 。C-DACは国家的要請によってできた。禁輸で並列しか可能性がなくなった。そして今やTera Flopsにまで到達した(と、ここで拍手)。インドはCERNのLHCにも参加している。Gridはmustである。
(8) Rajeeva Ratna Shah (Secretary of Department of Information Technology, Ministry of Communication and Information Technology) かなり偉い人らしい。release of the proceedingsということで、銀紙を破ってCD のプロシーディングスを取り出した。さらに冊子体のプロシーディングスも取り出す(そんなのあったっけ?)。続いてIGRID (Indian Grid。実際はネットワークの話。)の重要性について演説。
(9) Purohitが壇上のゲストにmonumentを手渡す。この記念品は金属製の文鎮みたいなものだが、すべての招待講演者にも講演後に渡されていた。
(10) 最後にI. H. Patnaik (ACS)が皆に感謝の言葉を述べた。
(11) これで展示会場に移り、展示の開会式を行った。若干の食べ物とコーヒー/茶はあったが、デザートみたいなものでみんな文句。インドの人は甘いものが好きなようだ。

このあと関係者だけは庭のプールサイドで食事。筆者は招待はされなかったが紛れ込む。ここでは、ちゃんとした食事と飲み物(ソフトドリンク、ビール、ワイン)もあった。

4) 中国のHPC/Grid事情
テクニカルプログラムは17日から始まった。

最初の基調講演(9:00~10:00)は、中国科学院コンピュータ技術研究所(ICT)のDr. Zhiwei Xuの”HPC and Grid in China”であった。プログラムには”HPC Research in China and the Vega Grid”とあった。

氏は中国国内のHPCの会社として3つの例を挙げた。まずLegend(聯想、今のLenovo)、これはICTから1981年にスピンオフした会社で、2001年からHPCに参入した。Lang Chao(浪潮、今のInspur)はもともとlow endのサーバの会社だが、今年からHPCに参入した。またDawning(曙光、今のSugon)も1995年にICTからスピンオフした会社ではじめからHPCを目指している。

中国でのGrid projectとしては、Chinese National Grid (2002-2005)がある。4 TFを越えるGrid Enabling Clusterを作り、10-18個(合計6-10 TF)のGrid Nodesを設置する。その上でGrid SoftwareとGrid Applicationsを開発する。応用としては、環境、製造、サービスなど広い範囲を考えている。

HPCおよびグリッドの例としていくつかの例を挙げた。

(1) Beijing Genomic Institute。Dawning 3000により今年4月に稲のシークエンスの概略を決定。10月には99%以上の配列を決定。
(2) Shanghai Insitute of Materia Medica。Gridを用いたdrug discovery。
(3) China Railways。投資計画と資産管理。
(4) 森林省。環境問題。
(5) 航空産業。部品のライフサイクル管理。
(6) Beijing Earth View(地球縦視)。7人の小さなNPOだが、環境問題の監視。

総じて中国のHPCおよびGridの市場は成長している。サーバは概して遊んでいるのでresource sharingとoverload-friendly serviceがGridの主要目的である。それに、Grid Enabling HPC Serversとかいうと予算が付く[と、本音をポロリ]。

ICTではThe Vega Grid Projectを進めている。中心はGSML (Grid Service Markup Language)である。OGSA (Open Grid Service Architecture)/Globusとは相補的なものである。

さてHPC/GridにおけるAsia Pacific Countiesの役割は何か。これまでITの分野で3回の波があった。Internet, Web, Gridである。中国は、RFCを1件出しただけで、webには寄与できなかった。Gridではもっとがんばらなくては。

結論として、HPC/Gridは15年以内に受け入れられる[ちょっと遅いような気もするが]。2つの最大の市場は中国とインドである。ケータイでは中国は1位である。world HPC researchに貢献しなくてはならない。Gridはinnovation opportunityを与えるからである。

5) プロセッサとOS
10:00~11:00は、Dr. Frank Baetke (Hewlett Packard)の”Status and Trends in High Performance Computing: Processors, Servers and Operating Environments”であった。マイクロプロセッサの動向を紹介しながらそれとなくHPのサーバを宣伝しているという感じの基調講演であった。どこかであったことがあると思ったら、かれは前にはConvexにいたそうだ。

プロセッサアーキテクチャは大きく変わった。昨年(2001)の主力は、Alpha 21264、PA8700、UltraSparc III、R14000、Power 3であったが、今年は3つの方向に発展している。一つは、PA8700+やEV7/EV79 (21364)のように大きなon-chip cacheを置きout-of-orderを強化する方向。Alphaではチップ上にnetwork interfaceを持っている。もう一つは、Power 4やPA8800のようにチップ上に2つのCPUを設置する方向。そして最後がItanium 2で、他のチップとは全然違う戦略を採っている。

Itanium 2は4つの特徴を持っている。

(1) 大量の資源。128個の128 bitsのレジスタを二組(整数と実数)、多くの整数演算器、浮動小数演算器、特殊レジスタを持っている。(初代の)Itanium に失望した人が多かったが当然である。これは2.1 GB/sのメモリバンド幅しかなかった。Itanium 2は6.4 GB/s (128 bits @ 400 MHz)である。
(2) 投機的実行。たとえillegalであってもキャッシュにpreloadする機能を持っている。後でvalidかどうかチェックする。そのため特殊なレジスタが用意されている。
(3) EPIC (Explicitly Parallel Instruction Code)。ItaniumはVLIWであり、128 bitsに3つの命令を書けるが、templateという5 bitsのフィールドがあり(compilerが)依存性を指定できる。Itanium 2では1サイクルに6命令(2ワード)実行できるが、将来は12命令(4ワード)実行する予定。[後で質問があり、そうはいってもコンパイラが分かるのは静的な情報だけなので、依存性は指定しきれないのではないか、と。なにかごちゃごちゃ答えていた。]
(4) 分岐予測。分岐の両方を並列に実行し正しくない方を捨てる。

Itaniumは最初からmultiple OSを前提に設計されている。HP-VXII, HP-UX, LINUX64, Win64など。この次はMadisonとDeerfieldで、後者は価格性能比を重視したチップである。

私の見方であるが、

(1) 生き残るアーキテクチャは少数であろう。残念ながら、AlphaやPA-RISCはItaniumに置き換えられるであろう。
(2) cc-NUMAを構成要素とした少数のノードから成るクラスタがはやるであろう。
(3) fat nodes(多くのCPUで構成された高性能なノード)の構成はccNUMAであろう。と、ここでHPのサーバを宣伝。自由に、かつ動的に複数のクラスタに再構成できる。しかも違ったOSでもよい。こういうことができるシステムは多くない(とHPの優位を主張)。

メモリバンド幅は、ピークでなく実効値が重要である。cache line lengthの値で全然違ってくる。長いキャッシュ長は、見かけはいいが多くの場合有効でない。

さてOS環境であるが、まずローカルな環境つまりOSについて。Igtanium 2では、HP-UX, LINUX, Win64が同居できる。WS上でLINUXで開発したコードを、HP-UXのサーバで実行することもかのうになる。真のmulti-OS enviroentsを提供するシステムは少ない[またもやHPの宣伝]。

グローバルなOS環境はGridか、ずばりそうだ。Gridをdriveしているのはhigh energy physics のworld wide collaboration (LHC)である。

6) パラレルセッション
第2セッションは4並列のパラレルであった。それぞれ、最初に招待講演があり、あと4~5件の投稿論文発表が続く。今日の第2セッションは

(1) High Performance Architecture
(2) Signal and Image Processing
(3) High Performance Networks
(4) High Performance Computing I

であった。

第3セッションは、以下の通り。

(1) Scheduling
(2) High Performance Software
(3) Parallel Applications I
(4) Optical Communication

7) Terascale Computing Panel
17時から”Terascale Computing and Beyond”というパネルが開かれた。司会は、N. Balakshrinan氏。まず各パネリストが15分ずつ発題する事になった。

最初は、Prof. Bharat Soni (University of Alabama at Birmingham)で、機械工学の専門家。彼は20世紀の偉大な成果を20件上げ、その8番目のcomputer (SC >> HPC) についてplatformの変遷をのべ、現在はGridだ、と語った。シミュレーションには、geometry, meshing, adaptationの3段階があり、計算以外に時間が掛かる。また、21世紀の研究のチャレンジとして、効率、エネルギー、水、空気、土地・空気・大気の相互作用、輸送、ナノテク、microfluidicsの8項目を挙げた。Terascale computingはこれらに大きく寄与する。

Karachi Kumar (iHPC, Singapore)は、まずiHPCの紹介を行い、中心的なハードウェアとしてRegattaのクラスタ(Power 4 x 224 = 1 TF)を挙げた。応用の例として、

(1) computational chemistry / material … ab initio MD (lead-free solder, boron-nitride nanotube)
(2) simulation of quantum dots
(3) computational MEMS
(4) computational electromagnetics (要するにレーダーで飛行機がどう見えるか。CPUが足りない。)
(5) Urban-level dispersion modeling (繁華街に化学物質を撒いたらどうなるか)
(6) multiscale modeling
(7) multiphysics simulations

HPCは国家的優先課題であり、重要は大きい、教育も必要である、と述べた。

A. S. Kolaskar (University of Pune 副学長)はbioinformaticsの観点からHPCの重要性を述べた。

司会のBalakshrinan氏もインドの国家的イニシアティブとしてHPCを提示した。ではペタフロップスは同実現するか。1000000個のGF levelのマシンか、10000個の0.1 TF levelのマシンか、200TFのマシン数個か?

結局、パネリストはTF級の計算機があればこんなことができるということをいろいろ示したが、費用・成果の評価については誰も語らなかった。質疑応答もいろいろあったが、まとまらないうち18:45にパネルを終了した。

8) 文化の夕べ
パネルのあとちょっとしたおやつがでて、19時半からインド舞踊「ダルマ・プージャン」があった。アレキサンダー大王がインドに進出するに当たり哲学者アリストテレスに意見を求めると、「インドは聖なる土地で、聖なる人が住んでいる瞑想の国である。万物が祝福されている。ギリシャ帝国の拡大ではなく、友情の拡大を目的としなければならない。これは一つの巡礼だ。」と諭される。アリストテレスがインドの6つの秘密の宝を述べ、それに対応する舞踏が示される、という嗜好である。音楽と台詞は録音だが、踊り手は男性と女性(大人からかわいい女の子まで)総勢20名ほどであろうか。

1) ガンジス川の聖なる水の壺
2) ラーマーヤーナの宇宙的物語
3) 竹の魔法のフルート
4) ある人物それ自体(誰のこと? 仏陀?)
5) 天と地をつなぐ赤い砂(塵)
6) マハーバーラタ、人生の至高の掟

アレキサンダー王の軍はインドに進出するが、インド王のsense of humorに感心して和解し、帰る途中に病に倒れる(33歳)。要するにインドは偉大な国だというオハナシ。舞踏の体(特に手、首など)の使い方は、タイの舞踏や(当然ながら)バリ島の舞踏などと似ている。さすが「ボリウッド(ボンベイ版のハリウッド)」の国柄である。

続きは次回に。

(タイトル画像:インドC-DACが開発したPARAM Padmaシステム )

left-arrow 50history-bottom right-arrow