新HPCの歩み(第231回)-2005年(i)-
今年のSupercomputing Conferenceは、Microsoft社の地元、そしてCray社の地元のシアトルで(初めて)開催された。Bill Gatesが基調講演を行い、空前の聴衆が集まった。Sun HPC Consortium USA 2005では東工大のシステムが紹介された。 |
SC|05
![]() |
|
1) はじめに
SC|05: The International Conference for High Performance Computing, Networking and Storage(通称 Supercomputing 2005) は、18回目の今年、”GATEWAY TO DISCOVERY”のテーマのもとで、ワシントン州SeattleのWashington State Convention and Trade Center で11月12日(土)から18日(金)まで開催された。会議名はInternational Conferenceと初めて名乗ったが、”computing”, “networking”, “storage” の並び方は去年と同じである。SC|05というロゴを用いている点が違っている。“SC05”という商標が誰かに取られていたようである。SCの歴史の中で、シアトルで開かれたのは初めてである。全参加者8709名、テクニカル登録3000人以上、予算$4.3M、ACMおよびIEEE/CSへの上納金$0.3+M、論文数62(投稿260件)、チュートリアル27、招待講演4件、Masterworks 16件、パネル5件、BoF 40件、Workshops 12件、ポスター38件など。
次世代スーパーコンピュータ計画が始まったので、今回初めて文部科学省情報課から1名(中里学氏、東大平木研出身、総務省からの出向)が参加し、国の熱心な取り組みを示していた。筆者としては前々からSC参加を文科省に勧めていたのであるが、今回やっと実現した。
2) 組織
今年の組織委員長はWillam Kramer (NERSC)、委員長代理はBarbara Homer-Miller (Arctic Region Supercomputer Center)であった。Technical Program Committeeは、Jeffery A. Kuehn (ORNL)とWes Kaplow (Qwest Communications)が共同座長である。Technical Papers Program Committeeは、Bob Lucas (ISI)とAllan Snavely (SDSC)が共同座長である。分野は、Networking, System Hardware、Applcations、Grid、Performance、System Softwareに分かれている。メンバーには、日本からは松岡聡が加わっている。
3) Sun HPC Consortium USA 2005
SC|05に先立ち、11月12日(土)13日(日)の2日間、シアトルの海岸にあるBell Harbor Conference CenterにおいてSun HPC Consortium USA 2005が開催された。NDAに署名して会議に臨んだが、大した秘密は出てこなかった。
Heidelbergと同様、Marc Hamiltonが“Delivering HPC Innovation”と題して冒頭の講演を行ったが、最大の話題は東工大の商談であった。会議の時は絶対秘密ということであったが、14日(月)にはシアトルで記者発表された。詳細は「日本の学界の動き」の「東京工業大学」を参照。Web serverを主要な用途とするNiagara processorは来月初めに発表すると言っていたが、チップ内8コアで、各コアには4スレッド走る。HPC用の次世代Sparcは自社では製造せず、PRIMEPOWERを作っている富士通との協力関係を考えているとのことであった。SunはUltraAPARC IV+を計画し、富士通はSPARC64V+を計画するが将来は合流するとのことであった。
AMDのJustin Boggsが来て、dual core Opteronのアーキテクチャや将来計画などを話していった。東工大のシステムもそうであるが、AMD社との連携を強めることを考えているようである。
Sun Studio 11についてRichard Friedmanが説明したので驚いた。Friedmanは、昔、Applied Parallel Research (APR)社でHPFの開発を行っていて、彼のNorth Berkeleyのオフィスを訪ねたことがある(「新HPCの歩み(第114回)-1993年(d)-」の「11) SSC計画中止」の項)。当時の同社の社長のJohn M. Levesqueは現在Crayの所属。IT分野は人の流動性がきわめて高い。
4) Fujitsu User’s Meeting 2005 in Seattle
13日夜は、上記のSunの会合を早退して、Fairmont Olympic Hotelで開かれた富士通の会に出席した。代表取締役会長 秋草直之氏から挨拶のあと、Tony Hey氏(Microsoft VP)の招待講演があった。これは翌々日のSCのBill Gates氏の基調講演のいわば予告編であり、マイクロソフトはHPCに積極的に取り組んでいること、Grid や Web Serviceの技術が発展しているので、ユーザーのマイクロソフトの環境(Windows, Powerpoint, Excel, Mathworks)とHigh End Machineとがシームレスに繋がっていることを強調した。
Tony Hey氏はイギリスのe-Scienceの中心人物であったが6月27日にマイクロソフトに加わった。元々は素粒子物理屋である。懇親会で「明後日Bill Gates氏は何を話すんですか?」と聞いたら、「知りません」ぐらい答えておけばいいのに、「わたしはそれを話す立場にない。」と持って回った言い方をしていた。イギリス流のレトリックかもしれないが、実際Bill Gates氏の基調講演を聞いていて、Tony Hey氏の入れ知恵ではないかと思われるところがたくさんあった。
5) 全体像
シアトルは言うまでもなく現Cray Inc. の本拠地、またMicrosoftの本拠地(近郊)、(当時の)イチローのマリナーズの本拠地、そしてスターバックスやタリーズの発祥の地である。市内到るところにスターバックスがあるが、海岸沿いのマーケットの近くに1号店がある。会議中のコーヒーもスタバであった。
Access Grid技術をつかって、世界中にこの会議の様子を双方向に中継するSC globalは、2001年に始まり、2003年には大きく広がった。一般のテクニカルプログラム、パネル討論、BoF会議を中継した。今年はSC Desktopという新しい企画があり、遠隔からテクニカルプログラムの一部に「仮想出席」することができるとのことである。2月から募集の案内がでていた。(HPCwire 2005/2/4)
6) StoreCloud
会議名称に去年からstorageが入り、今年もStorCloudという新しい試みが続けられた。StorCloudのインフラはProductionとNextGenとの二種類の要素からなる。 Production StorCloudの目的は、
・SC|05参加者に対して1 PB以上のランダムアクセス記憶を提供する。
・1 TB/s 以上のバンド幅を目指す。
・バックアップに対して1 GB/sのバンド幅を提供する。
・異機種の記憶システムの間の相互運用性を提供する
・SC|05の研究展示に対して、資源を提供する。
NextGen StorCloudは、インフィニバンドを中心とする新しい記憶技術を実証する。OpenIB (Open InfiniBand Alliance) やベンダーとの協力関係により、InfiniBandに基づく記憶装置を運用する。
StorCloud Challengeでは6チームが記憶技術またはその応用での技術について競う。評価の視点は記憶装置の革新的な利用法、バンド幅、I-opsの活用である。
7) Social Event
11日(木)の夜、市内のSpace Needleを会場にEvening Eventが行われた。焼肉コーナーが「Kobe Beef」という看板を出していたので、“Is this a real Kobe beef?”(これは本当のKobe beefか?)と聞いたら、“Yes, it’s a real Kobe beef.”(うん、本当のKobe beefだ)との答え。まさか? アメリカでは和牛はどれもKobe Beefらしい(正確にはKobe-style beef)。「本当のKobe Beef」が輸出されるのは2012年からである。
8) 開会式
前日のGala Openingに引き続いて、9日(火曜日)の8:30から開会式があった。8時半前には主会場が満席となり、その後に来た人はビデオ中継の第2会場、第3会場に回された。
9) 基調講演
今年の基調講演はマイクロソフトの会長でありChief Software ArchitectであるBill Gates氏であった。タイトルは”The Role of Computing in the Sciences”であり、ソフトウェア産業が、産業界、学界、政府の間の幅広い協力により科学計算をより容易により生産的なものとすることにより、いかに科学研究や技術革新に貢献することができるかについて述べた。また、マイクロソフト社が世界中の10の大学に共同研究資金を提供していること(日本では東工大)と、HPC用のOSとして”Windows Compute Cluster Server 2003″のベータ2版を公開したことを述べた。2006年には正式公開の予定。
マイクロソフトは、HPCのコミュニティーに対し長期的な支援を行い、科学上の発見における計算の役割について大きな熱意を抱いている。
まあ、内容的に特に新しい話はなく、誰でも言うような内容であったが、ビル・ゲイツが講演するとそれなりに様になるから不思議である。
面白かったのは質疑応答である。さすが、どんな質問にも平然と明確に答えていた。これがすごい。メモできたものだけ紹介する。
Q:オープンスタンダードへのマイクロソフトの取り組みは?[これはなんでも自分流が好きなMS社に対しては、かなり嫌みな質問であった。] A:GGFにはTony Heyが参加している。XMLやWSDLでも協力。[とうまく逃げた] Q:productivityをどう上げるか。 A:Windowsはcomponent object modelに基づいている。MS Officeは複雑なオブジェクトの集合で出来ている。tightly coupled technologyとloosely coupled technology の両方が重要である。 Q:マルチコアにどう対応するか。アカデミアから新しく人を入れるのか。並列化をどう進めるのか。 A:重要なポイントである。多くのアイデアがある。 Q:energyを減らすのにどうするのか。 A:software security, usabilityが重要である。Global warmingのサイエンスが重要。 Q:Xboxの将来をどう考えるか。 A:グラフィックス、可視化、物理学などに影響するであろう。 |
今回はホテルの多くが近くて連絡バスは出なかったが、この日の朝、町中のホテルから人が出て、砂糖に向かうアリの群れのように会場に向かっていたのは壮観であった。
10) 展示
今年は企業展示171(160)件、研究展示104(105)件、全体で276(265)件があった(括弧内は事後発表)が、展示会場が4階のメイン会場と6階のサテライトに分かれていたのが問題であった。売られたブース面積は107310 ft2である。
11) 企業展示
今年は企業展示は171件であった。中でも、地元Microsoftの展示は人目を引いた。主催者の分類によると、Analytics(18), Communication(19), Data Management(14), Grid(43), Networking(46), Server(43), Software(45), Storage (52), Visualization (30) とのことである。目に付いたものを挙げる。
a) Microsoft
マイクロソフト社は地元と言うこともあり、かなり力が入っていた。この会議場の建物はPike streetという道路をまたいでいるので4階の連絡橋の部分がくびれているが、地元Microsoft社はその両側のブースを確保していた。歩くたびにMicrosoftのところを必ず通るしかけであった。
b) ClearSpeed
これは去年から出展しているベンチャーで、低周波数、省電力、マルチコアの浮動小数演算付加プロセッサを出している。元々はイギリスの会社だそうである。今年の出品は500 MHzで動く96個のFPUを1チップに載せたもので、ピークで約50 GF 出るが、電力は10 W程度だそうである。あとに述べる東工大の新システムにも用いられている。
去年までSun MicrosystemsにいたJohn GustafsonがCTOとして9月にこの企業に就任した。Ames Labにいたときの有名な仕事はSLALOM benchmark(1分間でどこまで出来るかというベンチマーク)やHINTである。筆者はFloating Pointにいた86年から旧知である。現在はシンガポールのA*STARに所属している。
ClearSpeedのブースでは全長1 mを越える長い傘を配っていたが、ちょっともてあまし気味で、帰りにシアトル空港ではみなそれをチェックインするので、担当職員があきれていした。成田着のベルトコンベアでは大きなトレイに数本並んで出てきた。
c) Linux Networx
去年はパーティーを派手にやっていたが、今年は何か印象が違う。スタッフも変わった感じ。ロゴの色も緑から赤に変えたので違う会社のように見える。かなり大きなクラスタを作り軍の研究所に納入したようである。Top500の25番目のUS Army Research Laboratory (ARL), John Von Neumann – LNX Cluster, Xeon 3.6 GHz, Myrinetとあり、2048 CPUでRmax=10.65 TFlopsを出している。西さんの話では最近元Crayのエンジニアを多数採用したとか。
12) 研究展示
全体で104件であったが、そのうち日本からの研究展示は以下の18件であった。
a) Advanced Center for Computing and Communication, RIKEN
b) AIST – National Institute of Advanced Industrial Science and Technology(StoreCloud Challengeに参加)
c) Center for Computational Sciences, University of Tsukuba
d) CMC – Cybermedia Center, Osaka University
e) Computing & Communications Center of Kyushu University
f) Doshisha University
g) Ehime University & NICT 564(Band Width Challengeに参加)
h) eSociety, the University of Tokyo (6階展示会場)
i) GRAPE Projects
j) IIS – Institute of Industrial Science, University of Tokyo (FSIS, IIS)
k) ITBL – Information Tech. Based Laboratory
l) JAEA (Japan Atomic Energy Research & Development Agency) (旧原子力研究所)
m) JAXA – Japan Aerospace Exploration Agency(Band Width Challengeに参加)
n) NAREGI – Japanese National Research Grid Initiative
o) RIST – Research Organization for Information Science and Technology
p) Saitama Institute of Technology
q) Saitama University
r) Tohoku University
s) University of Tokyo (平木研究室。Band Width Challengeに参加)
去年出展して今年出展しなかったのは、地球シミュレータセンターとLAセミナーであり、今年新たに出展したのはeSocietyである。関係者によると、統計数理研究所を含む情報・システム研究機構は来年出展する希望を持っているとのことである。
今回東京大学から計3件出展してたが、外国でそんな所はない、日本の恥ではないかというような意見が聞かれた。歴史的に見ると、日本の大学から出展しているグループはいわばゲリラ戦的にSCに出しているところが多く、正規軍として出展している欧米の大学や研究所とはだいぶ事情が違うようだ。
13) Technical Papers
SCというとどうしても展示やイベントなど華やかなものに注目があつまるが、レベルの高い査読による原著論文(technical papers)は言うまでもなく重要な部分である。今年も日本から松岡聡氏(東工大)がメンバーに入っていた。
論文投稿総数は260、そこから62編が選ばれた。採択率は24%である。日本の組織が関連した発表としては、次の3件である。
“Full Electron Calculation Beyond 20,000 Atoms: Ground Electronic State of Photosynthetic Proteins” Tsutomu Ikegami, Toyokazu Ishida, Dmitri G. Fedorov, Kazuo Kitaura, Yuichi Inadomi, Hiroaki Umeda, Mitsuo Yokokawa, Satoshi Sekiguchi この論文はBest Paper Awardを受賞した。日本からは初めてBest Technical Paperであった。 |
“16.447 TFlops and 159-Billion-dimensional Exact-diagonalization for Trapped Fermion-Hubbard Model on the Earth Simulator” Susumu Yamada, Toshiyuki Imamura, Masahiko Machida この論文はGordon Bell Awardのfinalistであったが、惜しくも受賞は逃した。 |
“MegaProto: 1 TFlops/10 kW Rack Is Feasible Even with Only Commodity Technology” Hiroshi Nakashima, Hiroshi Nakamura, Mitsuhisa Sato, Taisuke Boku, Satoshi Matsuoka, Daisuke Takahashi, Yoshihiko Hotta 中島浩の講演はなかなかの熱弁であった。 |
14) SCinet
1991年のSCから、会場には超高速のネットワークSCinetが設置されている。今年もその例に漏れず、外部とは合計400 Gb/sを越える接続が設備された。一週間とはいえ地球上で最良の接続がなされている場所であった。会場内は、GigEや10GbEの他に、Open InfiniBand NetworkやXnet (eXtreme Networking) 引かれていた。
講演会場を含めほとんどの場所に無料の無線ランが設置されていた。例年、人数が増えてくると無線ランが不安定になり往生したが、今年はローミング技術を工夫したらしく非常に安定であった。そのため、会場内では2.4 GHz帯と5.2 GHz帯の個人的利用がきつく禁じられている。方向探知機を持った係員が会場を巡回していた。
15) Exhibitor Forum
いくつか紹介する。
a)IBM “Innovation That Matters” (Tilak Agerwala)
IBMは今後ともスーパーコンピュータの開発を進め、製品を出していく。チップの発熱の問題が性能を制限している。CMOS技術の採用により一時桁違いに下がったが、10年後結局同じ熱密度まで増大してしまった。次のブレークスルーが必要である。
システムには多様なスペクトルが必要である。IBMでは、large SMP、 cluster、 BladeCenter、 Cell/BG というようないくつかの路線を用意している。ASC Purple は8-wayのpSeries p5 575 SMP のクラスタで、10240個のプロセッサからなる。peak 93.4 TFlops、相互接続は3-stage dual rail fat-treeで>6 TB/sのバイセクション・バンド幅をもつ。2 PBのGlobal storageで、100 GB/s のアクセス速度。 BlueGene/Lは、131072個のプロセッサからなり、相互接続は3次元トーラス、peak 367 TFlops, Linpack 280 TFlops。64 racksからなり、2500 ft2 を占める。消費電力はわずか1.5 MW。Cell processorはソニー・東芝と協力して製作したゲーム用のチップ。90 nm SOIでダイは221 mm2、32bit だが256 GFlops のピークをもつ。
b) Cray “Supercomputing at Cray: Constants, Trends and Futures” (Jeff Brooks)
Cray社は3つの製品ファミリーをもっている。一つはX1Eに代表されるベクトル計算機で、目的志向のHPCである。二つ目はXT3に代表されるMPPで、いわば昔のT3D, T3Eの後継機である。相互接続は3次元トーラス。もう一つはXD1のミッドレンジシステムである。
SC|05の次の週に、Cray Inc.のco-founder でChief Scientist のBurton Smith氏が、12月7日にCray社を去り、マイクロソフト社に入社することが発表され世界に衝撃が走った。Cascadeの設計は彼の担当とされていたので、今後の方向性が注目される。(HPCwire 2005/12/2)
c) Sun “Innovation Matters” (Andreas Bechotolsheim)
IDC (2004)のHPC market sizeのレポートでは安い方が売れている。OpteronのKey trendとしては、プロセッサ数が2から8へ、32 bitから64 bitへ、メモリは4 GBから32 GBへの進化である。”Opteron + InfiniBand” solutionが方向性である。ノードは2.4 GHzの4 dual coresで38.4 GFlopsである。
EthernetとIB (InfiniBand)は、パケット通信であること、RDMAを用いていること、WARPなどでは似ているが、flow contorlなどは違う。IBはcut throughだが、Ethernetはstore-forwardである。IBは高速でレイテンシーが小さいのが特徴である。
d) Fujitsu “Fujitsu’s Vision for High Performance Computing” (奥田基)
富士通のHPCのラインアップとしては、IA32に基づくlinuxのクラスタと、IA64に基づくPRIMEQUESTと、Solarisに基づくPRIMPOWERの3種がある。PRIMEQUEST/HPCはMontecito (dual core) chipを富士通オリジナルのチップセットを使い、32CPUをSMPに組み、これを1ノードとしてleaf switchでつないだものである。1本あたり0.8–1.3 Gbps、全体で102–170 Gbpsのバンド幅をもつ。世界最高速の同期バスを有する。
今後、Patascale Computingにチャレンジしていく。
e) NEC “NEC High Perfornance Computing Solutions” (Joerg Stadler)
SX seriesは18年も続いている。implementationは時代とともに変わっているが。SX-8は、16 GF/CPU、64 GB/s memory bandwidth、8 CPU/node、最大構成は512 nodes (4996 CPU)で65 TFlops。サーバとしては、Express 5800/1000 (TX7)はItanium 2ベース。EM64T Blade serverもある。
ペタフロップスに向けての技術として、CPUとメモリとの光接続を研究している。
次回は、Top500や学術講演、各種Awardsなど。Jack Dongarra教授は新しいベンチマークHPC Challengeの構想を語った。招待講演でOliker(LBNL)は、は4つの最先端応用プログラムを用いて、スカラー計算機とベクトル計算機のベンチマークを行い、ピークと実効速度とのずれを分析した。地球シミュレータの性能が改めて話題となった。
![]() |
![]() |
![]() |