世界のスーパーコンピュータとそれを動かす人々


3月 13, 2017

HPCの歩み50年(第113回)-2004年(j)-

小柳 義夫 (高度情報科学技術研究機構)

64ビットプロセッサの競争が続いている。x86-64アーキテクチャのOpteronやAthlonを開発していたAMDは快進撃。かねてから予想はされていたが、Itaniumの開発を進めているIntel社が、x86アーキテクチャの64ビット拡張のチップを発売すると発表した。Itaniumの命運はいかに?

アメリカの企業の動き

1) HP(Hewlett-Packard)社
HP社は、1994年からIntel社とEPIC (Explicitly Parallel Instruction Computing, IA-64、コード名Merced)を開発してきた経緯があり、64ビットサーバには歴史的なAlphaを別にすれば、Itaniumプロセッサを使うものと考えられてきた。Itaniumサーバとしては、2003年7月に「HP Integrity NonStopサーバ」を発表している。

ところが2004年1月27日付けのCNET Newsによると、HP社がAMD社のOpteronプロセッサを搭載したサーバを発売する計画を進めているとのことである。IBMとSun Microsystemsについで大手では3社目である。「HPよ、おまえもか!」HPもAMDも口が重かったが、HP社の関係者は「いくつかの市場分野でx86拡張技術を求める需要があり、どのような選択肢があるか評価している。」と述べた(HPCwire 2月4日)。残るDellはAMDチップをこれまで採用して来なかったが、Intelが発表すると予想されているx86-64を採用する予定。

HP社は2004年2月24日、HP ProLiantサーバ系列に、AMD Opteron x86プロセッサの64ビット拡張を加える」と正式に発表した。32ビットのXeonサーバや、Itaniumを用いたIntegrityも継続するとのことである。

ところがWall Street Journalは9月26日、HP社はItaniumを搭載したデスクトップ型のワークステーションの販売を停止すると報じた。Integrityサーバは継続する模様。そして、12月15日、HP社とIntel社は、10年にわたるItaniumの共同開発契約を終了し、HPのItanium開発チームはIntelに吸収されると発表した。HP社はItaniumの開発から手を引き、ハイエンドサーバの開発に集中する。PA-RISCプロセッサの最後のアップグレードを2004年の夏にリリースして、これを搭載したシステムを2008年まで販売することと、2006年にはAlphaプロセッサ搭載サーバの販売も停止することが発表された。

2) AMD社
勢いづいたAMD社は5月、Opteronの新製品Models 850, 250, 150を発表した。製造プロセスはこれまで130 nmであったが、微細化が進み90 nmテクノロジを用いる。また6月には、dual coreプロセッサの設計を完了したと発表した。これは2005年5月に登場した。x86プロセッサでは初めての複数コアのプロセッサであった。

またAthlonについては、6月にAthlon 64ファミリに4個のモデルAthlon 64 FX-53およびAthlon 64 3800+, 37oo+,3500を加えた。Athlon 64はHyperTransportが1本しかなく、シングルプロセッサのみをサポートする。8月には、90 nmでモバイル用の低電力AMD Athlon 64プロセッサを発表し、10月出荷した。

2004年5月、IBM社とOracle社はAMD64向けにデータベースソフトの最適化を行っているとAMD社が発表した。

3) Intel社 (x86-64)
膨大な時間,エネルギー,資金をItanium開発に費やしたIntel社も、64ビットの“第2案”を用意しているのではないかという噂は前から流れていた。2002年1月28日のZDnetの記事によると、Intel社はPentium familyの次世代のPrescottに、AMD64と同様な64ビット機能を載せるのではないかという憶測を載せている。Intel関係者は、このようなバックアッププランの存在を認めながらも、「Itaniumは今後20年以上続くアーキテクチャの基礎となるものだ」と強気であった。そうでないと、これまでの投資は無駄になってしまう。

2004年に入り、Intel社の会長兼COOであるPaul Otelliniは、1月28日に、Wall Street Journalに対し、「アプリやOSなどのソフトウェアが開発されれば32ビットプロセッサを64ビットプロセッサに更新することになるであろう」と述べた。Intel社もついに舵を切ったと報道された。

Intel社のCraig Barrett CEOは、2月17日、San Franciscoで開催されているIntel Developer Forumの基調講演のなかで、Naconaというコード名で呼ばれる64ビットプロセッサの発表を行った。曰く、「Intelがこれを開発しているということは、San Franciscoで最もよく知られた秘密であった。」2プロセッサ搭載サーバ向けのNaconaは本年第2四半期に登場し、そのあと32/64ビット機能を搭載したPrescottも登場する。2005年には、4基以上のプロセッサを搭載するサーバ用のPotomacが登場する。ただ、PC用の64ビット機能を入れたプロセッサを出す計画は当面ない、と述べた。しかし、9月7日のIntel Developers Forumにおいて、Otellini会長兼COOは、2005年上半期に、64ビットWindowsの発表に合わせてPC用の64ビットプロセッサを出荷すると発表した。

ではItaniumはどうなるのか。Dell社のNeil Handは両者が直接競合しないだろうと述べている。Itaniumはほとんどハイエンドのコンピュータで使われているからである。

AMD64と互換性はあるのか、互換ならISAの著作権はどうなるのか心配する向きがあった。昔、日本電気のVシリーズは80×86の侵害だとIntel社からクレームが出ていたようである。ところが、Intel社とAMD社の互換CPU訴訟の和解内容では、Intel社はAMDのx86-64などの拡張機能に対し、ライセンス料を払わず利用できるとのことであった。2001年に両社はクロスライセンス契約を10年間更新した。2003年のところで述べたように、Microsoft社は、「もしIntel社が(命令セットを変えずに)64ビットのデスクトップチップを出すならば」AMD64用のWindows XPはその上でも動くと述べた。そして、「複数の版を管理したくないので、(Intelのために)リコンパイルする予定はない」と付け加えた。この時点で、Intelがx86-64のプロセッサを出すという発表はされてなかったが、このニュースを聞いて「ハハーン」と直感した人は少なくなかった。ただ、IntelのSSE3とAMDの3D-Now!は互換でない。また、かつて問題になったProcessor IDはIntelにしかない。Intel compilerが、それを見てAMDプロセッサでは走らなくするか、などとの議論もあった。2004年3月12日付けのHPCwireで、OctigaBay Systems社のPaul Terry CTOが両社の比較を行っている。

早速、日本のさる研究者が実験し、Intel Compiler の Version 8.0 から、Pentium4向けのコンパイラオプションとして、今までの -xW オプションに加えて、-xN(Northwood)、-xP(Prescott)、-xB(Banias)オプションが加わり、これらの新しいオプションを用いてコンパイルした実行ファイルは、Intel以外のCPUで実行できないことを確認したとのことである。

Intel社は64ビット拡張のx86命令セットの名称を何度も変更した。2004年2月のIntel Developers ForumではCT (Clackamas Technology)と名付けたが、その数週間後にIA-32e (IA-32 extensions)と変え、2004年4月にはこれをEMT64T (Extended Memory 64 Technology)という名前で公式に発表した。ところが、2006年7月27日なって、Intel 64と改称した。(Wikipediaによる)

4) Intel (x86)
32ビットでは高クロック路線に暗雲がかかっていた。2000年のPentium 4で初めて採用されたNetBurstマイクロアーキテクチャ(x86では8代目)は、クロック当たりの処理を減らす代わりにパイプライン段数を増やして、性能を向上させるという方針に基づいていた。消費電力は動作クロックに比例し大きくなるので、微細化により動作電圧を下げてバランスを取っていた。ところが90nmでは微細化によりリーク電流が問題になり、消費電力が下がらなくなった。

かねがね噂されていたが、CNET Japanの報道によれば、Intel社は2004年10月14日、4 GHzで動作するPentium 4の開発を遂に断念したことを発表した。Intel社は今後キャッシュサイズの増強によって性能を向上させる計画とのことである。Pentium 4の動作クロックは、2004年11月に発表された3.8 GHzが最高となった。今後NetBurstから次のマイクロアーキテクチャに移ることになるであろう。2005年にはdual core版を出荷する予定。

これまでx86では命令レベル並列度が上がらないことから、Itaniumの優位性が主張されてきたが、今後マルチコア化が進み、設計の重点が、単一スレッドの高速化よりも、マルチコアによる高速化、それを支えるプロセッサ間、メモリ、I/Oバンド幅の確保に移動していることが予想される。こんなにXeonを進化させてしまうと、ItaniumのIA84アーキテクチャとしての優位性はなくなるのではないか、という心配が出て来る。

5) Intel (Itanium)
Intel社は新しいItanium 2ファミリ(コード名Madison)を2003年に発表したが、その後大きな動きはない。これは130 nmプロセスで製造され、2006年6月にMontecitoが発表されるまで大きな技術的変化はない。Top500の上位に来るような最先端のマシンにはItanium 2がよく使われている。

さる日本国内での報告によると、4 PEのItanium 2マシンで、SX-5用のベクトルコードを移植したところ、自動並列化によりSX-5を上回る性能を出したという。等間隔のベクトル演算なら、rotate命令によりベクトル的に実行することができる。

6) IBM社(POWER)
2003年のHot Chips会議でIBM社はPOWER5の技術情報を初めて公開した。更に詳しい情報は2003年10月14日のMicroprocessor Forum 2003で発表された。基本的にPOWER4を改良したもので、dual core。2-way SMT (Simultaneous Multithreading)をサポートする。L2キャッシュは共用で1.875 MB、10-way set-associativeである。L3キャッシュはPOWER4と異なりon-packageで、容量は36 MB。メモリコントローラもチップ上にあり、64 GBのDDRかDDR2をサポートする。

POWER5を搭載したシステムは2004年に登場した。競争相手は、IntelのItanium 2と、Sun MicrosystemsのUltraSPARC IVと、富士通のSPARC64 Vであった。2005年にはPOWER5+に置き換えられた。

DODは2004年8月、NAVOCEANO (Naval Oceanographic Office) Major Shared Resource CenterにPOWER4+を搭載したスーパーコンピュータを選定したと発表した。これはPOWER4+ 2C 1.7 GHzを搭載したp655を結合したもので、コア数は2944である。2004年11月のTop500では、Rmax=10.310、Rpeak=20.0192で9位にランクしている。

7) IBM社(BlueGene/L)
IBM社が、1999年12月6日にBlueGeneという名前の超並列コンピュータを$100Mかけて開発すると発表してから5年が経過しようとしていた。紆余曲折のすえ、2004年後半にどうやらBleuGene/Lが動き出した。Lの意味は“light”とも“Livermore”とも言われている。

9月、Lyonにいた松岡聡がDongarraから、Rochester(Minnesota州)のIBM施設のBleuGene/L 12ラックで50 TFlopsを出したとの話を聞いた。地球シミュレータもこれでトップを譲ることになりそうである。ダークホースはNASAのColumbia (SGI)である。

2004年9月29日、IBM社は「BlueGeneのプロトタイプ(1/4サイズ)が9月16日Linpack性能36.01 TFlopsを出し、35.96 TFlopsの地球シミュレータの性能を抜いた」と記者団にプレ発表を行った。ちょっとせこい数字である。ピーク性能は90 TFlopsなので効率も悪い。正式発表は明日とのこと。2005年にはLLNLにフルサイズで納入される予定。

DOEは11月4日、BlueGene/LがLinpackで70.72 TFlopsの性能を記録したと発表した。チューニングが進んだのであろう。これが2004年11月のTop500のRmaxとなった。

SC2004のTop500の項で述べたように、NASAのColumbia (SGI製)は10月27日Linpackで42.71 TFlopsを記録したので、その時点ではBlueGene/Lを上回っていたが、BlueGene/Lはそれを追い抜いたことになる。最終的なTop500の結果は前述のSC2004のところにある。

日本IBM社の項にも書いたが、その少し前の2004年9月7日、産総研(産業技術総合研究所、AIST)生命情報科学研究センター(センター長・秋山泰)が、たんぱく質の構造解析による新薬の開発などのために、BlueGene/Lを2005年2月に導入すると発表した。産総研は東京・お台場に建設中の「バイオ・IT融合研究棟(仮称)」内にBlueGene/Lを設置する。4ラックでピーク22.8 TFlops。IBM社としては、LLNLに64ラックを、Astron(電波望遠鏡プロジェクト)に6ラックを、ANLに1ラックを販売しているので産総研は4件目となる。

さてここで例の匿名の辛口の論客HEC (High-End Crusader)が食ってかかった(HPCwire 2004年10月1日号)。IBM社はBlueGene/Lが地球シミュレータを打ち負かして世界最高速のコンピュータとなったと主張するが、Linpack性能は大きなLinuxクラスタを作れば原理的にいくらでも大きくなるので、コンピュータの真の性能を表現するものではない、と述べている。世の中にはhigh-bandwidth application/algorithmとlow-bandwidth application/algorithmが存在し、前者(今の言葉ではcapability computing)は頻繁な小粒度の長距離通信を必要とし、high-bandwidthな並列システム出なければ性能が出ないのに対し、後者(capacity computing)は多くの場合、小規模な大粒度の近距離通信が中心で、どんな並列システムでもそこそこの性能が出る。BlueGene/Lは後者の一例に過ぎない。

この論述に対し匿名の論客AR氏から異論が出てきたらしく、HECは10月8日付けで「BlueGene/Lの弁護者」への反論を書いている。「ARは、HECは、低コスト、低消費電力、省スペースを可能にしたBlueGene/Lの高度な実装技術を無視していると批判している。高度な実装技術はその通りである。スペースの関係で触れられなかった。ただ、低コストを言うのは不誠実だ。Linpack性能は、浮動小数演算器を増やしさえすれば、メモリバンド幅、結合網、同期機構などに金を掛けなくても上げることができる。ARは、アルゴリズムやプログラミングの工夫により、そういう安いマシンでも性能を上げるように書き換えることができるというが、それは誤りである。実用問題の中には、capability computingをどうしても必要とするものがあるのだ。」

8) IBM社(メインフレーム、サーバ)
IBM社がSystem/360を発表したのは1964年4月7日(日本では8日)であり、本年はその40周年であった。IBM社はこれを記念して、4月にMountain ViewのMuseum of Computer Historyにおいて記念式典を行い、System/360の開発に貢献したErich Bloch、Fred Brooks、Bob Evansなどのキーパーソンを招待した。これはこの博物館のレクチャー・シリーズの一環であり、“The 40th Anniversary of the Computer that Changed Everything: The IBM System/360”と名付けられた。なお、Erich Blochは昨年2016年11月25日、91歳で死去した。

サーバでは、2004年3月19日、IntelliStation A Proワークステーションを発表した。世界の主要なベンダとしては最初のAMD Opteron搭載のワークステーションであった。2個のOpteron Model 248(2.2 GHz)を搭載している。当然のことながら、64ビットとともに従来の32ビットのアプリケーションも高速に動くことを宣伝していた。グラフィックのためNVIDIA Quadro FXを搭載し、2次元/3次元の可視化を提供する。

9月にはdual core Opteronを搭載したサーバIBM eServer326を発表した。これはXtended Design Architectureを採用し、メインフレーム以来の技術により信頼性を向上させる。これは、高速I/O、システム管理、統合RAID、発熱に対応するCalibrated Vectored Coolingなどを提供する。最初の出荷は9月であり、10月15日には一般に発売する。OSとしては、Red Hat RHEL 3.0、Novell SuSE SLES 9.0、Windows 2003から選べる。IBM社は2004年8月5日、米国陸軍研究所のARL MSRC (Army Research Laboratory Major Shared Resource Center)に、dual Opteron (2.2 GHz)を搭載するIBM eServer 325を1186台をMyrinetで結合し、SUSE Linuxが動作するスーパーコンピュータを導入すると発表した。2004年11月のTop500では、Rmax=7.185 TFlops、Rpeak=10.208 TFlopsで23位にランクしている。

さらにOpteronのクラスタシステムIBM eServer 1350を、2004年第4四半期に発売すると発表した。TeraGridではItaniumの大規模システムを構築しているが、一般のサーバではOpteron路線まっしぐらである。

9) Sun Microsystems
Sun Microsystems社は、2004年2月、Sun Fire 25Kを発表した。これはdual core UltraSPARC IV+ プロセッサ(1.95 GHzまで)を最大72個搭載できる。ボード当たり64 GBのRAMを搭載でき、ドメイン当たり最大1.15 TB搭載できる。コード名は UltraSPARC IVがJaguar、IV+がPantherである。

UltraSPARC IVは3月に発表された初めてのmulti-core SPARCプロセッサであり、Texas Instruments社の130 nmテクノロジーで製造される。ISAはSPARC V9である。これはUltraSPARC IIIのコアを改良して2個搭載したものである。この後、UltraSPARC V(コード名Millennium)が続くはずであったが、後に述べる経営危機により2004年前半にこの計画はキャンセルされた。後を継いだ富士通のSPARC64 VI+である。Sun Fire 25Kは2005年6月のTop500に1件だけ載っている。その後はOpteron搭載のFireが登場したので、25Kはあまり売れなかったようである。

順位 設置場所 システム コア数 Rmax Rpeak
180 Archen大学(ドイツ) Sun Fire 25K/6900 Cluster 672 2.0544 3.0528

 

何月かは不明であるが、Opteronを搭載したSun Fire V20z、Fun Fire V40zサーバや、Java Workstation W1100z and W2100zを登場させた。

Sun Microsystems社は2004年2月29日~3月5日に、スペインのマドリッドのWestin Palace HotelにおいてSun ERC (Worldwide Education and Research Conference)を開催した。誘われたので筆者も自分の研究費で参加した。新しいSun Fireとともに、同社のN1 Grid computing solutionが世界中の大学で採用されていることが強調された。

マドリッドからは無事帰ったのであるが、次の週にバチカンで教皇庁文化評議会総会があり、今度はローマに滞在していた。3月11日(木)の朝9時から会議が始まってまもなく、会長が基調演説をしている最中に、マドリッド大司教が突然「今、マドリッドで大変なことが起こっている。100人以上の死者が出ている。私は今すぐ帰る。皆様のお祈りをお願いします。」と叫んで出て行ってしまった。これがマドリッドのアトーチャ駅付近の同時爆弾テロで、アメリカの9.11からちょうど911日目であった。1週間ずれていたら、自分も巻き込まれた可能性があり、背筋が寒くなった。場末の安宿に泊まっていたのでテレビはイタリア語チャンネルしか見られなかったが、スペイン中で100万人のテロ反対デモがわき起こっている様子はわかった。

さて、ERCの直後3月5日に、アメリカの格付け機関S&P (Standard and Poor’s)は、Sun Microsystems社をBBBから投資不適格級のBB+へ2段階引き下げた。S&Pは引き下げ理由について、「収益低迷が長引いているうえ、サンが主力事業とする企業向けコンピュータ市場の競争は激しく、将来の大幅増益は見込みにくい」と説明している。一方、Sun側は「保有する現金類は$5.2Bと負債額の3倍もある」と財務の健全性を強調している。

4月12日、Sun Microsystems社は業務縮小の一環として、2005年後半に登場するはずだったUltraSPARC Vと、web server向けのdual coreのGeminiの開発を中止したと発表した。UltraSPARC Vはテープアウトが終わっていたという。その代わり、2006年から2007年にかけてmulticore-multi threadのNiagaraを出す予定とのことであった。アナリストによると、Sun Microsystemsのプロセッサは、ここ数年IBMやIntelなどのプロセッサに性能面で遅れを取っているとともに、製品の出荷延期も続いていた。たとえば2000年に出荷が予定されていたUltraSPARC IIIが実際に製造ラインに載ったのは2002年になってしまった。Sun Microsystems社は3300人の社員を解雇する予定だが、UltraSPARC VやGeminiのプロジェクト要員の多くは社内に残るとのことである。

時も時、XML 1.0の起草者の一人であるTim Brayが、3月、Sun Microsystems社に入社しウェブ技術部門のディレクタに就任した。XMLの父Jon Bosak(Sun Microsystems社所属)が誘ったのではないかと言われている。2010年にGoogle社に移籍した。

他方、2003年4月にHPC担当副社長に指名されたばかりのShahin Khanが、7月初めSun Microsystems社を去ることが公表された。これは同社のHPCグループ再編成の一環である。かれは1983年にIBMに入社し、その後FPS (Floating Point Systems)社に移籍しヨーロッパ営業主任を務めた。筆者が彼と最初に会ったのは1986年で、Cornell大学Theory CenterにFPS社のT-seriesを見に行ったが、そのとき案内してくださった。FPS社はCray社に吸収されたが、Cray社がSGI社に吸収されたとき、元FPSの部分はSun Microsystemsに買収された。かれはそれに伴ってSun Microsystems社に移った。かれはそこでE10000 (Starfire)の世界中の販売を手がけていた。その後Oracleなどを経て、Scale Arc社の販売担当副社長を務めている。

さらに11月、同社のOSであるSolaris 10の性能を高めるとともに、これを無料にすると発表した。このOSはUltraSPARCだけでなくOpteronでも高性能で利用できる。種々のオープンソースのlinuxに対抗するためと思われる。正式なリリースは2005年1月31日。

アメリカ企業の後半は次回。CrayはOctigaBay社を買収し、その技術でCray XD1を売り出した。

(タイトル画像: UltraSPARC IV 出典:Wikipedia)

left-arrow   50history-bottom   right-arrow