世界のスーパーコンピュータとそれを動かす人々


7月 8, 2019

HPCの歩み50年(第204回)-2011年(p)-

小柳 義夫 (高度情報科学技術研究機構)

IBM社はBlue Watersからは撤退したものの、同じ技術と思われるものをPOWER7 775という名称で正式発表し出荷した。Blue Gene/QのCPUチップの詳細が発表された。なんと18コア。Intel社は、同社が開発したTri-Gateと呼ぶ3Dトランジスタ技術を22nm世代から量産に適用すると発表した。

アメリカの企業の動き

1) Cray社(XE6)
Cray XE6(コード名Baker)は、2010年5月25日に発表された。主要な設置場所は2010年のところに記した。2011年11月に京都大学学術情報メディアセンターに導入されると発表された(日本の大学センター等の項参照)。稼働は2012年5月の予定。

2) Cray (XK6)
去年のSCから話は出ていたが、2011年5月24日、Cray社が初めてGPUを装備したスーパーコンピュータXK6を発表した。CPUはAMDの16コアチップOpteron 6200(コード名Interlagos)、GPUはX2090(M2090のコンパクト版)で、最大構成では50 PFlopsになるとのことである。XE6の各ブレード上のCPUソケット8基のうち4基分をNVIDA Tesla GPUモジュールに置き換えている。

ソフトウェア面では、Cray Linux Environment(CLE)を含むソフトウェアスタックとプログラミング環境をXE6から継承している。 NVIDIAのCUDA SDKなど、GPU用のプログラミングライブラリーが追加されており、PGIコンパイラもGPU用のコード生成に対応している。「わが社はそもそもベクトル用コンパイラの長い経験を持っている」と、製品担当副社長のBarry Boldingは豪語した。

最初の顧客としてスイスのCSCSを予定していたが、実際には次世代のXK7が設置された。

3) IBM (POWER7)
米IBM社は、2011年4月12日、従来のPower 750の性能をさらに向上させたPOWER7サーバを発表した。7月には、Blue Watersの計算筐体と同じと思われるものをPOWER7 775という名称で正式発表し、8月26日から出荷することになっている。新製品は以下の通り:

(a) IBM BladeCenter PS703 (16-core)およびIBM BladeCenter PS704 (32-core)
(b) IBM Power 750 Express (enhanced version) (32-core)
(c) IBM Power 755 (enhanced version) (32-core)

4) IBM (Blue Gene)
3代目のBlue GeneであるBlue Gene/Qは、LLNLやANLに導入されることは発表されていたが、その詳細は不明であった。

2011年8月17日からStanford大学で開催されたHot Chips 23において、詳しいデータが公表された。ダイの写真によるとPU00からPU17まで見え、18コアらしい。中途半端な気がするが、計算に使うのは16コアだけで、1つはOS用、もう1つは予備とのことである。POWERファミリのCPUが商用・HPC用の両方を狙っていたのに対し、Blue Geneは純粋にHPC用である。

Blue Gene/Qは、POWER7と同様に、IBMの45 nm SOI技術を用いている。このチップは専用設計ではあるが、汎用のPowerPC A2コアを用いている。A2コアは、クロックは1.6 GHzと速くないが、エネルギー効率がよく、ピークで55 Wである。さらにエネルギーを節約するために高度なクロック・ゲーティングを用いている。

とはいえ、16コアが計算に使われ、各コアは4スレッドまで走り、クロック当たり4個の浮動小数演算が実行できるので、プロセッサ当たり204 GFlopsである。POWER7は、8コアで3.5 GHzのクロックで走り、256 GFlopsの性能を持つ(原記事ママ)が、200Wも消費する。エネルギー効率は3倍近くよい。6月のGreen500のトップはBlue Gene/Qのプロトタイプで、Linpackで2.1 GFlops/wを達成しており、最新のGPUや「京」のCPUよりよい。また、これまでのBlue Geneと比べても優れている。3種を比較すると、以下の通り

Version

Core Arch.

Core Count

Clock

Peak Perf

Blue Gene/L

PowerPC 440

2

700 MHz

5.6 GFlops

Blue Gene/P

PowerPC 450

4

850 MHz

13.6 GFlops

Blue Gene/Q

PowerPC A2

18

1600 MHz

204.8 GFlops

 

以前のBleu Geneと同様、プロセッサチップ内にeDRAM (embedded DRAM)を用いている。特に、コア間共有のLevel 2 cahceは、SRAMより容量を増やすことができ、Bleu Gene/Qでは32 MBである。また、共有データを保護するためにtransactional memoryという新しい仕組みを導入した。

IBM社は2011年11月15日、Blue Gene/Qを正式に発表した。2011年12月上旬からLLNLへ96台のラックの納入を開始する。

Blue Gene/Qのラックは、これまでと同様に筐体の前面が斜めのデザインになっている。これは本来空調のためであり、Blue Gene/Qは水冷なので不必要なのであるが、斜めでないとBlue Geneらしくない、ということでわざと斜めにしているとのことである。

なお、Blue GeneシリーズはQで終わりであり、この技術は将来のPOWER chipに組み込むとのことであある。Cell B.E.のときも同じようなセリフを聞いた覚えがある。

5) IBM社(Watson)
IBM社は、2009年に、開発中の質疑応答システムWatsonで、人気クイズ番組Jeopardy!に挑戦すると発表していたが、2011年1月13日には、Thomas J. Watson研究所でWatsonを公開し、Jeopardy!での人間との対戦デモが行われた。2011年2月4日からの本対戦では、初日は引き分けたが、総合ではWatsonが勝利し、賞金$1Mを獲得した。

6) Intel社 (roadmap)
2011年4月12日~13日に北京の国家会議中心においてIntel Developer Forumが開催された。13日の基調講演において、副社長のKirk Skaugenが講演し、IA (Intel Architecture)の方針などを説明した。Skaugenは「2012年のプラットフォームに、USB 3.0の機能を統合する」と述べ、2012年にリリースされる、次世代Coreプロセッサ向けのプラットフォームにおいてUSB 3.0の機能をチップセットに統合していく方針を、公式で初めて明らかにした。また、Intelのcloud computingに関する方針「Intel Cloud Computing Vision 2015」という構想を紹介したほか、Many Integrated Core(MIC)と呼ばれる数多くのx86プロセッサをPCI Expressの拡張カードに統合したHPC用のモジュールの提供を開始したことを明らかにした。

さらにSkaugenは「2012年に、初めてAtomマイクロアーキテクチャを採用したサーバープロセッサを投入する。その消費電力は10W以下になる」と述べた。これは、x64、ECC、VTなどサーバ向けの機能はフルに実装された製品になるという。

最後にSkaugenは、IntelがItaniumへのコミットメントを続けると確言した。この直前には、Oracle社がItanium向けのソフトウェア開発を打ち切ると発表していた。次世代製品となるPolusonは2012年に投入すると述べた。また、IntelがKnights Ferryとして開発を続けている、Intel Many Integrated Core(MIC)に関しても、ソフトウェアの研究開発などのために、今年の終わりまでに100以上のユーザに対して提供することを明らかにした。

7) Intel社(半導体)
2011年5月4日、Intel社は、同社が開発したTri-Gateと呼ぶ3Dトランジスタ技術を22nm世代から(テストでなく)量産に適用すると発表した。利点は、リーク電流の抑制、アクティブ電力の低減、トランジスタのスピードの向上、トランジスタの小型化などである。同技術の採用で、現行のトランジスタ技術より性能が高く、かつ低消費電力のマイクロプロセサ製品を実現できると同社は述べている。Tri-Gateを最初に採用するのは、Sandy Bridgeマイクロアーキテクチャに基づくIvy Bridgeプロセッサとのことである。Intel社によると、Ivy Bridgeの量産準備は2011年末までに整えるという。他社も3Dトランジスタ技術開発を進めているが、16nm世代からのようで、Intel社は3年先行すると述べている。Intel社は、Planar型トランジスタを22nmでは使わない。22nmプロセスで他社よりも1~2世代早く3Dトランジスタを採用したIntelは、大胆な賭けに出たことになる。

8) Intel社 (x86)
Intel社は、2011年1月6日~9日にLas Vegasで開催されるInternational CES (Consumer Electronics Show)を前に、1月2日、Sandy Bridgeというコード名で呼ばれていたCPU「Core iシリーズ」の詳細を正式に発表した。Nehalemに続く新Coreシリーズである。これらのチップの正式名称は、従来製品と同じCore i3、Core i5、Core i7になる予定である。第2世代のCoreプロセッサの主だった点は、より高いエネルギー効率と改良された3Dおよびグラフィックス機能などであるという。IntelのTurbo Boost技術の最新版であるTurbo Boost 2.0は、過熱しないように熱管理しつつ、動的な負荷に応じてベースクロック速度を超える性能を各コアで実現する。また、ひとつのパッケージにCPUとGPUの2つのダイを内蔵した旧Core iと違い、今回の新Core iシリーズは半導体レベルでCPUとGPUを統合している。そのため、旧Core iではGPU部分は45nmプロセスで製造されていたものが、ともに32nmプロセスで製造、L3 cacheの共有で高速化、消費電力も削減された。また新たに内蔵GPUがGPGPUに対応した。新規導入が必要なマザーボードは、“P67”と内蔵GPUを使える“H67”チップセットが登場の見込みである。

このほかAVX(Advanced Vector Extensions)と呼ぶ256ビット演算用の命令や、Turbo Boostを強化したTurbo Boost 2.0の実装もポイントだ。Turbo Boost 2.0ではこれまでのアルゴリズムを見直し、熱的な余裕も考慮して、より高い周波数に引き上げられるようにした。

2011年9月13日~15日にSan Fransiscoで開催されたIDF (Intel Developer Forum)において、2012年前半に投入予定のIvy Bridgeプロセッサの詳細を明らかにした。これは、現在のSandy Bridgeを32nmから22nmに縮小したものであるが、単なる微細化版でなく、DirectX 11に対応すると同時に、より汎用性が高くメディア処理性能の高いコアにしている。

9) Intel社 (Itanium)
他方IA64では、2010年2月9日にItanium 9300(コード名Tukwila、4-core)が発表されていたが、2011年3月21日、頼みのOracle社が、「Intel Itaniumプロセッサ上のすべてのソフトウェア開発を終了する。」と発表した。Intel社の戦略的重点がItaniumではなく、x86マイクロプロセッサであるから、と理由を述べている。「HP (Hewlett-Packard)社だって、Leo Apoltheker CEOはHPCの将来方向を述べるに際し、Itaniumについて一言も触れていない。」

HP社は激怒した。これは、HP社のサーバ上でOracle Databaseを使っているユーザを、自社のSPARCベースのサーバに誘導する陰謀ではないか。David Donatelli副社長は、「企業や政府機関は、これまで何億ドルも投資してきたが、Oracleはそれをドブに捨てさせる気か?」と述べた。Oracle社はこれに反論した。「とんでもない。Oracle社は、いかなるソフトウェア製品やハードウェアプラットフォームであっても、そのサポートを中止するときは、顧客に対し、十分な時間を取って通知する義務を負っている。従って、我々の顧客は、自分のビジネスを計画するに十分な情報を得ている。HP社だって、Intelの将来方向がx86にあり、Itaniumをx86に置き換える計画が進んでいることをよく知っている。HP社とOracle社の共同の顧客に対し、この情報をわざと伝えていないのはHP社の方だ。たしかに、Oracleソフトウェアの新版はItanium上では動かないが、現在のItanium上のOracleソフトウェアのサポートは継続する。わが社はItanium上のソフトウェアを最後まで守ってきたのだ。」

Intel社も不快に感じて、Paul Otellini社長兼CEOは、「Intel社は、Itaniumプロセッサとプラットフォームの開発は、何世代にもわたって衰えることなく計画通り継続する。」と述べた。「計画通り(on schedule)」は少し怪しいが。とはいえ、ItaniumマシンはTop500にわずか5台しかなく、Bull社やSGI社ももはやItainumのHPCマシンを開発していない。HP社だって、HP-UX OSを搭載したビジネス用のIntegrityに使っているだけである。

3か月後の6月15日、HP社は、Santa Clara郡にあるカリフォルニア州裁判所にOracle社を提訴し、「Oracle社は、HP社のハイエンド・サーバで使われるItaniumプロセッサをサポートし続けるという契約を破った」と訴えた。Oracle社はこの訴訟を裁判権の乱用であり、「SAP SE社のLeo ApothekerがHP社の新CEOになると知っていたら、HP社のItaniumサーバ用のソフトなど開発しなかった。」と述べた。HP社がこだわったのは、HP社は、Itaniumの共同開発契約終了後、Intel社に対し、Itaniumプロセッサの開発・製造を2009年から2014年まで継続するために、2008年に$440Mを支払っていたからである。2010年には、Intel社がItaniumプロセッサを2017年まで製造することを義務づけて、さらに$250Mを支払うことに合意した。この合意にOracle社がどう関係していたのであろうか。

Santa Clara郡裁判所は翌2012年8月1日に、Oracleに対して、Itanium向けソフトの新バージョンを開発するよう命じる判決を下した。この判決を受けてOracle社は、2012年9月4日にOracle DBなどの主要ソフトの新バージョンをItaniumサーバ向けに提供すると発表した。

Intel社は、Itaniumの将来計画について、32nmプロセスを採用したPoulsonを2012年に投入する計画である。8コアで、54MBのオンダイ・キャッシュ(50MB SRAM)、31億トランジスタとなる予定とするほか、その後継となるKittson(開発コード名)についても、「Itaniumについては2年サイクルで製品投入を図る計画」としており、今後も継続してサポートしていくと述べた。

結局、Itanium 9700(コード名Kittson)は2017年にリリースされたが、これが最後で、2020年1月3日が最終受注日、2021年7月29日は最終出荷日で、Itaniumの共同開発の発表以来27年の苦しい歴史を閉じることになった。

10) Intel社 (MIC)
紆余曲折のあったIntel MIC (Many Integrated Core)は50 coreまでのx86 coreの集まりで、extra-wideなSIMD unitを持つ。Knights Ferry (KNF)という試作チップは、1.2 GHzで動く32個のx86 coreから成り、各coreは4ウェイのSMPをサポートするので、全体では128スレッドが動く。このチップは、8 MBのキャッシュと、1~2 GBのGDDR5 DRAMを持つ。PCIeバスで繋ぎコプロセッサとして動作する。Forschungszentrum Juelich、LRZ、CERN、KISTIなど一部パートナーに対してはMICソフトウェア開発プラットフォームとして提供している。

最初の商品となるのは、Knights Corner (KNC)と呼ばれ、最大50コア、Tri-gateトランジスタを用いた22nmプロセスで製造する。おそらく2012年の後半には出ると思われる。TACCのStampedeは、KNCのクラスタである。GPUと違って、OpenMPそのままで並列に動くところが味噌のようである。

Intel社は、6月のISC11において、これによりエクサフロップスを実現すると豪語した。

11) Intel (Federal)
Intel社の日本法人であるインテルは2011年8月31日、新成長分野に対する戦略を立案する100%子会社「Intel社 (Federal)」を設立したことを発表し、同日、都内で同社のデータセンターおよびHPC分野に対する取り組みの説明会を開催した。

Intelの副社長兼データセンター・コネクテッド・システム事業部長のKirk Skaugen氏は、「Intel Federalは世界最高のスパコンを作り上げることを目的として米国政府と協力して立ち上げた」と米国政府との緊密性をアピールするが、その一方で、「もちろん、米国だけでなく、他国の政府とも協業していくつもりもある」と、それだけではないことも説明することを忘れなかった。

MICアーキテクチャを実装したKnights Ferryはすでに各国の研究機関などに提供されている。日本でも東京大学に提供され、ソフトウェアの開発などが進められている。実際にKnights Ferryを用いている同大大学院情報理工学系研究科コンピュータ科学専攻の石川裕教授は、「メニーコア搭載クラスタによる高性能計算環境の開発を進めており、MICアーキテクチャによる浮動小数点演算処理のやり方も考える必要があるということで研究している」と説明する。マイコミジャーナルには石川裕教授の写真付きの記事が載っていた。

12) AMD社(経営)
2011年1月10日、AMD (Advanced Micro Devices)社のDirk Meyer CEOが辞任した。これは、成長著しいモバイル市場への進出に消極的な同氏に取締役会がいら立ちを募らせたのが原因だったと、The Wall Street Journalが報じている。Meyer氏は2008年7月、AMDがIntelの陰で市場シェアを獲得しようと苦心していた時期に、Hector Ruiz氏からCEOの座を引き継いだ。2年半にわたるMeyer氏の在任期間中、AMDは組織再編とレイオフを余儀なくされた。

13) AMD社 (x86)
AMD社は、SC11に合わせて、2011年11月14日、Opteron 6200 Series(コード名Interlagos)とOpteron 4200 Series(コード名Valencia)という新しいプロセッサの出荷を発表した。いずれも「AMD FX」シリーズと同じく、最新のBulldozer coreを採用する製品である。同社は、これらの製品により、サーバ市場におけるシェアを回復し、時代の要請に応えられるメーカになることを目指す。

主な特長は次の通りである。

・コア数は4 coreから16 core
・1コアあたり4.375 Wの優れた電力効率
・1 CPUあたり最大12枚のDIMMを接続でき、1CPUあたり384 GBまでのメモリ に対応

HP社、Cray社、AMAX社、IBM社、およびDell社が新Opteronへの対応を表明している。

14) AMD (GPU)
AMD社は、Las Vegasで開催されるInternational CESの直前、2011年1月4日、新設計のCPUコアとDirectX 11対応のグラフィックス機能を1つのダイに統合した新型CPU、EシリーズとCシリーズを正式に発表した。低価格ノートPCやディスプレイ一体型PCに向けた製品で、同社はCPUに代わる言葉として「APU(Accelerated Processing Unit)」と呼んでいる。TDP(熱設計電力、実使用上の最大消費電力)が9W、18Wと低いのが特徴である。PCメーカ各社から搭載製品が登場する見込みだ。HPCとは直接の関係はないと思うが、影響は大きいのではないか。

15) IntelとAMDの新たな競争
というわけで、Intel社とAMD社とは、新たな競争に入った。それは、CPUとGPUの統合である。しかし、両社はその目的を達成するために、それぞれ異なる部分に力を入れている。CNET NewのBrooke Crothersの記事から紹介する。

AMDは自社製品の方が進歩的であると主張しており、その理由を、グラフィックスチップ部門ATIを通してGPUも供給し、MicrosoftのDirectXやAppleのOpenCLのような主要マルチメディアテクノロジを活用するグラフィックスへの取り組みを強化しているためとしている。

他方Intel社は、自分たちの方が優位に立っていると考えている。なぜならIntel社は同社の最先端の製造テクノロジによって、より早い時期に、より多くのものを1つのシリコン上に統合できるからである。例えば、IntelのAtomチップは既に2つのプロセシングコアとグラフィックス機能を単一のシリコン上に統合している。Intel社は2010年に32nmテクノロジに移行したが、GLOBALFOUNDRIESは1年遅れている。Intelは統合デバイスメーカーであるため、これらすべての部品を社内で最適化して、他社よりも早く最先端の製品を発売することができる。Intel社の次期Sandy Bridgeアーキテクチャはこれを活用している。

両社の競争は続く。

16) AMD社(ARM)
AMD社(Advanced Micro Devices)は、1969年5月1日に設立され、前年創立のIntel社のセカンドソースでプロセッサやペリフェラルチップを製造していた。同社がAm386 (1991)で x86ビジネスを始めて20年近くになる。しかし、あくまでセカンドソースに甘んじている。2011年第1四半期では、Intel社がx86の81%を占めているのに対し、AMD社はわずか18.2%であった。

しかしAMD社はIntel社の二番手しか興味がないわけではない。2006年にはGPUのメーカであるATI社を買収し、CPUに組み込んだ。EE TimesのPeter Clarke記者の2011年4月末の分析によると、AMD社が省電力を狙ってARMベースのCPUに向かうことは十分あり得る、とのことである。AMD社がIntel社との差別化を図って、統合メモリ・コントローラやHyperTransportなど新技術を開発しても、Intel社はすぐそれを取り入れてしまう。価格だけで競争するのはなかなかきつい。

短期的にみれば、AMD社はタブレットやモバイル機器のための有力が省電力チップを持っていないので、ARMアーキテクチャを使えば、比較的容易に省電力市場に参入できる。Microsoft社もARMをWindowsのプラットフォームとして保証しているので、AMD社はデスクトップやノートパソコンに非x86製品を投入できる。勿論、x86を捨てる必要もない。AMD社は、数百万ドルの費用と数%の使用権料を払えば、今でもARMビジネスに参加することができる。

長期的にみても、ARMが64ビット化すれば、サーバ市場に参入することが考えられる。ARM社としては、数年内はサーバに行く予定はないようだが、AMD社がそこを頑張ってもよい。しかし、ARMベースのサーバはAMD社の独占ではないので、どこかのメーカがやって来るかもしれない。事実、IBM社と富士通はARMのライセンスを取得している。うまくいきそうだとなったら、SamsungやTexas Instrumentsだってサーバ事業を始めるかもしれない。

HPC業界ではNVIDIAがARMとGPUを結婚させようとしている(Project Denver)。これは、AMDのFusionと似た構想である。これがFusionの脅威になりそうなら、AMDがARMに手をだすもう一つの理由になりうる。

ARMのJem Davies副社長が6月のAMD Fusion Developer Summitで基調講演をすることが4月末に発表されたことから、このような観測が乱れ飛んだ。その後の経過を見ると、2014年に、K12というARMv8-A命令セットによるCPUを2017年に生産する計画との発表があったが、Zenの方が忙しいらしく、まだ姿が見えていない。

次回はアメリカ企業の動きの後半やヨーロッパ等の動き。NVIDIAの快進撃が続く。ヨーロッパもエクサスケールに向けて、着々と研究開発を進めている。

 

left-arrow   50history-bottom   right-arrow