新HPCの歩み(第238回)-2006年(d)-
東京工業大学のTSUBAMEが、まずOpteronで地球シミュレータを抜いて日本最高速のコンピュータとなった。続いてClearSpeedを入れて性能を向上。筑波大学ではPACS-CSが完成した。理研では分子動力学専用計算機MDGRAPE-3が稼動した。T2K構想が始まった。 |
日本の大学センター等
1) 北海道大学(SR11000/K1)
北海道大学情報基盤センターは、SR8000の後継機として、2006年1月、HITACHI SR11000/K1を設置した。ノード数は40、ピーク性能は5.376 TFlopsである。2006年6月のTop500では、Rmax=4.596 TFlopsで110位にランクされている。
2) 東北大学(SX-7C、TX7/i9610、組織変更、NIWS Gene/S Turbo)
東北大学情報シナジーセンターは、並列コンピュータTX7/i9610およびスーパーコンピュータSX-7Cの運用を開始した。
4月、情報シナジー機構 情報シナジーセンターに改組された。
東北大学金属材料研究所は、2006年12月、ニイウス株式会社から小型スーパーコンピュータ「NIWS Gene/S Turbo」を購入すると発表した。これはニイウス社がIBM社よりOEM供給を受けている製品で、BlueGene/Lの1/8 rack(128ノード、256コア)に相当し、ピーク0.72 TFlopsである。(ZDNET Japan 2006/12/7)。2007年3月運用開始する(東北大金材研計算材料学センター沿革)。東北大以外には売れなかったようである。
![]() |
|
![]() |
|
![]() |
|
3) 東京工業大学(TSUBAME)
東京工業大学のTSUBAMEが、地球シミュレータを抜いて日本最高速のコンピュータとなった。昨年のISC2005やSC|05で予告されていたように、東京工業大学は4月3日、スーパーコンピュータ「TSUBAME(Tokyo-tech Supercomputer and UBiquitously Accessible Mass-storage Environment)」を稼働した。これはAMD Opteron(2.4GHz/2.6GHz)のデュアルコア・モデル880/885を8基搭載するSun Fire X460サーバ655ノード(10480コア)を結合し、ピーク性能は50.4 TFlopsである(2.6 GHzのOpteron搭載ノードは16枚のみ)。アクセラレータは、ClearSpeedのCSX600(250 MHz、96コア)を2基実装したボードが360枚で構成されており、ピーク性能は34.6 TFlopsである。合計85 TFlopsのピーク性能である。
メモリ容量はSun Fireに21.4 TB、アクセラレータに1.44 TBである。ディスク容量は1.1 PBを搭載している。ノード間の接続はVoltaireのInfinibandスイッチが使われるほか、ストレージはSun社の「Thumper」(1PB)とNECの「iStorage S1800AT」(0.1PB)が組み合わされた。システム統合は日本電気である。写真は次も含めNSUG2006での西川武志氏のスライドから。
Linpack性能は日々向上していたが、5月3日に36.36 TFlops(ピークの72.91%)を達成し、地球シミュレータ(35.86 TFlops)を抜いただけでなく、SNLのCray XT3 (36.19 TFlops)も凌駕した。この性能はOpteronのみで達成した。
さらにチューニングを進め、2006年6月のTop500では、38.18 TFlopsで7位に入った。アジアでの最高性能である。ちなみに地球シミュレータは10位、筑波大学のPACS-CSは10.3 TFlopsで34位であった。
7月3日東京工業大学ではTSUBAMEの披露を行った。TSUBAMEは東工大のスーパーコンピュータとしては4台目。その名前は校章にあしらわれた「窓つばめ」と同じである。新入生でも使える「みんなのスパコン」がコンセプトで、「スーパーコンピュータの新しい利用モデルを確立したい」と表明した。(ITmedia 2006/7/3) (ASCII.JP 2006/7/3)
主契約は日本電気であるが、TSUBAMEの成果はAMD社とSun社とにとってもHPC分野での大きな実績となった。Scott McNealy会長らSun社のトップも「プロジェクトに注目していたとのことである。今後ClearSpeedを稼動させるとともに、2008年にはQuad-Coreへのアップグレードを計画している。
この成功が、2006年9月5日に発表された、筑波大、東大、京大の「共通仕様」オープンスーパーコンピュータ構想T2Kに大きく影響している(後述)。
5月には、HPCwireのEarl Josephが松岡聡にインタビューを行い、7月には「サンのスーパーコンピュータは東から昇る(Sun’s Supercomputer Rises in the East)」と題した記事がでた。やはりSunは東から出るんですね。昔、厩戸皇子(聖徳太子)はこういう親書を隋の皇帝に送った。「日出る処の天子、日没する処の天子に書を致す。つつがなきや。」(「日出處天子致書日沒處天子無恙云云」)。皇帝が激怒したとか。伝説かもしれない。
10月頃、ClearSpeed社は声明を発表し、TSUBAMEに搭載されたCSX600をともに稼動させてLinpackを実行することに成功し、9 TFlopsの性能加速を実現したと発表した。2006年11月のTop500ではOpteronで11088コアと登録されており、若干増えている。I/O用のSun Fire X4500の一部を動員したのであろうか。Rmax=47.38 TFlopsで、38.18 TFlops と比べて9.2 TFlopsの増加であるが、ClearSpeedのピーク性能は約35 TFlopsなので、十全の能力を発揮したとは言い難い。東工大の遠藤氏ががんばったそうであるが、ロードバランスや通信制御に相当苦労したものと思われる。ClearSpeed社は、アクセラレータを稼働させたにもかかわらず消費電力がほとんど増えなかったことを強調していた。11月のTop500では、47.38 TFlopsで9位を獲得した。性能は上昇したのに順位が下がったところが悲しい。2008年のTSUBAME 1.2では、NVIDIA社のGPUに切り替える。
4) 筑波大学(PACS-CS、FIRST)
筑波大学計算科学研究センターでは、PACS-CSが完成し、5月18日 の DongarraらのLinpack Report にRmax = 10.35 TFlops で掲載された。国内マシンは TSUBAME の 38.18 TFlops が最高であるが、PACS-CS は地球シミュレータに次いで第3位ということになった。6月のTop500においては34位。7月から運用を開始した。
梅村雅之らは、科学研究費補助金特別推進によりGRAPEと汎用プロセッサを結合させた宇宙計算用のFIRSTシミュレータを開発していたが、2004年度には16ノード(32CPU+16Blade-GRAPE)のFIRSTシミュレータ1号機を完成させていた。FIRSTシミュレータの構築に関しては、 ビジネスサーチテクノロジ(株)、住商エレクトロニクス(株)両社の協力を得た。2006年度には、計算機規模を拡大し256ノード (496CPU+240Blade-GRAPE)のFIRSTシミュレータを完成させた。このクラスタの各ノードはMulti-port Gbitスイッチにより 一様なネットワークで結合され、柔軟な並列処理環境が実現している。FIRSTシミュレータ256ノードのピーク性能は、専用機33 TFlops、 汎用機3.1 TFlopsである。「FIRSTシミュレータは、新世代の超高密度融合型並列計算機への 道を切り拓くものである。FIRSTクラスタにより、人類がいまだ見たことのない宇宙に生まれた最初の天体を直接計算できるようになる。」
なお、展示用に整備されたQCDPAXとCP-PACSが2006年2月16日に搬入され、センターのオペレーション室に展示された。
2005年のところに書いたように、2006年度から筑波大学のスーパーコンピュータ予算(当時はVPP5000をレンタル)は計算科学研究センターに順次移管された。もちろん設置場所が変わったわけではない。
![]() |
|
5) T2Kオープンスパコン構想
2008年にスーパーコンピュータの入れ替え時期を迎える、筑波大学、東京大学、京都大学のセンター関係者の間では、2006年、次期スパコンの基本設計を3大学共同で行うという構想が持ち上がった。その原点は4月にギリシャのロードス島で開催されたIPDPS 2006(後述)での朴、佐藤、石川(リモート)、中島(浩)の議論であった。正確にいうと東京大学情報基盤センターは当初2007年3月に並列コンピュータを入れ替える予定であったが諸般の事情で1年延期した。東大と筑波大は以前から共通設計の構想を練っていたが、そこに京都大学が加わったものである。中島浩は京大に移る直前であった。会議中の4月26日に話がまとまり、その後協議が進められた。このプロジェクトのコード名はRhodesであった。以上、写真を含め朴泰祐氏からの情報による。
東京大学情報基盤センターは、2006年9月6日(水)に武田先端知ビルの武田ホールで「大学の知を支援するセンターマシン」ワークショップを開催した。ワークショップのプログラムの大略は以下の通り。
センター長挨拶 |
米澤明憲(東大) |
第1部 |
|
パネル討論「計算センターの新しい役割」 |
司会:坂内正夫(学術情報センター) パネリスト:宇川彰(筑波大)、米澤明憲(東大)、美濃導彦(京大) |
第2部 |
|
3大学が共同で進めている次期センターマシンに関するfeasibility study中間報告 |
石川裕(東大) |
パネル討論「次期センターマシンにもとめられるもの」 |
司会:佐藤三久(筑波大) パネリスト:押山淳(筑波大)、淡路敏之(京大)、森下真一(東大)、重田育照(東大)、高田俊和(NEC)、朴泰祐(筑波大)、石川裕(東大)、中島浩(京大) |
その前の晩に「3大学は次期スパコンの基本設計を共同で行う」とプレス発表するとともに、ワークショップの直前に記者会見を行った。目指す仕様は「オープンスパコン仕様」と命名し、パソコンと同じ半導体チップを効率的に使ってコスト削減をめざすとともに、基本ソフトもLinuxなどで有名なオープンソフトウエアを採用する。利用画面もインターネットの閲覧ソフト風に変えるなど、使いやすさを追求するなどと述べた。9月4日は堀江貴文の初公判、9月6日は秋篠宮家に男児が誕生するなどビッグニュースの中であったが、多くの一般紙が取り上げた(朝日新聞 2006/9/5など)。いつの頃からか、3大学の頭文字を取って、T2Kオープンスパコンと呼ばれるようになった。
これまで大学の情報基盤センターのコンピュータの調達は、旧大型計算機センターの時代から、国内のベンダの製品計画を見ながら調達計画を立てる例が多かったが、T2Kオープンスパコン計画では、CPU等のテクノロジーの動向を見ながら、それを搭載したシステムを調達するという全く違う方法論であった。一口で言えばvendor-drivenからtechnology-drivenへの方向転換であり、ベンダにとっては「黒船」であった。TSUBAME(東京工業大学)やT2Kを嚆矢として、その後technology-drivenな調達が増加した。
6) 高エネルギー加速器研究機構(SR11000モデルK1、BlueGene/L)
高エネルギー加速器研究機構は、2006年3月1日、日立製作所から、日立SR11000モデルK1(16ノード)とIBM BlueGene/L(合計10ラック)からなる複合システムを導入した。BlueGeneは4+4+2に分割して運用されている。2006年6月のTop500では、4ラック構成のMOMOとSakuraはコア数8192、Rmax=18.2 TFlops、Rpeak=22.9 TFlopsで15位tie、2ラック構成のUMEはコア数4096、Rmax=9.4 TFlops、Rpeak=11.5 TFlopsで38位である。
7) 統計数理研究所(HP XC4000)
統計数理研究所では、2006年、HP XC4000を導入した。ProLiant DL 145G2の128ノードから成る。各ノードはOpteron 2.6 GHz×2を搭載。
8) 岡崎共通研究施設(PRIMEQUEST+Altix4700)
岡崎共通研究施設 計算科学研究センターでは、2006年、スーパーコンピュータ枠のVPP5000、SGI2800、Origin3800を、富士通PRIMEQUEST(640core)とSGI Altix4700(640core)に更新した。いずれもItanium2を搭載している。前者はノード内共有メモリ、ノード間分散メモリであるが、後者は8 TBのCC-NUMAである。2006年11月のTop500で、PRIMEQUESTは、Rmax=3.119 TFlops、Rpeak=4.096 TFlopsで391位にランクしている。Altixは、同じくRmax=3.83666 TFlops、Rpeka=4.096 GFlopsで236位にランクしている。(計算科学研究センター 2006/10)
日本の学界の動き
1) PCクラスタコンソーシアム
経済産業省RWCPの活動を中核としてPCクラスタ市場育成を目指して2001年10月4日に発足したPCクラスタコンソーシアムは、以下のイベントを開催した。
2006年3月3日、富士通株式会社 関西システムラボラトリにおいて、Scoreワークショップin関西を開催した。プログラムは以下の通り。
10:00 |
コンソーシアム紹介 |
石川 裕 (東京大学) |
10:15 |
並列処理とMPI通信ライブラリ入門 |
石川 裕 (東京大学) |
11:00 |
SCore 入門 |
原田 浩 (日本ヒューレット・パッカード株式会社) |
11:30 |
break |
|
13:30 |
企業発表 13:30 – 13:50 PCクラスタ性能への取り組み 久門 耕一(富士通株式会社/株式会社富士通研究所) 13:50 -14:10 NECのPCクラスタへの取り組み 松岡 浩司(日本電気株式会社) 14:10 – 14:30 日本HPのPCクラスタへの取り組みについて 根本 雅樹(日本ヒューレット・パッカード株式会社) 14:30 – 14:50 Webポータルおよびワークロード管理への取り組み 松本 新一(アルテアエンジニアリング) 14:50 – 15:10 住商情報システム株式会社 |
|
15:00 |
break |
|
15:15 |
PM通信ライブラリの最新情報 |
住元 真司 (富士通研究所) |
15:45 |
SCore-Dの使い方 |
堀 敦史 (Allinea Software) |
16:15 |
SCore Lightの概要
|
堀 敦史(Allenia Software)、長谷川 篤史(NEC情報システムズ)、竹岡 尚三(AXE)、石川 裕(東京大学) |
17:00 |
懇親会 |
第1 回 PC クラスタワークショップ「ここまできたクラスタシステム」を2006年9月22日、NEC本社ビルで開催した。プログラムは以下の通り。
|
題目 |
講演者 |
13:10 |
会長挨拶 |
石川 裕 (東京大学) |
13:20 |
科学技術計算用超並列クラスタPACS-CSの実装・評価・運用 |
朴泰祐 (筑波大学) |
14:20 |
大規模構造解析システム ADVC の運用事例 |
秋葉博 (アライドエンジニアリング) |
15:00 |
PCクラスタでのLS-DYNAの実行環境の構築 |
大下文則 (日本総研) |
15:30 |
構造流体解析プログラムRADIOSSの並列計算性能に関して |
田井 秀人 (メカログ ジャパン) |
16:20 |
パネル「PCクラスタが抱える現状」(講演者によるパネル) |
司会:西克也 (ベストシステムズ) |
12月14日~15日には第6回PCクラスタシンポジウムを日本科学未来館で開催した。プログラムは以下の通り。
12月14日
10:30 |
「Score ご紹介」 |
原田 浩 (日本HP) |
13:30 |
「ペタフロップス時代に向けたPCクラスタの役割」 |
姫野 龍太郎(理研) |
15:00 |
パネル討論:「ペタ時代に向けた要件とSCoreの役割と課題」
|
司会:石川 裕 (東大) 姫野 龍太郎(理研)西川 武志(東工大)住元 真司(富士通研)清水正明(日立) |
17:30 |
懇親会 |
12月15日
10:30 |
「SCoreアップデート、今後の展開」 |
石川 裕(東大) |
11:00 |
「Intel マルチ・コア・コンピューティングの威力 - 最新ハードウェアとソフトウェアの紹介 -」 |
池井 満 (インテル) |
11:30 |
「AMD Opteron(TM) プロセッサ 最新情報アップデート~HPCクラスタプラットフォームとしての優位性~ 」 |
山野洋幸 (日本AMD) |
13:30 |
企業発表「メンバ企業によるSCoreクラスタ導入事例・応用事例・今後の取り組み」 |
|
15:30 |
パネル討論:「PCクラスタの将来展望 -汎用スパコンになり得るか? 運用、実装、アプリ、人材の観点から-」 |
司会:西 (ベストシステムズ) |
2) 情報処理学会(日本でのコンピュータ生誕50周年)
情報処理学会は45回目の全国大会を2006年3月7日~9日に工学院大学新宿校舎を会場に開催した。学会創立45周年でかつ日本初の真空管式電子計算機FUJICの完成(1956年3月)50周年ということで、「日本のコンピュータ生誕50周年記念」記念イベントが行われ、シンポジウムや特別展示が企画された。展示では、FUJICの実物大の写真とともに、6台の大型液晶パネルに1950年代から各十年ごとのコンピュータ等の写真を順次表示した。あわせて、ETL Mark IVAやMARS101(国鉄のオンライン座席指定用コンピュータ)なども展示された。筆者もこの学会に参加したが、東大定年と工学院移籍など取り込んでいた時期で、展示については残念ながらほとんど記憶がない。工学院大学としては、4月からの情報学部設置へのこけら落としとして、かなり力が入っていたようである。『情報処理』2006年6月号に椎塚久雄情報学部情報デザイン学科主任教授の長文の報告がある。
3) 理研(MDGRAPE-3)
理研の泰地真弘人らは、タンパク3000プロジェクトの一環として、分子動力学専用計算機MDGRAPE-3 (Protein Explorer)を計画し、2002年に開発を開始した。MDGRAPE-3チップは分子動力学の力の計算のためのLSIであり、130 nmのテクノロジ(日立HDL4N)を用い、250~300 MHzのクロックで20本のパイプラインを駆動する。クーロン力1対の計算を36演算とすると、1チップで180~216 GFlops相当の計算ができることになる。このチップは2004年8月に開発完了していた。このチップを24個搭載したユニット201台に、Xeonサーバ101台を接続したシステムである。日本SGI社とIntel社の協力により開発した。理研は2006年6月19日完成を発表した。全体では1 PFlops相当の性能があるとのことである。(ZDNET Japan 2006/6/20)
4) GRAPE-7
牧野淳一郎(2006年から国立天文台所属)らは、日本学術振興会未来開拓学術研究「計算科学」(1997年~2002年)により開発していたGRAPE-7が2006年に完成した。GRAPE-7 は PROGRAPE とGRAPE-5 の流れをくむ機種であり、内部回路を書き換え可能な FPGA を1~7個搭載している。ピーク性能は600 GFlopsであるが、最大構成モデルにこのパイプラインを実装した場合の動作は理論性能 364 GFlops 相当まで確認されている。2006年に宇宙論的構造形成の計算で 1GFlops 当たり $105 という価格性能比を達成し、同年のGordon Bell賞価格性能比部門ファイナリストに選出された。K&F Computing Research Co. より製品化されている。
5) GRAPE-DR(SINGチップ開発)
東京大学、情報通信研究機構、NTTコミュニケーションズ、国立天文台、理化学研究所による研究グループ(研究代表平木敬)は、2004年5月、「分散共有型研究データ利用基盤の整備」プロジェクトが2004年度科学技術振興調整費に採択され、「GRAPE-DRプロジェクト」に着手したと発表した。5年間の予定で
(a) 2008年に2 PFlopsの計算速度を実現することと、
(b) 40 Gbps ネットワークを高度利用した科学技術研究データ処理システムを構築すること
を目標としている。GRAPE-6は、天体の問題を解くための専門コンピュータだったが、GRAPE-DRは天体シミュレーション、分子動力学計算、ゲノムの解読など、幅広い分野で利用できるようにするとのことであった。従来のGRAPEシリーズとは異なり、重力相互作用計算に特化したパイプラインをLSIチップに集積するのではなく、多数の演算器を集積する設計であり、より汎用性がある、と述べていた。
2006年11月6日、東京大学理学部7号館で記者会見を行い、GRAPE-DRの中核であるプロセッサチップ(開発コード名:SING)の開発に成功したとのべた(朝日新聞 2006/11/6他)。プロセッサは一つのシリコンチップに512個の要素プロセッサを集積し、単精度で512 GFlops、倍精度で384 GFlops のピーク性能をもつ。消費電力は最大60W、アイドル時30W。実装のための設計は台湾のファブレス企業のAlchip Technologies社、製造は台湾TSMCの90 nm CMOSプロセスと発表された。Alchip社の発表によると、「SING」プロセッサは、TSMCの90nm generic processとflip chip packaging technologyを使用して試作したが、60Mのロジックゲートを内蔵している上、チップ全体の動作周波数が500 MHzと、市販のEDAツールでの限界を超えていたため、アルチップは独自の設計手法である「分割統治法(divide-and-conquer)」を採用し、デザインを数百ものサブブロックに分割した上で3階層に配置したとのことである。C言語コンパイラも開発したが、実際には手のチューニングをしないと性能が出ないようである。
今後は2008年度までに、2 PFlopsの性能をもつシステムを構築する計画とのことであった。11月13日からのSC06で展示する。多くの一般紙で取り上げられたが、価格性能比やエネルギー効率の議論で、演算加速チップとSX-8などのコンピュータシステム全体とを混同している不勉強な記事が多く見られた。イギリスのChannel Register紙も取り上げたが平木氏のことをJapanese boffinと紹介していた。Boffinとは聞いたことのない英語であるが、辞書によると、「(英古風)科学者, 専門的技術者;((略式))利口だが人気のない人」とあった。
6) 産業技術総合研究所
産業技術総合研究所と鹿島建設は2006年4月、産総研が開発したGridASPを使った技術計算に関する共同研究を始めたと発表した。この共同研究は秋葉原クロスフィールドビルに設置した鹿島の衛星研究室で行う。
7) 遊休PCグリッド
2006年8月16日付け讀賣新聞電子版によると、文部科学省は学校に設置されて、夜間や休日に使われない数約台のPCをグリッド技術でつないでスーパーコンピュータ並みの計算を行う実験を開始したと発表した。文部科学省は人口数十万規模の市の公立小・中・高校を使う考えで、8月末までに具体的な自治体を選定する。作業は日本教育工学振興会に委託し、東京から遠隔操作して稼働させる計画である。学校をつかったグリッド技術のビジネスの可能性を探るということであったが、どうなったのであろうか。
8) IEEE Computer Society Japan Chapter Young Author Award
IEEE Computer Society Japan Chapter(Chair:早稲田大学笠原博徳)は、若手研究者のIEEE/CSにおける研究活動奨励のため、IEEE/CSで発行する定期刊行物や主催・共催国際会議会議録に掲載された優秀な論文の筆頭著者でIEEE/CS Japan Chapterに所属する若手研究者を表彰した。2006年の受賞者は、石川 博氏(名古屋市立大学大学院システム自然科学研究科)と Taleb Tarik氏(東北大学 大学院 情報科学研究科)であった。2006年12月12日、早稲田大学理工学部において、授与式および記念講演があった。
9) 「Linux World」「Java World」休刊
2006年11月6日、IDGジャパンは、「Linux World」を11/24売を以って休刊し、さらに、この10月売から隔月刊化した「Java World」も12/24売を以って奇数月売の「ITアーキテクト」に統合(事実上の休刊)する事を同時に発表した。(ITmedia Tank 2006/11/6)
10) 日本物理学会
筆者はもともと物理分野の出身で、日本物理学会にも属しているが、前に述べたように江澤洋会長の依頼で学会事務局の電子化のためということで1995年9月から2年間理事を務めた。その後すっかり物理学会から遠ざかってしまったが、2006年9月から2年間、坂東昌子会長の依頼で、学会監事を務めた。監事は理事とは異なり、会務とは違う立場から会の運営について意見を出すのが任務であり、会計監査だけでなく、経理状況、事務局体制(この頃、常任理事が着任した)などについても意見を具申した。大きな問題は、2006年に決まった公益法人制度改革であった。2008年12月1日から新しい公益法人関係の法律が施行され、5年間の間に新制度に移行することになったが、各学会が一般社団法人になるべきか、公益社団法人になるべきか、その得失など勉強会を行い、互いに情報交換をした。
11) 渕 一博氏死去
第5世代コンピュータ開発のリーダーであった渕 一博氏は、2006年8月13日になくなられた。享年70歳。告別式は18日であった。
次は国内会議である。HPCS 2006では、CellやBlue Geneが話題となった。
![]() |
![]() |
![]() |