HPCの歩み50年(第97回)-2003年(c)-
アメリカでは地球シミュレータを打倒するためのアメリカ国家戦略を練る動きが3件も動き出した。アメリカ科学アカデミーは日本に調査団まで派遣した。NERSCのSeaborgはPOWER3チップの数を倍増して動き出した。TeraGridの課題公募が始まった。
アメリカ政府の動き
1) PITAC第2期
アメリカの情報科学技術政策がどうあるべきかを大統領、議会、連邦政府機関などに勧告するPITAC (The President’s Information Technology Advisory Committee)は1997年に設置され、第1期が2001年まで続いた。第2期が2003年11月に始まり、2005年6月まで続いた。その後は置かれていない。
第2期の共同議長は、Marc R. Benoiff(Salesforce.comのCEO)とEdward D. Lazowska(Washington大学のthe Bill & Melinda Gates Chair教授)が5月に任命された。委員は大学関係8名、産業界14名。HPC関係で目に付く委員は、David A. Patterson (UCB)、Daniel A. Reed (North Carolina大学)、Eugene H. Spafford(Purdue大学)といったところか。2005年までの会議は以下の通り。
2003年11月12日 | 「新しい医療:ITはアメリカの医療制度をどう変えるか」 |
2004年4月13日 | 「ネットワークと情報技術の研究開発へのアメリカ政府の投資」 |
2004年6月17日 | 「ネットワークと情報技術の研究開発へのアメリカ政府の投資」 |
2004年7月29日 | 「サイバーセキュリティの研究開発」に関するタウンホールミーティング |
2004年11月4日 | 「コンピュータ科学小委員会」(遠隔会議) |
2004年11月10日 | 「コンピュータ科学に対する国家的優先課題」に関するタウンホールミーティング(SC2004において) |
2004年11月19日 | 「サイバーセキュリティ小委員会の報告」 |
2005年4月14日 | 「コンピュータ科学に関する報告書(案)」に関する議論 |
2005年5月11日 | 「コンピュータ科学に関する報告書(案)」に関する議論 |
この期のPITACは「ITによる医療の革新」(2004年6月)、「サイバーセキュリティ:優先順位付けの危機」(2005年2月)、「コンピュータ科学:アメリカの競争力を確保するために」(2005年6月)の3件の報告書を公開している。いずれもPITACのページからリンクされている。
2) HECRTF最先端コンピューティング再生タスクフォース
日本の地球シミュレータを打ち負かすためのアメリカ国家戦略を練る動きが、PITAC以外に(筆者の知る限り)3件始まった。「最先端コンピューティング再生タスクフォース」とアメリカ科学アカデミーの「スーパーコンピューティングの将来に関する委員会」とJASONの「Requirement for ASCI」である。
2003年3月、ホワイトハウスのNSTC(National Science and Technology Council、国家科学技術会議、1993年11月発足)は、特別プロジェクトとしてHECRTF(High End Computing Revitalization Task Force、最先端コンピューティング再生タスクフォース)を設立し、アメリカが今後科学技術でのリーダーシップを確保するための計画 “Fedearal Plan for High-End Computing”を作成した。これは政府機関を横断した活動であり、科学技術の発展、国家安全保障、国際競争力にHPCが必須であるにもかかわらず、現状の政府機関のHPC資源がニーズを満たしていないという問題意識で作られた。この計画の策定過程では、地球シミュレータを初めとする日本のHPCの現状についても詳細に調査を行っている。
この計画は以下の3つの要点から構成されている。
a) 研究開発:アプリでの実効性能を重視し、挑戦的な研究開発などを盛り込んだ、今後5年~10年にわたる最先端コンピューティング技術のロードマップ
b) 設備:最先端コンピュータの設備不足の解消と、アクセスの改善。最高性能のコンピューティング処理へ向けた国家的リーダーシップシステムの設置
c) 調達:総合的コストや実効性能を重視した、政府機関での調達の効率化
2004年5月に計画の策定が完了し、報告書“Report of the High-End Computing Revitalization Task Force”が5月10日に出版された。これに基づき“Department of Energy High-End Computing Rivitalization Act of 2004”が2004年11月に成立した。(野村稔著『米国政府の高性能コンピューティングへの取り組み』、「科学技術動向」2005年2月号参照)
3) アメリカ科学アカデミー
アメリカ科学アカデミーThe National Academy of Sciences (NAS)は、Committee on the Future of Supercomputing(スーパーコンピューティングの将来に関する委員会)を2003年に設置し、検討を開始した。共同議長はSusan L. Graham (UCB)とMarc Snir (UIUC)、委員には蒼々たる面々が名を連ねている。W. J. Dally (Stanford), J. W. Demmel (UCB), J. J. Dongarra (Tennessee/ORNL), K. S. Flamm (Texas), M. J. Irwin (Penn State), C. Koelbel (Rice), B. W. Lampson (Microsoft), R. F. Lucan (USC), P. C. Messina (consultant), J. M. Perloff (UCB), W. H. Press (LANL), A. J. Semtner (Navel Postgraduate Scool), S. Stern (Northwesten), S. Subramaniam (UCSD), L. C. Tarbell, Jr. (Technology Futures Office), S. J. Wallach (Chiaro Networks)。スポンサーはDOEである。
委員は自分の考えを述べるのではなく、政府機関関係者や、アメリカや日本の政府関係者、科学者、製造会社、ソフトウェアベンダ、スパコンセンタの運営者、アプリのユーザなどからのインプットを求め、集約したものである。DOEやNSAのスーパーコンピュータセンタの訪問も行った。
会合や訪問は以下の通り。,
2003/3/6-7 | Washington DC | 第1回会合 |
2003/5/21-23 | Stanford, CA | 第2回会合 |
2003/9/24-26 | Santa Fe, AZ | Application Workshopと第3回会合 |
2003/11/19 | Phoenix (SC2003) | Town Hall Birds of a Feather Session |
2003/12/2 | Fort Meade, MD | National Security Agency site visit |
2003/12/3-4 | Washington DC | 第4回会合 |
2004/1/9 | Livermore, CA | LLNL site visit |
2004/1/14 | Berkeley, CA | LBNL site visit |
2004/2/26 | Albuquerque, NM | SNL site visit |
2004/2/27 | Los Alamos, NM | LANL site visit |
2004/3/2 | Argonne<, IL | ANL site visit |
2004/3/3-4 | Argonne, IL | 第5回会合 |
2004/3/23-26 | 日本訪問 | 日本工学会でForum、東大センター、JAXA、某自動車製造企業、地球シミュレータセンター、東大GRAPE、文部科学省等訪問 |
委員全員がすべてに参加したわけではないであろうが、精力的な活動である。2003年7月に中間報告を出し、2004年4月に最終報告を出した。300ページを越える報告書は、“Getting up to Speed, The future of Supercomputing”(Susan L. Graham, Marc Snir and Cythia A. Patterson, Editors)としてThe National Academies Pressから出版されている(pdfでも公開されている)。
Executive summaryによると、「合衆国の現在および将来の必要に応えるため、スーパーコンピューティングを利用する政府機関は、連邦議会とともに、スーパーコンピューティングの進歩を加速し、ハードウェアとソフトウェアの両方に複数の強力な国内の供給者が続くよう保証する第一の責任を持つ」と述べている。
具体的には、以下の8点の勧告が出されている。
(1) 政府機関はスーパーコンピューティングのインフラを継続的に進化させる共同責任を持つ。
(2) 政府機関は国家的必要にとって本質的な国内の指導的地位を保証すべし。
(3) 高バンド幅システムのユニークな技術の需要を満たすために、政府は複数の国内の供給者を保証すべし
(4) ソフトウェア(OS,コンパイラ、ツール、応用コード、データベースなどを含む)の創造と長期的保持のために、スーパーコンピュータの研究開発に責任のある政府機関はそれをサポートすべし。
(5) 今後のスーパーコンピューティングに対する主要な障害とsynergiesを明確化するロードマップを作る、コミュニティーの努力を支援すべし。
(6) 基礎研究(アーキテクチャ、ソフトウェア、アルゴリズム、応用)への複数機関による投資を安定に頑強に長期的に行うべきである。。
(7) 国際協力を推進すべし
(8) アメリカ政府は、最も計算能力を必要としてる研究者に最も強力なスーパーコンピュータへのアクセスが可能になるよう方策をとれ。
議論のポイントの一つは、汎用の(off-the-shelf)ハードやソフトを用いた価格性能比のよいシステムと、膨大な計算能力に応える特注のシステムの間のバランスをどうとるかということであった。政府は両者にバランスよく資金を投入せよと述べている。地球シミュレータを意識してか、「自国の(domestic)」「複数の(multiple)」供給者の重要性を強調している。
4) JASON
数十人の科学者からなり、科学技術の観点から政府に提言を行う独立グループJASONは、1960年に創設され、ベトナム戦争のころはマクナマラ戦略に加担し問題となった。その後は、温暖化や酸性雨、医療情報、サイバー戦争、再生エネルギーなどを研究している。2003年夏にASCIプログラムの評価を行う討論会“Requirement for ASCI”を開催した。公開された資料によると、ASCIそのものは成果が出ていることを認めながら、それでもASCI Qが地球シミュレータに負けたことに注目し、今後どんな性能改善が可能かを知論している。プロセッサの微細化やノード数の増加だけでは性能の向上が難しく、メモリへの演算素子の埋め込み(昔のPIM)やベクトル処理を提案している。(大原雄介「スーパーコンピューターの系譜 ASCI Redの後継機RED Storm」参照)Red Stormの方向性を承認した形になった。
科学アカデミーのものを含め、スーパーコンピューティングに関して政府への提言報告書が合わせて3件出されていることになる。地球シミュレータのショックの大きさがわかる。
5) DOEの大型科学計画
毎日新聞(2003年11月12日)によると、アメリカのDOE (Department of Energy、エネルギー省)は、11月10日、今後20年間にアメリカが優先的に研究すべき28項目の大型科学計画を発表した。専門家で作る諮問委員会を作り、科学的重要度や実現可能性を基準に選定した。最優先課題はITER(国際熱核融合実験炉)であるが、2番目にはスーパーコンピュータを挙げ、地球シミュレータの5倍の計算能力をもつスーパーコンピュータを開発すると宣言した。恐らくRed Stormのことを指していたのであろう。
安定性信頼性を重視し、各ボードにRASのコントローラを置き、各キャビネットに電源ユニットを2台搭載し、1台が故障しても運転が続けられるようにするとか。省エネルギーを重視し、2 MWとか。
2004年会計年度は2003年10月から始まっているが、DOEスーパーコンピュータの$213Mの2004年度予算案(H.R. 2754)は、11月28日下院を387対36でやっと通過した。上院も同日、声の投票により$183Mの額で通過した。両院の協議により$203Mで妥協が成立した。日本と異なり、アメリカの連邦議会の予算審議は、一括ではなく項目別に審議・採決される。上記の額は財源が不足していたが、the National Nuclear Security Administration (NNSA)から捻出した。
6) INCITE Program
2003年、DOEのSecretary for Science Raymond Orbachのもと、革新的な大規模計算科学プロジェクトを支援するために、公募制の資源提供プログラムINCITE (the Innovative and Novel Computational Impact on Theory and Experiment)を開始した。最初の2003年は、52件の申請から3件(超新星爆発の3次元モデル、高レイノルズ数乱流、色素と光の量子モンテカルロ計算)を採択し、490万ノード時間を提供した。このプログラムの趣旨から、少数の大規模計算の計画を受け入れる。
7) NERSC
昨年のところで述べたように、DOEの公開計算センターNERSC (National Energy Research Scientific Computing Center)は2001年1月“Seaborg”というスーパーコンピュータをBerkeleyの隣町Oaklandの新しい拠点で運用を開始した。予告されていたとおり、3328個のPOWER3のシステムを6656個に倍増させ、予定より1か月早く3月3日に稼動を開始した。システム稼働率は98%以上。主記憶は7.8 TBで、並列ファイルシステムは44 TB、アーカイブは8.8 PB。ユーザ2100人。DOEの公募制の資源提供プログラムSciDAC Program (Scientific Discovery through Advanced Computing)でも利用される。2003年6月のTop500では、SeaborgはRmax=7304 GFlops 、Rpeak=9984 GFlopsで5位を占めている。
8) ORNL
2003年、ORNL (Oak Ridge National Laboratory)は創立60周年を迎えた。マンハッタン計画で黒鉛炉が作られたのが始まりである。
テネシー州選出の下院議員Zach Wamp氏(共和党)が、大統領年頭一般教書のあとORNLを評価し、大体うまく行っているが、スーパーコンピュータは例外だ。2004年度予算は$100M要求しているが、イラク戦争の出費もあり減らすべきだ、と述べた。「2番ではだめなんでしょうか?」とは言わなかったようであるが。研究所関係者は2年以内に地球シミュレータを凌駕したいという計画である。予算は$14Mに減らされ、コンピュータ部門の責任者のThomas Zacharia氏は、「これでは無理だ」と述べた。Cray X1はこれとは無関係で、3月には予定通り8キャビネットが導入された。9月末までに稼動開始する予定。
9) LANL
LANLは、AMD OpteronをLinux Networxで結合したクラスタを2セット設置すると発表した。合計3300個のOpteronを含む。一方のクラスタ“Lightning”は、2800のOpteron(2 GHz) を含み、ピーク性能は11.2 TFlopsである。設置は10月の予定。もう一つの“Orange”クラスタは256ノードのdual processor(Opteron 1.6 GHz)のクラスタで、接続はInfinibandである。2003年11月のTop500では、Lightningは2816コア、Rmax=8.051 TFlops、Rpeak=11.264 TFlopsで6位である。Orangeは512コア、Rmax=1.053 TFlops、Rpeak=1.638 TFlopsで116位である。
1997年11月から所長を務めていたJohn C. Browneは、2002年12月23日に辞表を提出し、2003年1月6日に辞任した。New York Time(1月3日号)の報道によると、1998年以来$3M以上の備品の喪失や、研究所のクレジットカードの不正利用などの不法行為に対し、十分な対処を行ってこなかった責任を問われたものである。G. Peter Nanosが代理の所長に任命された。
10) PNNL
エネルギー省傘下のPNNL (Pacific Northwest National Laboratory、ワシントン州Richland)は、8月末、アメリカ国内で最高性能の公開スーパーコンピュータを稼動させた。これは、Hewlett Packard製のIntegrityシステムで、Itanium2 (1.5 GHz)プロセッサ1936個をQuadricsネットワークで結合したものである。Linux OSで動く最大のスーパーコンピュータであり、IntelのIA64を用いた最大のシステムである。2003年11月のTop500では、Rmax=8.633 TFlops、Rpeak=11.616 TFlopsで5位である。化学、生物学、気象、表面化学を含む環境分子科学のために使われる。
11) ESnet
エネルギー省関係の通信を担当するESnet (Energy Science Network)は、2003年、南ルートを2.5 Gbps(OC48)に増強した。北ルートは10 Gbps (OC192)。
12) HPCS (DARPA)のPhase II
アメリカ国防省のDARPA (Defence Advanced Research Projects Agency 国防高等研究計画局)は、それまで実効性能よりピーク性能に重点が置かれていたことの反省の上に立って、2002年6月にHPCS (High Productivity Computing System)プロジェクトを開始した。国防および産業用に生産性の高いスーパーコンピュータを開発するプロジェクトで、ハードウェアのみならずソフトウェアをも対象とする。2002年からのPhase IではIBM、Cray、Sun、HP、SGIのベンダ5社が参加した。
2003年7月8日、その中からPhase IIとして、Cray, IBM, Sun Microsystems3社に約$146Mの助成金を与えたことを明らかにした。期間は3年間。IBM社はPERCS (Productive, Easy-to-use, Reliable Computing Systems)を開発するために$53.3M、Sun Microsystems社は、統合コンピュータ設計およびプログラミングツールを推進するHeroプログラムのために$49.7M、Cray社は、ペタスケールの計算に対する高生産性を可能にするCascadeを開発するために$43.1Mが与えられた。Phase IIIでは4年を掛け、2009年または2010年までに実機を建設する。
13) Blue-Ribbon Advisory Panel
NSFはDaniel E. Atkins (Michigan大学)を座長とするBlue-Ribbon Advisory Panel on Cyberinfrastructureを設置し議論を進めてきたが、2003年1月付けで報告書:”Revolutionizing Science and Engineering Through Cyberinfrastructure”を発行した(公開されたのは6月)。パネルは、コンピューティング、情報、通信技術の絶え間のない進歩により、科学技術の新時代が到来したことを指摘し、重点的に投資すべき4つの分野を明示している。
a) サイバーインフラストラクチャを推進する基礎研究
b) 先進的で実働するサイバーインフラストラクチャの構成要素を創造し発展させるための活動
c) 実働する支援体制を提供する人員と設備をもつ研究機関
d) 科学技術の全領域における先進的なサイバーインフラストラクチャの、インパクトある応用
14) Pittsburgh Supercomputing Center
2003年1月20日、TeraGridの5番目の参加者であるPSC (Pittsburgh Supercomputer Center)に大きなEV7 AlphaServer (GS1280) が2台到着した。それぞれ16個のAlpha processorと32 GBの共有メモリを持つ。これは第一陣で今後増強される。1台 (Jonas) はbiomedical researchのため、もう1台 (Rachel) はNSF全体用である。Rachelの名は、懐かしい Rachel Carson (1907—1964)から来ている。Rachel は名著 “Silent Spring” (1962,『沈黙の春』青樹築一訳、新潮社)で環境における殺虫剤の蓄積の危険を指摘し、環境保護の先駆となった。Pittsburgh’s Chatham Collegeの出身である。これらは3000個の EV68 Alpha processorsを含む既存のLeMieuxシステムを補完するものである。
15) TeraGrid公募開始
DOEのSciDACと並ぶ公募制の資源提供プログラムであるNSFのTeraGridプロジェクトは、2003年6月15日に申請受付を開始した。20万CPU時間以上の申請は9月にPACI peer-reviewによって審査され、12月から利用可能となる。新年からは800個のItaniumプロセッサによるプロダクションランが始まる。これは4 TFlopsの計算資源である。計算資源だけでなく、1/4 PBのストレージ、可視化施設、データベース,データ収集能力(何?)を提供する。これに加えて、上記PSCの3000プロセッサのHP AlphaServerSCが部分的にTeraGridインフラに加わる予定である。
今後、TeraGridは20 TFlopsの分散計算資源と、1 PB のストレージ、高精度可視化環境、グリッド計算のツールキットなどを用意する。また、TeraGridの要素間は新しい40 Gbps の専用ネットワークで接続される。
2003年10月、NSFはTeraGridの新しい4拠点として、ORNL (Oak Ridge National Laboratory)、Perdue大学、Indiana大学、Texas大学Austin校のTACC (Texas Advanced Computing Center)を指定し、Atlantaに新しいネットワークハブを設置した。これらのために$10Mの予算を用意した。
その他の政府の動き
1) CERN Grid
ヨーロッパ合同原子核研究所CERN (the European Organization for Nuclear Research)は、グリッドの初期から積極的に取り組んできたが、2003年4月、LHC実験に備えて、これまでにないような大量のデータ管理システムを構築するためIBMと協力すると発表した。IBMで研究していたStorage Tankを拡張して、異機種・異OSの下にあるデータを単一のファイル・ネームスペースを使ってアクセスする新しい技術を開発する。
CERNはヨーロッパのグリッドの中心的存在になりつつある。
2) カナダのリサーチグリッド
カナダのWestGrid (Western Canada Research Grid)プロジェクトのインフラ構築のため、Hewlett Packard , IBM, SGIの3社が選ばれ、合計$44M(たぶん米ドル)の契約が結ばれた。WestGridは、Edmonton とVancouverの2州、8個の機関(University of British Columbia, Simon Fraser University, New Media Innovation Centre, TRIUMF physics laboratory, University of Alberta, University of Calgary, University of Lethbridge and The Banff Centre)を接続し、カナダ中の研究者からアクセス可能にする。これらは、BC (BCNet), Alberta (NeteraNet)および Canada (CA*net)によって接続される。
3) C-DAC (インド)
インド電子省のC-DAC (Centre for Developmento of Advanced Computing)は、自前のスーパーコンピュータの開発を続けて来たが、2003年4月PARAM Padmaを正式に発表した。設置場所はBangaloreの C-DAC Knowledge Parkで、筆者は昨年末のHPC Asia 2002で見学してきた。正式発表が遅れたのは大臣(情報技術大臣?)の都合とのことである。開発には$10Mの予算と130人の人員と3年の期間を要した。中身はIBMの4-way POWER4 SMPを独自開発のPARAMnetで結んで箱にいれたものである。ピーク性能は1.024 TFlopsで、インドでの初めてのテラフロップス超えのマシンであった。Padmaはヒンドゥー語で「蓮」の意。使用目的として、天気予報、バイオインフォマティクス、ロケットの発射と再突入のシミュレーション、ナノテク、流体力学、空気力学、地震波処理、株式市場、データマイニングなどが上げられているが、アメリカなどは軍用の計算(つまり水爆開発など)に用いられないか心配しているようである。
4) Bhabha Atomic Research Centre
2003年7月、MumbaiにあるThe Bhabha Atomic Research Centre (BARC)は、クラスタANUPAM-XENON/128を開発したと発表した。これは64台のdual Xeon servers(2.4 GHz、2GBメモリ、40 GB HDD)をノードとして結合したもので、Linpackで202 GFlopsの性能を持つ。相互接続網はScalable Coherent Interface (SCI)で、レイテンシは3.5 μs、バンド幅300 MB/sである。OSはLinuxである。
使用目的が気になるところであるが、材料、エレクトロニクス構造、分子動力学、放射化学、大気化学、非線形有限要素法、計算流体力学の大規模問題を解くとのことである。さらに、結晶構造解析、輻射流体力学、中性子輸送、γ線シミュレーション、電磁プラズマ、第一原理電子構造計算、構造解析、レーザー原子相互作用など。ちょっときな臭いか。
ANUPAMシリーズのクラスタスーパーコンピュータは、Aeronautical Development Agency (ADA) Banglore, Vikarm Sarabhai Space Centre, Thiruvanthapuram, National Centre for Medium Range Weather Forecasting (NCMRWF), New Delhi, Nuclear Power Corporation, Mumbai, IIT Mumbai, IIT Kanpur, UDCT Mumbai and SNDT Mumbaiなどでも使われているとのことである。
5) オーストラリア
オーストラリアでは10月、シドニーのac3 (The Australian Centre for Advanced Computing and Communications)は、155台のdual Xeon machines(Dell製)からなるシステムを設置した。メモリはノード当たり2 GB。OSはLinuxで、ピークは1.07 TFlops。これは、Australian Research Councilからの補助金と、5大学の分担金により設置された。オーストラリア気象庁(Australian Bureau of Meteology)は近々1.15 TFlopsのマシンを設置する予定。この他、メルボルンにあるSwinburnge工科大学は、240個のIntel CPU(XeonかItaniumか不明)からなるクラスタを保有している。
次は世界の学界の動き。
(タイトル画像: NERSC Seaborgスーパーコンピュータ 出典:NERSCホームページより )