提 供
HPCの歩み50年(第185回)-2010年(k)-
中国は、中長期の性能目標のマイルストーンを作ってその達成に向けて活動を積み重ねていくアプローチを取っている。銭 (Depei Qian)北京航空航天大学教授によると、中国は、Tianhe-1とDawning 6000とSunwayという3台のPFlops級マシンを計画している。
SC10(続き)
7) ATIP 2010 Workshop on HPC in China
11月15日(月)は、夕方展示の開会イベント(Gala Opening)があるが、昼は多くのチュートリアルやワークショップが開催されている。その一つとして、ATIP (Asian Technology Information Program)の主催で2010 Workshop on HPC in Chinaが企画され、NSFなどの支援により、中国科学院 (Chinese Academy of Sciences (CAS))の研究機関と北京大などの中国国内大学から約30名の講演者を招いた。
どうやらTOP500 の一位が、中国の国防科技大(NUDT)が開発したTianhe-1Aになりそうだ (実際に1 位になった)ということもあって中国HPC の状況についての関心は高く、約150 人入る会場が立ち見になることもあった。
筆者はこの日の夕方到着したので参加できなかったが、プログラムは次の通り。これ以外にも大学院生のポスターが展示された。
Welcome and Opening Remarks |
David Kahaner (ATIP President) |
Keynote Speach |
Zongyou SHAO, Dawning Information Industry Company, Ltd. |
Session 1: Chinese Government Initiatives |
|
“Status of HPC-related R&D in China’s High-tech Program” |
Depei QIAN, Computer School, Beihang University |
“Position of China HPC” |
Ninghui SUN, Institute of Computing Technology (ICT), Chinese Academy of Sciences (CAS) |
“Introduction to Tianhe-1 Supercomputer” – |
Guangming LIU, National Super Computer Center in Tianjin (NSCC-TJ) |
Morning Break (refreshments served by SC) |
|
“Cappella: A New Paradigm for Building High Performance Object- based Storage” |
Dan FENG School of Computer Science and Technology, Huazhong University of Science and Technology (HUST) |
Session 2: Experience at HPC Centers |
|
“Extreme Effort to Petascale Computing in CAS” |
Xuebin CHI, Supercomputing Center of CAS (SCCAS) |
“HPC Activity in Shanghai Supercomputer Center” |
Tao WANG, Shanghai Supercomputer Center (SSC) |
“The Practice and Thinking of Beijing Industrial Cloud Computing” |
Yu ZENG, Beijing Computer Center |
“Design and Application of High-performance Computing Multi-service Platform in Northwest” |
Yulin SHEN, Gansu Computing Centre |
IBM-Sponsored LUNCH / NETWORKING / POSTER SESSION / PANEL DISCUSSION ON CHINA-US RESEARCH COLLABORATIONS |
|
Session 3: Chinese University and Institute Research Related to Specialized Hardware & Software |
|
“A Unified Programming Interface for GPU Clusters” |
Yifeng CHEN, School of Electronics Engineering and Computer Science, Peking University |
“Godson-T: A High-Efficient Many-Core Architecture for Parallel Program Executions” – |
Dongrui FAN, Institute of Computing Technology (ICT), CAS |
“State-of-the-Art Analysis and Perspectives of China HPC Development: A View from 2010 HPC TOP100” |
Prof. Yunquan ZHANG, Institute of Software, CAS |
“The Energy Conservation Technology for Large-scale Data Storage System” |
Changsheng XIE, School of Computer Science and Technology, Huazhong University of Science and Technology (HUST) |
“Synergistic Collaboration with HPC Researchers in China” |
Yuefan DENG, Applied Mathematics Department, Stony Brook University (SUNY), Stony Brook, NY |
Session 4: Science Engineering Applications in China |
|
“Multi-scale Supercomputing for Multi-scale Multi-phase Systems” |
Wei GE, Institute of Processing Engineering, CAS |
“Earth System Models and High-Performance Computing” |
Bin WANG, National Key Laboratory of Numerical Modeling for Atmospheric Sciences and Geophysical Fluid Dynamics (LASG), Institute of Atmospheric Physics, CAS |
“Computing Platform for High Energy Physics in China” |
Gang CHEN, Institute of High Energy Physics, CAS |
“HPC Platform in Automotive Design” |
Yi DAI, SAIC |
Afternoon Break (refreshments served by SC) |
|
“Realistic Protein Folding with Next Generation Methodology and Supercomputer” |
Guohui LI, Dalian Institute of Chemical Physics, CAS |
Session 5: Vendors |
|
|
Andy Keane, GPU Computing Business Unit, NVIDIA |
“Democratizing HPC China Industry through Windows HPC Server” |
Mingqiang XU, Microsoft China |
|
Dr. Nash PALANISWAMY, Intel |
“Computing Paths to the Future” |
Stephen Gray, Global CERN/LHC Technologist, Dell |
“Notes about DeepComp 7000 Applications and Development of PF Technology” |
Prof. Mingfa ZHU, Lenovo |
“Inspur HPC Innovation on Product and Application” |
Jun LIU, Inspur (Beijing) Electronic Information Industry Co., LTD |
ATIPの田村栄悦氏の報告「中国の2010 年HPC 最新事情」から二三の話題をひろう。
(a) 張教授の講演
張(Zhang)教授(Institute of Software (IoS)、CAS)らは、中国HPC Top100リストを2005年から作成しているが、講演では中国HPC の性能トレンド・将来予測、メーカー別やアプリケーション別シェアなどを発表した。これによると2008-2009 の100 TFlops システム完成目標が2008 年10 月に達成、2010-2011 に1 PFlops システム完成目標が2009 年10 月完成と、近年は目標よりも1 年程早く性能目標を達成できており、性能目標達成への自信を強めている。
TOP500 1 位のTianhe-1A および3 位のNebulae といった中国の現行の最大級スーパーコンピュータはIntel 製CPUとNVIDIA 製GPUを多数使用し、インターコネクトのみ中国が自主開発したものを使用している。しかし来年出現する曙光(Dawning社)製Dawning 6000スーパーコンピュータではCAS のInstitute of Computing Technology (ICT)が開発しているMIPS アーキテクチャの龍芯(Loongson (ロンサン) ) 3B あるいはその後継のLoongson 3C マイクロプロセッサを使用するなど国産化の流れも長期計画により着実に進めている。
このように中国のアプローチは、中長期の性能目標のマイルストーンを作ってその達成に向けて活動を積み重ねていく米国に近いスタイルである。現在「第12 次5 カ年計画(2011-2015 年)」を検討している段階にある。将来予測ではピーク性能10 PFlops システム完成を2012-2013、中国内のLINPACK 性能累計10 PFlops 達成を2011-2012 としている。現在、10 PFlops 一番乗りが次の目標となっていることが推察される。
(b) TOP500 1 位のTianhe-1A について
2009年11 月のTOP500 LIST で5 位に踊り出た国防科技大 (NUDT)開発のTianhe-1はその後本格稼動した様子はなかったが、実際にはその間中国メーカーのInspur 浪潮が加わってTianhe-1A へと再構築が進められていた。CPU はXeon E5540 からXeon 5670 へ変更となり、GPU もATI RadeonからNVIDIA Fermiへ、インターコネクトもInfinibandから自主開発のものへと変更された。率直にいえば、Tianhe-1 はTOP500 記録達成目的のためのシステムで、その1 年後のTianhe-1A で初めて実用システムになったと言えよう。Tiane-1A は新設の天津国家スーパーコンピュータセンター (National Supercomputer Center in Tianjin (NSCC-TJ)) に2010年8月に設置された。その後試験とデバッグが行われ、11 月以降サービスインの予定となっている。
コンピューティング・ルームは1,200m2の広さで東工大TSUBAME 2.0のスペースの約4倍。ピーク性能は4.7 PFlops (TSUBAME 2.0 の約2 倍)でTSUBAME 2.0 のような高実装にはなっていない。またGreen500 でもTSUBAME2.0 の約66%の635 MFlops/Wと性能は低い。総消費電力は4 MWである。
インターコネクトは二階層で、自主開発したHigh radix router ASIC とNetwork interface ASICを組み込んで全体で61.44 Tbps のスループットの仕様にしている。
1,024 個のサービス・ノードには自主開発の8 コアFT-1000 プロセッサ (SoC, 1 GHz, 8GFlops)がインテル製8 コアプロセッサと合わせて使われている。YinHe FeiTeng(銀河飛騰)という中国チップは、Sparc系のようである。
OS はKylin Linux(麒麟か?)、コンパイラはC, C++, Fortran, Java, OpenMP, MPI, OpenMP/MPI, CUDA, OpenCL そしてHeterogeneous programming framework が用意されている。
なおTianhe-1A は国防科技大がオープン用のシステム(Unclassified system)として開発したとのことである。
(c) 中国スーパーコンピュータの開発アプローチ
ワークショップの共同議長の銭 (Depei Qian)北京航空航天大学教授によると、中国スーパーコンピュータの開発アプローチは二段階アプローチによっている。
第一段階が2 台の100 TFlops システムの開発をすることで、これは上海スーパーコンピュータセンター (SSC)へのDawning 5000Aの開発、CASスーパーコンピュータセンター (SCCAS)へのLenovo社DeepComp 7000 の開発が相当する。
第二段階が3 台の1 PFlops システムの開発をすることである。ひとつが前述のTianhe-1A でNUDT/Inspur 浪潮/天津スーパーコンピュータセンターが担当するもの、二番目が開発中のDawning 6000システムでCAS ICT/Dawning社/華南(深釧)スーパーコンピュータセンターが担当するもの、三番目がSunway で江南/山東スーパーコンピュータセンターが担当するものとのことである。
Tianhe-1A は前述のとおりであるが、Dawning 6000 はService unit とComputing unit から構成されるハイブリッド・システムで、TOP500 の3 位のNebulae はそのService unit の部分である。Nebulae もTianhe-1A同様にIntel 6-core Xeon Westmere プロセッサとNVIDEA Fermi GPUを使用したピーク性能3PFlops, LINPACK 性能1.27 PFlops のスーパーコンピュータで電力消費は2.6 MWである。Service unit とは言うもののNebulae は実際にはTOP500 記録達成の役割を担っていた。Tianhe-1 のケースと同様、深圳での実運用はComputing unit が完成しDawning 6000 になる2011 年以降まではなされないとのことである。そのときにはTianhe-1同様にNebulaeも現在の構成と異なっている可能性もある。
Dawning 6000 のComputing unit の具体的な内容は明らかにされていないが、プロセッサにはCAS ICT が開発しているMIPS ベースのLoongson 3B が使用される予定である。しかしTOP500 記録のために、より高性能の後継プロセッサであるLoongson 3Cになる可能性も残っていよう。Dawning 6000 の稼働予定は当初予定よりも遅れており、完成は来年とされている。
(d) 上海スーパーコンピュータセンター (SSC)の状況
上海スーパーコンピュータセンター (SSC)では出来たばかりの天津や深圳のスーパーコンピュータセンターと異なり、いち早く2009 年には第3 フェーズの構築が終わり、Magic Cubeの愛称の230 TFlops 水冷Dawning 5000A が実稼動している。2008年11月のTop500では11位にランクされている。このシステムでは、ISV コードのFluent, CFX, LS-DYNA などが主に自動車設計、航空、建築工学に使用されている。最大の利用分野は天文物理、ナノサイエンス,量子化学、MD、CFD となっている。このセンターのハードウェア/ソフトウェアへの投資は中国政府と上海地方政府が行っている。運用コストについては大部分を上海地方政府が負担している。すなわち構築第一フェーズ (2000-2003)では全額、第二フェーズ(2004-2008)で80%、第三フェーズ(2009-)では70%のコスト負担を上海地方政府がしている。残りのコストは大学や企業ユーザからCPU 使用に応じた課金、中国政府や地方政府からの科学研究プロジェクト資金、そして企業からのR&D 資金でまかなっている。
国策としてのスーパーコンピュータ開発・設置は手厚くサポートされるが、その後のセンターの運用コストについてはそれほど優遇されておらず、ますます増える運用コストの負担がどのセンターでも課題となっている。SSC の利用ニーズは毎年2.3 倍ずつ上昇 しているため2014 年には10 PFlops に拡張する予定である。
8) 開会式
前日のGala Openingに引き続いて、16日(火曜日)の8:30から開会式があった。組織委員長の Barry V. Hellがあいさつし、委員、多数のボランティア、SCinetの担当者などへの感謝を述べた。
展示会場はSC史上最大であり、またSCinetでは総延長200マイルに及ぶこと、今回初めて100 Gbpsの回線を引いたこと、全体で270 Gbpsのバンド幅があることが紹介された。
ここで共同主催者であるIEEE/CSとACMの代表がそれぞれの学会の宣伝を行った。特にIEEE/CSは60周年とのことである。
最後のプログラムの3つのThrust areas (Climate Simulation, Data Intensive Computing, Heterogeneous Computingが紹介され、これに従って総合講演やMaster Worksプログラムが企画されていることが述べられた。
9) 基調講演 Clayton Christensen
式に続いて行われた基調講演はHarvard Business SchoolのClayton M. Christensenの、”How to Create New Growth in a Risk-Minimizing Environment”であった。
かれはいわゆる破壊的技術(”Disruptive Technology”)の提唱者である。かれの著書”The Innovator’s Dilemma: The Revolutionary National Book That Will Change the Way You Do Business”, Clayton M. Christensen (著)(Harvard business school press, 1997)、邦訳は「イノベーションのジレンマ―技術革新が巨大企業を滅ぼすとき」玉田 俊平太, 伊豆原 弓(訳)(翔泳社,2001)、およびその続編、”The Innovator’s Solution: Creating and Sustaining Successful Growth,” Clayton M. Christensen and Michael E. Raynor(著)(Harvard business school press, 2003)、邦訳は「イノベーションへの解―利益ある成長に向けて」玉田 俊平太, 櫻井 祐子(訳)(翔泳社, 2003)はビジネスの世界での必読書である。第一の本により、「disruptive technology破壊的技術」という言葉の定義が変わってしまったほどだという。すなわち、技術の進化する速度が、ニーズが進化する速度より大きいとき、破壊的技術が生まれる可能性があるという。第二作では、「技術」を「革新」と言い換え、破壊的な技術革新の挑戦を受ける側ではなく、技術革新により優位企業をうち負かそうとする視点から論じている。
Christensenは、3ヶ月前に脳の手術を受けたばかりでその後初めての講演だと前置きして、病み上がりとも思えない元気で講演を行った。
ビジネスで成功することは難しい。一時的にうまく行ってもそれを続けることは難しい。イノベーションはなぜ難しいか。それはハーバード・ビジネス・スクールで教えていることを実行していると失敗してしまうからである。
技術革新はしばしばカストマーが利用可能な範囲を超えて進展してしまう。例えばDigital Equipment社は、1980年代には成功例として賞賛されたが、1988年から崖から転がるように落ちてしまった。同様な例は、Data General、SGI、Sunなどいろいろある。10年前こんな日が来るとは思わなかった。その理由はどの場合も同じで、最初25万ドルの計算機の利益率は45%であったが、技術革新により同じ性能を2000ドルのPCで実現できるようになり、利益率は20%になってしまう。”Up is easy, down is hard.” “Little boys beat giants by disruption.”
鉄鋼産業でも同じだ、と述べて、ミルの技術革新によりベトレヘム・スチールの大型のミルより小さなミルが主流になってしまった。大会社の経営者が馬鹿だったわけではない。
なんでGMがつぶれたのか。カローラのようなサブコンパクトカーを作らなかったからだ。しかし今、トヨタはヒュンデ(現代)やキア(起亜)にやられている。
高等教育では数百年disruptionが起こっていない。
ドラッカーは、「カストマーは会社が売っていると思っているものを買うわけではない」と述べている。
真空管からトランジスタへの変化はなぜdisruptiveか。ソニーのポケットラジオはティーンエイジャーに受け入れられた。ソニーのポータブルTVはRCAよりよかった。真空管の製造会社RCAはつぶれた。
アウトソーシングは利益率をあげるのに有効であるが、これによりビジネスが液状化する危険がある、とDellとAsustek{台湾)との関係を例に説明した。部品の製造をアウトソースすると利益が上がった、組み立てもアウトソースすると利益がまた増える。製品販売もアウトソースし、ついに社名までアウトソースすることになる。経営者が馬鹿だったわけではない。ハーバード・ビジネス・スクールで教えられたことを忠実に実行しただけなのである。
質疑応答で、「IBMなど大会社でつぶれないものもあるのはなぜか」という質問が出た。「そういう会社は、独立なビジネスユニットに分けて競争させている。」
10) HPC Challenge Awards
![]() |
|
16日12:15からのBirds of a Feather sessionの一つとして、The 2010 HPC Challenge Awardsが発表された。これはClass 1とClass 2の二つのクラスがある。Class 1では、多くの問題のベスト性能を競う。カテゴリとしては、
a) HPL (High Performance Linpack)
b) Global-Random-Access
c) EP-STREAM-Triad per system
d) Global-FFT
Class 2では上記4つを含むHPC Challenge Benchmarkのプログラムの4つ以上を最もエレガントに実装したチームを表彰する。採点基準は「技術点」(性能)と「芸術点」(エレガンス、明晰さ、サイズ)がそれぞれ50%である。
Class 1の上位受賞は次の通り。
G-HPL |
Achieved |
System |
Affiliation |
Submitter |
1st place |
1,533 Tflop/s |
Cray XT5 |
ORNL |
Buddy Bland |
G-RandomAcces |
Achieved |
System |
Affiliation |
Submitter |
1st place |
117 GUPS |
IBM BG/P |
LLNL |
Tom Spelce |
G-FFT |
Achieved |
System |
Affiliation |
Submitter |
1st place |
11.88 Tflop/s |
NEC SX-9 |
JAMSTEC |
Kenichi Itakura |
EP-STREAM- |
Achieved |
System |
Affiliation |
Submitter |
1st place |
398 TB/s |
Cray XT5 |
ORNL |
Buddy Bland |
今回、Class 1のGlobal-FFTにおいて地球シミュレータ(JAMSTECのSX-9)が第1位を受賞した(写真はブースの前での記念写真。どういうわけか筆者も入っている)。なおEP-STREAMでは3位を受賞している。上記の表において、ORNLのXT5はJaguar、UTKのXT5はKrakenである。両者はORNLの広大なコンピュータルームに仲良く並んでいる。
Class 2の結果は以下の通り。
Award |
Recipient |
Affiliation |
Language |
Most Productive System |
George Almási |
IBM |
UPC and X10 |
Most Productive Language |
John Mellor-Crummey |
Rice |
CAF 2.0 |
Honorable Mention
|
Josep M. Perez
|
Bacelona |
SMPSs |
Honorable Mention |
Jinpil Lee |
U.of Tsukuba |
XcalableMP |
筑波大学のXcalableMPはHonorable Mentionを受賞した。
次回はSC10の第3部で、中国の2台のスーパーコンピュータがTop500のトップに躍り出た話など。
![]() |
![]() |
![]() |