9月 3, 2014

富士通Post-FX10の詳細が明らかに

HPCwire Japan

西　克也

今月アメリカで開催された「HotChip26」において「Post-FX10」に採用されるCPUの詳細が明かされた。HPCwire Japanでは昨年のSC13において展示されていた富士通の「Post-FX10」の早期記事を取り上げていたが、今週東京で開会された「サイエンティフィック・システム研究会」においてPost-FX10のさらなる詳細が明かされたので読者の方々にもお伝えしようと思う。

今回発表されたPost-FX10に搭載されるCPUである「SPARC64 XIfx」とこれまでの「京」で使われたSPARC64 VIIIfxおよびFX10用のSPARC64 IXfxの比較表を以下に示す。昨年SC13で公表された通りに4倍以上の性能となり、CPUあたり1.1 TFLOPSの性能を誇っている。

システム名	京コンピュータ	FX10	Post-FX10
CPU	SPARC64 VIIIfx	SPARC64 IXfx	SPARC64 XIfx
アーキテクチャ	SPARC V9 + HPC-ACE		SPARC V9 + HPC-ACE2
動作周波数	2 GHz	1.848 GHz	2.2 GHz
コア数	8	16	32(プラス、アシスタントコアが2)
ピーク性能	128 GFLOPS	236.5 GFLOPS	1.1 TFLOPS
演算器	FMA x 4 (2SIMD)		FMA x 2 (256bit wide SIMD)
L1キャッシュ(命令)コア当り	32KB	32KB	64KB
L1キャッシュ(データ)コア当り	32KB	32KB	64KB
L2キャッシュノード当り	6MB	12MB	24MB
メモリ	DDR3 SDRAM	DDR3-1333	HMC
メモリ容量	16GB	32GB/64GB	32GB
メモリバンド幅	64GB/s	85GB/s	480GB/s
インターコネクト	Tofu (外部チップ)		Tofu2 (CPU内蔵)
リンクバンド幅	5GB/s		12.5GB/s

クロックが約20％アップしてコア数が2倍とはなったものの、性能が4倍以上に上がっているのは何故だろうか？これは新たに開発されたHPC-ACE2と呼ばれる演算器の改良によるものだ。これまでのFX-10に使われていたHPC-ACEにおいては、各演算器ではSIMDで2データ同時処理が可能であったが、HPC-ACE2では、SIMDを256ビットワイドに変更したため、同時に最大4個の倍精度浮動小数点データ処理が可能となっている。これによって、最大性能が4倍を超える1.1TFLOPSを達成している。

さらにCPUについては32コアの演算コアの他にアシスタントコアとして2コアが内蔵されている。これはFX-10まではI/Oノードとして別のノードが必要だったものをCPUに内蔵したものだそうだ。このアシスタントコアによって演算コアのOSノイズ(デーモンやIO割込み処理)を排除する役割を担っている。またL1およびL2のキャッシュサイズが倍増していることも注目すべきことだ。

メモリについてはすでに分かっていたようにHMCが採用されている。メモリ容量は32GBと小さいが、メモリバンド幅が480GB/sと5倍以上の性能になっており、コア数が倍増することによるデータ供給の増加に対応できるように考慮されている。またHMCを採用することにより低消費電力化にも成功しており、これまでのFX-10ではメモリの電力消費量が最大の場合CPUと同じ程度消費していたものが、Post-FX10ではCPUに対して四分の一程度の消費電力に抑えることに成功したそうだ。ただし、コア当りのメモリ容量は1GB/コアとなりこれまでの半分となるため、アプリケーションの開発には考慮する必要がありそうだ。また、メモリも水冷冷却となるとのことだ。

インターコネクトについては外部チップのTofuからCPU内蔵のTofu2へとバージョンアップされ、これによりリンクバンド幅も2倍以上になっている。シャーシ間の接続も光接続となる。

性能データについても今回一部公表された。SIMDが256ビットになったことによって演算性能がFX10に対しコア当り2.7倍から3.3倍に向上したとのことだ。また、ストライドおよびインダイレクトのロード/ストアの命令をSIMD対象の命令として追加されたことによる性能向上も見逃せない。組込関数の処理性能も向上させている。最後にアプリケーションの種類は流体系としか明かされていないが、いくつかカーネルによる評価試験結果もだされており、コア当りの性能はFX10の約1.7倍と報告されている。

Post-FX10は12台のノードを1個の2Uシャーシに収めて19インチラックに収納可能だ。1ラックに最大216ノードを搭載できる。1ラック当りの最大性能は237.6TFLOPSとなる。これまでのFX10と同じく最大1,024ラック接続可能であれば最大243PFLOPSのマシンが構成できる。この性能は現在TOP500の首位である中国のTianhe-2の4.4倍の性能だ。最後にPost-FX10については正式な製品名はまだ決まっていない。

順位	機関名	システム名	ピーク性能(TFLOPS)
1	理化学研究所	富岳	537,212
2	産業技術総合研究所	ABCI 3.0	181,490
3	ソフトバンク株式会社	CHIE-4	151,880
4	ソフトバンク株式会社	CHIE-3	138,320
5	ソフトバンク株式会社	CHIE-2	138,320
6	産業技術総合研究所	ABCI-Q	99,350
7	最先端共同HPC基盤施設	Miyabi-G	72,800
8	FPTジャパンホールディングス	FPT AI Factory	67,440
9	東京科学大学	TSUBAME 4.0	61,600
10	さくらインターネット	SAKURAONE	47,790

すべての国内スパコンリストはこちらから。

西克也
西克也はフェアチャイルド社、クレイ・リサーチ社、ベストシステムズ社など、30年以上に渡ってHPCに関する仕事に従事している。Hpcwire Japanの編集長として記事の作成と翻訳を行っている。

島田佳代子
1999年～2007年まで英国在住。2001年よりスポーツ、旅、ビジネス、映画など幅広いジャンルで執筆活動を開始し、Hpcwire Japanでは主に日本のHPC業界が世界に誇る研究者、開発者の方々のインタビューを担当。

小柳義夫
小柳義夫氏は40年以上に亘ってHPCに携わってきた研究者であり、日本のHPC業界における生き字引として有名。現在　高度情報科学技術研究機構に所属し、産業界のHPC推進にあたっている。

小西史一
小西史一は、理化学研究所、東京工業大学においてHPCおよびバイオインフォマティクスに関する研究と教育に携わってきた研究者。2012年からフォトグラファーとしての活動を開始し、現在はIT技術・セキュリティのコンサルティング業務に携わっている。

eNewsletter

検索

PLUTNUM

GOLD

SILVER

HPCの歩み50年記事一覧

スパコンリスト日本

記事寄稿について

富士通Post-FX10の詳細が明らかに

調達情報

ニュース記事

お知らせ

特別イベント

International Conference for High Performance Computing, Networking, Storage & Analysis (SC26)

技術資料ダウンロードサービス

スパコン調達手続き中

国内スパコン上位10システム(TOP500順)

近日開催国内イベント

2026年並列／分散／協調処理に関するサマー・ワークショップ（SWoPP 2026）

【CAE懇話会】第17回中四国CAE懇話会『中国地区におけるデジタルイノベーション活用事例』

【CAE懇話会】第107回関西CAE懇話会テーマ：「AI・最適化が切り拓く設計とものづくりの未来」

【東京科学大学】東京科学大学 AI-Science Nexusセンター（AISNeC）設立シンポジウム

リコンフィギャラブルシステム研究会 (RECONF)

第206回ハイパフォーマンスコンピューティング研究発表会

【RIST】第15回オンラインサロン「スパコンコロキウム」燃焼シミュレーション

【RIST】第13回成果報告会／第9回HPCIコンソーシアムシンポジウム

CBI学会2026年大会

International Conference on Big Data and Smart Computing (BigComp)

寄稿者

HPCwire Japan

E-Marketings, Inc.

PLUTNUM

GOLD

SILVER

HPCの歩み50年記事一覧

スパコンリスト日本

記事寄稿について

富士通Post-FX10の詳細が明らかに

調達情報

ニュース記事

ホットな話題

お知らせ

特別イベント

技術資料ダウンロードサービス

スパコン調達手続き中

国内スパコン上位10システム(TOP500順)

近日開催国内イベント

寄稿者

HPCwire Japan

E-Marketings, Inc.