PEZY、新プロセッサ・モジュールカードでLINPACK値を向上しTOP500で性能値を更新か?
株式会社PEZY Computingは5月6日、既存の PEZY-SC の半導体部分は変更せずに使用しながら、そのパッケージ内のサブストレート基板の信号品質と電源品質を改善した「PEZY-SCnp」を新たに開発したと発表した。また、PEZY-SCnp プロセッサを搭載するモジュールカード基板についても、並行して信号品質と電源品質を解析・最適化し、プロセッサのパッケージ内のサブストレート基板とモジュールカード基板を一体で同時開発することで、既存の PEZY-SC とモジュールカードでの組み合わせと比較した場合、演算性能と消費電力効率のそれぞれに関して 10%を超える改善を確認したとしている。

PEZY が開発した PEZY-SC は、既に日本国内の高エネルギー加速器研究機構と理化学研究所にそれぞれ 2台ずつ設置されている、合計 4台のスーパーコンピュータに搭載され、2015 年 7 月期と同年 11 月期のスーパーコンピュータ消費電力効率ランキング「Green500」において、世界最高の消費電力性能値を認定されている。しかしながら、本来の設計仕様に対して未達であった項目が幾つか残存しており、これらは半導体自体に起因するものではなく、プロセッサパッケージ内の、ダイを搭載したサブストレート基板を特急で開発したために最適化が行われていないことに起因することが明らかとなっていた。
昨年の 11月以降、PEZY-SC のパッケージ内のサブストレート基板の問題を信号品質、電源品質の双方について詳細に解析した結果と、同時に、PEZY-SC プロセッサを搭載しているモジュールカード基板についても信号品質、電源品質を解析した結果を得ることで、本来の仕様から未達となっていた項目のほぼ全てを改善できる見通しを立てることが出来たそうだ。これらを基に、プロセッサパッケージを拡大してパッケージ Ball数を増加させつつ、サブストレート基板の構成を全面的に見直した「PEZY-SCnp(New Package)」として再開発を行ったことで、信号品質、電源品質の大幅な改善を得た。更に、大型化したプロセッサパッケージと増加した Ball数に対応しつつ、外形寸法を大きくせずに、24層から28層に基板層数を増やす対応を施し、モジュールカード基板レベルでも信号品質と電源品質を改善する再開発を行うことで、プロセッサを搭載したモジュールカード全体としての性能の改善を得ることが出来たとのことだ。
その結果、「PEZY-SCnp」を搭載した新モジュールカードは、PEZY-SC を搭載したモジュールカードと比較して、特に 32レーンある PCIe接続が Gen2(5 Gbps)から Gen3(8 Gbps)に高速化されたことと、DDR4のメモリ転送速度が 1,333MH から 1,866MHz に高速化されたことが大きく寄与して、演算性能について 10%を超える向上が確認された。また、その際の消費電力効率についても、コア動作電圧を 1.00V から 0.95V に 0.05V 分低下出来たことで、10%程度改善されていることが確認されたとしている。
今回開発された「PEZY-SCnp」の主要諸元は以下の通りです(括弧内は PEZY-SC の数値)。
・コア動作電圧:0.95V(1.00V)
・コア動作周波数:766MHz(733MHz)
・倍精度演算性能:1.57TFLOPS(1.50TFLOPS)
・パッケージサイズ:50.0*50.0mm(47.5*47.5mm)
・パッケージ Ball 数:2,397(2,112)
・DDR4 メモリ通信速度:1,866MHz *8ch=119.4GB/s(1,333MHz *8ch=85.3GB/s)
・PCIe 接続:Gen3 *32(双方向)=64GB/s(Gen2 *32(双方向)=32GB/s)
この「PEZY-SCnp」を搭載したスーパーコンピュータにおいて、256個規模の性能を計測したところ、上記の主要諸元において 260.8 TFLOPS(Rmax)の HPL性能が確認された。この数値はこれまでの PEZY-SC で計測された同規模での HPL性能の最高値であった 225.4 TFLOPSから 15.7%の向上となっており、PEZY-SCnp1 個当たりでは 1.02 TFLOPS と、初めて 1 TFLOPSを超える値を記録した。この Rmax 値の Rpeak値に対する実行効率に関しても、56.2%から65.0%にまでの向上が認められている。
PEZY では、今回開発した「PEZY-SCnp」について、既存の 4 台のスーパーコンピュータと、今後新設されるスーパーコンピュータに搭載して貰いながら、引き続き多様なアプリケーションにおける性能の向上に関しても、積極的に取り組んでいくとしている。
1)「PEZY-SC」と「PEZY-SCnp」(右)の 2 種類のプロセッサパッケージの比較(表面・裏面)
2)PCIe カードエッジを有するキャリアボード上に搭載した、2 種類のモジュールカード: 既存の「PEZY-SC」専用モジュールカード(左側)と比較して、プロセッサパッケージが大型化 しながらも外形寸法を保持しつつ、基板層数を 24 層から 28 層に増やすことで信号品質と電源品質 を改善した「PEZY-SCnp」専用モジュールカード(右側)
3)PEZY-SC 用と PEZY-SCnp 用のプロセッサ評価ボードの比較 予め信号品質と電源品質を解析したことで、評価項目を絞ることができて大幅な小型化を図れた PEZY-SCnp 用のプロセッサ評価ボード(右)