世界初、1,000プロセッサ搭載のチップは様々なワークロードに対応
Doug Black

初めて1,000の独立したプロセッサを搭載し、デジタル信号処理、ビデオ処理、暗号化、およびデータセンター/クラウドのワークロードへの適応が確約されていると言われる、まばゆいばかりの高速マイクロチップがカリフォルニア大学デービス校のチームによって発表された。開発チームによれば、6月にホノルルで開催される2016 Symposium on VLSI Technology at Circuitsにおいてこのチップが公表されたこの「キロコア(KiloCore)」チップは、最大で毎秒1.78兆回の命令実行の演算レートを持ち、6億2千百万個のトランジスタを持っている。
比較のために、もしこのキロコアの面積が32nmのIntel Core i7プロセッサと同じであるとしたら、おおよそ2300から3700個のプロセッサを搭載することができ、ピーク実行性能で毎秒4.1から6.6兆回の独立した命令実行が可能になると設計チームは述べている。
このチップアーキテクチャ設計チームを率いるカリフォルニア大学デービス校の電気計算機工学の教授であるBevan BaasがHPCwireの姉妹誌であるEnterpriseTechに語ったところによると、このプロセッサを商業化する計画は今のところないが、このチップ用にすでに開発したいくつかのアプリケーションは重要な商業的意味を持っていると語っている。
![]() |
|
Bevan Baas | |
「多くのデジタル信号処理、無線符号化/復号化、マルチメディアおよび組込みワークロードにおいて目覚ましく優れていることが分かっており、最近のプロジェクトでもデータセンター/クラウドおよび科学的なワークロード用の計算カーネルにおいてもまた優れていることが分かっています。」と語っている。このキロコアはアーキテクチャ、アプリケーション開発、マッピング、回路およびVMLSI設計などの多くをカバーする分野において技術革新をもたらすと述べている。
「私達はキロコアの複数の側面が未来の計算システム設計に影響を与えることを願っています。」と語っている。「このアーキテクチャにマップすることができるワークロードの場合、エクサスケール・コンピューティングにおける適用性を持っている可能性があるのです。」
この設計チームはキロコアが大学でこれまで設計された最速のクロック速度を持つプロセッサであると主張している。これまで作られた他のマルチプロセッサ・チップにおいては、300プロセッサを超えるものがないとチームは述べている。
このキロコア・チップはIBMが彼らの32nm CMOS技術を使って製作した。
スループット性能以上に、キロコアはまた、これまで発表された中で最もエネルギー効率の高いメニーコア・プロセッサであるとBaasは語っている。例えば、1,000個のプロセッサは毎秒1150億命令を実行することができるが、たった0.7ワットしか消費せず、これは1個の単三電池で駆動できるくらい十分に低いのだ。このキロコア・チップは現在のラップトップのプロセッサよりも100倍以上効率的に命令を実行することができる。
各プロセッサコアは独立して個々に独自の小さいプログラムを実行することができるとBaasは説明しており、GPUのようなプロセッサに使用されている単一命令複数データ(SIMD)のアプローチよりも根本的により柔軟なアプローチであると述べている。アプリケーションを多数の小さいピースに分割するという考え方は、それぞれが異なるプロセッサで並列に実行でき、より低いエネルギー利用で高いスループットを可能にするということなのだ。
このキロコア・アーキテクチャは「細粒度メニーコア」プロセッサ・アレイの一例であるとBaasは述べている。プロセッサは可能なかぎりシンプルに保たれているので、チップ当たり多数のコアを小さいチップ面積しか必要としないのだ。「短く低容量の配線のおかげで高い効率を得ているのです。」と述べており、「高いクロック周波数で動作するのです。(高スループット、低遅延の面で高性能)」実際には、アクティブでもアイドルでも、コアは低い電力しか消費せず、何もやることがなければ完全にゼロのアクティブ電力しか消費しないと述べている。高いエネルギー効率はまた、低供給電圧による駆動と、相対的にシンプルなアーキテクチャによって達成されており、キャッシュベースの共有メモリ・モデルよりも、コア毎に少量のメモリコアを持ったシングルイシュー7段パイプラインとメッセージ通信ベースのプロセッサ間インターコネクトで構成されている。
このチームではチップのプログラミングに利用できるコンパイラと自動プログラム・マッピング・ツールを完成したとBassは述べている。