IBMのHPC戦略はグローバルに「点をつなぐ」ことだ
John Russell

先日IBMはエクサスケールへの道に向けた科学コードの用意をするためのGENCIとの公式な共同研究を発表した。7月にIBMは2番目の欧州POWER加速化・設計センター(PADC)を発表しており、これはフランスのモンペリエだ。これもまたGENCIとの取り組みの軌跡だ。昨年11月にIBMは最初のPADCを開設し、これはドイツ(ユーリッヒ・スーパーコンピュータセンター)で、同様にイギリスにもビッグデータ・イノベーション・ハブ(STFC)を開設している。もちろん、IBMの中核的研究拠点は米国中(いくつかはCORALのサポートとして)、そして中国にもまた広がっている。
「これは来年に向けて点をつなぐ活動となりますので、これからより多くのセンターの発表をお聞きになることになります。一般に考えられているのとは逆に、我々がインテル・ベースの事業を投げ出した時に、IBMがHPCの分野を残さなかったことは、更なる徴候です; 私共は少しばかりの再編を行ったのです。」とHPCwireとのインタビューにおいてIBMのハイパフォーマンス・コンピューティングの副社長であるDave Turekは語った。
これまでのところ、若い努力が実を結んでいるようだ。最初のPDAC(ユーリッヒ・スーパーコンピュータセンター)が開設された時にはOpenPOWERは70のメンバーがいた。現在は約140だ。PDACセンターはOpenPOWER財団の共同創設者であるNVIDIAやMellanoxとの協調の中で運営されており、両社はOpenPOWERエコシステムの拡大に大きく貢献しているが、この関係はOpenPOWERメンバーに厳しく制限されている、とTurekは指摘している。GENCIとの共同研究のように個々の協力者もまたOpenPOWERの利益を得ることとなるが、もっと一般的なエクサスケールに向けた活動を進めることにフォーカスしている、と彼は語った。
「現在のOpenPOWERのすべての参加者の20〜30パーセントの参加者がHPCに重点を置いており、これらの企業と共同で進められている多くの活動があります。しかし、OpenPOWERがIBMとは個別に各自のHPCの意欲をサポートする多くの活動もあるのです。」とTurekは語った。「これは、確かに我々の技術を使い、我々のIPをライセンスし、IBMのデザイン・サービスを利用し、幾つかの事例ではIBMのソフトウェアスタックの要素を利用していますが、彼らが一緒にしようとしている全体的なソリューションは非常に特定の種類の固有の特徴を持っているという中国のいくつかのベンダーの合理的な特徴だと言えます。」
GENCIはエクサスケールに向けたフランスの推進の先頭にたってリードする組織である。この新しいIBM-GENCI協定は科学アプリケーション・ソフトウェアにフォーカスする予定だ。エクサスケールへの道は長いので、IBMはこの協調体制が18ヶ月間を超えて「おそらく7年、8年もしくはもっと」延長されることを期待しているとプレス発表の中で引用している。「IBMはGENCI専属の人員を持っていますので、単なる空約束ではありません。実際に人員をGENCIにアサインし、フルタイムで勤務させています。これは、GENCIで発見する種類の専門知識を活用し、国際的な視点から広く起きているエクサスケールを進めるための私達の側の真剣なコミットメントなのです。」とTurekは語った。
Turekによると、この共同研究で作られたソフトウェアの大半はオープンソースにしていく予定だ。「移植もしくは最適化する必要があるが、商用ソフトウェア・プロバイダーとの協調の中でおそらくIBMによってほとんどが実行される商用コードがあるところになります。」と付け加えた。
Turekが表向きのエクサフロップスの目標についての話といいながら、「私たちはこの市場でのフロップス中心の視野を実際にはもはや持っていません。解析と率直に言って古典的なHPCアプリケーションとの統合を実際に見る場合、より多いフロップスの存在は何の意味もありません。我々がSequoia(Blue Gene)上で動いているアプリケーションのポートフォリオの自己試験を行って、より大きい性能を得るのに整数性能とメモリ帯域幅でより多く行うという方法を発見した少なとも2012年から、2つのアーキテクチャの特長がPOWER8と将来のpower設計に反映していることを知っています。」
![]() |
IBM-GENCIの共同研究はまた、高速NVIDIA NVLinkインターコネクトを介したPOWERプロセッサへのNVIDIA GPUアクセラレータの接続と、同様にMellanoxのEDRスイッチがソリューション性能を劇的に向上させるIBMのCoherent Application Processor Interface (CAPI)を活用することができる方法のようなOpenPOWERベースの技術革新をフル活用するようにする。GENCIとIBMの専門家たちは、プログラミング・モデルの発展を理解し、共有メモリ・マルチプロセッシング・プログラミング用にMPIやOpenMPのアプリケーション・プログラム・インタフェースの代替を検討する取り組みも行う予定だ。
「私はこれらのセンター(最適化センター、デザインセンター、powerベース技術センター、coralプログラム支援のための米国内の中核的研究拠点)を配置する際に研究を調整するように非常に慎重に行いましたので、何をやっているかという面では重複はありません。これは分割統治の種類の国際的協調なのです。」とTurekは語った。
例えば、「GENCIで続いている取り組みが米国の中核的研究拠点の一つ、またはその逆のものまねでないことを確信しています。なので、CORALプロジェクトの一部である中核的研究拠点は、我々がヨーロッパでセットアップしたセンターからの実際には利益を引き出すでしょうし、これをさらに国際的に進展させるためにこの数ヶ月でさらに多くのセンターを公表する予定です。」とTurekは述べた。
HPCが広く地域的な要件に対応することを保証することは重要であるが、不幸にも稀である、とTurekは語った。Cray、HP、IBM、IntelおよびSGIのパネリストを持ったHPCwireのpodcast(NSCIの危険と約束における業界リーダー)を引用しながら、彼は顔をしかめて指摘した。「この電話の参加者はすべてアメリカのアクセントでした。SGIのGabriel Bronerはアルゼンチン出身ですが我々の一人としてカウントしています、しかし彼はとてもとても長く住んでい過ぎるのです。」
地理から地理への視点の違いがあり、協調のための自然な機会を創造する特定の地域においては、専門知識の集中があるのだ。世界中の人々がこの技術の展開を考える時に対処しなければならない障害の種類(電気の継続的な利用可能性、電気料金、広く様々な規制、HPC利用に向けた異なる文化的態度のような簡単な事)は特に大企業がHPCを運用する際には簡単に忘れられるので、これは重要だとTurekは語った。
「彼らがそうでない時、地球上で人類の均一な特徴にあたかも適用できるように私たちは時々宣言をします。例えば、研究にクラウドを適用するにあたっては、米国とヨーロッパで異なる意見があるのです。」とTurekは指摘した。
これらの相違を許容することは成長するHPCの利用やIBMの事業にとっては実際に必要なことだ。
「世界中にこのようなセンターを設立し、システム設計者が国際基準を遵守しながら実際に作るものを確認するために、一種の教育メカニズムとしてこれらを利用します。時間の経過とともに、我々の世界地図を手にして点を結び始め、これがどれくらい多様であるか見ることができるでしょう。」