世界のスーパーコンピュータとそれを動かす人々


5月 29, 2015

画像認識の覇権をかけた技術巨人の戦い

HPCwire Japan

Tiffany Trader

エクサスケールへの競争は高度計算分野をかき回す唯一の競争ではない。深層学習のような人工知能のサブフィールドはまた、世界中のハイテク大企業から加熱した競争を引き起こしている。

画像認識となると、コンピュータはすでに平均的人間の能力に達しており、百度、Googleやマイクロソフトのような技術巨人達をお互いをしのぐように争わせている。

この競争の中での最新のプレーヤーは中国の検索企業である百度だ。百度の専用MinwaスーパーコンピュータでImageNetオブジェクト分類ベンチマークを利用することで、この検索巨人は画像識別エラーでたった4.58パーセントを達成し、人間、マイクロソフトおよびGoogleをこのプロセスで負かしたのだ。

百度のエンジニア・チームによるアップデートされた論文【PDF】は、この最新の成果は、「カスタム構築された深層学習専用スーパーコンピュータ【Minwa】、データ分割および通信のための新しい戦略を使った高度に最適化された並列化アルゴリズム、大規模深層ニューラルネットワークモデル、新規データ増強アプローチ、およびマルチスケール高解像画像の利用」から構成される百度の画像認識システムであるDeep Imageによるものだと述べている。

20150513-F1-Baidu-Fig9-2015-images-robustness堅牢性試験のための画像クレジット: 百度

ImageNet分類チャレンジは大規模オブジェクト分類のための事実上の標準ベンチマークとなっている。ソフトウェアは1,000の異なるカテゴリに事前に定義されたセットを使って150万画像で学習されている。性能を評価するための他の試験もある。そのひとつは「top-5」と呼ばれるもので、ソフトウェアの上位5つの推測のミス率を参照している。

「私共のシステムはこれまでにtop-5エラー率で4.58%という最高の結果を達成しており、人間の認識性能を超えており、ILSVRC 2014の優勝者を相対的に31%改善しています。」とこのレポートの著者は述べている。

百度の仲間達は、4.82%のエラー率を報告したGoogleと、4.94%のスコア達成して平均的人間のエラー率(5.1%)を越したことで数日前に勝利宣言をしたマイクロソフトの両社からの最新の結果よりもかなり良い結果であることを付け加えた。両企業ともまたImageNet大規模ビジュアル認識チャレンジで競合していた。

低いエラー率を達成した北京にあるMinwaスーパーコンピュータは36台のサーバノードを搭載しており、各ノードは2台の6コアIntel Xeon E5-2620プロセッサと4基のNVIDIA Tesla K40m GPUを搭載し、RDMAをサポートしているFDR InfiniBand (56Gb/s)のファブリック上で動作している。各GPUは12GBのメモリを搭載しており、単精度浮動小数点演算のピーク性能で4.20テラフロップスを提供している。GPUDirect RDMAにより、InfiniBandインタフェースはCPUの介在無しにGPUメモリにアクセスすることができる。システムはCUDA 6.0とMPI MVAPICH2を持ったLinuxで動いている。図1はシステムアーキテクチャを示している。

「我々の会社は現在、コンピュータ知能における競争をリードしています。」と百度の科学者であるRen WuがMIT Technology Reviewでレポートされたように組込ビジョンサミットで話をした。もし単に深層学習だけに追いやられていなければ、世界のトップ300の高速コンピュータに入るに十分な計算能力を持っているとWuは付け加え、次のように自慢した:「これは深層学習に特化した最速のスーパーコンピュータだと私は思います。我々の競合よりもさらに大きい、偉大なパワーを手に入れたのです。」

WSJによると、さらに大規模なマシンが作業中であるとのことで、約7ペタフロップスの性能を送り出すことができるらしいが、深層学習であるために、これは倍精度の値ではないのだ。

驚くことではないが、Facebookも深層学習の包みを押しているが、ソーシャルメディア企業はその状況については話をしていない。WSJの中で、コンピュータビジョンのパイオニアでFacebookのAI研究のディレクターであるYann LeCunはImageNet試験における場面を取り上げ、それがベンチマークとしては出口であると提言している。「人々は、オブジェクト検知やローカライゼーションのようなオブジェクト認識を伴うさらに大規模なデータセットとさらにチャレンジングなタスクにフォーカスしているのです。」