世界のスーパーコンピュータとそれを動かす人々


2月 27, 2017

AIとスパコン、TSUBAMEからABCIへ

西 克也

この2月、人工知能とスーパーコンピュータに関する大きな動きがあった。2月9日に意見招請の公示があった産業技術総合研究所の「人工知能処理向け大規模・省電力クラウド基盤」、2月17日に報道発表のあった東京工業大学の次期スーパーコンピュータシステム「TSUBAME 3.0」、2月20日に開所式が行われた産業技術総合研究所と東京工業大学の「実社会ビッグデータ活用オープンイノベーションラボラトリ」である。すでに知る人は知る大きな動きだ。

まず本題に入る前に人工知能(AI)に関する日本政府の動きについておさらいしておこう。日本政府は今後のAI研究に関して総務省、文部科学省、そして経済産業省の3省体制で臨むこととしている。体制としては「人工知能技術戦略会議」を頭として、総務省管轄の情報通信研究機構CiNetセンター、文部科学省管轄の理化学研究所革新知能統合研究センター、そして経済産業省管轄の産業技術総合研究所人工知能研究センターの3本柱のAI研究推進体制で動いている。

aijapan

日本のAI研究推進体制(人工知能技術戦略会議資料より)

近年AIが急速に脚光を浴びたのは理由がある。それは計算機性能の飛躍的な向上によるものだ。人工知能では推論を行うための手法がいろいろとあるが、主に人工知能で用いられるのはニューラルネットワークだ。ニューラルネットワークは推論のための学習が必要である。従来のニューラルネットワークによる学習では人間が特徴を抽出するための基本情報を与える必要があり、人工知能といっても基本は人間が考えるものから学習を行っていた。それに対して近年用いられる多層ニューラルネットワークであるディープラーニングでは、計算機が自分で特徴抽出を行って学習させることができる。これには膨大なデータを与えることが必要なだけでなく、それを処理するための莫大な計算資源を必要とするのだ。これは近年のビッグデータとマッチすることで第三次のAIブームとなっている。ここに昨年12月にPCクラスタコンソーシアムが主催したシンポジウムにおいて、産業技術総合研究所情報・人間工学領域長 関口智嗣の講演資料があり、現在の人工知能が再注目される背景を説明している。

whyainow
人工知能が再注目される背景(PCクラスタシンポジウムでの関口智嗣氏の講演資料より)

AI、ビッグデータ、そしてスーパーコンピュータは前述するようにディープラーニング(多層ニューラルネットワーク)とは切っても切れない関係だ。日本におけるAI研究推進体制において、文部科学省理化学研究所は誰もが知っている「京」コンピュータを開発運用し、そして現在ポスト「京」を開発している。さらに、和光本部には情報基盤センターに「HOKUSAI-GW」というスパコンが有り、十分な計算機能力を抱えていると言えるだろう。また総務省の情報通信研究機構はあまり広くは知られていないが莫大な計算機資源をけいはんな、北陸、そして仙台に保有している。特に有名なのは長年研究が行われているWeb上のテキスト分析システム「WISDOM X」とスマートフォンのアプリにもなっている自動翻訳システムだ。これらの背景にはスーパーコンピュータとも言えるクラスタコンピュータが使われている。これに対して、経済産業省の産業技術総合研究所はこの数年、スーパーコンピュータについては恵まれていなかった。産業技術総合研究所はその前身となる工業技術院の時代に自らスパコンの開発も行っていたし、1988年の日米貿易摩擦によりクレイスーパーコンピュータを導入したこともある。産総研はそれ以来スパコンを導入し続けたが、2004年のAISTスーパークラスタを最後に大規模なスパコンを導入することはなかった。

話は若干それるが当時1988年の同じ時期に国立大学として初めて外資系のスーパーコンピュータを導入した大学がある。それが東京工業大学だ。当時CDC社のETA-10を導入した。今回の産総研と東工大のコラボレーションは日本の官公庁大学として1988年に初の外資系スパコンを導入した仲なのだ。その点、両機関とも新しい風を取り込む力量を持っていると推測される。

さて話を戻そう。2015年に人工知能研究センターを設立した産業技術総合研究所は3省体制のAI研究推進体制の中で唯一スパコンを持っていない状態だった。もちろん産総研単独で新たなスパコンの導入を図ることもできたであろう。しかし、コンシューマー技術をフルに活用したスーパーコンピュータの構築において世界的な有名な東京工業大学、特に松岡聡教授を取り込むことができれば鬼に金棒だ。憶測に過ぎないかもしれないが、2月20日に開所式のあった産総研と東工大のオープンイノベーションラボラトリの概要から推測すると恐らくそのような背景もあったと考えられる。果たして、松岡聡教授は産総研人工知能研究センターの特定フェローとなり、このラボラトリのラボ長に就任している。

AIST-Titecg-OIL
AIST-Titech-OIL-Oragnization
産総研・東工大 実社会ビッグデータ活用オープン・イノベーションラボラトリ(東京工業大学TSUBAME3.0記者発表資料より)

産総研が計画している次期大型スパコンはAIに特化している。現在意見招請中の「人工知能処理向け大規模・省電力クラウド基盤」、通称ABCI(AI Bridging Cloud Infrastructure)だ。これは平成28年度の補正予算である「人工知能に関するグローバル研究拠点事業」の一環だ。総予算は拠点整備のための建物を含め総額195億円である。

h28_2hosyuyosan_pr

経済産業省人工知能に関するグローバル研究拠点事業(経済産業省平成28年度第2次補正予算PR資料より)

ABCIは資料招請時のスペックでは16bit浮動小数点演算性能で130PFLOPS以上とされ、驚愕した人も多かった。実際の64bit浮動小数点演算性能では33PFLOPS以上となっているので、現在の「京」コンピュータの3倍程度だ。3倍といっても来年インストールされた際には国内最速のスーパーコンピュータとなることは間違いない。

一方、2月17日に記者発表された「TSUBAME 3.0」は演算性能は64bit浮動小数点演算で12.15PFLOPSとなり、「京」を上回る性能となっている。また今後も既存のTSUBAME2.5も継続運用することでTSUBAME3.0と2.5を合わせた16bit浮動小数点演算性能は65.8 PFLOPSとなり、これは現在国内最速の東京大学のスパコンを上回り、国内最速のAI用スパコンシステムとなる見込みだ。すでに多くの内容が報道されているので詳細な説明は省くこととする。ただ一番重要な点はこれまでのスパコンと違ってAIにも力点を置いていることだろう。

TSUBAME3-Press-Final-16bitperformance
TSUBAMEの演算性能(TSUBAME3.0記者発表資料より)

 

産総研と東工大のオープンイノベーションラボラトリの資料によると、ABCIが導入される来年までの間、利用できるリソースとしては今年度に日本電気が落札した産総研AIクラウドシステム(AAIC)と、このTSUBAMEシステムとなるようだ。これから導入されるABCIはTSUBAME同様に16bitである半精度の演算性能を重視している。となると現在16bit演算をサポートしているNVIDIA社が優勢となるのだろうか。もちろん、インテル社も2017年出荷予定のKnight Millでディープラーニングを強調しているのが最後まで分からない。いずれにせよ半精度が主流である人工知能研究にとって、TSUBAMEはABCIへの絶好のプロトタイプとなることは間違いない。

P100
NVDIA TESLA P100アクセラレータ仕様

 

また、TSUBAME 3.0はABCIで求められている要求要件のひとつにつながる大きなマイルストーンを持っている。それは省エネ効率であるPUEだ。PUEは電力使用効率で冷却設備を含めた施設全体が消費する電力をコンピュータが消費する電力で割ったものだ。PUEが1.0とはコンピュータが消費する電力以外に冷却用の電力を必要としないということだ。これまでの一般的なデータセンターではPUEが2.0程度となっている。それがTSUBAME 3.0の場合にはPUEが1.033となるそうだ。ABCIにおいても資料招請時においてPUEは1.1以下であることが望ましいとされている。その点においてもTSUBAMEがABCIにとって、性能ばかりでなく省エネ効率における先駆けとなっているのだ。

産総研において、ABCIの導入でAI研究体制におけるインフラは十分なものになるだろう。しかし問題はこのインフラを使って得られる成果だ。その成果を出すためための道筋として「AIクラウドプラットフォームのエコシステム」の構築として説明されている。その説明スライドの中において、ひとつめの課題である「世界最先端のAIクラウド計算機資源の構築」はABCIの導入で完結する。ふたつめの課題は「世界最先端のAI研究を産学官連携して推進」とある。もちろんこれは産総研人工知能研究センター自体の設立もそうだろうし、今回の東工大とのオープンイノベーションラボラトリの設立もそうだ。そして3つのめの課題は「AIの社会実装を促進」とあるが、これはこれからの努力目標と言ったところだろう。

161216_PCCC-pub-research-model

AIクラウドプラットフォームのエコシステム(PCクラスタシンポジウムでの関口智嗣氏の講演資料より)

 

いずれにしても国を挙げてのAI研究はまだ始まったばかりだ。それも他国と比べるとかなり遅れをとっていると言う人もいる。日本の三省が行うAI研究推進体制が今後どれくらい成果を上げることができるのだろうか。これはスパコンの状況に似ている。世界に遅れを取ることはそれ自体が日本の競争力を失うことになりかねない。産総研・東工大のオープンイノベーションラボラトリにおいてTSUBAME 3.0稼働し、来年にはABCIが稼働し、大型のスパコン2システムを使った日本最大のAI研究センターが稼働することとなる。この動きが日本のAI研究推進体制の起爆剤のひとつになることができるか、期待される。