世界のスーパーコンピュータとそれを動かす人々


10月 2, 2015

AIの進軍: 72時間の学習でマシンがチェスをプレー

HPCwire Japan

Tiffany Trader

人工知能の分野は多くの障壁を持った厳しい歴史があるが、1997年にIBMのDeep Blueが君臨するチェスの王者Garry Kasparovを打ち負かしたり、2011年にもうひとつのIBMマシンであるWatsonがクイズ番組のJeopardyで気概を示したように、高得点もあった。現在、機械学習とその兄弟である深層学習は、革新的なアルゴリズムと継続的な演算能力の民主化に推進されて、遍在するようになってきた。

歴史的なDeep Blueの試合に戻って耳を傾けると、新種の学習マシンが、ニューラルネットワークをベースとした深層学習の現代的な方法を使って初期の強引なテクニックを改良することで、AIのための賭け金を再び上げたのだ。MIT Technology Reviewで報告されているように、これはマシンが人間の直感力と同類の何かを使って、チェス盤を評価しながらチェスを行った初めとのことである。

プロセッサ技術が向上すると、ゲームのプレイ・エンジンも速くなるが、ゲームプレイの知識を広範囲に利用する賢いコードと組み合わせて、すべての可能な動きを見極めるために力任せに行う彼らの手口は全く変わらないのだ。無制限の(ライフ)時間と十分なインクと紙を持っている人間は、おそらく同じことをできるだろう。しかし、Deep Blueは毎秒2億個の位置を評価するのに比べてKasparovは毎秒3から5個の位置であるのに、彼らのゲームプレイのレベルが本質的に同じだったことを考えてみる。人間の高度化はこのはるかに大きな効率を可能にするものであり、この品質はAIが取り込むことを望んでいるのだ。

その作成者であるインペリアル・カレッジ ロンドン校の修士の学生であるMatthew Lai,が述べるように、Giraffeと呼ばれる新しいチェス・エンジンは、「プログラマが与える最初の手作りの知識を使って、すべての領域固有の知識を発見するためにセルフプレーを使います。」このマシンはニューラルネットワークで訓練されており、人間の脳をモデルとしているのでそう呼ばれている。Laiの見解では、人工ニューラルネットワークは人間の「直感」の代わりとして動作し、純粋な腕力のアプローチよりもさらに効率的になる可能性を持っている。

トレーニングは2個の10コアIntel Xeon E5-2660 v2 CPUを搭載したマシンで約72時間掛かる。実際のゲームデータを利用するトレーニングは、最大20スレッドまでリニアに高速化するように完全に並列化されている。一旦トレーニングされると、コンピュータ化されたチェスプログラムは、数千行の手作りでチューニングされたパターン認識を搭載している現在の最先端のチェスエンジンと同じようにプレーするのだ。

Laiのエンジンは次の重要な場所にある所から出発する。

•静的な位置を評価する – 先を見ないで位置がどのくらい良いか予測する。
•任意の位置で最も「興味深い」分岐方向を決定し、その先を検索してどの分岐を破棄するか決定する。
•移動順序 – 検索効率に著しく影響しないように、どの動きを先に検索するか決定する。

「我々の狙いは、人間の創造性によって制約されないようにするために、自動的に高いレベルの特徴抽出を行うことができるシステムを創造することです。1990年代に計算パワーの制約のために実用的ではなかった何かのように。」と論文の中でLaiはこのプロジェクトについて述べている。

以前の試みでは、手作りの評価関数でパラメータ・チューニングを実行するためだけに機械学習を使っており、対してGiraffeの学習システムもまた自動特徴抽出とパターン認識を行っていると、Laiはさらに説明している。

拡張機能を利用すると、GiraffeはおおよそFIDE International Master (公式レートでトーナメント・チェス・プレーヤーの上位2.2パーセント)のレベルでチェスをプレーする。製作者によると、チェスをプレーするためにエンドツーエンドの機械学習を用いた最も成功した試みとなるそうだ。

「現在存在するほとんどのチェス・エンジンと違って、Giraffeは、遠い先を見るのではなく、トリッキーな場所を正確に評価し、人間にとっては直感となる複雑な位置的概念を理解することができることから、プレーの強みを引き出していますが、これは長い間チェス・エンジンにとっては難しいことでした。取り分け非常によくプレーをしている場合には、これはゲームの開始と終了段階において特に重要なのです。」