チェスも将棋も! AlphaZeroのすごさ

10月にAlphaGo Zeroのことを書いたが、先週はさらにすごいニュースが。

nlab.itmedia.co.jp

あんぐり。

AlphaGo Zeroがゼロから人間やそれまでのAIを超えたといっても、現在のところはあくまで囲碁に限った話、と思っていたのだが、まさかこんなに早くチェスや将棋にまで応用されてしまうとは。しかもニューラルネットワークのアーキテクチャ(?)としては同じもので囲碁にもチェスにも将棋にも使えるという。

wired.jp

本当に、これからの展開に目が離せない。

DeepMindの論文はこれ。

Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (PDF)

将棋の方は、自己学習を始めてから2時間でelmo(今年の世界コンピュータ将棋選手権優勝ソフト)を超えたという。1手1分で100戦して90勝8敗2引分け。とんでもなくすごい。人類が何百年もかけ、将棋ソフトもようやく近年になって到達したレベルをやすやすと跳び越えてしまったということになる。

チェスでは世界最強のオープンソースチェスエンジンであるStockfishと100戦して28勝0敗72引分け。引分けの多さが目を引く。それと、28勝のうち25勝が白番(先手)でのもので、黒番(後手)では3勝しかしていない。このレベルになると先後の差は非常に大きいと見える。

（承前）昨年、NHKがAIの特集番組で羽生さんを起用してDeepMind社を取材したときに、羽生さんと、Hassabis さんはチェスの対戦をしたのではなかったっけ。それが今回将棋が選ばれたのに効いているとしたら、将棋界のトップ外交の成果、といえるのかもしれない。
— takodori (@takodori) 2017年12月7日