10月にAlphaGo Zeroのことを書いたが、先週はさらにすごいニュースが。
あんぐり。
AlphaGo Zeroがゼロから人間やそれまでのAIを超えたといっても、現在のところはあくまで囲碁に限った話、と思っていたのだが、まさかこんなに早くチェスや将棋にまで応用されてしまうとは。しかもニューラルネットワークのアーキテクチャ(?)としては同じもので囲碁にもチェスにも将棋にも使えるという。
本当に、これからの展開に目が離せない。
DeepMindの論文はこれ。
Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (PDF)
将棋の方は、自己学習を始めてから2時間でelmo(今年の世界コンピュータ将棋選手権優勝ソフト)を超えたという。1手1分で100戦して90勝8敗2引分け。とんでもなくすごい。人類が何百年もかけ、将棋ソフトもようやく近年になって到達したレベルをやすやすと跳び越えてしまったということになる。
チェスでは世界最強のオープンソースチェスエンジンであるStockfishと100戦して28勝0敗72引分け。引分けの多さが目を引く。それと、28勝のうち25勝が白番(先手)でのもので、黒番(後手)では3勝しかしていない。このレベルになると先後の差は非常に大きいと見える。
(承前)昨年、NHKがAIの特集番組で羽生さんを起用してDeepMind社を取材したときに、羽生さんと、Hassabis さんはチェスの対戦をしたのではなかったっけ。それが今回将棋が選ばれたのに効いているとしたら、将棋界のトップ外交の成果、といえるのかもしれない。
— takodori (@takodori) 2017年12月7日
そう、「NHKスペシャル 天使か悪魔か 羽生善治 人工知能を探る」で、羽生さんとハサビス氏がチェスで対戦して、確か1勝1敗だった。
チェス以外のターゲットとして、シャンチー(中国将棋)やチャンギ(朝鮮将棋)ではなく日本の将棋が選ばれたのは、案外羽生さんとの交流があったからかもしれないな。持ち駒を使える(だから終盤の変化が多い)というユニークなルールに注目したからかもしれないが。