Tweet AlphaGoを改良したAlpha Zeroが囲碁だけでなくチェスや将棋などを攻略できるようになった、という話を聞いても「今更?」とピンと来なかったまま日々が過ぎていきました。 しかし一昨日ふと気になって、会社に届いたばかりの深層学習PC、DK-1000で試運転がてら実装をいくつか見てみると、AlphaGoのときよりもずっとシンプルな実装になっていて心底驚きました。 試しに、リバーシ(オセロ)とTic-Tac-Toeを実行してみると、猛烈な勢いでAlpha Zeroは自己対戦を始め、どんどんスコアを上げていきます。 最終的にはTic-Tac-Toeを1000回くらい学習したところで、自己対戦の結果は0勝0敗1000引き分けになりました。 この結果に、心の内側からこみ上げてくるものを感じずにはいられません。 これはまさしく映画「ウォーゲーム」のラストシーンで、NORADの司令室に

