自然言語処理スレッド　その５

デフォルトの名無しさん

私も囲碁のアマ高段者のはしくれなので、「アルファ碁」の出現には驚いた

初期の「アルファ碁」は教師あり学習で、プロ棋士の棋譜を多数学習して強化された
そのうちに「アルファ碁」同士で対局し、経験値を上げて人間より強くなった

現在の「アルファ碁ゼロ」は教師なし学習らしい
「アルファ碁ゼロ」は「「アルファ碁」よりもさらに強く、１００勝０敗である

アルファ碁は入力情報は棋譜である
棋譜とは１９×１９のマス目に白黒の石の配置と手順記録したものである
こんな感じ
１）先手　黒４－四　２）後手　白１６－一七　３）先手　黒………

入力情報は１９×１９の画像情報である
探索空間は１手進むごとに探索木が決定する木構造となる
ある局面の瞬間のスナップショットが１９×１９の画像となりニューラルネットへの入力となる

アルファ碁はある局面での優劣判断を過去の学習結果から計算できる
その計算により次の１手を割り出していく

http://home.q00.itscom.net/otsuki/alphaZero.pdf

https://www.slideshare.net/suckgeunlee/alphago-zero

自然言語処理スレッド その５

自然言語処理スレッド　その５