■ このスレッドは過去ログ倉庫に格納されています
自然言語処理スレッド その5
- 806 :デフォルトの名無しさん:2020/03/13(金) 01:04:33.05 ID:3thqY/PO.net
- 私も囲碁のアマ高段者のはしくれなので、「アルファ碁」の出現には驚いた
初期の「アルファ碁」は教師あり学習で、プロ棋士の棋譜を多数学習して強化された
そのうちに「アルファ碁」同士で対局し、経験値を上げて人間より強くなった
現在の「アルファ碁ゼロ」は教師なし学習らしい
「アルファ碁ゼロ」は「「アルファ碁」よりもさらに強く、100勝0敗である
アルファ碁は入力情報は棋譜である
棋譜とは19×19のマス目に白黒の石の配置と手順記録したものである
こんな感じ
1)先手 黒4−四 2)後手 白16−一七 3)先手 黒………
入力情報は19×19の画像情報である
探索空間は1手進むごとに探索木が決定する木構造となる
ある局面の瞬間のスナップショットが19×19の画像となりニューラルネットへの入力となる
アルファ碁はある局面での優劣判断を過去の学習結果から計算できる
その計算により次の1手を割り出していく
http://home.q00.itscom.net/otsuki/alphaZero.pdf
https://www.slideshare.net/suckgeunlee/alphago-zero
総レス数 1001
433 KB
新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★