2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

自然言語処理スレッド その5

806 :デフォルトの名無しさん:2020/03/13(金) 01:04:33.05 ID:3thqY/PO.net
私も囲碁のアマ高段者のはしくれなので、「アルファ碁」の出現には驚いた

初期の「アルファ碁」は教師あり学習で、プロ棋士の棋譜を多数学習して強化された
そのうちに「アルファ碁」同士で対局し、経験値を上げて人間より強くなった

現在の「アルファ碁ゼロ」は教師なし学習らしい
「アルファ碁ゼロ」は「「アルファ碁」よりもさらに強く、100勝0敗である

アルファ碁は入力情報は棋譜である
棋譜とは19×19のマス目に白黒の石の配置と手順記録したものである
こんな感じ
1)先手 黒4−四 2)後手 白16−一七 3)先手 黒………

入力情報は19×19の画像情報である
探索空間は1手進むごとに探索木が決定する木構造となる
ある局面の瞬間のスナップショットが19×19の画像となりニューラルネットへの入力となる

アルファ碁はある局面での優劣判断を過去の学習結果から計算できる
その計算により次の1手を割り出していく


http://home.q00.itscom.net/otsuki/alphaZero.pdf

https://www.slideshare.net/suckgeunlee/alphago-zero

総レス数 1001
433 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★