2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【オセロ,将棋】ボードゲーム Part2【囲碁,War】

584 :310:2019/01/06(日) 20:36:40.74 ID:a93oWf/5.net
>>582
Tiny-DNNはGPU対応していないんじゃないかなぁ。
結局、DCNNはGPUで処理しないと無理っつー気がする。

585 :535:2019/01/06(日) 20:44:29.63 ID:6f3tqt5A.net
>>584
あ〜やっぱそうなんですかねぇ。
GPUも結構いいの買ったのでぜひ活用したいところではあります。

586 :535:2019/01/06(日) 22:23:00.36 ID:6f3tqt5A.net
明日は仕事なのでハマらないうちに切り上げようww
社会人として自制しなければwww

587 :535:2019/01/07(月) 20:55:27.41 ID:4rY/alBf.net
学習回しても損失が全く減らない。。。
そういやそんなのあったな。orz

588 :535:2019/01/07(月) 23:12:38.14 ID:4rY/alBf.net
なんかネットワーク初期化忘れてたみたいw
初期化したら損失減ったw

ちょっと希望が出てきた。

589 :535:2019/01/08(火) 23:12:12.87 ID:1omQC7Mg.net
損失減ることは減るんだけどホントにちょっとづつしか減っていかない。
ネットワークの形状が悪いんだろうか?学習率だろうか?
うーん、深みにはまりそうorz

590 :310:2019/01/09(水) 20:33:25.82 ID:9GUGdavc.net
学習の速度はオプティマイザに依存します。

普通のSGDだと、あちこちぐるぐる回ったり、平野トラップで立ち往生したり、
局所最適解から抜け出せなくなったり。また、SGDは学習率(α)を大きくすると、
簡単に発散しちゃったりしますので、学習率を低めにして1000回とか学習する
事になります。それでも上記の問題で、なかなか収束しなかったり、うまく学習
できなかったりします。

そういうものなのです。昔は、初期値(乱数設定しているはず)を変えてみたりして
トライ&エラーしてましたが、今なら別のオプティマイザ(RMSpropやADAM)を試す
べきかと思います。それでも数百回は学習を繰り返さないといけないと思います。


久々に検索したら結構種類が増えてた。
https://qiita.com/ZoneTsuyoshi/items/8ef6fa1e154d176e25b8
自分は線形回帰モデルですが、SMORMS3を使って効率化を図っています。
それでも、数百回学習しないと損失は落ち着いてきません。

591 :310:2019/01/09(水) 22:31:13.85 ID:9GUGdavc.net
置換表ですが、結局のところ、ハッシュのビット数を増やしてチェーン接続があまり
生じないようにし、メモリーをある程度のサイズでまとめて確保する、チェーン型
ハッシュに落ち着いています。

普段速度計測に使っているFFO#40-49ではconcurrent_unordered_map版より若干
遅いのです。が、どうも残り28手(現在はそのあたりをチェック中)では、自作チェーン
ハッシュの方が早いというか、ノード数が増えた時に速度低下が少ないように感じて
おり、現在は自作置換表を使っています。

とはいえ、29手や30手まで行った暁にはチェーン接続が多発し始めて速度低下が
始まると思われるので、対策を考えて行きたいと思います。28手が終わるまでまだ
一カ月くらいかかるので、幸か不幸か時間はたっぷりあります(--;

今のところチェーンの代わりに2分木を置いて、ハッシュが衝突したときの速度低下を
O(n)からO(log(2)n)にしてみようかと考えています。

592 :535:2019/01/09(水) 23:20:11.40 ID:ED/1LPLd.net
ふーむ。要素が少ない時はリストやツリーは遅く、配列が圧倒的に早いという認識でしたが。

593 :535:2019/01/12(土) 00:34:20.08 ID:I11IVt9R.net
あれ、序盤DBに棋譜を追加したら全然おかしな手を打つようになっちゃった。
棋譜がまずいのかな?

594 :535:2019/01/12(土) 01:02:50.64 ID:I11IVt9R.net
くそ〜強いAI(自我があるとかではないよ)作りてぇなぁ

595 :535:2019/01/12(土) 01:39:38.14 ID:I11IVt9R.net
三連休とはいえそろそろ寝なければな。
生活のリズム崩すのはいくない。

596 :535:2019/01/12(土) 21:33:08.59 ID:I11IVt9R.net
質にばらつきのある棋譜から良いデータを抽出する方法はあるのだろうか?

597 :535:2019/01/12(土) 22:30:56.75 ID:I11IVt9R.net
うーんせっかく3連休なのに捗らないな。
これだというアイディアが湧くまでこねくり回すしかないか。

598 :535:2019/01/13(日) 22:01:49.93 ID:vPz6niN1.net
結局アルファゼロという正解がある限りその呪縛から逃れるのはかなり難しいorz
うーん。

599 :535:2019/01/14(月) 21:36:22.16 ID:yfXkG3lc.net
やっぱグラボも活用したいなぁ。
でも難しいんだよなぁ。
とくにウィンドウズだと。

600 :535:2019/01/16(水) 00:51:29.20 ID:ecOlQUBV.net
昨日一日学習回して損失が初期値の2/3位になった。
この辺が限界かなぁ
それともぞうきんを絞るようにまだまだ損失減るんだろうか?

601 :310:2019/01/18(金) 00:47:06.53 ID:YI61Q9H1.net
NN系は学習してるんだかわからない時があるよね。
とことんまで回すと今度は過学習も怖くなってくるし。


こちらは、自作concurrent_mapクラスができました。
ハッシュキーは二分木で、ハッシュ値は64bit。
配列ハッシュキー版と同様に、削除もiteratorも無し。
すこーし速度があがったかなぁ程度。
衝突時の処理はチェーン式。流石に64bitだとキーの衝突が無い。

棋譜訂正は時間がかかるので、暇つぶしが必要な状態。
二分木を赤黒木に変えてみようかと思い始めています(汗。

本当はヒューリスティックスの改良の方が効果あるんだろうなぁ。

602 :535:2019/01/18(金) 22:51:46.73 ID:glnAkAuX.net
今週は残業がひどかったorz
でも土日は休める。

603 :310:2019/01/19(土) 09:03:58.77 ID:/dbSBJQm.net
赤黒木を検討してますが、これ並列処理だと木全体をロックしないと
いかんのではないかと…。置換表のように追加の頻度が高いケース
では、排他待ちでパフォーマンス出ないかも。

まあ、やってみるしかないけれど。

604 :535:2019/01/19(土) 11:25:42.95 ID:R+TIxYAB.net
赤黒木とかめっちゃむずかしいやつですやん。
さすがですな。

605 :535:2019/01/19(土) 19:50:28.36 ID:R+TIxYAB.net
ん、なんか学習したネットワークがすべてのデータに対して同じ結果を返してるっぽい?

606 :535:2019/01/19(土) 19:58:01.80 ID:R+TIxYAB.net
学習開始時のネットワークの重みの初期化をミスってるんだろうか
うーん。

607 :535:2019/01/19(土) 20:54:13.90 ID:R+TIxYAB.net
tiny-dnn以外のGPU使えるライブラリで重みだけ学習してアプリケーションからはtiny-dnnを使うというのもあるのだろうか

608 :535:2019/01/20(日) 02:28:47.86 ID:O7gh4nMQ.net
全く同じ結果ではなく微妙に違う結果を返してるのは確認できたけど。
単に学習量がたりてないのかなぁ。

609 :535:2019/01/20(日) 15:00:24.16 ID:O7gh4nMQ.net
やっぱり全く同じ結果返してる??
混乱してきたorz

610 :535:2019/01/20(日) 15:40:18.18 ID:O7gh4nMQ.net
層が多すぎたのが悪かったみたい?
層減らしたら違う値になった。

611 :535:2019/01/20(日) 17:41:45.52 ID:O7gh4nMQ.net
お、LV1に勝った!
まあDNNの学習の効果の勝利というよりも序盤DBと詰みルーチンの補助による勝ちなんだけどね。
でもとりあえず、それっぽく動くところまで来ました。

612 :535:2019/01/20(日) 17:54:10.26 ID:O7gh4nMQ.net
序盤DBが良すぎてDNNの真価がわからないから序盤DB外してみるか…

613 :535:2019/01/20(日) 17:59:21.27 ID:O7gh4nMQ.net
酷すぎwwww
でもランダムよりはマシに見える。

614 :535:2019/01/20(日) 18:24:44.15 ID:O7gh4nMQ.net
やっぱ序盤DBに頼るか…
こんなにプログラムが楽しいの久しぶりやな

615 :535:2019/01/20(日) 20:01:09.83 ID:O7gh4nMQ.net
たぶんだけどまだまだ棋譜増やしたほうがいい。
ていうかあればあるほどいいい。まだまだ良くなる。
可能なら100万局を目指したい。

616 :310:2019/01/22(火) 00:34:53.58 ID:9pySCUmT.net
赤黒木大体できたけど…ただの二分木よりほんの少し遅い…。

元々ハッシュでランダマイズしているから、二分木の末端ノードまでの深さは
綺麗な正規分布になっていて、赤黒木にしても木の最頻高さで3割程度しか
小さくならないという事で、ツリーを修正するオーバーヘッドが効いているのか、
それとも木全体でしか排他できないのが原因なのか。

もうちょっと調べてから諦めます。

617 :535:2019/01/22(火) 22:52:21.02 ID:jAP2hLDv.net
要素が100個未満ならぶっちゃけvectorでいいと思いますが。。。

618 :535:2019/01/22(火) 23:02:42.33 ID:jAP2hLDv.net
前も同じこと言ったような気がするけど、学習させるなら局面の勝率より次の一手のほうがいいのだろうか?

619 :名前は開発中のものです。:2019/01/22(火) 23:17:25.29 ID:LaaXTOn4.net
いまきたんですがここはどんなゲームを開発してるんですか
じぶんで開発したとして対戦相手=プログラムありますか

620 :535:2019/01/22(火) 23:34:54.50 ID:jAP2hLDv.net
>>619
とりあえず、落ち着いて。
過去ログから読んでください。

621 :310:2019/01/23(水) 01:56:46.43 ID:QHWWUXAJ.net
置換表に使ってるので要素数は現在残り28手で100万超える事もあります(汗
まあ、βカットの具合でだいぶ変わるので、学習進むと減るんですが。
最低でも残り30手まで行くつもりなので、1000万くらいは想定したいです。

次の一手ソート用の配列は、Array型にしています。32個確保すれば足ります。
こちらも比較したところ、明確に速度差がありました。この辺から、領域をチマチマ
確保されるオーバーヘッドが気になりだした次第です。

で、赤黒木ですが、実装が悪いのだと思いますが、現時点で2分木と比較して
およそ3倍時間がかかります。シングル動作でも同じくらいの差になるので、
排他待ちではなく、木のつなぎ替え処理の重さが原因かなと。置換表は追加が
の比率が大きいので、ポインタたどるロスは優位ではない感じ。

というわけで、赤黒木はちょっと放置。

というか、二分木もシングル動作は10倍くらい速い感じなので、今一度シングル
探索の並列化を試そうと思っています。

622 :310:2019/01/23(水) 02:07:28.76 ID:QHWWUXAJ.net
>>618
min-Max前提だと、探索値を求める際には勝率(点数)が必須で、
次の1手評価関数はオーダリングや前方枝刈向きではないですか?
探索深さ1なら次の1手で行けますが。

初代アルファ碁も、両方組み合わせていますが、次の1手評価関数で
手の優先順位をつける事で読み深さを実現した変則mctsで、最終的には
評価値で判断していますよね。

623 :535:2019/01/23(水) 20:43:46.28 ID:B65SvCza.net
ふーむ、勝率のほうが応用が利くってことですかね?
もうしばらく勝率で学習させてみます。

624 :535:2019/01/23(水) 21:07:20.14 ID:B65SvCza.net
ついネットワークを大きくしたくなっちゃうけど。
本当は小さいネットワークでエポック数を稼いだほうがいいのかもしれない。

625 :535:2019/01/23(水) 21:28:27.72 ID:B65SvCza.net
そういえば、対称局面も学習データとして使ったほうがいいんでしたっけ?

626 :310:2019/01/24(木) 01:32:42.88 ID:cGqmeFv+.net
囲連星は初期配置ないんでしょ?
だったら対象局面ありの方が良いと思う。

オセロは悩み中。
初手をF5固定にした時に、本当に対称局面が出てくるのかわからない。
対称局面が同じ重要性で生じないのであれば、評価値を希釈しちゃうだけ。
学習の時間も単純に倍々で増えるので、今はやっていない。

強いて言うなら、F5F6E6の次がF4とD6で斜め対称になるので、ここだけは
記譜作成時にはF4固定にして、D6の対称局面を作っている。

627 :310:2019/01/24(木) 01:49:46.37 ID:cGqmeFv+.net
置換表自作の件、目的を見失っている(汗
一旦リセットして、最初からやり直して、当初の目的に戻ろうと思うorz

628 :578:2019/01/24(木) 01:53:14.72 ID:mzMMzuaC.net
私は教師データの数が8倍になるのは大きいと思って対称局面も入れて学習させてます
とくにDeep Learningさせてると(ネットワークの規模にもよりますが)だいぶ過学習しなくなります
もっとも、Deep Learningするんだったら対称性を考慮したネットワークにしたほうがいいのかもしれないですが・・・

629 :310:2019/01/24(木) 02:08:25.51 ID:cGqmeFv+.net
着手できる場所の自由度が高いゲームは回転させるべきだと思う。
オセロは着手可能場所が限られるので、現れない局面が結構ありそう。

ちなみに、オセロは8倍じゃなくて4倍。初期配置が4対称だから。
囲連星は初手天元固定なのかな?

630 :578:2019/01/24(木) 07:09:21.18 ID:mzMMzuaC.net
>オセロは8倍じゃなくて4倍
たしかに棋譜で考えると4対称しか無いですね
今のところ、学習させるときには現局面しか渡してないので、
90度回転で一致する局面が存在するかもしれないから8倍で良いはず…

631 :535:2019/01/24(木) 22:03:23.55 ID:gSjgdU9w.net
うーん。今のやり方だとLV0やLV1とはいい勝負になるけどLV3には一生勝てないかも?
出来れば自己対戦による強化学習とか取り入れたいな〜

対称局面もやってみますね。

632 :535:2019/01/24(木) 22:45:59.18 ID:gSjgdU9w.net
なんか長時間計算回してると画面が真っ暗になってマウスやキーボード押しても復帰しないことがあるんだが?
スリープは解除してるはずなんだけどなんなんだろう?

633 :535:2019/01/25(金) 23:18:39.41 ID:gNQn5rdl.net
LV0ってやっぱ棋力低いな。
そんなLV0といい勝負の俺のAIもあれだけど。
やればやるほどLV3の完成度の高さが際立つ。

634 :310:2019/01/26(土) 17:00:37.38 ID:VyVaK4H+.net
自作置換表ですが、大体のところがまとまりました。
結局のところ、unordered_mapを作っていた形になります(汗

当初は領域の追加について、データ部分をまとめて追加する方向で改造し、
ハッシュ配列については22ビット固定で、高速化をしました。で、ハッシュ配列が
22ビット固定は芸がないと、二分木・赤黒木などを試しましたが、速度大幅低下。
要するに、unordered_mapにmapを組み合わせて、ハッシュのメリットを相殺して
しまっていたという事で。

最終的に、ハッシュ配列の追加方法をようやく思いつき、組んでみたところ、それが
そのままunordered_mapのrehashだと気が付きました(汗。その後、max_load_factor
などを追加して、unordered_mapと条件を揃えて速度比較となりました。

iteratorと削除が無い分だと思いますが、unordered_map、concurrent_unordered_map
に対して、それぞれシングル版、concurrent版とも若干高速になりました。

新たな課題は…stlも自作版も、どちらも並列に動かしたconcurrent版の方が遅いと
言う事です。もともとそういうものなのか…テスト方法が並列向けじゃないのか。

635 :535:2019/01/26(土) 17:38:15.71 ID:VGsbBdjp.net
8対称はメモリがやばいので4対称にします。
4対称で16GB位食ってる。

636 :535:2019/01/26(土) 17:54:22.18 ID:VGsbBdjp.net
思い切っていいPC買ったけどまだ足りないとかorzorzorz
ケチらず64GB積むべきだったか?

637 :535:2019/01/26(土) 18:59:37.97 ID:VGsbBdjp.net
1エポック4539秒
これは厳しいorzorzorz
GPUが使えれば…

638 :535:2019/01/26(土) 19:45:15.05 ID:VGsbBdjp.net
ん、1エポック目だけど損失がかなり少ない。。
対称局面を入力とすることで特徴量がよりはっきりしたということだろうか?

639 :535:2019/01/26(土) 19:46:56.43 ID:VGsbBdjp.net
ん、動きが断然よくなってる?
まだわからんが。

640 :535:2019/01/26(土) 19:53:15.64 ID:VGsbBdjp.net
対称局面学習以前はどちらかというとランダムに近かったが
対称局面学習以後はどちらかというと知性があるっぽく見える。
まだわからんが。

641 :535:2019/01/26(土) 20:02:51.02 ID:VGsbBdjp.net
これでエポックが進めばとんでもなく強くなる?
まだわからんが。

642 :535:2019/01/26(土) 20:15:10.01 ID:VGsbBdjp.net
マシンパワーが欲しい!
Googleに匹敵するマシンパワーが!

643 :535:2019/01/26(土) 20:40:08.93 ID:VGsbBdjp.net
まだLV3には遠く及ばないな。
でも希望が出てきた。

644 :535:2019/01/26(土) 21:34:58.78 ID:VGsbBdjp.net
学習用、棋譜採取用、対戦統計用、開発用で4台マシンほしいw

645 :535:2019/01/26(土) 22:03:09.49 ID:VGsbBdjp.net
やっぱ思考時間短いのはいいな。
モンテカルロは強いけど思考時間長すぎたからな。

646 :535:2019/01/26(土) 23:04:44.42 ID:VGsbBdjp.net
棋力が低すぎてすさまじい泥仕合になるの切ないorz

647 :535:2019/01/26(土) 23:32:04.39 ID:VGsbBdjp.net
メモリがもっとあれば異なるネットワークを並列に学習とかもできたかもなぁ
まさか32GBで足りないとは…

648 :535:2019/01/27(日) 14:58:44.29 ID:RY/5cpPz.net
DNNの評価値とMM法の評価値の和で最終評価値を算出するようにしてみました。
多分DNNのみより強くなってます。

649 :535:2019/01/27(日) 15:49:50.57 ID:RY/5cpPz.net
黒番で軽く動かしてみました。

10局目
黒(airandom.dll)の勝利回数: 8
白(ai-lv1.dll)の勝利回数: 2

まずまずの結果かな。
ちなみに白番はうまく動いてなくて1の1とか打っちゃうので途中で中断しました。

650 :535:2019/01/27(日) 16:41:37.92 ID:RY/5cpPz.net
うお、猛烈に追い上げられてるorz
悪くない手ごたえがあったと思いましたが…

25局目
黒(airandom.dll)の勝利回数: 15
白(ai-lv1.dll)の勝利回数: 10

651 :535:2019/01/27(日) 19:54:22.32 ID:RY/5cpPz.net
ちょっとヒューリスティックを入れました。
詰めろがあるときは詰めろを優先的に打つ。
当たりの点数を恣意的に上げる。

652 :535:2019/01/27(日) 21:09:49.27 ID:RY/5cpPz.net
うおお、キター
DNNでLV3に初勝利!

(;SZ[19]
;B[jj];W[kj];B[ji];W[jk];B[kk];W[kl];B[lk];W[ih]
;B[li];W[mj];B[lj];W[kh];B[ki];W[mi];B[lh];W[ll]
;B[lg];W[lf];B[kf];W[ik];B[le];W[mf];B[jh];W[mk]
;B[ke];W[ml];B[kj];W[kg];B[jg];W[mh];B[mg];W[mm]
;B[mn];W[kd];B[kh];W[ld];B[kg])

対LV1も流しなおしててこんな感じ

24局目
黒(airandom.dll)の勝利回数: 18
白(ai-lv1.dll)の勝利回数: 6

653 :535:2019/01/27(日) 21:11:57.38 ID:RY/5cpPz.net
ついDNNの学習に計算リソースを使いたくなっちゃうけど
ぐっとこらえてすべての源泉である棋譜取りにリソースを回すのが正解かも?

654 :535:2019/01/27(日) 21:39:45.24 ID:RY/5cpPz.net
いやーこんなに充実してるの久しぶりだな。
長いトンネルを抜けたようだ。

655 :535:2019/01/27(日) 22:08:36.61 ID:RY/5cpPz.net
うお、またLV3に勝った!
まだまだ負け越すだろうけど、偶然の勝利じゃないってことか。

(;SZ[19]
;B[jj];W[ik];B[ii];W[jk];B[kk];W[lk];B[ll];W[kj]
;B[kl];W[hh];B[mm];W[ji];B[ij];W[ih];B[nn];W[oo]
;B[jm];W[ml];B[hg];W[hk];B[om];W[lm];B[ln];W[nl]
;B[nm];W[im];B[pm];W[km];B[kn];W[pp];B[km];W[qp]
;B[lm])

656 :535:2019/01/27(日) 22:25:29.35 ID:RY/5cpPz.net
明日は仕事だから夜更かしは社会人として自制しなければwwwww
そろそろ切り上げるかwwww

657 :535:2019/01/28(月) 19:44:18.33 ID:m5wr/yMi.net
そういえば赤黒木って深さキャッシュして置くんですか?オーダーlogで深さを求める方法が思いつかない

658 :535:2019/01/28(月) 21:07:17.34 ID:LAfUnJ6o.net
長連判定入れなかったのが意外と響いてるな。
ちょくちょく長連に引っかかる

659 :535:2019/01/28(月) 21:36:36.08 ID:LAfUnJ6o.net
ん、DNN学習の裏で棋譜取りしたら計算速度落ちてるな。
コア数は足りてるはずだがメモリ帯域が足を引っ張ったのだろうか?

660 :535:2019/01/28(月) 22:36:38.66 ID:LAfUnJ6o.net
こちらの棋力が上がるのに呼応するようにLV3も素晴らしい手を返してくる。
奥が深いすな。

661 :535:2019/01/28(月) 22:50:40.16 ID:LAfUnJ6o.net
LV3との対戦統計とってみたいけどまだ時期尚早かな。
まずは大量の棋譜を手に入れる。
量が質に転換する地点が必ずあるはず。

662 :535:2019/01/28(月) 22:57:44.79 ID:LAfUnJ6o.net
将来的には自己対戦による強化学習は絶対取り入れたい。

663 :535:2019/01/29(火) 20:45:33.27 ID:PoANmAul.net
今一手読みで打ってるから、3手読みとかモンテカルロか入れたらもちっと改善するかな?
でも計算量がどうなるかだなぁ。
遅いのはコリゴリ。

664 :535:2019/01/29(火) 22:13:06.04 ID:PoANmAul.net
とりあえず2手読みにしてみたけど2手読みが限界かなぁ
3手は計算量的に相当厳しそう。

665 :535:2019/01/29(火) 22:33:10.05 ID:PoANmAul.net
2手読み、なかなかいい感じ。
1手読みから明らかにうち筋が良くなっている。
もし3手読みにしたら…

666 :535:2019/01/30(水) 21:21:00.00 ID:d36pZkYy.net
3手読みを仮組してみました。
計算時間がやばいので前方枝刈で思いっきり枝刈してます。

667 :535:2019/01/30(水) 22:07:01.71 ID:d36pZkYy.net
あああ、惜しいなぁ!
今すごくいい勝ち方しそうだったのに!

(;GM[1]FF[4]AP[Zenith:7.0]SZ[19]HA[0]KM[6.5]CA[UTF-8]PB[]BR[]PW[]WR[]
ZT[60]DT[]RE[];B[jj];W[ik];B[kk];W[hj];B[ii];W[jk];B[ll];W[hh];B[mm];
W[nn];B[hi];W[gi];B[jl];W[hl];B[ki];W[km];B[lh];W[mi];B[kg];W[kl];B[ke];
W[kf];B[jf];W[lf];B[jd];W[ie];B[je];W[ig](;B[jg];W[jh];B[ih];W[ji];B[kh];
W[jh];B[ji];W[gg];B[jh])(;B[kh];W[jg];B[ih];W[gg];B[nm];W[gk];B[fh];W[gh];
B[gj];W[fj];B[gl];W[ek];B[fk];W[fl];B[mk];W[gm];B[mh];W[gl];B[jh];W[gj]))

もしこの勝ち方ができてたら瞬間最大棋力は名人に届く、ってくらいすごかった。

668 :535:2019/01/30(水) 22:44:38.83 ID:d36pZkYy.net
実装もひと段落ついた感じがあるので対戦統計とってみます。

669 :535:2019/01/31(木) 20:38:25.44 ID:wmRSa8/r.net
やはりLV3は強いですね。
正直、もっと勝てるかと思ってました。
まだまだ精進せねば。


41局目
黒(airandom.dll)の勝利回数: 33
白(ai-lv1.dll)の勝利回数: 8

58局目
黒(airandom.dll)の勝利回数: 48
白(ai-lv2.dll)の勝利回数: 10

32局目
黒(airandom.dll)の勝利回数: 6
白(ai-lv3.dll)の勝利回数: 26

670 :535:2019/02/01(金) 20:50:18.97 ID:YKCFM9Y9.net
序盤DBがlv3 vs lv3の生の勝率データだからちょっと加工したらもっと有益なデータにならないかな

671 :535:2019/02/01(金) 23:25:50.28 ID:c38ZEsSq.net
バグは小説よりも奇なり

672 :535:2019/02/03(日) 19:29:39.51 ID:AT8t8or9.net
(;SZ[19]
;B[jj];W[ij];B[ik];W[hk];B[hj];W[ii];B[hl];W[gk]
;B[gm];W[ki];B[jl];W[fl];B[km];W[gi];B[ji];W[jh]
;B[lm];W[im];B[il];W[in];B[ml];W[ll];B[lk];W[gl]
;B[nl];W[kl];B[kk];W[ol];B[ll];W[pl];B[kl])

673 :535:2019/02/03(日) 20:43:10.48 ID:AT8t8or9.net
(;SZ[19]
;B[jj];W[ij];B[ik];W[hk];B[hj];W[ii];B[hl];W[jk]
;B[gk];W[hi];B[jl];W[kk];B[gi];W[km];B[kl];W[im]
;B[il];W[gl];B[gm];W[fl];B[ki];W[fn];B[lk];W[mk]
;B[fk];W[lh];B[kj];W[jn];B[kk];W[mg];B[hk];W[ng]
;B[jk])

674 :535:2019/02/04(月) 21:24:20.28 ID:xSiFrXwQ.net
コア数が足りていたとしても性能が落ちるのは
ターボブーストが利かなくなる分クロックが落ちるということだろうか?

675 :535:2019/02/04(月) 21:32:25.91 ID:xSiFrXwQ.net
単独で学習流すと1エポック5000秒強くらいだが棋譜取りと並列にすると1エポック8000秒弱かかる。
結構違いますね。

676 :535:2019/02/05(火) 19:35:44.19 ID:LeUKzWtY.net
自分からすぐ取られる手を打たない、必敗の手順をちゃんと読む、などの地味な改良をした結果だいぶ改善したようです。

38局目
黒(airandom.dll)の勝利回数: 37
白(ai-lv1.dll)の勝利回数: 1

28局目
黒(airandom.dll)の勝利回数: 28
白(ai-lv2.dll)の勝利回数: 0

30局目
黒(airandom.dll)の勝利回数: 12
白(ai-lv3.dll)の勝利回数: 18

677 :535:2019/02/05(火) 19:37:52.43 ID:LeUKzWtY.net
そろそろ白番もちゃんと動くようにしなければ…

678 :535:2019/02/05(火) 20:01:16.79 ID:LeUKzWtY.net
白番が動かないことには自己対局による強化学習も不可能…

679 :535:2019/02/05(火) 20:07:09.73 ID:LeUKzWtY.net
>>676の棋譜を見ていますが自分からすぐ取られる手を打たなくしたはずなのですが打ってますね。。。
バグか。

680 :535:2019/02/05(火) 20:47:39.46 ID:LeUKzWtY.net
すげぇぇぇええええぇえ!
ゲタ打った!!!


(;SZ[19]
;B[jj];W[ji];B[ki];W[ii];B[ik];W[kh];B[jh];W[kj]
;B[li];W[hi];B[lh];W[mg];B[kk];W[lj];B[mi];W[mj]
;B[ni];W[ij];B[jk];W[hk];B[nk];W[gl];B[kg];W[fm]
;B[en];W[hm];B[gj];W[il];B[mh];W[hh];B[hj];W[gi]
;B[oh];W[fi];B[ih];W[ei];B[di];W[jg];B[nh];W[ig]
;B[kh])

681 :535:2019/02/05(火) 20:55:47.56 ID:LeUKzWtY.net
ゲタなんか一切教えてないのにゲタ打った。
この衝撃がみんなに伝わるかなぁ。

682 :535:2019/02/05(火) 21:18:10.97 ID:LeUKzWtY.net
あれ、ネットワークのファイル更新したらLV2に負けるようになっちゃった。
なぜ?

683 :535:2019/02/05(火) 23:23:47.50 ID:LeUKzWtY.net
ネットワークじゃなくて序盤DBがおかしいのかなぁ。

684 :310:2019/02/06(水) 01:11:54.97 ID:uzcir1oY.net
久々です。

置換表は、だいぶ前にリハッシュ対応して、この辺にしとこうか状態になってます。
多分unordered_mapの仕組みはそこそこ理解できたと思います。
deleteとガベージコレクション、iteratorを除いてですが。

Edaxのソースを解析しようと、VC++で読み込んでみましたが、Edaxは裸のCで…
_s地獄とコンパイラの違いで、動かすところまで持ち込むのが相当大変な感じ。
一番の地獄は、探索部のソースを見ても何がなんだかわからない事。
せめて偶数理論のところは見つけたいんだけど。滅茶諦めモード。

というわけで、記譜作成を動かし続けるしかなくなってしまいましたorz

WZebraのソースが見たい…。

685 :310:2019/02/06(水) 01:14:08.23 ID:uzcir1oY.net
>>675
メモリバスの帯域とか、L2キャッシュ溢れとか…
わかっているけど、エビデンスが取れないので、認められないorz

686 :535:2019/02/06(水) 20:19:19.81 ID:s2iJEq7C.net
ゲタっぽい手また打った。
パッと見成立しないんだけど、なんとなく味が悪いことわかってるんだな。
すごい!

(;SZ[19]
;B[jj];W[ji];B[ki];W[ij];B[ii];W[jk];B[jh];W[li]
;B[kk];W[kg];B[ik];W[jl];B[hj];W[lj];B[lh];W[hl]
;B[jg];W[if];B[mk];W[lk];B[ll];W[kl];B[kj];W[lm]
;B[ml];W[mm];B[mi];W[il];B[mj];W[gj];B[nj];W[lj]
;B[li];W[jm];B[lk];W[oi];B[ij];W[pi];B[lj])

>>685
マルチ性能も大事だけどシングル性能も結構大事で
並列計算するか結構悩みどころですね。
学習結果が早くほしい時は棋譜取りしないというのもありっちゃあり。

687 :535:2019/02/06(水) 21:11:19.34 ID:s2iJEq7C.net
ん、なんかいままでは序盤DBの力で勝ってきたようなものだけど、
むしろ中盤力のほうが勝り始めてる気がする。
序盤DBが物足りなく感じる。。。

688 :535:2019/02/06(水) 21:50:52.85 ID:s2iJEq7C.net
いろいろ試してみたくなるけど、やっぱ棋譜取りがすべての源泉な気がする。
日中は棋譜取りに専念するのが吉か?

689 :535:2019/02/07(木) 21:28:54.73 ID:GJ+3NG1C.net
やはり更なる上を目指すには強化学習が必須か?

690 :535:2019/02/07(木) 21:49:04.85 ID:GJ+3NG1C.net
どうやっても勝ちってかんじではあるけど
17手目が面白い手でうまく必勝形につなげた。
正直この手は俺にも見えてなかった。

(;SZ[19]
;B[jj];W[ij];B[ii];W[hi];B[ik];W[ih];B[hj];W[gh]
;B[gi];W[fj];B[hh];W[hg];B[fh];W[jl];B[gg];W[kk]
;B[kh];W[ig];B[li];W[fi];B[mi];W[ji];B[jh];W[km]
;B[ki];W[ln];B[hi];W[mn];B[ji])

691 :310:2019/02/08(金) 00:11:00.05 ID:Ar3tbH3V.net
偶数理論なかなか良い実装を思いつきました。

オーバーヘッドが極小なのは、オーダリングへ影響する値だけゼロにして、
ほぼ速度低下が無い事で確認済です。が…何をどうしても速度がダウンします。

というわけで、またしても偶数理論挫折。

次ネタ考え中。
ネタを一つ見つけたけど、結構全面改訂になりそう。

692 :535:2019/02/09(土) 16:38:22.33 ID:Y3QZLQMW.net
なんかひと段落ついちゃったら次何すればいいかわかんなくなっちゃったな。
とりあえず、棋譜取りだけは地味に続けるけど。

693 :535:2019/02/09(土) 16:39:13.34 ID:Y3QZLQMW.net
白番がバグってるの直すのあったなそういえば。。。

694 :310:2019/02/09(土) 21:06:41.89 ID:bf+o2ihZ.net
次ネタ結構大変だと思ったら、意外と簡単にできた。
FFO40-49のタイムは30%強短縮した。
FFO40が悪化して、49はだいぶ短縮しているので、探索深さが深い方が
効果が出る傾向に見える。という事は、残り28か所空きをやっている棋譜
作成では、もっと改善する可能性あるかも。

思い込みって怖い。正直、何故今まで思い付かなかったのだろうというレベルorz

695 :535:2019/02/10(日) 00:11:19.28 ID:CIRPPqWT.net
白番動くようになったみたいです。
白番でLV2に勝ちました!

(;SZ[19]
;B[ef];W[eg];B[fg];W[fh];B[eh];W[dg];B[gh];W[fi]
;B[gf];W[di];B[df];W[fe];B[cg];W[dh];B[gi];W[ff]
;B[gg];W[ge];B[hi];W[ej];B[ij];W[de];B[hd];W[hj]
;B[he];W[if];B[hf];W[ih];B[hh];W[ig];B[hc];W[hg]
;B[gj];W[hk];B[gl];W[gk];B[fj];W[ei];B[cd];W[cf]
;B[jk];W[kl];B[ed];W[ee];B[ek];W[dj];B[jh];W[dk]
;B[il];W[df])

696 :310:2019/02/10(日) 09:57:20.94 ID:WWsJbkKo.net
パラメータの調整というか、使い方変えたら、更に5%くらい改善。

残り28手空きの記譜作成は、トータル倍弱まで速度アップした模様。
とはいえl、記譜作成の方は、解く問題によってばらつきが大きすぎる
ので、もう少し様子を見ないと、どれくらい早くなったかはなんとも
言えない。早くなったのは確実。

さて、またネタが無くなった(汗

697 :535:2019/02/10(日) 14:13:32.91 ID:CIRPPqWT.net
分かってたつもりだったけどLV2の黒番のうち筋が思ったより良くて、
序盤DBに取り込んでもいいかなってちょっと思うようになった。

698 :535:2019/02/10(日) 14:38:22.21 ID:CIRPPqWT.net
lv2 vs lv3で棋譜取りしてlv2のいいところを抽出しようとしたら
lv3が強すぎてlv2のいいところが取れないっぽいんだがwwww
これは計算外

699 :535:2019/02/10(日) 16:41:39.34 ID:CIRPPqWT.net
lv2 vs lv3はlv2の勝率が3割3分くらい。
思ったよりはlv2が善戦してるかな?

700 :535:2019/02/11(月) 00:03:36.62 ID:upj5oiO/.net
lv2の棋譜を取り込んで対戦統計とり始めました。

15局目
黒(airandom.dll)の勝利回数: 13
白(ai-lv1.dll)の勝利回数: 2

14局目
黒(airandom.dll)の勝利回数: 14
白(ai-lv2.dll)の勝利回数: 0

7局目
黒(airandom.dll)の勝利回数: 0
白(ai-lv3.dll)の勝利回数: 7

10局目
黒(ai-lv1.dll)の勝利回数: 1
白(airandom.dll)の勝利回数: 9

6局目
黒(ai-lv2.dll)の勝利回数: 3
白(airandom.dll)の勝利回数: 3

6局目
黒(ai-lv3.dll)の勝利回数: 3
白(airandom.dll)の勝利回数: 3

lv1には文句なく勝ってますね。
lv2もトータル勝ち越せるかも。
lv3は白番でいい勝負なのはすごいですが、
黒番で勝ててないのが気になりますね。

701 :535:2019/02/11(月) 19:03:47.89 ID:N2auq0Bn.net
黒番対lv2は勝率100% w
序盤DBが完全に筋に入ってる感じですかね。
対lv3の戦績もlv2 vs lv3の戦績と比較して決して悪くないです。

40局目
黒(airandom.dll)の勝利回数: 36
白(ai-lv1.dll)の勝利回数: 4

42局目
黒(airandom.dll)の勝利回数: 42
白(ai-lv2.dll)の勝利回数: 0

25局目
黒(airandom.dll)の勝利回数: 9
白(ai-lv3.dll)の勝利回数: 16

50局目
黒(ai-lv1.dll)の勝利回数: 7
白(airandom.dll)の勝利回数: 43

30局目
黒(ai-lv2.dll)の勝利回数: 22
白(airandom.dll)の勝利回数: 8

33局目
黒(ai-lv3.dll)の勝利回数: 24
白(airandom.dll)の勝利回数: 9

702 :535:2019/02/11(月) 21:10:52.87 ID:N2auq0Bn.net
でも悲しいことに俺のAIには怖さがないんだよなぁ。
ちょっと気を抜くと負かされてしまうような怖さが。
lv2とlv3にはそれがある。

703 :535:2019/02/12(火) 20:26:23.49 ID:G3iO6dyJ.net
こんな感じです。

50局目
黒(airandom.dll)の勝利回数: 45
白(ai-lv1.dll)の勝利回数: 5

50局目
黒(airandom.dll)の勝利回数: 50
白(ai-lv2.dll)の勝利回数: 0

40局目
黒(airandom.dll)の勝利回数: 14
白(ai-lv3.dll)の勝利回数: 26

50局目
黒(ai-lv1.dll)の勝利回数: 7
白(airandom.dll)の勝利回数: 43

48局目
黒(ai-lv2.dll)の勝利回数: 39
白(airandom.dll)の勝利回数: 9

46局目
黒(ai-lv3.dll)の勝利回数: 32
白(airandom.dll)の勝利回数: 14

ホントは全部50局打ちたかったんだけど時間がかかるので打ち切りました。

704 :535:2019/02/13(水) 19:55:00.78 ID:7bnMzRQL.net
DNNの教師データを棋譜からの生勝率ではなく、少し探索した結果にしてみようかと思ってます。

705 :535:2019/02/14(木) 22:04:12.79 ID:yW8Bcw4A.net
なんか変な手打つorz
結局、生勝率が一番いいのかな…

706 :名前は開発中のものです。:2019/02/15(金) 23:01:57.18 ID:szQyRPlV.net
>>684
https://github.com/okuhara/edax-reversi-AVX
は VC でもコマンドラインならビルド可能です。(NMakefile)
(本家の Edax も NMakefile は付いているが、多少変更が必要)
Edax の偶数は基本的に Zebra と同じ。QUADRANT_ID あたりを追ってみては?

707 :310:2019/02/15(金) 23:44:55.03 ID:fcveN5+T.net
>>706
情報ありがとうございます。そのソースなのですが、コマンドラインなのですね。

ビルドしたかった理由はデバッグモードを使いたかったからです。
QUADRANT_IDのあたりは追っかけたのですが、もともとの探索の構造が
読めなくて、デバッグモードに頼ろうとした次第です。

で、処理内容を予想して自分で組んでみたのですが、FFOテストでは速度が
若干ですが、落ちてしまうのです。


あと、実はVC++しか使った事ないというか、オセロ開発でC++使い始めたので、
makefileが何やってるのかわからないです(汗
というわけで、ちと調べてみます。
動くだけでも、自動対戦の相手になってもらえる可能性ありますから。

708 :535:2019/02/16(土) 00:14:31.55 ID:MvwJSI7c.net
310さんってC++のエキスパートなのかと思ってたっす。
ちょっと意外。

709 :535:2019/02/17(日) 21:11:39.54 ID:23WhPvCR.net
ネタがなくなってちょっと熱も冷めた感じ。
とりあえず、自己対局による強化学習をぼちぼち何とかしたい。

710 :535:2019/02/18(月) 23:23:00.57 ID:dOglmLQj.net
俺のAI vs 俺のAIの棋譜

(;SZ[19]
;B[jj];W[kj];B[kk];W[ji];B[lj];W[ki];B[ij];W[lk]
;B[ll];W[mk];B[ii];W[ml];B[mm];W[nn];B[hh];W[gg]
;B[oo];W[on];B[ih];W[nm];B[po];W[mj];B[nk];W[ok]
;B[ol];W[ni];B[nl];W[mo];B[ln];W[mn];B[lm];W[li]
;B[hk];W[oj];B[oi];W[pi];B[oh];W[qj];B[pk];W[nj]
;B[pj];W[pl];B[il];W[qk];B[in];W[pj];B[im];W[lj])

両当たりかけられるところを放置したり抜かなくていい石を抜いたりいろいろ危なっかしいところはあるが
現状、こんな感じです。

711 :535:2019/02/19(火) 22:08:59.80 ID:d5ndvgDR.net
いまよりもっと人工知能技術が普及して働き口が増えたら人工知能系の職に転職したいwww

712 :535:2019/02/19(火) 22:42:38.22 ID:d5ndvgDR.net
次のアイディアが出るまで

対LV3の棋譜をとる→序盤DBを更新する→DNNを更新する→対LV3の棋譜をとる

のサイクルを繰り返すことにします。

713 :535:2019/02/20(水) 21:16:37.27 ID:d5NzdsVZ.net
珍しい負け方した。
白必勝形のダブルリーチ
この形は非常に珍しいと思う。

(;SZ[19]
;B[jj];W[kk];B[ki];W[ik];B[ii];W[hi];B[ij];W[jk]
;B[hk];W[hl];B[gj];W[hj];B[gk];W[gl];B[jl];W[gi]
;B[fi];W[jm];B[kl];W[km];B[ll];W[im];B[fm];W[lm]
;B[hh];W[mm];B[hm];W[lk];B[gh];W[hn];B[gm];W[mk]
;B[li];W[nl];B[om];W[ok];B[nj];W[nk])

714 :535:2019/02/21(木) 19:59:44.77 ID:PxV5X23E.net
日に日にじわじわ強くなってる気がする。
どこかのタイミングで爆発的に強くなったりしないかな?

715 :310:2019/02/22(金) 00:24:39.77 ID:e/VjvE/W.net
ようやく評価関数が安定してきたのか、遡り記譜作成の速度が上がってきた気がする。

暇なので、mctsでも組んどこうかと考え始めたら、置換表の新アイデアが。

今までは、unordered_mapにとらわれていましたが、もともと探索木は文字通り
ツリー構造なので、その形のまんま置換表にして、探索しながら木を同時並行
でたどっていけば、置換表内で「探す」必要が無い上に、着手リストがそのまま
ノードとして存在しているので、反復系の探索の時に何度もmobility関数を呼ぶ
必要が無い。

結構大掛かりな修正になりましたが、とりあえず基礎的な探索まではできるように
なりました。速度計測はこれから。

あと、shared_ptr使った事で、不要な置換表データを自動削除できるので、minMaxで
AIを組んだ時に、置換表を縮小しながら再利用できるかなと。
あ、mctsはどこに行ってしまったんだろう(汗

716 :535:2019/02/22(金) 20:49:26.61 ID:pJcyJywR.net
10並列でLV3と対戦しました。

29局目 黒(airandom.dll)の勝利回数: 15 白(ai-lv3.dll)の勝利回数: 14
32局目 黒(airandom.dll)の勝利回数: 15 白(ai-lv3.dll)の勝利回数: 17
32局目 黒(airandom.dll)の勝利回数: 20 白(ai-lv3.dll)の勝利回数: 12
34局目 黒(airandom.dll)の勝利回数: 16 白(ai-lv3.dll)の勝利回数: 18
30局目 黒(airandom.dll)の勝利回数: 12 白(ai-lv3.dll)の勝利回数: 18
32局目 黒(airandom.dll)の勝利回数: 6 白(ai-lv3.dll)の勝利回数: 26
30局目 黒(airandom.dll)の勝利回数: 12 白(ai-lv3.dll)の勝利回数: 18
33局目 黒(airandom.dll)の勝利回数: 18 白(ai-lv3.dll)の勝利回数: 15
37局目 黒(airandom.dll)の勝利回数: 17 白(ai-lv3.dll)の勝利回数: 20
32局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 19
トータル 144勝 177敗
勝率 44.9%

これはLV2 vs LV3 と比べてかなりいい数字です!

717 :310:2019/02/23(土) 17:22:38.75 ID:XSOOC+yB.net
>>715の続き

良く考えたら、ツリー構造で自分の値を残しておくという意味で、mtd(f)や
反復深化の系統には効果あるけど、同じ局面を見つける事ができないので
そもそも置換表ではありませんねorz

その代り、並列探索でも排他制御をしなくて良い事になります。
メモリー使用量も少なくて済みます。

速度については、今のところ微妙。
棋譜作成が一段落したらPCリセットしてクリーンな状態で再計測の予定。

718 :535:2019/02/23(土) 19:16:16.09 ID:ThnkYxTz.net
対戦統計って10000局くらいやらないと±10%くらいの誤差は簡単に出てしまうのかもしれない。
何局くらいやれば信頼できるんだろ?あんま統計詳しくないんだよな〜

719 :535:2019/02/23(土) 19:28:15.18 ID:ThnkYxTz.net
そういえば「コンピュータ囲碁 ―モンテカルロ法の理論と実践」になんか書いてあったような気もする。

720 :535:2019/02/24(日) 21:49:18.42 ID:auCrr5Wc.net
なんか弱くなってる気がするorz
LV0とかLV1にも序盤不利になったりするorz
最終的に逆転できることもあるんだけど、そのまま押し切られることもあるorz
まずいでしょうこれはorz

721 :310:2019/02/24(日) 23:56:43.56 ID:GBomweD/.net
んごー。めっちゃスピードダウンorz
ダメ筋だったかも。

途中速度アップしてる気がしていたけど、単にバグっていただけだった。

置換表機能が消えて、余計な筋を読んでいるのか。
それとも、パラパラとmake_sharedしているからなのか。
どうせやる事ないので、しばし検討。

722 :535:2019/02/25(月) 20:30:16.25 ID:/PmJxqQK.net
もっとマシンパワーが欲しい!
モアパワー、モアトルクだ!

723 :535:2019/02/25(月) 20:48:25.65 ID:/PmJxqQK.net
大学で統計の単位とっとくんだったorz
独学は厳しいorz

724 :535:2019/02/26(火) 20:20:50.08 ID:veq8AgWN.net
序盤DBはもう少し工夫しないと駄目かもなぁ

725 :535:2019/02/26(火) 22:16:04.17 ID:veq8AgWN.net
あの伝説の手筋が実現しかけたが、残念ながら実現しなかった。
あとちょっとだったのに、悔しい!!

(;SZ[19]
;B[jj];W[jk];B[ki];W[ij];B[ik];W[hk];B[il];W[kj]
;B[ji];W[ih];B[hl];W[gm];B[ii];W[hi];B[gl];W[li]
;B[hh];W[ig];B[kk];W[ll];B[km];W[jl];B[jn];W[kl]
;B[lh];W[mg];B[lj];W[hj];B[gk];W[gh];B[lm];W[hf]
;B[he];W[kh];B[gi];W[hg];B[gj];W[jg];B[gg];W[lg]
;B[kf];W[fg];B[ef];W[kg];B[ng];W[gf];B[fe];W[gg])

726 :535:2019/02/26(火) 23:53:19.73 ID:veq8AgWN.net
負けたけど、7連までの手数が絡んだ微妙な駆け引きが素晴らしい名局だった。
勝つチャンスはあったと思うけどな〜惜しいな〜

(;SZ[19]
;B[jj];W[kj];B[jk];W[ki];B[kk];W[kh];B[il];W[lk]
;B[ll];W[ml];B[in];W[ji];B[im];W[ih];B[nm];W[hi]
;B[jo];W[gi];B[li];W[fh];B[ij];W[ii];B[io];W[ei]
;B[ip];W[fi])

727 :535:2019/02/27(水) 21:30:22.80 ID:Y++kUwc3.net
モンテカルロ木探索とDNNと組み合わせてみようかなぁ
そのほうがランダム性も出せるし
でも遅くなったらやだな。うーん

728 :535:2019/02/27(水) 22:03:24.47 ID:Y++kUwc3.net
なんか取れないシチョウを追いかけたw
シチョウルーチンにバグがあるのか、DNNの評価値でシチョウを追いかけてしまったのかイマイチ判断がつかないな。

729 :535:2019/02/27(水) 22:47:59.69 ID:Y++kUwc3.net
ん、なんかLV2にコロコロ負けるようになった。
自分のAI vs lv 3 の棋譜を取り入れたせいで序盤DBが狂っちゃったかな。

730 :535:2019/02/28(木) 22:39:23.34 ID:VN3HTH0V.net
なんか新しいアイディアが欲しいな。
>>712のサイクルはちょっと手詰まり感。

731 :535:2019/03/04(月) 20:07:01.61 ID:+UlAfF8J.net
ここ数日さぼりっぱなし。
棋譜取りも逆に弱くなりそうでさぼってます。

732 :535:2019/03/04(月) 22:26:37.19 ID:+UlAfF8J.net
やっぱ序盤の大局観で優位に立ちたいんだよなぁ。
中盤、終盤はある程度読みでカバーできるけど序盤はマジ謎が多いからな。

733 :310:2019/03/04(月) 23:03:17.87 ID:2gMEJXd0.net
バグでドツボ中。

再現性がなさすぎて、よーわからん。
頻度の低さと、再現性の無さから、置換表の二重更新だと思うんだけど…
それっぽい箇所も見当たらない。

734 :535:2019/03/09(土) 21:06:39.62 ID:jNDDSRBd.net
完全にさぼり状態。
アイディアも枯渇したし。
どこかにネタ落ちてないかな。

735 :535:2019/03/10(日) 00:25:59.41 ID:BU7hKn7v.net
禁断の人間(俺)vs lv3の棋譜取りをやろうかと思ってます。
これは手間が半端ないw

736 :535:2019/03/10(日) 00:40:34.55 ID:BU7hKn7v.net
早くもギブアップwwwww
なかなかいい棋譜が取れない
基本的に無理筋orz.

737 :535:2019/03/10(日) 20:17:25.17 ID:BU7hKn7v.net
自分のAI vs lv3 で 手筋炸裂!!
うって返しでました!

(;SZ[19]
;B[jj];W[ki];B[ii];W[kj];B[kk];W[ih];B[hh];W[gg]
;B[ll];W[mm];B[mk];W[jk];B[jl];W[ik];B[il];W[hk]
;B[hl];W[gl];B[gk];W[ji];B[hj];W[ij];B[jj];W[hi]
;B[jk];W[gi];B[ik];W[nk];B[lk];W[ok];B[hk])

738 :535:2019/03/11(月) 19:47:21.03 ID:X4t/4BPO.net
棋譜取り再開しました。
弱くなる可能性は潰せてないのですが、何もしないよりはましだと思って。

739 :535:2019/03/11(月) 21:55:27.12 ID:X4t/4BPO.net
10並列 対戦結果

30局目 黒(airandom.dll)の勝利回数: 16 白(ai-lv3.dll)の勝利回数: 14
21局目 黒(airandom.dll)の勝利回数: 10 白(ai-lv3.dll)の勝利回数: 11
29局目 黒(airandom.dll)の勝利回数: 12 白(ai-lv3.dll)の勝利回数: 17
22局目 黒(airandom.dll)の勝利回数: 6 白(ai-lv3.dll)の勝利回数: 16
24局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv3.dll)の勝利回数: 10
27局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv3.dll)の勝利回数: 13
27局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv3.dll)の勝利回数: 13
30局目 黒(airandom.dll)の勝利回数: 15 白(ai-lv3.dll)の勝利回数: 15
23局目 黒(airandom.dll)の勝利回数: 10 白(ai-lv3.dll)の勝利回数: 13
28局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 15

トータル 124勝137敗 勝率 47.5%

悪くない

740 :535:2019/03/12(火) 20:57:52.00 ID:ACQKgt0P.net
LV3に勝利。
途中負けかけたけど相手がミスした。
終盤の数手が素晴らしい一局だった。

(;SZ[19]
;B[jj];W[ki];B[ji];W[jh];B[ih];W[ig];B[kh];W[jg]
;B[kj];W[hf];B[li];W[kg];B[lg];W[gf];B[lk];W[mj]
;B[hi];W[fg];B[eg];W[mi];B[lf];W[lj];B[fi];W[gi]
;B[gj];W[gh];B[ej];W[fk];B[fj];W[ij];B[ik];W[ge]
;B[ii];W[hj];B[hk];W[fd];B[ki];W[me];B[ij];W[ne]
;B[hj])

741 :535:2019/03/12(火) 21:01:50.73 ID:ACQKgt0P.net
それにしてもディープラーニングの学習がメモリ20GB食ってるんだがw
奮発してメモリ32GBにしといてよかった。

やっぱハードウェア性能は正義だな。
Zen2のスリッパ出たらうっかり買いそうで自分が怖いw

742 :535:2019/03/13(水) 20:46:36.19 ID:7rSi15yT.net
12並列対戦

29局目 黒(airandom.dll)の勝利回数: 12 白(ai-lv3.dll)の勝利回数: 17
30局目 黒(airandom.dll)の勝利回数: 17 白(ai-lv3.dll)の勝利回数: 13
28局目 黒(airandom.dll)の勝利回数: 11 白(ai-lv3.dll)の勝利回数: 17
28局目 黒(airandom.dll)の勝利回数: 10 白(ai-lv3.dll)の勝利回数: 18
36局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 23
25局目 黒(airandom.dll)の勝利回数: 11 白(ai-lv3.dll)の勝利回数: 14
31局目 黒(airandom.dll)の勝利回数: 14 白(ai-lv3.dll)の勝利回数: 17
28局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 15
32局目 黒(airandom.dll)の勝利回数: 13 白(ai-lv3.dll)の勝利回数: 19
33局目 黒(airandom.dll)の勝利回数: 17 白(ai-lv3.dll)の勝利回数: 16
31局目 黒(airandom.dll)の勝利回数: 17 白(ai-lv3.dll)の勝利回数: 14
25局目 黒(airandom.dll)の勝利回数: 8 白(ai-lv3.dll)の勝利回数: 17

156勝200敗 勝率 43.8%

弱くなったのか誤差の範囲なのか、うーん。

743 :535:2019/03/14(木) 23:27:52.29 ID:V04VYcAB.net
>>742の棋譜を序盤DBに取り込んで、その序盤DBをもとにDNNの学習をやり足しました。
DNNは序盤DB拡張と学習のサイクルを繰り返し行っているので秘伝のタレみたいになってますw
これで今夜からもう一度対LV3対戦やってみます。

744 :535:2019/03/14(木) 23:40:56.98 ID:V04VYcAB.net
7局目 黒(airandom.dll)の勝利回数: 3 白(ai-lv3.dll)の勝利回数: 4
7局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 3
7局目 黒(airandom.dll)の勝利回数: 3 白(ai-lv3.dll)の勝利回数: 4
5局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 1
7局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 3
5局目 黒(airandom.dll)の勝利回数: 3 白(ai-lv3.dll)の勝利回数: 2
4局目 黒(airandom.dll)の勝利回数: 1 白(ai-lv3.dll)の勝利回数: 3
5局目 黒(airandom.dll)の勝利回数: 3 白(ai-lv3.dll)の勝利回数: 2
9局目 黒(airandom.dll)の勝利回数: 7 白(ai-lv3.dll)の勝利回数: 2
6局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 2
6局目 黒(airandom.dll)の勝利回数: 2 白(ai-lv3.dll)の勝利回数: 4
7局目 黒(airandom.dll)の勝利回数: 4 白(ai-lv3.dll)の勝利回数: 3

42勝33敗 勝率56%

出だしは好調!
明日一日回してどうなるか… 👀
Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b)


745 :535:2019/03/14(木) 23:44:29.21 ID:V04VYcAB.net
ありゃなんかRock54ついとる。
文章の繰り返しが駄目なんか?

746 :535:2019/03/15(金) 20:06:11.54 ID:PqqnV2Up.net
残念ながら駄目でしたorz

155勝 209敗 勝率 42.6%

やっぱ対局回数増やすとこの辺に落ち着くのか、うーん

747 :535:2019/03/16(土) 18:31:00.14 ID:7iioDFjE.net
>>746から対戦を止めずに継続していましたが

211勝289敗 勝率42.2%

となりました。

やっぱこの辺が真の値なのかな。

748 :535:2019/03/17(日) 00:52:38.93 ID:5SZpbjE6.net
更に学習を続けます

749 :535:2019/03/17(日) 21:35:48.21 ID:5SZpbjE6.net
まじでZen2スリッパでたら買ってしまいたい衝動に駆られる

750 :535:2019/03/18(月) 00:19:09.18 ID:eJisfZab.net
8勝2敗だと95%の確率で強いといえるらしいが、12並列もしてると1つは8勝2敗ぐらいになったりするw。
まあ確率的にはそうなのかも。
結局1000局くらいやらないと駄目ってことかな?

751 :535:2019/03/18(月) 21:25:08.42 ID:eJisfZab.net
やっぱ弱くなってるかもT△T

143勝 220敗 勝率 39.4%

このままこの学習サイクルを進めていいか迷うorz

752 :535:2019/03/18(月) 21:37:35.02 ID:eJisfZab.net
禁断のモンテカルロ木探索の封印を解くか?
しかしあれは計算時間が半端ないからな。
出来れば避けたい。

753 :535:2019/03/18(月) 21:52:51.93 ID:eJisfZab.net
プロのタイトル戦が7番勝負とかだけど7番ぽっちじゃ真の強者はわからんってことやなw

754 :535:2019/03/18(月) 23:53:39.58 ID:eJisfZab.net
モンテカルロ実装したけど、なんか素朴な手を選ぶようになってしまった。
うーん、コレジャナイ感がorz

755 :535:2019/03/19(火) 21:06:00.35 ID:87DWY+/2.net
なんかおかしい。
LV3が強すぎる気がするw
もしかしてLV3には学習機能がついていて計算回せば回すほど強くなるとか?w
んなわけないか。

756 :535:2019/03/21(木) 03:04:06.19 ID:gYmqCPQ5.net
祝日だって油断してたらこんな時間w
弱くなってもいいから計算量削る方向で調整しています。

757 :535:2019/03/21(木) 17:29:13.47 ID:gYmqCPQ5.net
対戦統計とってます。

66勝 70敗 勝率48.5%

今のところむしろ勝率上がってます!
速度も若干だけど速くなったはず…

勝率50%が欲しい!

758 :535:2019/03/22(金) 19:55:26.77 ID:9WNMIpie.net
161勝188敗 勝率 46.1%

悪くない。

759 :535:2019/03/22(金) 20:13:46.91 ID:9WNMIpie.net
次のアイディアが欲しいところだ

760 :310:2019/03/23(土) 00:07:59.98 ID:QKAaRf+n.net
久々です。

新型版はテストのためにいちいち学習を止めるのが面倒で、放置しています。
一晩耐久テストやらないとわからないので。

で、未だずーっと棋譜作成&学習を続けています。
もともと800件強の記譜をベースに間違い訂正をしたり、確定しているところ以降
の全分岐を作成したりして学習データにしていたのですが、昔作った記譜なので
序盤で結構間違いが多く、効率よく学習できないのではないかと考えました。

で、最近は序盤の定石6〜20手からスタートして記譜を作成したりしていました。
そこそこ序盤の間違いが訂正されてきたのですが、まだところどころおかしい
ところがあって、Zebraで並べてみながら、多分間違えたであろう箇所を特定して
それ以後の記譜を作らせる事で、強制的に正しい手順に戻すなんていう、禁断の
ドーピング技を始めてしまいました。

現在は1200記譜くらいまで増えていますが、まだまだ間違いも散見されますし、
パブリックドローの変化っぽいのに、記譜が無いものもあり、まだまだ記譜が足り
ていない感じです。

あと、ドーピング作業やりながらZebraの評価値見ていると、20〜30手目あたりは
進行の種類によってはZebraの評価値もあまりあてにならないなぁと言う事に気付い
てしまいました。ここら辺の精度を上げると、もっと強くできるのではないかと思います。
自動対戦してくれる序盤DB付きのオセロプログラムがあると、ドーピング作業が更に
楽になるんだけど(汗

現在残り20手目以後の学習に使う盤面は70万件くらいになっています。それでも
残り20手以後の初見の盤面の評価値では結構な誤差があります。本当にBuroさん
の線形評価関数で良いのかというのも相変わらず悩ましいところです。

761 :535:2019/03/23(土) 09:44:42.00 ID:C9QFpANM.net
197勝 233敗 勝率 45.8%

悪くない。

一旦対局中断します。

762 :535:2019/03/23(土) 17:57:32.40 ID:C9QFpANM.net
やっぱ1手1秒くらいで打ちたいなぁ。
そうすれば対戦統計も棋譜も全然もっと取れるのに

763 :535:2019/03/23(土) 21:04:03.52 ID:C9QFpANM.net
LV2と対戦してみました。
50局目 黒(airandom.dll)の勝利回数: 48 白(ai-lv2.dll)の勝利回数: 2
勝率 96%

764 :535:2019/03/24(日) 10:11:30.45 ID:IEpX66ro.net
LV1ともやってみました。
50局目 黒(airandom.dll)の勝利回数: 45 白(ai-lv1.dll)の勝利回数: 5
勝率 90%

765 :535:2019/03/24(日) 21:21:09.27 ID:IEpX66ro.net
ふーむ、損失が減らない地点まで学習が進んでしまったようです。
一回止めるか。

766 :535:2019/03/24(日) 21:27:42.78 ID:IEpX66ro.net
うーん、やっぱ現状を打破する画期的なアイディアが必要かな。
ちなみにいまは強さよりも速度が欲しいかも。

767 :535:2019/03/25(月) 05:48:57.06 ID:9reqTGkG.net
対戦してます。

黒番 対 LV3 107勝 102敗 勝率 51.2%

200戦以上して勝率50%超えはすごい!
今日一日回してみます。

768 :535:2019/03/25(月) 21:18:02.28 ID:9reqTGkG.net
結局負け越しでした

165勝 174敗 勝率48.7%

でも決して悪い結果ではない!

769 :535:2019/03/26(火) 21:11:49.41 ID:AISc91ZO.net
まだ回してました

239勝 237敗 勝率 50.2%

キター!

まあ、今だと50%行くかどうかはホント運しだいなんだろな。

770 :535:2019/03/26(火) 21:12:45.47 ID:AISc91ZO.net
そろそろ対局止めて次の学習のターンに入ります。

771 :535:2019/03/26(火) 21:59:22.07 ID:AISc91ZO.net
うお、棋譜が多すぎてls */*.sgfがコアダンプするようになったw
分割しないと駄目か〜

772 :535:2019/03/27(水) 21:35:10.22 ID:4D2b4lCy.net
そろそろ人間(俺)相手に勝利が欲しいところだがまだむずかしいかな。
素人相手なら勝てるんだろうか?

773 :535:2019/03/28(木) 19:32:56.94 ID:ZCt2CXW9.net
165勝 176敗 勝率 48.4%

774 :310:2019/03/30(土) 20:46:31.09 ID:IsrC9h82.net
既知のパブリックドローのリストが見つかったというか、
今年になってブログでまとめて発表してくれている人がいた。

ちょうど良いタイミングすぎる(汗

2種類あるのと、自分がZebraから拾った奴を合体して、32手目まででカット。
ソートして重複削除したら450件程度に。多分既存の記譜と多少重複してると思う。

全部やるとかなり記譜が偏る気がするけど、やっちゃうかな。

775 :535:2019/03/30(土) 23:47:00.24 ID:o6pzrkpp.net
序盤DBを劇的に改善する方法ないかな?
不利なオープニングを避けるだけで勝率めちゃくちゃ上がりそうな予感がするんだが。

776 :310:2019/03/31(日) 01:39:32.24 ID:5poc64Oc.net
棋譜から序盤DB作れない?

777 :535:2019/03/31(日) 09:41:09.06 ID:eFSA5935.net
作ってるですがそれでも不利な局面になったりしますorz

778 :310:2019/03/31(日) 20:14:25.76 ID:5poc64Oc.net
棋譜から序盤DB作る時に、その盤面からの勝率入れて、勝率が高い手を指す
ようにするとか。まあ、ぶっちゃけ記譜単位でmctsやってるような事になるの。

779 :535:2019/03/31(日) 20:34:17.11 ID:eFSA5935.net
いや、それに近いイメージのものはすでに実装してあるんですが、たまに変な手を打つのです。

780 :310:2019/04/01(月) 20:17:52.98 ID:JaNWOXQ3.net
普通DB化すると同じ手順だと毎回同じに間違えるはず。
だとするなら、DBの棋譜をテキストに吐き出すなどして、チェックしたら?

間違いっぽい分岐見つけたら、正解着手させてその後を対戦させて記譜を
強制的に正しい分岐を学習させるの。そのあとでも間違えて、なかなか治らない
事もあるけど。

これが>>760で書いたドーピング。

781 :310:2019/04/01(月) 20:22:42.07 ID:JaNWOXQ3.net
>>774のリスト。パブリックドローはFJT分だけだった。
2種類あって、もう一つは代表的な序盤定石から適度に着手した後で、
残り30手を読み切ったリストで、ドローとは限らなかった。

遡りチェックの時にあり得ない奴があったので、気が付いた。

試しにZebraで並べて評価値見てみたら、中盤で結構変な手順になっていたりする。
まあ記譜の足しにはなるかなぁという感じ。

782 :535:2019/04/01(月) 22:13:58.23 ID:58wx0Qom.net
手動でDB書き換えるのは工数的に地獄の苦しみなのですw
まあ、負けた棋譜だけ水増ししてDBに登録するのはあるかも?

783 :535:2019/04/01(月) 23:15:44.55 ID:58wx0Qom.net
自動対局プログラムに手を入れて棋譜のファイル名に黒が勝ったか白が勝ったか入れるようにしました。

784 :535:2019/04/02(火) 20:42:13.63 ID:IVxd4rzM.net
やっぱ手動で棋譜を訂正するのはムリゲーだなぁ。
棋譜訂正も自動化すべきかな。
うーん

785 :310:2019/04/02(火) 20:42:16.77 ID:BP3gZfVl.net
そうか。オセロだとある程度定石はあるし、ZebraやEdaxで並べれば
終局スコアの予想はできて、間違いが見つけやすいけど、囲連星では
そうはいかないですね。

途中で変な手を打つのは、恐らく記譜が足りていないからではないかと
思います。オセロでもドーピングやらないで純粋に自己対局学習だけで
やった場合、1万〜10万対局くらいは必要かなと思っています。

786 :535:2019/04/02(火) 22:11:14.64 ID:IVxd4rzM.net
勝った棋譜水増しするのと負けた棋譜水増しするのどっちがいいんだろ?
おんなじ割合で水増ししたら意味ないかもw

とりあえず負けたほう増やすか

787 :535:2019/04/03(水) 22:07:38.48 ID:+wdY9CJ5.net
とりえあず、負けた棋譜を100倍にして序盤DBに注入してます。
定型パターンにはまりやすいLV2にはかなり効果あるのですが
変幻自在なLV3には今一つみたいです。

788 :535:2019/04/04(木) 20:30:39.10 ID:QG8xddyq.net
負けた棋譜だけ増やすとバランス崩れるかも?と思い始めました。
うーん。

789 :535:2019/04/04(木) 22:06:44.84 ID:QG8xddyq.net
やはり大量、多種類の棋譜が欲しい。
棋力が下がっても計算量を抑えて、速度を稼ぐ方向で行くべきか?

790 :535:2019/04/04(木) 22:52:58.55 ID:QG8xddyq.net
2手読みだったところを1手読みにしたら大分早くなったけど、やっぱ棋力は落ちるな。
これはちょっと採用するか迷う。

791 :535:2019/04/05(金) 22:13:28.38 ID:6lxF2ret.net
ん、なんか白番が絶望的に負けてる。
なんか評価値の計算まちがえたか?

792 :535:2019/04/05(金) 22:26:12.15 ID:6lxF2ret.net
それとも棋譜水増しで入れた序盤DBが狂ったのかな?

793 :535:2019/04/06(土) 00:52:52.21 ID:Uoezh941.net
白番で、相手が初手端のほうに打ってきたときに、盤が狭くなって序盤DBどおりに打つのが悪くなるみたい?

とりあえず、白番持った時に相手が初手天元付近に打たなかったときは、中央寄りの斜めに打つように変えた。
これで少しでも緩和されるといいな。

794 :535:2019/04/06(土) 01:11:14.50 ID:Uoezh941.net
水増しした分の棋譜はいったん削りました。
確率の理論を根底から壊してしまうみたいなので。
やっぱ遅いようでもじっくり行くのが確実っぽい。

795 :535:2019/04/10(水) 20:58:12.46 ID:x47ianNw.net
今、極端な水増しはやめてほどほどの水増しにしてます。
新しい棋譜が古い棋譜の1〜2%程度になるくらいに水増ししてます。

796 :310:2019/04/10(水) 23:44:48.34 ID:R42Zvvs5.net
どんより…
バグを見つけてしまった。

今ある記譜50万件の数%くらいに間違いがありそう。
直管的には、全データに対して読み切り処理を噛まさないと間違いの有無すら確認できない。
多分、逆順探索処理を簡素化した時にバグが入り込んだのだと思う。
暇なのでログ書き出しの処理を作ってたら見つかった。

うぐぐ。

もうしばらく様子を確認して、他にもバグが無いか見た上で…どうしよう。
一旦記譜をリセットして作り直すべか。

797 :310:2019/04/10(水) 23:48:12.99 ID:R42Zvvs5.net
と、書いた直後に気が付いた。
ログの側のバグだった事に…

お騒がせ様でした。

798 :535:2019/04/15(月) 23:21:56.01 ID:+vRjXb2F.net
いままで8対称中4対称で学習してましたが、のこりの4対称も学習させてみることにしました。
8対称すべてはメモリに収まらないので半分づつ学習させます。

799 :535:2019/04/16(火) 20:45:49.68 ID:+pjTjN+Q.net
178勝192敗 勝率 48.1%
8対称、勝率あんまり上がらないですね。
うーん、うち筋は悪くないと思うんだけど。
なにかブレークスルーが欲しいですね。

800 :535:2019/04/16(火) 21:15:27.46 ID:+pjTjN+Q.net
2手読みに戻したら勝率上がるかな?
うーん。

801 :535:2019/04/16(火) 22:50:30.94 ID:+pjTjN+Q.net
まじでZen2スリッパ欲しい。

802 :535:2019/04/17(水) 20:33:59.36 ID:5Verubd2.net
154勝178敗 勝率46.4%
2手読みに戻したらかえって勝率さがりましたね。
誤差の範囲かもわかんないですが。

803 :535:2019/04/18(木) 22:39:13.48 ID:Bi+APi3V.net
お、素晴らしい勝ち方した。
必勝形のダブルリーチ
これほど少ない石数でこの形を作れるとは…

(;SZ[19]
;B[jj];W[kj];B[jk];W[li];B[ji];W[lh];B[kl];W[jm]
;B[ih];W[lk];B[ig];W[jf];B[il];W[ik];B[hk];W[if]
;B[im];W[ij];B[hj];W[lg];B[ii];W[in];B[ik];W[jn]
;B[ij])

804 :535:2019/04/19(金) 21:34:26.27 ID:NHUtwCQF.net
ふーむ、いままで勝率のいい手かつ沢山選ばれた手を優先的に選択するように序盤DB周りを組んでいたのだけど、
それだと手が固定されてしまうかなと思って勝率のいい手かつあまり選ばれてない手を優先的に選ぶようにしたら

147勝 220敗 勝率40.1%

これは誤差とは言えないほどの差ですねぇ。

805 :535:2019/04/23(火) 20:49:51.89 ID:rLrZWc/a.net
205勝 246敗 勝率45.5%
棋譜取り&序盤DBへの取り込みを継続したら少し勝率戻りました。
50%付近まで頑張ろう。

806 :535:2019/04/24(水) 19:17:49.68 ID:DcbjCIK3.net
なかなかの快勝だった
こういう風に毎回打てるといいんだけど

(;SZ[19]
;B[jj];W[ij];B[ki];W[ii];B[ik];W[ih];B[jh];W[ji]
;B[kj];W[jg];B[kh];W[if];B[hj];W[ig];B[lk];W[jk]
;B[jl];W[hk];B[kk];W[km];B[hl];W[gk];B[gm];W[fn]
;B[kg];W[kf];B[lf];W[mg];B[lg];W[gi];B[le];W[lh]
;B[mh];W[mi];B[li];W[ie];B[id];W[md];B[lh];W[nd]
;B[lj])

807 :535:2019/04/25(木) 23:58:43.25 ID:DQ0GFyMT.net
192勝 212敗 勝率 47.5%
棋譜取り、序盤DB更新、DNN更新だけでは50%の壁は突破できないかもな。

808 :535:2019/04/26(金) 20:16:53.04 ID:F5QY8KS+.net
130勝 195敗 勝率40.0%
ん、勝率かなり落ちた。
何が起きた?

809 :535:2019/04/27(土) 23:11:18.27 ID:zszgzhMg.net
ん、序盤DB壊れたか?

810 :535:2019/04/27(土) 23:25:35.40 ID:zszgzhMg.net
序盤DB外したほうが勝率あがるかも?

811 :310:2019/04/30(火) 03:48:07.73 ID:RyvRJxq2.net
どもです。
ひたすら記譜作成中に、やっぱり暇なので、記譜管理周りをリニューアルしていたら、
結局記譜ファイルの形式を大きくいじってしまい、かなり全面的なリニューアルに。
そしたら、あちこちバグが出て、結局記譜作成より新作デバッグ優先に(汗

>>809-810
序盤DBは、記譜溜めていくと途中で弱くなるけど、いずれ直ってくるものだと思う。

正しい手順があるとして、1回間違えると、間違えた側が負ける記譜ができる。
負ける事で、その手は選ばれない事が記譜に登録される。

しかし、探索の精度が低い状態で記譜作ると、2回間違える記譜ができて、本来
負けのルートで勝ってしまう。これが記譜に登録されると、この2回目の間違いが
訂正されるまでは勝率が下がる。

どのくらいで直るのかは、直接なのか評価関数経由の間接なのかなど、フィード
バックのかかり方で変わってくる。直接的なら割とすぐに直るはず。

自分のは間接なのでかなり時間がかかりそうで面倒なので、Zebraで2つ目の間違い
箇所を特定して、そこまで着手した後探索をする棋譜を作って、かなり強制的に直し
ちゃった。

序盤は大体良いのだけど、確定値で学習している箇所と、序盤DBで学習している
箇所の境目で、確定値が足りないまま過学習になっている評価値ステージがあって
そこらあたりで大抵間違える(汗

812 :535:2019/05/02(木) 21:41:13.81 ID:uWEPsgK5.net
天頂の囲碁を使って9路を徹底的に調べたら面白いかも
ま、やらないけどね

813 :535:2019/05/04(土) 19:08:14.82 ID:wk+bg2Ip.net
GWは何もしませんでした(過去形)

814 :310:2019/05/04(土) 22:14:44.08 ID:fzBCFIZ6.net
新作の探索周りを、例のバグ付のやつにしたら、案の定バグ発生。
色々と入れ替えながらバグ発生箇所を特定に成功しました。
が、なぜそこでバグっているのかわかりませんorz
まともに動いたから良しとするしかない感じ。

あと2か所改良したいところがあります。
あと2日では無理だなぁ。

815 :310:2019/05/04(土) 22:17:34.69 ID:fzBCFIZ6.net
と思ったら、またいきなりバグ発生。
原因は複数ありそうですorz

816 :310:2019/05/05(日) 20:55:26.72 ID:GksqIPP4.net
原因判明。アホなミスでした。
やっぱり当初の置換表に変なデータが登録されているのが正解だった。

残した課題のうち1つもできた。

817 :310:2019/05/05(日) 23:26:28.04 ID:GksqIPP4.net
最後の課題は、学習の速度アップを目論みましたが、まったくダメでしたorz

さて、何をしよう。

818 :535:2019/05/06(月) 19:55:01.10 ID:uIBlT68N.net
長連対策そろそろしなければ…

819 :535:2019/05/06(月) 20:33:01.71 ID:uIBlT68N.net
序盤DBがおかしくなってたので、序盤DBの手の採用基準をもとに戻しました。
あと中盤終盤でDNNの値の比重を大きくしました。

820 :535:2019/05/07(火) 22:40:16.02 ID:hqvfZJCN.net
59勝 62敗 勝率48.8%
なんとか勝率50%弱まで戻せました。

821 :535:2019/05/08(水) 21:43:00.75 ID:c2FYdM3E.net
来たっ
262勝 248敗 勝率51.4%
誤差の範囲かもしれないけど嬉しいっ

822 :535:2019/05/08(水) 21:52:12.23 ID:c2FYdM3E.net
そろそろ白番も着手していくか、もうちょっと黒番を突き詰めるか。
悩ましいい。

823 :535:2019/05/09(木) 20:06:42.08 ID:w95MoSGU.net
ありゃ、わずかな棋譜を序盤DBに加えただけなのに勝率めっちゃさがった
149勝 202敗 勝率 42.5%

そんなに微妙なものではないと思ってたが??

824 :535:2019/05/09(木) 20:28:40.86 ID:w95MoSGU.net
棋譜さらっと見てみたけど序盤DBが壊れたって感じでもないなぁ
実は微妙なものだったのか、誤差の範囲なのか?

825 :535:2019/05/09(木) 22:32:58.01 ID:w95MoSGU.net
なんか誤差の可能性が微レ存

826 :535:2019/05/10(金) 21:38:12.73 ID:5KPSEUAN.net
163勝 202敗 勝率44.7%
±5%くらいは誤差ででるのかもしれないなぁ

827 :535:2019/05/10(金) 21:42:26.07 ID:5KPSEUAN.net
こんな時統計の知識があれば真の勝率は○○%〜××%の間とか論じられるんだろうなぁ

828 :535:2019/05/11(土) 11:49:39.90 ID:fuy9y7gB.net
うお、すげぇ

179勝 149敗 勝率54.6%

この数字をどう解釈すればいいのか…

829 :535:2019/05/11(土) 17:43:16.57 ID:fuy9y7gB.net
まだ勝ってる。
222勝 194敗 勝率53.4%

そろそろ棋譜反映させるか。

830 :535:2019/05/11(土) 22:40:54.90 ID:fuy9y7gB.net
長連対策、完全じゃないけど簡単な判定入れてみた。
さてどうかな?

831 :535:2019/05/12(日) 10:03:08.61 ID:7HaK6dtp.net
かなりいい
対LV2 白番はもうちょっと勝ちたいかな

対LV1
黒番 61勝 9敗 勝率87.1%
白番 49勝 4敗 勝率92.5%

対LV2
黒番 57勝 0敗 勝率100.0%
白番 10勝 28敗 勝率26.3%

対LV3
黒番 25勝 16敗 勝率61.0%
白番 13勝 28敗 勝率31.7%

832 :535:2019/05/12(日) 18:17:47.41 ID:7HaK6dtp.net
ふむ。かなりいい。
一回止めるか。

対LV1
黒番 90勝 10敗 勝率90.0%
白番 64勝 6 敗 勝率91.4%

対LV2
黒番 78勝 0敗 勝率100.0%
白番 14勝 33敗 勝率29.8%

対LV3
黒番 39勝 23敗 勝率62.9%
白番 19勝 40敗 勝率32.2%

833 :535:2019/05/12(日) 18:46:46.62 ID:7HaK6dtp.net
ここらでドカンとブレークスルーが欲しいところだ。

834 :535:2019/05/13(月) 20:57:06.68 ID:rQSLa/J8.net
お、すごい
249勝 204敗 勝率55.0%

835 :535:2019/05/13(月) 21:55:46.89 ID:rQSLa/J8.net
LV3 vs LV3の黒番の勝率が65%くらいだったはずだから、黒番で勝率70%位いけばLV3越えといえるかも

836 :535:2019/05/13(月) 23:06:54.58 ID:rQSLa/J8.net
地味な学習も必要だとは思うけどアイディア一発でドカンと強くなるのも諦めきれない。

837 :535:2019/05/14(火) 21:30:20.81 ID:kAvibZwR.net
ん、なんかDNN学習させたらうち筋はそんなに悪くなってないと思うんだけど勝てなくなったな。
なんだろう?

838 :535:2019/05/15(水) 21:00:42.40 ID:ce+jhpkV.net
173勝 176敗 勝率 49.6%
対戦してみたけど思ったほど負けてないな?

839 :535:2019/05/15(水) 21:22:39.79 ID:ce+jhpkV.net
初期アルファ碁のようにポリシーネットとバリューネットに分けてみるか?

840 :535:2019/05/15(水) 21:35:41.77 ID:ce+jhpkV.net
そこそこの精度でも軽い評価関数は結構ほしいかも。
モンテカルロで役に立つし。

841 :535:2019/05/15(水) 22:07:54.43 ID:ce+jhpkV.net
というわけで、今使ってるDNNより大幅に簡素化したネットワークで学習させてみる。
データは同じ。

842 :535:2019/05/15(水) 22:45:22.49 ID:ce+jhpkV.net
あれ、大幅に簡素化したのに学習時間が思ったより短くならないな。
10倍速くらい早くなると思ってたのに3倍速くらいだ。

843 :535:2019/05/15(水) 23:06:58.43 ID:ce+jhpkV.net
更に簡素化して10倍速くらいにしました。
ちょっと簡素化しすぎかも?

844 :310:2019/05/15(水) 23:27:46.15 ID:2Iqikd3t.net
新バージョンで色々プログラム見直し。
探索部は全く改善していませんが、その他の部分が大幅にスピードアップ。
自動記譜作成時のオーバーヘッド(探索以外の時間)がかなり減った。

あとは学習の時間を減らしたい。

845 :535:2019/05/16(木) 19:50:22.50 ID:bKmJMMur.net
大きい方のネットワークの損失が3500位なのに対して小さい方のネットワークの損失が5300位。
さて、使い物になるかな?

846 :535:2019/05/16(木) 20:26:43.20 ID:bKmJMMur.net
うおお,遅え!
モンテカルロに使おうと思ったらプレイアウト回数かなり減らさなきゃだめだな。

847 :535:2019/05/16(木) 20:40:14.63 ID:bKmJMMur.net
一回打ってみたけど打ち筋は決して悪くない。
だが激遅。
だかが300プレイアウトでここまで遅いとは…

848 :535:2019/05/16(木) 20:49:50.51 ID:bKmJMMur.net
ん、でも打ち筋がいい。
ブレークスルー来たか??

849 :535:2019/05/16(木) 21:05:06.63 ID:bKmJMMur.net
すごいな、こちらの打ち筋は相当改善されたのにLV3がその上を行ってくる。
奥が深い。

850 :535:2019/05/16(木) 22:04:27.02 ID:bKmJMMur.net
ん、まだ学習飽和してないみたい。
ジリジリ損失減ってる。

851 :535:2019/05/16(木) 22:42:50.95 ID:bKmJMMur.net
LV1と対戦させ始めてみたけど、かえって勝率落ちてるな?
まだ対戦回数少なすぎて結論出すのは早いけど、もっと50連勝くらいするかと思った。

対LV1
黒番 17勝 3敗 勝率85.0%
白番 13勝 3敗 勝率81.3%

852 :535:2019/05/17(金) 21:14:13.13 ID:Af3ltV5Z.net
勝率上がってるみたいです。やった!

対LV1
黒番 156勝 15敗 勝率91.2%
白番 109勝 8敗 勝率93.2%

853 :535:2019/05/17(金) 21:17:20.41 ID:Af3ltV5Z.net
小さいネットワークの損失も5180くらいまで減ってます!
次は本丸、LV3と決戦や!

854 :535:2019/05/17(金) 22:31:13.53 ID:Af3ltV5Z.net
対LV3 黒番
47勝 34敗 勝率58.0%

ふーむ、まあ悪くないけど、正直もっと期待していたw
400〜500戦くらいはしないとまだ結論は早いけど。

855 :535:2019/05/18(土) 01:00:18.55 ID:NdCkwblz.net
ほほう、6割行った。
120勝 80敗 勝率60.0%

856 :535:2019/05/18(土) 16:28:24.45 ID:NdCkwblz.net
291勝 231敗 勝率55.7%
ふーむ、まあ悪くないけど。
最終的には対LV3黒番勝率 70% を目指したい。

857 :535:2019/05/18(土) 21:21:56.33 ID:NdCkwblz.net
そういえば、勝率ばかり気にして肝心の棋譜をあまり見てなかったな。
どんな負け方してるのかちゃんと把握せねば。

858 :535:2019/05/18(土) 22:11:34.39 ID:NdCkwblz.net
ふーむ、必敗を避けるルーチンに若干バグがあるな。

859 :535:2019/05/19(日) 07:21:38.98 ID:GRYTxzHT.net
GPU使いたいなぁ。
せっかくいいの買ったんだから。

860 :535:2019/05/19(日) 07:52:25.50 ID:GRYTxzHT.net
ライフゲーム囲碁も平行で開発しようかなぁ。
アルファゼロアルゴリズムが心のどこかで捨てきれない。

861 :535:2019/05/19(日) 13:54:34.49 ID:GRYTxzHT.net
ライフゲーム囲碁 コード書き始めました。
ルール実装が結構効率的な奴思い付いて、1000万プレイアウト/s位出ました。

並行でやるっつっても計算資源が問題だなぁ。

囲連星はアイディアないしちょっとお休みかなぁ。

862 :535:2019/05/19(日) 17:10:04.89 ID:GRYTxzHT.net
GUIがないと不便だなぁ。うーん。

863 :535:2019/05/21(火) 00:59:34.87 ID:rSRUkqQW.net
うお、ついに人間(俺)に勝った!
内容的にも文句ない勝ち方だ!

(;SZ[19]
;B[jj];W[ji];B[ii];W[ih];B[ki];W[jh];B[kk];W[kh]
;B[lj];W[ij];B[hi];W[hk];B[hh];W[lg];B[gl];W[mg]
;B[gg];W[ff];B[gk];W[gj];B[ll];W[mm];B[fj];W[fi]
;B[gi];W[hj];B[hl];W[jk];B[ik];W[hj];B[gj];W[gf]
;B[gm];W[gh];B[fn];W[fh];B[lh])

864 :535:2019/05/21(火) 01:06:56.53 ID:rSRUkqQW.net
ここまでくると囲連星はいったん公開してもいいかもな。
本当は白黒総合勝率でLV3に勝ってからが理想なんだけど。
あとDBのファイルサイズでかいんだよなぁ。

865 :535:2019/05/21(火) 23:53:55.55 ID:rSRUkqQW.net
現状の囲連星のAIを公開します。
ちなみに対LV2黒番必勝ではなくなってしまっているようです。
あと思考時間かなり長いです。

https://drive.google.com/file/d/1M86qczNQQScvkH-ZMyZVAlDvJ-K0OlVc/view?usp=sharing

866 :535:2019/05/23(木) 20:03:18.47 ID:boQDU2Sa.net
反応がなくて寂しい。。。
まあもともと過疎スレだからしかたないか。

867 :310:2019/05/25(土) 01:28:48.60 ID:rX0QQhRb.net
すんまそん。
ダウンロードしたけど、記譜作成中なので、CPU食いたくなくて(汗

868 :535:2019/05/25(土) 21:14:03.65 ID:LKgjurKe.net
囲碁ディープラーニングプログラミングという本があったので買ってみた

869 :535:2019/05/25(土) 22:41:49.53 ID:LKgjurKe.net
このサイトも面白そう
https://medium.com/applied-data-science/how-to-build-your-own-alphazero-ai-using-python-and-keras-7f664945c188

870 :535:2019/05/25(土) 22:44:29.26 ID:LKgjurKe.net
C#からC++を呼び出すの結構難しい。
マネージドコードとアンマネージドコードがどうたらとか、、、

871 :535:2019/05/27(月) 14:54:14.96 ID:6xYMMPUB.net
AMD Ryzen 3900来た

872 :535:2019/05/27(月) 17:52:37.02 ID:8VbKHTBW.net
囲碁ディープラーニングプログラム読んでるけどすっごい目が滑る
でも12章のactor critics法というのが面白そうで頑張って読みたい

873 :535:2019/06/01(土) 23:30:05.61 ID:bijpxRGI.net
俺のマザーボードRyzen3000シリーズに対応しないらしいorz
ショック

874 :535:2019/06/02(日) 18:07:27.02 ID:rgij2qjY.net
はぁ〜だめだあぁ
目が滑る
頭に入ってこない

875 :535:2019/06/02(日) 21:33:07.07 ID:rgij2qjY.net
うお、betago(>>868の本のプログラム)動いた。
そして意外と強い。

876 :535:2019/06/02(日) 21:38:17.03 ID:rgij2qjY.net
ん、終局の仕方がわからん。
終局は実装されてないのかな?

877 :名前は開発中のものです。:2019/06/02(日) 21:42:02.90 ID:pCuEsXAG.net
いまからやってみるか

878 :310:2019/06/04(火) 01:18:15.20 ID:11K0AF4X.net
強化学習本興味あります。
棋譜作成がいまいち上手く行っていないので。

879 :535:2019/06/04(火) 21:25:33.03 ID:eotmjR11.net
くそう、時間が欲しい。
金さえあればニートになるのにww

880 :535:2019/06/05(水) 21:45:28.39 ID:tAUB+cOz.net
これから仕事が忙しくなりそうな予感。
まあさすがに土日は休めるだろうけど。

881 :535:2019/06/08(土) 18:42:48.95 ID:bTp76tLI.net
うおお、目が滑りまくりorz
一日無駄になったorz

882 :535:2019/06/08(土) 21:38:02.44 ID:bTp76tLI.net
目が滑るのは取り組み方が間違ってる証拠。

883 :名前は開発中のものです。:2019/06/10(月) 12:52:10.55 ID:/Ra7JNmg.net
囲碁は完全に人工知能に負け人間が追いつくことはないとおもうが。
これや将棋は微妙な線で、人間に勝ち目あるかもしれん。
囲碁より勝ち方、有利のさせ方が分かりやすい差。
人工知能なしの人間技で、人工知能に勝てる方法あるんじゃないかと。

884 :名前は開発中のものです。:2019/06/10(月) 17:27:02.16 ID:sKxIYoYq.net
大人も子供も白熱!最新ゲーム「ノッカノッカ」が面白い
https://ima.goo.ne.jp/column/article/5290.html
ビビットカラーを使ったポップなデザインの二人用ボードゲーム「ガブル」
http://boardgame-kikou.blog.jp/archives/9311305.html
LOGY GAMES ボードゲームカタログ
http://www.logygames.com/index.html#catalogue
オシャレで簡単、だけど深いボードゲーム
http://sweetint.com/ic/tinttile-game
コンポーネントに酔いしれて、戦略にゆったり溺れる「箱庭の国」
http://sake.saloon.jp/dojin_miniaturized-world/
『すずめ雀』初心者でも本格的な駆け引きを楽しめるミニマル麻雀ゲームが登場
https://www.inside-games.jp/article/2018/05/02/114450.html
エクストリーム将棋の企画から販売まで
https://nakagawa-hands.com/digital-fabrication/ex-shogi_a2z/

885 :535:2019/06/11(火) 18:15:44.55 ID:a3oKL+Tm.net
「来た!」「16コア来た!」「メイン16コア来た!」「これで勝つる!」

886 :535:2019/06/11(火) 22:20:28.87 ID:R+B8a+a7.net
囲碁ディープラーニングプログラミング相変わらず目が滑ってるんだけど、
しつこく食らいついてたらすこしずつ目が滑らなくなってきてる。
何とかものにしたい。

887 :535:2019/06/12(水) 19:47:45.91 ID:UjRskMNa.net
githubのリポジトリbetagoとは別に囲碁ディープラーニングプログラミング用のやつがあんのか!
気が付かなかったぜ!
これで勝つる!

888 :535:2019/06/13(木) 21:23:37.11 ID:ip5cHIAR.net
囲碁ディープラーニングプログラミングのgithubのコードいいかも。
マルチスレッドにも対応してるっぽいし。
これはかなり期待できる。

889 :535:2019/06/13(木) 21:36:37.70 ID:ip5cHIAR.net
GPUが使えてないみたいだな。
tensorflow-gpuうまく入ってないみたいだ。

890 :535:2019/06/13(木) 21:38:46.69 ID:ip5cHIAR.net
それにしてもZen2 スリッパが欲しい。
16C32Tじゃ足りない。
64C128Tが欲しいww

891 :535:2019/06/14(金) 21:40:47.35 ID:AD5EB04u.net
ん、27000回学習を回した時点から過去のAIに対する勝率が10%〜30%位しか行かなくなったみたい。
なぜ?
こんなことってあるのか?

892 :535:2019/06/14(金) 22:09:53.32 ID:AD5EB04u.net
ん、学習したネットワークと対戦する方法がわからんなぁ。
web_demo.pyあたりで行けそうな気もするが…

893 :535:2019/06/15(土) 17:55:00.43 ID:ANVzDRfZ.net
human_v_bot.pyというのでランダムAIと対戦できるようなので、これをちょっといじれば自作AIと対戦できそう。

894 :535:2019/06/15(土) 19:41:51.27 ID:ANVzDRfZ.net
ヤバイ、待ってる時間がじれったい。
やはり zen2 スレッドリッパー買うしか…

895 :535:2019/06/15(土) 21:21:58.56 ID:ANVzDRfZ.net
LifeGameGoのルールを早く移植したいけど、もうちょっとgithubコードの感触つかんでからかな。

896 :535:2019/06/15(土) 22:03:51.50 ID:ANVzDRfZ.net
ふーむ、まじで>>891の状態から抜け出せないな。
ネットワークが小さすぎるんだろうか?

897 :535:2019/06/16(日) 19:35:53.70 ID:OMA3ZwQu.net
あかんな、遅すぎる。
うーん。アルファゼロに幻想持ちすぎかも知れんな。

898 :535:2019/06/16(日) 20:37:51.38 ID:qjgvbRbv.net
囲碁よりもシンプルなLifeGameGoならもっと速く学習できるという可能背もありますが…
とりあえず、GPUを使えるように頑張るのが先かなぁ?

899 :310:2019/06/17(月) 17:09:51.93 ID:pTM6WQ3W.net
Surface Pro2の液晶が割れたorz
仕事で使うPCなので慌ててPro6の発注をかけました。
一応コア数2倍の4コア8スレッド、メモリーも16Gになる予定。
そろそろスピードの限界を感じていたので、痛しかゆしなところ。

ようやくIntelの呪縛から解放されるAVX2対応のCPUがAMDから出るというのに、
専用新型PCが遠のきました。



どのくらいスピードアップするかなぁ…。

900 :535:2019/06/17(月) 19:55:14.11 ID:KSoga8dR.net
仕事で使うpcが自腹なんかよ?
乙です

901 :535:2019/06/21(金) 20:05:05.51 ID:wxbtZaxz.net
なんかちょっとモチベが落ちてます。
せっかく週末なのになぁ。

902 :535:2019/06/22(土) 20:40:40.51 ID:s675JLMo.net
あああああ、だめだ完全に気持ちがしぼんでしまった。

903 :535:2019/06/23(日) 23:02:35.16 ID:wqGRreNQ.net
つかやっぱpythonはちょっと厳しいんだよなぁ…

904 :310:2019/06/25(火) 22:00:54.87 ID:i36dK7DH.net
あ、会社のPCです。流石に性能2倍なので、買うモチベーションが下がったのです。

現在液晶の表面パネルバキバキで、タブレット機能止めて、
セロテープで補強してだましだまし使ってますが、発熱によって
内部が歪んじゃっているみたいで、通常状態でも液晶が湾曲してます。


で、将棋の探索の深さが意味不明だったので、色々考えていましたが、
なんとなく想像がついてきました。多腕バンディット使って、反復深化と
絞り込みを行っているのではないかと思います。

現状中盤探索の速度がいまいち遅く、シングルプローブカットすると
何故かさらに遅くなるという状態。棋譜作成メインだったので、あまり
気にしていなかったのですが、新しいPC来たらちょっとトライしてみよう
かなと思っています。

905 :310:2019/06/28(金) 22:23:55.68 ID:jdIE39If.net
新PCセットアップ中。

前回思いついた中盤探索ロジック。具体的に実装を考え始めたら、
MCTSでいいじゃんということに(汗

これからVisual Studioのダウンロードです。

906 :名前は開発中のものです。:2019/06/29(土) 09:41:43.34 ID:aAhzQFUl.net
セットアップ完了して、開発環境の移行も終わりました。
VS2017→VS2019でエラーチェックが厳格化したものがあったようで、ソース修正。
Win8→Win10でコマンドプロンプトがなんか変わって、CTRL-Sの動作がよくわからない。
などなど、細かい点はいくつかありますが、速度的には思いのほか効果が出ていて、
ほぼ倍速くらいな感じです。並列のオーバーヘッド増加分を、クロック他CPU単体の
パフォーマンスアップで吸収していると思われます。

907 :310:2019/06/29(土) 09:42:10.63 ID:aAhzQFUl.net
↑は僕です。

908 :535:2019/06/29(土) 17:06:05.94 ID:6alt1Zxx.net
倍速はなかなかいいですね。おめでとうございます。
俺も頑張らねば。。。

909 :535:2019/06/30(日) 17:26:00.32 ID:5SElYd7b.net
逃げちゃだめだ、逃げちゃだめだ、逃げちゃだめだ(pythonから)

910 :535:2019/07/04(木) 18:51:35.21 ID:JLZZWsF4.net
VMWareだとどうにもtensorflow-gpuが使えないのでネイティブubuntuを入れるか迷い中
SSD丸ごと1個あけて別ドライブにインストールすればwin10とも干渉しないはず…

911 :535:2019/07/05(金) 20:11:11.37 ID:gv5AG18i.net
一応ubuntu入ったっぽい。
でも環境構築する根性が湧いてこない。
あしたにするか。。。

912 :535:2019/07/06(土) 17:14:44.78 ID:YqSGwJgi.net
あかん、ubuntuすっごい固まるorz
今日だけで4回フリーズしたorz

913 :535:2019/07/07(日) 19:22:27.22 ID:8kGyRN1E.net
ここまで固まられるとネイティブubuntuは正直、撤退かなぁ
うーん。惜しいなぁ。

914 :535:2019/07/07(日) 22:36:19.30 ID:8kGyRN1E.net
VMWareのubuntuは固まらないんだよなぁ
バージョンが違うからかなぁ

915 :535:2019/07/08(月) 23:58:39.11 ID:J+Oysvfm.net
50万局学習させても知性とは程遠い打ち筋orz
絶望した!

916 :535:2019/07/12(金) 20:02:35.26 ID:5KSDfXOV.net
さんれんきう

917 :535:2019/07/14(日) 01:02:14.40 ID:BHfYEZqG.net
AQZという囲碁AIが50万局の学習でプロに勝ったそうな。
なんで俺が試したプログラムとそんなに違うんだ?

918 :535:2019/07/15(月) 07:10:16.79 ID:U2als8ec.net
徹夜してしまった
反省(反省するとは言っていない)

919 :535:2019/07/21(日) 20:03:14.96 ID:E/xzPLNe.net
二進も三進もいかないorz
しばらく休憩するか…

920 :535:2019/07/21(日) 21:27:54.74 ID:E/xzPLNe.net
https://github.com/xuetf/AlphaZero_Gobang
気分を変えてこれに手を出そうかと思ってます。

921 :535:2019/07/28(日) 15:53:29.60 ID:afiNgtjO.net
すっかりさぼってしまっています。

922 :310:2019/07/31(水) 22:58:56.92 ID:RoaGFb2p.net
地味に改良&棋譜作成継続中。

評価値で黒番+2、白番−1くらいの差が生じているので、
評価関数にバイアス項を導入しました。

他、若干の高速化ネタ。

中盤探索でProbcutすると遅くなる問題を回避。本格修正するか悩み中。
というか、そもそもZebraより圧倒的に遅い原因がわからん。

923 :535:2019/08/04(日) 00:47:49.68 ID:kSURYkNt.net
ようやっと>>920のプログラムにライフゲーム囲碁のルールを実装しました。
python 超つらい…

924 :535:2019/08/04(日) 01:56:43.25 ID:kSURYkNt.net
CPU使用率10%か。。。切ない。。。

925 :535:2019/08/04(日) 20:02:48.59 ID:kSURYkNt.net
計算がある程度進むと必ずOSごとフリーズするorz
きょうびOSごと落ちるってどういうことだよ?

926 :535:2019/08/04(日) 20:18:18.16 ID:kSURYkNt.net
これはもうアルファゼロには手を出すなという神のお告げかもorz orz orz

927 :535:2019/08/07(水) 20:34:05.86 ID:cRW9S7xJ.net
そもそも、気温が高すぎて留守にしてる最中計算回しっぱなしにするの怖いってのもあるんだよなぁ

928 :310:2019/08/10(土) 21:39:26.19 ID:iTdjAaDm.net
中盤探索を改良。

一つは、普通に無駄な処理を見つけて修正。

もう一つは、評価値の計算に差分計算を取り入れました。
今まで並列処理で差分ってどうやるんだろうと思っていましたが、
単にDepth=1のところ(次がLeaf)で、順次評価値計算するのを
差分すればよかったのね。

この2つで、中盤探索で2手ほど深く読めるようになりました。

929 :535:2019/08/13(火) 19:47:02.79 ID:wzsq2qR8.net
今、実家に帰省してるんですが>>865のAIを動かしてみようとしたけどdllが認識されませんね?
何が悪いんだろう?

930 :310:2019/08/15(木) 23:44:11.68 ID:NhTCTcJa.net
小人閑居して不善をなす…。

思い切って、不要そうに思える棋譜をバッサリ削除してみました。
削除しすぎたかも。

いろいろ細かく修正と、デバッグ用表示の改良。

とかやっていたら、丸1日近く動かしたところで、なぜか急激にパフォーマンス低下。
もともと空きが少なかったSDDが一杯になっている…。とはいえ30Gはあったはず。
再起動していたらもとに戻った。原因不明。

対症療法で不要プログラムアンインストールしていたら、使っているOfficeを間違えて
アンインストールしてしまった。

HDD一杯が原因なのか、評価値のファイルが壊れていた。
ギリギリ間に合ってバックアップから復旧できた…と思う。

931 :310:2019/08/16(金) 14:28:22.00 ID:MY5mY5kZ.net
SDD一杯の犯人判明。
セキュリティー対策ソフトの監視対象管理DBのファイルが合計で400G越え(汗
ところが、管理者権限ないと停止できず、ファイル掴んでいるため削除できない。
今日は管理者休暇中。

logファイルを頻繁に追記しすぎて、ファイルサイズ変化する都度DBファイルが
作られているのではないかと想像。棋譜バッサリ削除して、一気に遡り探索やり直し
していて、これまでと比較にならないペースと数で追記処理が起きているので、
その影響の可能性が。


Officeは再インストールしてもらったけど、何故かセキュリティ解除キーの入力ができない。
来週月曜日は出張なので、来週火曜日までだましだまし行きます。

古い方のPCがまだ生きているので、Excel作業はそちらでやる事にしました。

932 :535:2019/08/23(金) 19:05:38.98 ID:KljXhF7+.net
AQZ敗退か
残念

933 :名前は開発中のものです。:2019/08/23(金) 19:13:36.62 ID:KljXhF7+.net
囲碁は現在のコミで白番有利説もあるようですがどうなのか

934 :310:2019/09/05(木) 22:24:16.41 ID:NIzTzKyA.net
棋譜の作り方全面改訂。
分岐のチェックで、以前は全ての分岐を棋譜化していたけど、今度のは軽い探索で
怪しい評価値(同一評価値〜−4程度まで)のものだけ棋譜化するようにして、
棋譜数を大幅節約。学習が楽になるという算段です。

棋譜づくりが順調になり暇ができると、細かく気になっていた、どーでもよいところを
改良し始めて、バグとりで棋譜づくりが滞るという悪循環orz


よくよく考えたら、PCのパワーアップしたので、またDCNNトライとかしてみようかな
とか思い始めた。tiny-dnnしか選択肢無いんだけど。

935 :535:2019/09/11(水) 20:42:08.54 ID:EGEM/7RV.net
googleがminigoというオープンソースやってるらしいですね。
最近さぼりっぱなしだったけど、ちょっと見てみるか。

936 :535:2019/09/12(木) 19:49:22.62 ID:qOi8eRBu.net
すげー難しそう
まだちゃんと見てないけど

937 :310:2019/09/17(火) 23:33:38.68 ID:KoOw8EHX.net
相変わらずしこしこ棋譜作って学習繰り返してます。
もう無いだろうと思いつつ、ちょこっとした事に気づいて修正を繰り返してます。

置換表のハッシュ関数を改良。
格納効率が結構良くなったので、衝突が減ったはず。

終盤探索の時にBOOK(確定)も参照して余計な探索を減らしました。
基本遡りで確定させているので、運が良い時に滅茶苦茶早くなりました。
無い時は今まで通り(汗

学習データが不足しているのではないかと、置換表内に残っているスコアが確定
した局面FIFOで貯めて、折々に学習に回してみました。1回探索で100〜500件
程度。これをFIFOで500万件。棋譜に残っていない局面で学習する事で、過学習
が防止できるかなと思っていますが…。

現在、27手確定局面で大体14000件の棋譜とその分岐で合計23万件ほどですが、
まだ棋譜が足りていない感じです。が、件数が増えすぎて手に負えません。
BOOKの確認ができるWindowsアプリ作ろうかと思い始めています。

938 :535:2019/09/22(日) 19:52:21.38 ID:ctBLCdpw.net
このまま失踪しそうな感じです。
やっぱアルファゼロは手を出してはいけないかったんや。

939 :310:2019/09/22(日) 19:56:33.01 ID:x3eDgHtk.net
DCNNになってから、一般人のPCでは手が出せなくなってるからね。

計算プロセス自体は、NNを極端に単純化したものが線形回帰だと思えば、
NNで生まれた計算ノウハウが流用できますよ。

というか、今の時代、ただのLRでDCNNとほぼ同じ強さ、とかの方がオシャレ
ではないかと思う、ひねくれものの僕。

940 :310:2019/09/23(月) 19:34:01.85 ID:taOqGsoO.net
所詮趣味なので、あまり無理せず、やる気になるときにやればよいかと思います。

941 :535:2019/09/23(月) 20:58:22.95 ID:T5ohU9uM.net
うーむ、やりたい気持ちはあるのですが、いかんせん難しすぎて…
githubにもっと易しそうなのでてくるまで待つか?うーん。

942 :535:2019/09/25(水) 21:31:58.87 ID:/O9j0jn/.net
気温が徐々に下がってますね。
そろそろ計算回しっぱなしにしてもいいかな。
つっても回せるプログラムがないけど。

943 :535:2019/09/28(土) 22:43:07.40 ID:upFNPupL.net
またgithub漁ってます。
https://github.com/yangrc1234/Gomoku-Zero

944 :535:2019/10/01(火) 22:13:53.83 ID:r/X1idNR.net
3日くらい計算回したけど全く強くなる気配がないなorz
もしかしたら微妙に強くなってるのかもしれないけどあまりに成長速度が遅すぎる
やっぱアルファゼロは計算時間が半端ないのかも?

945 :535:2019/10/01(火) 23:21:06.21 ID:r/X1idNR.net
やっぱアルファゼロはいったん諦めて、囲連星でやったようにモンテカルロAIの棋譜取り&勝率DB作り&教師ありDNNでライフゲーム囲碁やるべきか?
うーむ

946 :310:2019/10/02(水) 01:57:09.42 ID:FIHYKLNY.net
DCNN強化学習はマシンパワーが恐ろしいほど必要だからね。
満足できる教師データがそろってから評価関数に使ってみる程度にしないと…。
自由度が高すぎるので、まともな評価関数に収束するまでに、相当な試行回数が
必要なんじゃないかと思う。

自分は棋譜作成をずーっとやっていますが、現在は棋譜作りの目的がBook充実
になりつつあります。なんというか、現在の形はいつの間にかQ学習+ε-Greedy
っぽくなってきています。

アルファ様のお陰で、目標を見失いましたので、手段のためなら目的を選ばない感じ
で、プログラム作る楽しみという方向になっています(^^;

947 :535:2019/10/02(水) 22:58:01.64 ID:BtKMO/4x.net
ライフゲーム囲碁、モンテカルロAIの棋譜取り始めました。
ヒューリスティックなしのモンテカルロで1手10000プレイアウトで1局に約1分かかります。
それを16並列で1分当たり約16局採取できる予定。
棋譜の質があまりよくないのが難点ですがとりあえず、これでやってみます。

948 :535:2019/10/03(木) 21:37:56.85 ID:tdDOcoA1.net
18257局分棋譜が取れたようです。大体13.2局/分くらい取れるっぽい。
全コア動かすとシングルよりやっぱ少し遅くなるみたいですね。

949 :535:2019/10/06(日) 00:55:35.61 ID:V0Jk6SKR.net
DB作成まで来ました。
ライフゲーム囲碁は囲連星と比べてもっと沢山の棋譜が必要になるかもしれません。
オープニングのバリエーション的に。

950 :310:2019/10/11(金) 20:52:12.13 ID:Tdz7win8.net
評価関数を変えたくなってきた。
偶数手番と奇数手番の癖が顕著になってきたので、スムージングをしたく
なったのだけど、キーを手番優先にしているので、1手進むと盤面がひっくり
返ってしまい、連続性が無くなってしまう。

キーを黒番優先にして、評価値も黒番サイド(白番の場合は−1を掛ける)に
統一するとスムージングしやすくなる。

ただし、評価関数からBookから、あちこち影響が出る。

そろそろソースの整理がしたくなってきていたので、バッサリやっちゃおうかな。
台風で暇だし。

951 ::2019/10/12(Sat) 09:18:22 ID:acZ84t7K.net
一晩考えてやっぱ辞めました(^^;
単純じゃない。

952 ::2019/10/12(Sat) 19:26:22 ID:pRNoi8N2.net
あ〜なんか情熱が湧いてこないな。
プログラム書くのがすごい億劫。

953 ::2019/10/13(Sun) 05:54:00 ID:ZL98wLBj.net
とりあえず、囲連星のコード流用してDNN学習回せるところまで来ました。
あとはAIプレイヤーのコードを移植すればひと段落かな。

954 ::2019/10/13(Sun) 07:51:43 ID:ZL98wLBj.net
モンテカルロAIとDNNAIで対戦できるところまで来ました。
DNNAIの動きはまあ第一弾にしては悪くない感じ。

955 ::2019/10/13(Sun) 08:07:20 ID:ZL98wLBj.net
パッと見DNNAIには知性の芽生えのようなものを感じる。
勝率に結びつくかは微妙だけど。

956 :535:2019/10/13(日) 08:47:17.90 ID:ZL98wLBj.net
勝率に結びついてませんね…。
残念過ぎる…。

寝るか。。。

957 ::2019/10/13(Sun) 10:43:15 ID:ZL98wLBj.net
うーん、ハッキリと弱くなってますね。
ライフゲーム囲碁って昔勝率DB使った時も勝率落ちたし何でだろう?

958 :535:2019/10/13(日) 10:48:13.56 ID:ZL98wLBj.net
モンテカルロAIにトリプルスコアで負けてますね〜
かなc

959 ::2019/10/14(Mon) 19:34:30 ID:+gotlTkI.net
ここからどうしていけばいいのかわからんなぁ。
負けるDNNAIで棋譜取りして勝てるようになるのかといえばかなり期待薄。
でもやれることもないし一応やってみるか。

960 ::2019/10/15(Tue) 23:46:30 ID:ttnyLWCi.net
DNNの評価値を得点差から勝率と得点差/81の平均にしたところ
トリプルスコアで負けてたのがダブルスコアになったようです。
まだ負けてるけど。

囲碁では得点差で評価値を付けるのはほぼタブーで勝率を評価値にするのがセオリーなのですが、試してみたかった。

961 :535:2019/10/17(木) 22:06:11.66 ID:AT1bNTwz.net
やっぱ、負けてるなぁ。

962 :535:2019/10/22(火) 14:18:39.16 ID:Mqr1tYDA.net
うーむ相手から攻撃されたときに反撃しない癖があるようだ。
反撃さえすれば楽に勝てるはずなんだが…。

963 :535:2019/10/22(火) 16:38:49.29 ID:Mqr1tYDA.net
DNNの入力にに盤面の情報だけじゃなくて、石がぶつかってるところの情報も与えてみるか。
かなり肝になる情報のはずだから。

964 :535:2019/10/22(火) 17:02:51.95 ID:Mqr1tYDA.net
うお、メモリがパンクしたorz
もー新スレッドリッパーにメモリ1TB載せたいorz

965 :535:2019/10/22(火) 17:31:13.35 ID:Mqr1tYDA.net
データベースがでかすぎるのかなぁ。
500万局面を4対称で2000万局面分くらいあるんだが、初期アルファ碁でも3000万局面くらいだったっていうし減らそういかなぁ。
うーん。

966 :535:2019/10/23(水) 20:19:32.52 ID:VmufmFSW.net
前も言ったかもしれないけどいたずらにネットワークを巨大化するよりコンパクトにしてエポック数を稼いだほうがいいかもしれないな。

967 :535:2019/10/26(土) 19:36:09.88 ID:4XMH/3Nj.net
学習するほどに弱くなる理由がさっぱりわからんorz
ちょっと休憩

968 :535:2019/10/27(日) 18:41:08.53 ID:OnknjOzZ.net
またgithubでアルファゼロ探ししようかなぁ(懲りてない)

969 :535:2019/11/05(火) 18:52:29.53 ID:F2Rnn9oI.net
新スレッドリッパー今日発表見たいですね
ワクワク

970 :535:2019/11/05(火) 22:09:32.07 ID:GKFgjg5l.net
あれ、今日じゃないのか…

971 :535:2019/11/07(木) 23:17:24.41 ID:OiCk9RdB.net
スレッドリッパー 32コア ベース3.7GHz ターボ4.5GHz 1999$
素晴らしい
金がないけど

972 :535:2019/11/09(土) 22:53:36.89 ID:rF2mt5AD.net
https://github.com/suragnair/alpha-zero-general
これwindowsでも動くっぽい

973 :535:2019/11/10(日) 20:01:17.40 ID:KZcBl7Ju.net
せっかく良さそうなの見つけたのに、イマイチモチベーション上がんないな〜
なんでだろ。ホントよさそうなのに。

974 :535:2019/11/17(日) 21:06:42.27 ID:eK7f1inq.net
コツコツpythonやってます。
リストの使い方がわかってくると書く速度あがりそう。

975 :535:2019/11/17(日) 21:48:33.74 ID:eK7f1inq.net
>>972にライフゲーム碁のロジックを実装しました。
ランダムプレーヤーと対戦できるところまで確認しました。
意外と拡張しやすい作りになってるっぽい。

976 :535:2019/11/17(日) 22:00:36.51 ID:eK7f1inq.net
インターフェースの作りがうまいプログラムは心が躍りますね。
見習いたい。

977 :535:2019/11/17(日) 22:24:52.29 ID:eK7f1inq.net
うおおお、遅えええええええ
6x6オセロだと結構速いけど9x9ライフゲーム囲碁だとめちゃ遅いorz
なにか高速化策を考えねば…

978 :535:2019/11/17(日) 22:33:57.28 ID:eK7f1inq.net
並列化されてないっぽいな。うーむ
並列化狙うか…

979 :535:2019/11/18(月) 20:52:01.98 ID:mPMMCB5I.net
今日一日、強化学習回してたんですが途中でOS固まってたorz
でも一応、3回ベストポリシー更新されたみたい。
ランダムボットと対戦させてみます。

980 :535:2019/11/18(月) 21:16:14.14 ID:mPMMCB5I.net
ランダムボットと黒白25戦づつやってディープラーニングAIの39勝11敗
でだしとしてはまあまあかな。

純モンテカルロAIともやってみよう。

981 :535:2019/11/18(月) 21:19:24.26 ID:mPMMCB5I.net
あれ、純モンテカルロAIないのか?
うーん。

982 :535:2019/11/19(火) 19:48:59.11 ID:EOzKZ0AX.net
うーむOS固まるなぁ。
今日も固まった。
グラボの熱が悪いのだろうか?

983 :535:2019/11/19(火) 20:34:57.86 ID:EOzKZ0AX.net
パソコンの調子が悪いのならいっそAWSとか検討するという手も…
でも金が…

984 :名前は開発中のものです。:2019/11/20(水) 21:49:18.08 ID:lMEK9Bn7.net
今日も固まったorz
ほんまどーなってるの?

985 :535:2019/11/20(水) 21:49:44.28 ID:lMEK9Bn7.net
名前忘れた

986 :535:2019/11/20(水) 22:46:44.07 ID:lMEK9Bn7.net
固まったけど少し更新されてたようです
ランダムボットと対戦したら48勝2敗
結構ハッキリ強くなってるな。

987 :535:2019/11/21(木) 19:44:58.21 ID:xK6B/ksk.net
今日も当たり前のように固まってるorz
どうすりゃいいんだ?

988 :535:2019/11/21(木) 21:11:44.62 ID:xK6B/ksk.net
そろそろ次スレの季節ですね。
順番的に私の番か。
995くらいで立てたらいいですかね。

989 :535:2019/11/22(金) 19:54:12.78 ID:nusik7MY.net
今日も固まった
いまのところ100%

990 :310:2019/11/22(金) 20:03:28.74 ID:bJtjxKyJ.net
どもです。そろそろ次スレですね。

相変わらず、色々小改造しながら相変わらず棋譜作り続けています。

Book確認のデバッグ用プログラム作って、棋譜の間違い特定が飛躍的に早くなり、
その分、訂正用の棋譜が膨れて遡り探索がおろそかになっています。

評価関数の学習は進めていますが、どちらかというと評価関数が怪しくて間違えて
いそうなところで、わざと分岐させてBookで正解手順(に近い)の分岐を登録していく
事で、棋譜の精度を上げようとしています。BookをQ値と考えると、選択的なε-Greedy
でQ学習しているような感じになりつつあります。

もちろん、最終的には評価関数に反映しますが、今はBook構築が先みたいな。


VC++のバージョンアップ通知が来たので更新したら、あちこちワーニングや
エラーが出て来まして、ソースの整理をしながら、ワーニングにならないソース
に書き換え中です。急いでも仕方がないので、裏で棋譜作り動かしながら、
ちんたらやってます。

久々にMCTS部分を見たら、バグだらけだったので、直したところ、マシンパワーが
上がったことからか、残り30手程度ならすぐに終局まで枝が伸びて比較的正確に
最善手順が生成できそうかなと思っています。全てのプログラムの書き換えが
終わったところで、テストしてみたいと思っています。

991 :535:2019/11/23(土) 14:12:48.21 ID:0YM91Vba.net
昨日の晩からいままで連続で動いてます。
なかなかベストポリシーが更新されなくて焦れる

992 :535:2019/11/23(土) 17:50:36.12 ID:0YM91Vba.net
ランダムボットに白黒25戦づつやって50勝0敗来ました!
このゲームはほかのゲームと比べてランダムボットが比較的強いから素晴らしいですね。

993 :535:2019/11/23(土) 18:12:06.28 ID:0YM91Vba.net
うーん、人間に勝てるほどは強くないな

994 :535:2019/11/23(土) 19:11:14.10 ID:0YM91Vba.net
次スレ
【オセロ,将棋】ボードゲーム Part3【囲碁,War】
https://mevius.5ch.net/test/read.cgi/gamedev/1574503798/l50

995 :535:2019/11/23(土) 20:58:35.29 ID:0YM91Vba.net
こっち埋めちゃいますね。

996 :535:2019/11/23(土) 20:59:10.47 ID:0YM91Vba.net


997 :535:2019/11/23(土) 21:00:52.15 ID:0YM91Vba.net
AWSでいいマシンを使うというのも憧れるが、
買うのとどっちが安いかは微妙かな。

998 :535:2019/11/23(土) 21:02:40.43 ID:0YM91Vba.net
スレッドリッパー11月30日発売。
コア数はいわずもがなベースクロックもかなり高い。

999 :535:2019/11/23(土) 21:05:07.92 ID:0YM91Vba.net
pythonの文法は結局何がいいのかよくわからんな。
ライブラリが充実してるってのはそうなんだろうけど。

1000 :535:2019/11/23(土) 21:05:51.11 ID:0YM91Vba.net
1000 !
お疲れさまでした。
次スレでまたお会いしましょう。

1001 :2ch.net投稿限界:Over 1000 Thread
2ch.netからのレス数が1000に到達しました。

1002 :2ch.net投稿限界:Over 1000 Thread
2ch.netからのレス数が1000に到達しました。

総レス数 1002
261 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver.24052200