DeepLearningによる将棋の学習10~現状の最高性能~

コンピュータ将棋

前回は損失の比を調整することでPolicyの損失曲線とValueの損失曲線がだいたい同じタイミングで底を打つようにできるのではないかということを実験しました。今回はそれを踏まえて現状での最高性能を出す条件で実験してみました。 ResidualBlock5つ、フィル…

2018-04-28

WCSC28・各チームアピール文書一言メモ

コンピュータ将棋

elmo 文字化けしていて読めなかった(・ω・) ダウンロードしたら読めた。定跡を「自己対局→勝敗＋評価値を利用して評価」によってうまく作るというのは面白そうな考えですね。ライブラリを複数組み合わせいくのはやはり公開されていることの良さを上手く活か…

2018-04-27

DeepLearningによる将棋の学習9~損失比の再検討~

コンピュータ将棋

前回の実験ではResidualBlockの実装にミスがあったことがわかりました。Valueの出力を3つ目のブロックから取る実験をしてそのままにしていて、前回の実験は無意味でした。今回はそれを修正して一番基本的な実装に戻し、一番気になるのが損失の比をいじる部…

2018-04-25

DeepLearningによる将棋の学習8~元のモデル~

コンピュータ将棋

前回はフィルタ数を変更して実験をしてみました。今回はいろんな実験をしすぎて情報が取っ散らかってきたように思えるのでここらで一度標準的なものを再実験してみることにしました。 ResidualBlock5つ、フィルタ数192、optimizerはSGD、patienceは10、損失…

2018-04-23

DeepLearningによる将棋の学習7~フィルタ数の変更~

コンピュータ将棋

フィルタ数を256にして実験してみました。損失の比が1:1の場合 Epoch Total Loss Policy Loss Value Loss Move Accuracy Value Accuracy 1 3.9012 3.3180 0.5833 0.2844 0.6544 2 3.4626 2.8997 0.5630 0.3194 0.6710 3 3.2766 2.7227 0.5539 0.3407 0.6819…

2018-04-21

DeepLearningによる将棋の学習6~全結合型NN~

コンピュータ将棋

前回は損失の配分を調整して学習をさせてみましたが思わしい結果は得られませんでした。しかし、これは指し手予測の精度だけを見た場合の話であり、損失について考えると実は良い結果になっているともいえるかもしれないことに記事を書いてから気づきました…

2018-04-20

DeepLearningによる将棋の学習5~損失の配分を変更~

コンピュータ将棋

前回はフィルタサイズを変更してもうまくいかないことを確認しました。個人的にはDeepLearningによる学習でValueの学習がなかなかうまくいかないという点が気になっています。マルチタスク学習をさせているので損失は指し手の一致具合とValueの一致具合の和…

2018-04-19

DeepLearningによる将棋の学習4~フィルタサイズの変更2~

コンピュータ将棋

前回はフィルタサイズを5にして実験してみました。その結果性能は下がり、学習時間も多くなるということがわかりました。単純に考えれば増やしてもダメだということになるのですが、念のため今回はさらにフィルタサイズを7にして実験を行いました。結果は以…

2018-04-18

DeepLearningによる将棋の学習3~フィルタサイズの変更~

コンピュータ将棋

前回はブロック数を10、optimizerをAdamにして実験してみましたが良い結果は得られませんでした。今回はブロック数ではなくフィルタサイズを3→5に変更して学習させてみました。ブロック数は5、optimizerはSGD、patienceは7です。下の表が結果となります。 e…

2018-04-17

DeepLearningによる将棋の学習2~Adamによる学習~

コンピュータ将棋

前回の続き。 patienceを7にしてAdamでもやってみました。 optimizer = tf.train.AdamOptimizer(learning_rate=0.001) 結果は次の通りです。 epoch Loss Move Accuracy Value Accuracy 1 4.4521 0.2929 0.6807 2 4.1956 0.3232 0.6873 3 4.1133 0.3335 0.689…