2020-10-05から1日間の記事一覧

AobaZeroの棋譜を用いた教師あり学習 192ch

今回は普段128chである残差ブロック中のCNNを192chに増やして学習を行った。学習結果左:Policy損失右:Value損失どちらも学習損失では192chの方がやや良いのだが、検証損失ではそこまで差が出ていない。学習時間はやや長くなり45時間、約二日であった。 …