2021-09-01から1ヶ月間の記事一覧

合法なラベル数の計算

前回、検証データにおいて1回でも出現する出現するラベル数を記録したところ、1411種類だとわかった。 ネットワークの出力の都合上、2187クラスとしてクラス分類を行っているが、その中には将棋の指し手としてあり得ないものもある。 今の指し手ラベル構築方…

Policy正解ラベルの偏り調査

深層学習系の将棋ソフトでは主にPolicyを教師あり学習などで訓練する。しかし、将棋を普通にプレイしている上で出やすい手と出にくい手があると考えられ、正解ラベルにはクラスごとの偏りが大きくあると思われる。今回はその偏りについて調査した。 ラベルの…

Transformerで将棋の学習

最近Transformer(ViT)モデルで教師あり学習をやっていたところ、損失値についてはCNNと近い程度の低さが出せるようになってきたので記事としてまとめておく。 (※ 教師あり学習での損失値を比較しているだけなので、CNNより強いという主張をしているわけでは…