2019-08-20から1日間の記事一覧

価値のソフトマックス分布を教師としたAlphaZero学習(最終結果)

要約 価値のソフトマックス分布を選択および教師に利用することでレートが150程度上がったが、これはMiacis特有の事情である可能性がある。 背景 前回、価値のソフトマックス分布を教師としたAlphaZero学習は少なくとも最初の方では学習が上手く進んでいるこ…

AtCoder Beginner Contest 138

結果 順位 267th / 5238 パフォーマンス 1919 レーティング 1881 → 1885(+4) 前日のAGCでレート-4だったので二日間でプラマイゼロ。このあたりが適正か? A - Red or Not これAtCoderの色システムと対応しているの? 上のほうがどうなっているのかよく知らな…