要約 価値のソフトマックス分布を選択および教師に利用することでレートが150程度上がったが、これはMiacis特有の事情である可能性がある。 背景 前回、価値のソフトマックス分布を教師としたAlphaZero学習は少なくとも最初の方では学習が上手く進んでいるこ…
結果 順位 267th / 5238 パフォーマンス 1919 レーティング 1881 → 1885(+4) 前日のAGCでレート-4だったので二日間でプラマイゼロ。このあたりが適正か? A - Red or Not これAtCoderの色システムと対応しているの? 上のほうがどうなっているのかよく知らな…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。