2024-02-01から1ヶ月間の記事一覧

AHC030復習

やったこと 解説ページにあるものを読んだ 特にwriter解を参考にして(細かい高速化などは省いて)自分なりにRustからC++に書き直し、自分の本番時より良いスコアを得る提出を実装した 理解内容 解説ページが充実しているのであえて繰り返すまでもないが、自…

AtCoder Heuristic Contest 030

暫定64位。 0086 考えたこと ソフトマックス分布を使いたい 個ある各油田について、それぞれ左上のマス位置がである確率を保持してみたい。これはについてlogitを持つSoftmax分布として表現したくなった。 この分布を持って、マップ全域について期待値を取っ…

STL-10データでFSQを試す

最近の世界モデル系手法ではVQ-VAEが当たり前のように使われているので試してみたいが、生のVQ-VAEだとcommitment lossとかentropy lossとか、様々な工夫を入れなければいけないことが気になり、そういう工夫が要らないと主張されていて内容もシンプルなFSQ…

BBFで連続的に2つのゲームを実行する

強化学習エージェントが環境の変化に対応できるかどうか、という点に興味があるため、atariゲームを連続的に切り替える設定での学習を試せるようにした。 デフォルトのatari環境では各ゲームによって有効な行動数が異なる。たとえばBreakoutだと4種類(NOOP…