2019-06-01から1ヶ月間の記事一覧

AtCoder Beginner Contest 132

結果 E問題までの5完で365位。変な勘違いばかりして解くのが遅く、全然ダメだった。 A問題 すっきりとしたやり方がわからなくて結局std::mapに各文字の出現回数を詰め込むというオーバーキル気味なことをやった。解説PDFにあるソートして比較が一番スマート…

長時間学習の結果/選手権以降にやったことのまとめ

要約 2週間弱かけて1Mステップの学習を行ったところレート2600程度になった。パラメータとWindows向けバイナリはGitHubで公開している。 背景 第29回世界コンピュータ将棋選手権以降、一通り試したいことはやったのでここで一度長時間の学習を行った。選手権…

AtCoder Beginner Contest 131

結果 E問題までの5完。 内容 値 順位 292nd / 5123 パフォーマンス 1869 レーティング 1861 → 1862 (+1) A問題 特になし。 提出 B問題 脳みそを使いたくなかったので問題文の通りまず総和を計算して各に対して絶対値の差が小さくなるものと探索してそれを出…

Learning Action Representations for Reinforcement Learningを読んだ際のメモ

出典 International Conference on Machine Learning 2019に採択 読んだ理由 前回に続いて行動の表現を学習する手法についてのものがICMLにあった。特に昨日の論文が行動ログから事前学習という形のものだったのに対して、より強化学習の学習ステップに明示…

The Natural Language of Actionsを読んだ際のメモ

出典 International Conference on Machine Learning 2019に採択 読んだ理由 うさぴょん外伝のアピール文書を読んでから行動表現の学習に興味が出ている。自然言語処理における分散表現の考え方に近いなと思いながらICML2019の論文一覧を見ていたところ、か…

AtCoder Beginner Contest 130

結果 D問題までの4完で久しぶりにレートが下がった。 A問題 最近はA問題でもちょいひねりが入ったりしていた気もするが今回はいやに簡単だった。 提出 B問題 特になし。 提出 C問題 半分に切る場合が最大というのはすぐわかったが、それが複数ある場合の条件…

diverta 2019 Programming Contest 2

結果 D問題までの4完。Highestが更新されていく。 A問題 での場合分けを間違えて1WA。サンプルにあるのに合ってないものを提出してしまうとは。自動でサンプルの成否確認して提出するプログラム欲しいと思うこともあるけど、コンテストに出る際の環境が複数…

優先度付き経験再生の実装・実験

要約 優先度付き経験再生はAlphaZero方式の学習でも効果がありそう。 背景 以前の記事でも軽く触れたが、優先度付き経験再生という手法がある。 大雑把に言うとリプレイバッファからのサンプリング確率を一様ランダムではなく優先度で重み付けするものである…

AtCoder Beginner Contest 129

結果 E問題までの5完。Fを解けている人が少なく、Eまでの早解きゲームになっていたようだ。近のRatedでは6回連続でレートが伸びており、たまたま上手くいっている感じは否めないが気分は良い。 A問題 ちゃんと問題文を読めているかちょっと不安になりつつの…

Sarsa-UCT(λ)の実装・実験

要約 Sarsa-UCT(λ)のλを調整しても明確な性能向上は見られなかった。 背景 以前の記事の通りMCTSにおける価値の漸進的更新を実装した。 これにより単なる平均を求める手法とは異なる手法へ改造することが容易になった。特に以前紹介したSarsa-UCT(λ)は自然な…

AtCoder Grand Contest 034

結果 A,Bの2完でレート+1。C問題を解けないようでは厳しい。 A問題 のうち右にある方を先に移動させたいという気持ちから考えていって方針は早い段階で立ったのだが、実装で悩んでしまった。最終的には多少冗長でも1マスずつ見ていくようにループを書くのが…

M-SOLUTIONS プロコンオープン

結果 A→B→D→Cと解いて4完。もっと早く解けるべきだとも思うけれど、これくらいが実力だとも感じる。 直近4回のRatedでは全てレートが上がっていて計+120、Highest更新中。特に訓練しているわけではないので単なる上ブレっぽくはあるが。 A問題 えー公式なん…