2019-03-01から1ヶ月間の記事一覧

AtCoder エクサウィザーズ 2019

結果 A,B,Cの3完。350位でパフォーマンスは1924、レーティング変動は1727→1749(+22)だった。D問題は自分の力でも解き得る問題だったと思うが、上手くまとめられなかった。 A問題 最初は"正"三角形というところを見落としていて、三角形の成立条件は最大辺が…

【WCSC29】Miacisアピール文書が公開されました/PERについての所感

Miacisのアピール文書が公開されました。Miacisは簡単に言うとAlphaZeroの(個人でできるレベルでの)再現実験中といった感じです。あまりアピールという感じではなく、やった実験と今後の展望が主になっています。自分としては優先順序付き経験再生(Prioritiz…

平均化MCTSの実装変更

AlphaZeroで用いられているようなモンテカルロ木探索においては、状態で行動を取った回数とその行動以下の部分木から得られた報酬の総和を保存しておくことで、必要な際に行動価値をとして求める。 しかしこの書き方ではSarsa-UCT(λ)の実装をしようとしたと…

AtCoder Beginner Contest 122

結果 38分51秒(1WA)で全完、103位だった。やはりWAを出してしまうと100位以内は難しい。 A問題 条件分けを書くので微妙に時間を取られた。 #include"bits/stdc++.h" using namespace std; using ll = int64_t; int main() { char b; cin >> b; cout << (b ==…

AtCoder Grand Contest 032

結果 A問題だけの1完で1195位。パフォーマンスは975でレート変動は1787→1727(-60)。レート下げ幅が自己ワーストの大失敗という内容だった。 A問題 57分かかった。入出力例3の最後の方の数字をいろいろいじって成立するか考えていたんだけど、できるものをで…

On Monte Carlo Tree Search and Reinforcement Learningを読んだ

出典 Tom Vodopivec, Spyridon Samothrakis and Branko Ster, "On Monte Carlo Tree Search and Reinforcement Learning," Journal of Artificial Intelligence Research, vol.60, pp.881-936, 2017 概要 MCTSと強化学習を統一的な観点から捉え直し、TD()法…

AtCoder Grand Contest 031

結果 A,B問題を解いて634位。パフォーマンスは1708でレート変化は1796→1787(-9)だった。C問題を通せるようになるにはもう少し成長が必要そう。 A問題 3分4秒でAC。ある文字が回出てきたらそれらのうちどれかから1回取るか全く取らないかで通りありえるんだ…

AtCoder Beginner Contest 121

結果 25分24秒で全完。148位だった。人々D問題解くの速すぎでしょ。 A問題 えーA問題でこんなに難しいものを出すのっていう感じの感想を毎回抱いている気がするしA問題を舐めすぎなのか? いやでも今回のはさすがにちょっと難しめでしょ。タイムとしてはいつ…

自分用 Ubuntu18.04を入れた後やることリスト

時間経過でスリープ状態になるのをオフにする ソフトウェアの更新をする ダウンロードなどのディレクトリ名を英語にする(参考リンク) LANG=C xdg-user-dirs-gtk-update 日付の表示(参考リンク) gsettings set org.gnome.desktop.interface clock-show-date t…

AtCoder Beginner Contest 120

結果 22分59秒(1WA)で全完。140位だった。WAなければ100位以内という前回と同じパターンか。 A問題 はい。 #include"bits/stdc++.h" using namespace std; using ll = int64_t; int main() { ll A, B, C; cin >> A >> B >> C; cout << min(B / A, C) << endl…