2019-09-01から1ヶ月間の記事一覧

第一回日本最強プログラマー学生選手権決勝

結果 A, Bの2完で94位。レートで見たらとても低い方だと思っていたんだけど、コンテスト前の順位表を見ていたら思っていたよりもドベ付近というわけでもなかったっぽい? まぁそれにしても100位以内は運が良かった(A問題がひねったものだったので普通の実力…

AtCoder Beginner Contest 142

結果 順位 145th / 5235 パフォーマンス 2116 レーティング 1893 → 1917(+24) ノーペナ全完ができたので良かった。E問題が簡単めかと思ったけど意外と解いた人が多くなくて順位もそこそこ。次回は上手くいけば最高レート(1925)更新なるかという戦いに。 A - …

対抗形の学習が不十分

結論 現状の学習方法で得たパラメータは対抗形が苦手であり、学習局面として対抗形ほとんど出現していない。 背景 自己対局による強化学習だと学習局面が偏ってしまうのではないかという指摘は多々ある。Miacisについてはどうも対抗形で上手く指せていないよ…

AtCoder Grand Contest 038

結果 順位 514th / 2032 パフォーマンス 1663 レーティング 1916 → 1893(-23) ペナルティが重たくのしかかる。再びmerom氏にレート抜き返されてしまった。 A - 01 Matrix さっぱりわからなくてやばかった。58分かけて8WAの後に通すことができたけどこれは致…

AtCoder Beginner Contest 141

結果 順位 111th / 5166 パフォーマンス 2214 レーティング 1877 → 1916(+39) A - Weather Prediction 頭が悪い実装方法でタイプミスが怖かったが、そのときはCLionが指摘してくれるだろうと信じてやった。 提出 B - Tap Dance こういうの条件間違えそうで怖…

適当にやった実験の結果

以下全てEloレートは全て技巧2(深さ10)と1手0.25秒で500局対戦した結果から推定したもの。 ディリクレノイズなし 行動選択を価値のソフトマックス関数にしたので、ある意味Policyに対する依存性が弱まり、ディリクレノイズを抜いても良いのではないかと思っ…

DeepMDP: Learning Continuous Latent Space Models for Representation Learningを読んだ際のメモ

本当にただのメモだし意味もわからないままに式を写しているだけなので注意。特に数学の専門用語など誤訳も多そう。力のある人は自分で読んで。 出典 ICML2019に採択 概要 状態表現空間の中でのMDPとしてDeepMDPを定式化 報酬予測と次状態表現予測について適…

AtCoder Beginner Contest 140

結果 順位 196th / 5446 パフォーマンス 2058 レーティング 1855 → 1877(+22) E問題まで素早く解けたのに結局F問題を解けなくてそこまで伸びきらなかった。残念。 A - Password A問題のページを開いておくのを忘れていてやや時間がかかってしまった。 提出 B…

AtCoder Beginner Contest 139

結果 順位 653rd / 5899 パフォーマンス 1568 レーティング 1883 → 1855(-28) 5完遅解きではこんなもん。もうmerom氏に抜かれそう。 A - Tenki for使っちゃった。 提出 B - Power Socket A問題じゃん。 提出 C - Lower えー、やるだけと思ったらforを抜ける…