2019-07-01から1ヶ月間の記事一覧

AtCoder Beginner Contest 135

結果 ユーザ名 tokumini コンテスト名 AtCoder Beginner Contest 135 順位 327th / 4583 パフォーマンス 1795 レーティング 1925 → 1913 (-12) 難しかった。 A問題 見た目が難しくてびびった。 提出 B問題 脳みそを使わない力のこもった三重ループを投げつけ…

価値のソフトマックス分布を教師としたAlphaZero学習

要約 価値のソフトマックス分布を行動選択および教師分布として利用することで学習が2倍から3倍程度速くなった。 背景 前回、生成している棋譜を分析したところ、評価値を大きく損ねる悪い手が多く選ばれすぎていると感じられた。この原因として探索回数をも…

AtCoder Grand Contest 036

結果 tokuminiさんのAtCoder Grand Contest 036での成績:254位 パフォーマンス:2080相当 レーティング:1906→1925 (+19) :) Highestを更新しました! B問題を自分としては素早く解けたがC問題に歯が立たなくて座っているだけの時間が長かった。 A問題 一つ…

AtCoder Beginner Contest 134

結果 tokuminiさんのAtCoder Beginner Contest 134での成績:320位 パフォーマンス:1845相当 レーティング:1913→1906 (-7) :( D問題で4WA出したのが痛かった。 提出 A問題 半径の円に内接する正十二角形の面積はであることが知られています。 知らなかった…

AtCoder Grand Contest 035

結果 A,Bの2完。順位は悪くなかったしレートも上がったけど嘘解法もありC問題を解けず、反省点は多かった。 A問題 300点という見た目に惑わされて「簡単に解けるはずなのに全然わからない」と焦るのもいい加減やめよう。確かAGCの300点はABCの300点とは違う…

学習中に生成した棋譜の分析

要約 生成している学習データの質が悪い可能性がある。質を高めていくために(1)価値を考慮した行動選択 (2)の調整 (3)リプレイバッファサイズの調整 などを考えていきたい。 実験 前回1Mステップの学習を行ったが、まだ収束していないようにも思えたので2Mス…

ELF OpenGo: An Analysis and Open Reimplementation of AlphaZeroを読んだ際のメモ

出典 International Conference on Machine Learning 2019に採択。arXivには2月ごろに投稿されていたので以前もちらっと読んだことはあったが、一応再確認。 概要 AlphaZeroのオープンソースによる再実験を行い、学習や推論における挙動について分析 詳細 実…

AtCoder Beginner Contest 133

結果 E問題までの5完で157位。パフォーマンス2118でレーティングは1854 → 1883 (+29)。F問題が難しい(というか重実装だった)影響でEまで早く解けていればそこそこな順位になった。始まる前から疲れていて不安だったがなんとかなってくれて良かった。 A問題 …

思考時間とレートの関係

要約 Miacisではおおむね思考時間を2倍でレート+100となる。MCTSのスケール性もαβ探索と比べてあまり変わらないのではないか。 背景 AlphaZeroの論文(arXiv版)には1手の思考時間とレートの関係が図で表されている(Figure 2)。以下に将棋の方だけを切り抜いた…