2019-11-06から1日間の記事一覧

Model-Based Reinforcement Learning for Atariを読んだメモ

論文

出典この文字色の部分は当記事筆者の感想 Introduction モデルフリー強化学習手法は学習に実時間にして数週間ほどのプレイが必要一方人間は数分でAtariゲームを学習可能人間は行動結果の予測ができるからだと推測→モデルベース強化学習 10万タイムステッ…