水たまり

2019-10-02から1日間の記事一覧

2019-10-02

Why Does Hierarchy (Sometimes) Work So Well in Reinforcement Learning?を読んだ際のメモ

論文

出典 読んだ理由 前回、コンピュータ将棋における現状の強化学習の課題として、特定の戦型に弱く、探索が偏っているのではないかという問題意識を持った。居飛車・振飛車のような方針からして大きく異なる戦法を探索できる必要があり、それは階層的強化学習…

はてなブックマーク - Why Does Hierarchy (Sometimes) Work So Well in Reinforcement Learning?を読んだ際のメモ
Why Does Hierarchy (Sometimes) Work So Well in Reinforcement Learning?を読んだ際のメモ
プロフィール
id:tokumini id:tokumini
読者です 読者をやめる 読者になる 読者になる
検索
リンク
  • Twitter
カテゴリー
  • コンピュータ将棋 (73)
  • 探索系NN (12)
  • 論文 (18)
  • 競技プログラミング (157)
  • コンピュータオセロ (8)
  • プログラミング (5)
  • ゲーム (2)
  • 将棋 (3)
最新記事
  • Transformerを用いた探索的NNの学習(成功?編)
  • 教師あり学習をした後の強化学習
  • Transformerを用いた探索的NNの学習(失敗編)
  • AobaZeroの棋譜を用いた教師あり学習 192ch
  • Miacisを用いた教師あり学習の実行手順
月別アーカイブ
水たまり 水たまり

Powered by Hatena Blog | ブログを報告する

スターをつけました

引用をストックしました

引用するにはまずログインしてください

引用をストックできませんでした。再度お試しください

限定公開記事のため引用できません。

読者です 読者をやめる 読者になる 読者になる