2021-11-01から1ヶ月間の記事一覧

画像to画像のネットワークに二桁の足し算を学習させる

手頃な大きさのニューラルネットワークが、画像を入力とし画像を出力する形で二桁の足し算を解くことができるのかどうかを検証した。 実験方法 データ形式 入力画像に「A+B=」という式を画像化したもの、教師画像として「A+B=C」の正しい式を画像化したもの…

『Which are you?』 その2 Transformerの採用

前回 前回は『Which are you?』というトイタスクを考え、LSTMを使って方策勾配法を用いることで10回中7回でそれなりな正答率になった。 今回は時系列モデルをLSTMからTransformerへと変更した。 実装 Transformerで時系列を扱う場合、過去の入力情報が必要に…

Not All Memories are Created Equal: Learning to Forget by Expiringを読んだメモ

概要 Transformerに与える系列に対して、記憶が有効である期限を事前に計算し、不要な記憶は捨てていくような機構を導入する。 提案手法 前提として、毎回のタイムステップで、表現ベクトルがやってくる。これをTransformerで処理して、過去の情報を考慮しつ…

ICML2021のPoster採択論文一覧を眺める

なんかoralは上手く反応しないのでPosterだけ。AbstだけGoogle翻訳にかけて、明らかに誤訳そうなところだけは少し手直しして貼り付けておく。結局これが手間と後で見返したとき便利さのバランスとして適当そう。 MuZero系 多くの重要な現実世界の問題には、…

深層強化学習の実装練習

深層強化学習プログラムの実装練習として『Which are you?』というトイタスクを考えて、エージェントを実装した。 1.『Which are you?』の説明 概要 以下のような5×5マスの2次元グリッドの世界を考える。 ##### #...# #A.B# #...# ##### A, Bはこの2次元グリ…