2025-04-01から1ヶ月間の記事一覧

拡散モデル数式メモ

(正直難しくて理解はかなり怪しいです) SDEから始めて周辺確率とODEに帰着して考えるのが比較的整理されていそうに感じたのでその視点で 厳密な証明には立ち入らない 分散保存型ノイズスケジュール/データ予測モデル/DPM-Solver++(2M)での計算に絞る とい…

(継続的)強化学習のコンセプト的論文を読む

今週出たPosition Paperのようなものとして Rethinking the Foundations for Continual Reinforcement Learning Welcome to the Era of Experience の2つを読んでいきます。 論文1: Rethinking the Foundations for Continual Reinforcement Learning こちら…

Real-Time Recurrent Learningの実装(その3)

前回は一般的なRNNについて、jax/flaxでRTRLの層を定義しました。今回は一般的なRNNではなく、最近のState Space Modelなどで使われる再帰の定式化を考え、特にRWKV-7でのGeneralized Delta Ruleを実装します。 Generalized Delta RuleでのReal-Time Recurre…

OpenDWMをざっくり読む

で公開されているものについて、前提としている論文の手法をざっくり読んでいきます。 UniMLVG こちらの論文ではStable Diffusionの重みから始めて追加モジュールと特徴量の工夫などにより自動運転ドメインで上手くマルチビュー動画生成をする方法を提案して…