2022-01-10から1日間の記事一覧

2022-01-10

雑記（ViT実験など）

ViTについての実験をいくつか。 10ブロック、256chを長期学習 Google Colab Pro+を使って7日かけていつもの10倍、1.6Mステップ回した。左: Policy損失右: Value損失 Policy損失はResNet（20ブロック・256ch）より良くなる。Value側がひどい。速度差もある…