2022-01-10から1日間の記事一覧

雑記(ViT実験など)

ViTについての実験をいくつか。 10ブロック、256chを長期学習 Google Colab Pro+を使って7日かけていつもの10倍、1.6Mステップ回した。 左: Policy損失 右: Value損失 Policy損失はResNet(20ブロック・256ch)より良くなる。Value側がひどい。 速度差もある…