上の調査に便乗してMiacisでも調べ直した。以前(8ヶ月前)の調査は
結論としては今回も変わらず、「思考時間2倍でレート+100ちょい」という感じ。
以下対戦相手はYO/Kristallweizen(Thread4・0.2秒)。
Miacis 1手1秒
対局数 | 勝数 | 引き分け数 | 敗数 | 勝率 | 相対Eloレート |
---|---|---|---|---|---|
1000 | 461 | 0 | 539 | 46.1% | -27.2 |
(本筋とは関係ないが前回に比べて、探索中のバッチサイズを32から64にすることで持ち時間1秒でもレート低下が抑えられた。)
Miacis 1手2秒
対局数 | 勝数 | 引き分け数 | 敗数 | 勝率 | 相対Eloレート |
---|---|---|---|---|---|
500 | 315 | 0 | 185 | 63.0% | 92.5 |
レート上昇分は119.7
MuZero
以前もちらっと触れたが、MuZeroの論文中で学習したシミュレータと真のシミュレータでの比較グラフが掲載されている。(囲碁についての結果なので将棋でも単純比較はできないかもしれないが)
オレンジ線の方が真のシミュレータでの結果なのでそっちを見ることとして、これの1秒〜2秒の変化ではR+100くらいだろうか。大雑把に1秒でR:4800、50秒でR:5400と読み取れば持ち時間50倍でレート+600なので、2倍分で考えると。まぁこれくらいしか上がらないものなのかなという印象。