思考時間とレートの関係(2)

 上の調査に便乗してMiacisでも調べ直した。以前(8ヶ月前)の調査は

 結論としては今回も変わらず、「思考時間2倍でレート+100ちょい」という感じ。

 以下対戦相手はYO/Kristallweizen(Thread4・0.2秒)。

Miacis 1手1秒

対局数 勝数 引き分け数 敗数 勝率 相対Eloレート
1000 461 0 539 46.1% -27.2

 (本筋とは関係ないが前回に比べて、探索中のバッチサイズを32から64にすることで持ち時間1秒でもレート低下が抑えられた。)

Miacis 1手2秒

対局数 勝数 引き分け数 敗数 勝率 相対Eloレート
500 315 0 185 63.0% 92.5

 レート上昇分は119.7

MuZero

 以前もちらっと触れたが、MuZeroの論文中で学習したシミュレータと真のシミュレータでの比較グラフが掲載されている。(囲碁についての結果なので将棋でも単純比較はできないかもしれないが)

f:id:tokumini:20200322134440p:plain
Figure 3 A 囲碁に関してのグラフ

 オレンジ線の方が真のシミュレータでの結果なのでそっちを見ることとして、これの1秒〜2秒の変化ではR+100くらいだろうか。大雑把に1秒でR:4800、50秒でR:5400と読み取れば持ち時間50倍でレート+600なので、2倍分で考えると \frac{600}{\log_2 50} = 106.3。まぁこれくらいしか上がらないものなのかなという印象。