置換表に保持する指し手の削減

コンピュータ将棋

Miacisでは一つの局面に対応する置換表エントリが持つ変数として、以下のようなものを保持している。(hash_table.hppから一部抜粋し見やすく改変) struct HashEntry { int32_t sum_N; //探索回数の合計 int32_t virtual_sum_N; //バーチャルロスの合計 //以…

2020-05-01

【コンピュータオセロ2】カテゴリカル分布の有効性

コンピュータオセロ

Miacisで用いている手法の主張点は「評価値出力をスカラーではなく、各値になる確率を示すカテゴリカル分布にすることで性能が上がり、探索にも有効活用できる」というところにある。簡単な説明はWCSC30アピール文書を参照。そもそも着想の元ネタの一つであ…

2020-04-30

【コンピュータオセロ1】指し手選択の温度について

コンピュータオセロ

背景1 手法の有効性がゲーム依存ではないことを主張するため、そして実験サイクルを高速に回せるという利点があるため、オセロでも実験をしていく。オセロは将棋より簡単だろうと勝手に判断してやや小さめのネットワークで学習をさせている。具体的にはチャ…

2020-04-29

Miacis WCSOC2020版

コンピュータ将棋

世界コンピュータ将棋選手権のオンライン大会（WCSOC）に向けて、これ以上レートが伸びそうにないのでここで結果をまとめておきます。実行ファイル Windows向け実行ファイルをGitHubで公開しています。 CPU版 GPU版 CPU版はNPS50くらいしか出ないのでほぼお…

2020-04-11

教師データ生成時(800探索)の性能

コンピュータ将棋

要約教師データ生成時のレートはfloodgate換算で Miacis:2700程度やねうら王:2800〜2900程度？ AobaZero:3000程度また探索バッチサイズはできれば1で生成するべきだとわかった。背景 AobaZeroが800回の探索でKrist_483_473stb_16t_100mに勝ったという話…

2020-04-03

損失と棋力の関係

コンピュータ将棋

動機 Miacisでは強化学習の最中にも定期的にfloodgateの棋譜を用いて検証損失の計測をしている。対局には計算コストがかかるため、検証損失の値から大雑把にでも性能が把握できると嬉しい。よって今回はこれらの関係を調査した。使用した結果基本的にはこ…

2020-03-30

Google Compute Cloudでの探索実験

コンピュータ将棋

8GPUインスタンスを使って探索速度を検証した。まず20CPU、8GPU(Tesla V100)のインスタンスを使って探索速度を検証した。早い段階で頭打ちになっている。8GPU使うときのGPU利用率を見てもあまり高くなっていない（1GPUなら50%くらいは行く）。 1GPUでも探…

2020-03-22

思考時間とレートの関係(2)

コンピュータ将棋

上の調査に便乗してMiacisでも調べ直した。以前（8ヶ月前）の調査は結論としては今回も変わらず、「思考時間2倍でレート+100ちょい」という感じ。以下対戦相手はYO/Kristallweizen（Thread4・0.2秒）。 Miacis 1手1秒対局数勝数引き分け数敗数勝率相…

2020-03-15

対局結果メモ

コンピュータ将棋

ここ数日で回していた対局結果をメモしておく。対局結果は全てMiacis側から見たもの。マシンはCPUの周波数約3.6GHz、GPUは2080ti。YO/Kristallweizenは4スレッド、定跡オフ。ベースライン Miacis側 0.5秒、YO/Kristallweizen側 0.1秒。対局数勝数引き分…