3年ぶりのレート計測
2018年の9月に将棋ソフトのレート計測を中断してから3年が経ちました。長期間計測の現場から外れたため将棋ソフトの発展がよくわからなくなってきたということもあり、ここ数ヶ月久しぶりに計測を再開してみました。やめた当時最強だったdolphin1/illqha1.1のレーティン...
NNUE評価関数総当たり戦
NNUE評価関数が最近どうなっているのか興味があり、調べることにしました。方針としては 評価関数本来の実力を見るため、探索エンジンを固定、評価関数だけを変化させて対局させ、過去の評価関数も現在のものと同じ基準で測る。 相性問題を回避するため、総当たりで同じ回数ずつ対局させる...
dlshogiの実用性とNNUE系と比較した時の持ち時間の影響
# 追記(2021/8/18) 新しいバージョンDL2_exhが発表されております。かなり強くなっておりますが、インストールの方法はこの記事と同じです。 昨年行われた第一回電竜戦でdlshogiのグループであるGCT将棋が優勝。チェスと同じく将棋ソフトも深層学習系(Deep...
M1 Macと将棋ソフト
追記: 2022/04/29 M1 MacでYaneuraouはコンパイル・動作できます。こちらのサイトに詳しく述べられています。 (YO7.1でも同じ方法で行けることが確認済みです。) またYO7.0にKristallweizenの評価関数を組み込んだバイナリーファイル...
ソフト評価値による人間の対局の勝率予想について
将棋ソフトを用いると対局の各局面における優勢/劣勢の度合いを「評価値」という形で定量的に知ることができます。例えば評価値が300点以内であれば「互角」、300点から800点の間であれば「有利」、800点から1500点の間なら「優勢」、1500点を超えると「勝勢」と判断されま...
二枚落ちの限界レーティング
これまで4回ほど駒落ちのレーティング、すなわち測定時トップRの評価関数が駒落ちしたときにどの程度のレートのソフトと互角になるか調べてきました。第4回までの調査で飛車落ちのレーティングがR3400となり、人類の限界を超えてしまいました。かつて羽生永世七冠が神様と人類トップとの...