3年ぶりのレート計測
2018年の9月に将棋ソフトのレート計測を中断してから3年が経ちました。長期間計測の現場から外れたため将棋ソフトの発展がよくわからなくなってきたということもあり、ここ数ヶ月久しぶりに計測を再開してみました。やめた当時最強だったdolphin1/illqha1.1のレーティン...
NNUE評価関数総当たり戦
NNUE評価関数が最近どうなっているのか興味があり、調べることにしました。方針としては 評価関数本来の実力を見るため、探索エンジンを固定、評価関数だけを変化させて対局させ、過去の評価関数も現在のものと同じ基準で測る。 相性問題を回避するため、総当たりで同じ回数ずつ対局させる...
dlshogiの実用性とNNUE系と比較した時の持ち時間の影響
# 追記(2021/8/18) 新しいバージョンDL2_exhが発表されております。かなり強くなっておりますが、インストールの方法はこの記事と同じです。 昨年行われた第一回電竜戦でdlshogiのグループであるGCT将棋が優勝。チェスと同じく将棋ソフトも深層学習系(Deep...
M1 Macと将棋ソフト
追記: 2022/04/29 M1 MacでYaneuraouはコンパイル・動作できます。こちらのサイトに詳しく述べられています。 (YO7.1でも同じ方法で行けることが確認済みです。) またYO7.0にKristallweizenの評価関数を組み込んだバイナリーファイル...
ソフト評価値による人間の対局の勝率予想について
将棋ソフトを用いると対局の各局面における優勢/劣勢の度合いを「評価値」という形で定量的に知ることができます。例えば評価値が300点以内であれば「互角」、300点から800点の間であれば「有利」、800点から1500点の間なら「優勢」、1500点を超えると「勝勢」と判断されま...
二枚落ちの限界レーティング
これまで4回ほど駒落ちのレーティング、すなわち測定時トップRの評価関数が駒落ちしたときにどの程度のレートのソフトと互角になるか調べてきました。第4回までの調査で飛車落ちのレーティングがR3400となり、人類の限界を超えてしまいました。かつて羽生永世七冠が神様と人類トップとの...
AobaZeroのレーティング測定
しばらく前より、AobaZeroの成長の度合いを定点観測していますので、記事としてまとめていこうと思います。この記事はその性格上定期的に更新する予定です。 AobaZeroはAlphaZeroの追試を目標としているプロジェクトで山下さんのホームページよりソフトをダウンロード...
測定ノード数とレート差(その2)
前回の記事ではDolphin1+水匠改とYO485+Kristallweizenの自己対局を用いてノード数により対局結果(ソフト間のレート差)がどのように変化するのか測定を行い、ノード数によりレート差が思いの外大きく変動することを示しました。今回の記事ではその際課題として上...
測定ノード数とレート差
測定ノード数によりレーティングがどのように変わるのかは以前より多くの議論がなされています。例えば最近の磯崎氏の議論は、こちら(1)(2)を参照してください。 最近、水匠開発者の@tayayan_tsが新しい評価関数水匠改を公表されたのを機に、データを取ってみることにしました...
やねうら王系ソフトリンクとインストール法
やねうら王互換ソフト、ずいぶん増えてきたのでリンク集を作ります。(とりあえず、需要がありそうなものだけ。)個人的にはこれらのソフトはまとめておいてもらった方が助かると思うのですが、リンクが散らばっていてすこぶる使いづらい!最終的にはご本家などによる統合(将棋神やねうら王かな...