tanuki-wcsc35計測 余話
tanuki-wcsc35の測定も6000局を超えて,概ね終了に近づいております。私のサイトでは比較的レーティングが離れたソフトとも対局を行い,レーティング表が大局的に歪んでいないか確認していますが,今回は3つのソフトで検証を行いました。 ...
2025年度の計測
とても久しぶりのブログのアップデートとなりました。誰も見てないかもしれませんが皆様,こんにちは。 WCSC35を観戦後,何かコンピュータ将棋の今年の進歩をみれないかと考えた結果,tanuki-のwcsc35版の計測を始めました。本ソフトは選手権で準優勝。有償とはいえ,公開し...
3年ぶりのレート計測
2018年の9月に将棋ソフトのレート計測を中断してから3年が経ちました。長期間計測の現場から外れたため将棋ソフトの発展がよくわからなくなってきたということもあり、ここ数ヶ月久しぶりに計測を再開してみました。やめた当時最強だったdolphin1/illqha1.1のレーティン...


NNUE評価関数総当たり戦
NNUE評価関数が最近どうなっているのか興味があり、調べることにしました。方針としては 評価関数本来の実力を見るため、探索エンジンを固定、評価関数だけを変化させて対局させ、過去の評価関数も現在のものと同じ基準で測る。 相性問題を回避するため、総当たりで同じ回数ずつ対局させる...
dlshogiの実用性とNNUE系と比較した時の持ち時間の影響
# 追記(2021/8/18) 新しいバージョンDL2_exhが発表されております。かなり強くなっておりますが、インストールの方法はこの記事と同じです。 昨年行われた第一回電竜戦でdlshogiのグループであるGCT将棋が優勝。チェスと同じく将棋ソフトも深層学習系(Deep...
M1 Macと将棋ソフト
追記: 2022/04/29 M1 MacでYaneuraouはコンパイル・動作できます。こちらのサイトに詳しく述べられています。 (YO7.1でも同じ方法で行けることが確認済みです。) またYO7.0にKristallweizenの評価関数を組み込んだバイナリーファイル...


ソフト評価値による人間の対局の勝率予想について
将棋ソフトを用いると対局の各局面における優勢/劣勢の度合いを「評価値」という形で定量的に知ることができます。例えば評価値が300点以内であれば「互角」、300点から800点の間であれば「有利」、800点から1500点の間なら「優勢」、1500点を超えると「勝勢」と判断されま...


二枚落ちの限界レーティング
これまで4回ほど駒落ちのレーティング、すなわち測定時トップRの評価関数が駒落ちしたときにどの程度のレートのソフトと互角になるか調べてきました。第4回までの調査で飛車落ちのレーティングがR3400となり、人類の限界を超えてしまいました。かつて羽生永世七冠が神様と人類トップとの...


AobaZeroのレーティング測定
しばらく前より、AobaZeroの成長の度合いを定点観測していますので、記事としてまとめていこうと思います。この記事はその性格上定期的に更新する予定です。 AobaZeroはAlphaZeroの追試を目標としているプロジェクトで山下さんのホームページよりソフトをダウンロード...


測定ノード数とレート差(その2)
前回の記事ではDolphin1+水匠改とYO485+Kristallweizenの自己対局を用いてノード数により対局結果(ソフト間のレート差)がどのように変化するのか測定を行い、ノード数によりレート差が思いの外大きく変動することを示しました。今回の記事ではその際課題として上...