JKishi18gouのレート推定
- uuunuuun
- 2018年3月24日
- 読了時間: 2分
現在、将棋倶楽部24に人造棋士18号(JKishi18gou)が常駐しています。このソフト、とても強くて、対局相手とのレートが離れており、いくら勝ってもほとんどレートが変化しない状態になっています。現在のレートはR3209ですが、もっと強いのではないかと想像されます。
このような飛び抜けて強い存在がいた場合、レートのやり取りによる計算は無理があるので、ちょっと違う方法はないかなと考えてみました。イロレーティングではレートRのプレーヤとレートSのプレーヤが戦ったときレートRのプレーヤの勝率PがP=(1+10^(-(R-S)/400))^(-1)のように与えると定義されています。将棋倶楽部24の棋譜検索を使うと人造棋士が勝ったプレーヤのレートと負けたプレーヤのレートがわかるのでそれを用いて
F(R)=Product[p_i(R),i=1,..,W]Product[(1-p_i(R)),i=1,..,L]
という関数を定義します。ここでp_i=(1+10^(-(R-R_i)/400))^(-1) (R_iはプレーヤのレート)で最初のファクターが勝ったプレーヤに対する勝率、二番目のファクターは負けたプレーヤに対する負ける率をかけたものです。人造棋士のレートはこの関数F(R)が最大になる値として定義されると考えました。つまりF(R)の導関数F'(R)=0の解がJKishi18gouのレートとなります。この方法だとレートが離れたプレーヤとの勝敗の寄与も取り入れられるので18号のレートの定義としてはもっともらしいと思われます。(専門でないので間違えていたらコメントいただけると助かります。)
計算してみた結果ですが、24から勝敗がダウンロードできる直近3600局のうち、(1) 相手がR2000以上、(2) 40手以上の対局、(3) 自動対局プログラム(カツ丼坊)の問題と思われる時間切れ負けを外すと残るのは890局。対局結果は883勝7敗。上記の考え方でELOレーティングを評価するとR3370。現在の24レートよりは高いですが、思ったよりは低めの値となりました。R2600台のプレーヤに取りこぼしているのが効いていると思われます。
一方、3月になってソフトを動かすPCが変更になってより強くなったらしいので、3月の対局のみ考えると372勝1敗。レートを計算するとR3600となりました。一度しか負けてないので誤差を真面目に計算し始めると大変なことになりそうですが、個人的にはソフトレートからしてこれくらいあってしかるべき値だと思っています。
#加筆訂正
その後、18号が負けた7局のうち4局の対局相手はソフト指しとして将棋倶楽部24から登録抹消されていることがわかりました。その分を差し引くと18号のレートはR3370からR3530に上昇します。なお、残る3敗のうち1局は対ソフトです。
最新記事
すべて表示2018年の9月に将棋ソフトのレート計測を中断してから3年が経ちました。長期間計測の現場から外れたため将棋ソフトの発展がよくわからなくなってきたということもあり、ここ数ヶ月久しぶりに計測を再開してみました。やめた当時最強だったdolphin1/illqha1.1のレーティン...
# 追記(2021/8/18) 新しいバージョンDL2_exhが発表されております。かなり強くなっておりますが、インストールの方法はこの記事と同じです。 昨年行われた第一回電竜戦でdlshogiのグループであるGCT将棋が優勝。チェスと同じく将棋ソフトも深層学習系(Deep...