読みの深さを制限した技巧のレーティング
追記:(7月15日)この記事のデータですが技巧の設定が少しおかしかったようで正しいレートが取れておらず、データを取り直しました。この記事で指摘しているレート差の凹凸の問題は新しいデータでは解決されています。詳しいことは7月14日の記事を参照ください。
技巧というというまでもなく現在手に入れられる最強のソフトで、通常は棋譜検討や研究に用いる、技巧をほかのソフトと対局させて鑑賞したりなど、ある意味で将棋の先生として使うことが多いと思います。一方で、有料ソフトの激指などに見られるように技巧を適当に弱くして日常的な対局相手にできないかという欲も出てきます。私もたまたまですが技巧を1スレ思考時間0.1秒に落としてみたところ、そのハンディにもかかわらずR2400前後のソフトより結構強かった(今のレーティングは2600近い)のは驚きでした。ただこれでもかなり強いので、さらに落として、様々なソフトのレートを測るものさしのような役割を果たせないかと思っていました。一つのソフトを基準にしてレートを測れば、私を悩ませる三すくみ現象からも解放され、ある程度頑張りさえすれば統計精度も上がっていくのではという希望も出てきます。ただ、思考時間をこれ以上削るとインターフェースがどれほど設定をちゃんと守るのかということがよくわからないので、さらに先に進むのは無理かと思っていました。
その後、ツィッターでDepthを制限する機能を教えてもらったのですがその後、mizarさんが技巧を修正して、設定した深さまで手を読む設定ができる技巧というものを発表されました。このソフトすごいと思って早速Depth1(一手しか読まない設定)で技巧にチャレンジすることができました。このDepthを調整すれば素人からアマトップクラスまで楽しめるような技巧になるのではないのか、調べることにしました。私のブログはデータばかりで申し訳ないのですが以下のような対局成績が得られました。Depthを制限すると一局あたりの時間が驚くほど短くなり、数時間の作業で数千局単位の結果が得られます。
ご覧のように各組み合わせに500または1000局対局しており、私が何か月もかけてやってきた自己対戦の数とほぼ変わらない対局数を得ることができました。このなかで私のレーティング表でレートを得ているものは1スレ0.1秒設定の技巧で上に書いたように約2600のレートを保持しています。これに合わせてそれぞれのバージョンのレートを計算すると以下のようになりました。
この表はあちこちに変な所があります。例えば、1コア0.2秒の技巧がR2800とか0.4秒でR3000突破とかありえないと思いますが、とりあえずは自己対局だけからくる一面的な結果だと思ってください。また、depth 1のレートが772というのは信じられないほど高いのですが、これは、基準点の問題とともに自己対戦の特別性とdepth制限からくる特殊性から来ていると思っています。あと明らかなのは、私の今までの漠然としたイメージでは読みの深さを言って増やすとともに一定の幅でレートが上がっていくというものでしたが、上の表を見る限り、かなり凸凹しているのが分かります。(1-2-3, 5-6が大きく3-5, 7-8がなぜか小さい) その後、Bonanzaにも同じようにDepthの制限付きで対局する機能があるのを思いつき、ちょっと比べてみると
このような感じで意外と近いのが分かります。最後の3行を見ていただけるとほぼGikou depth n=Bonanza depth n+1のように見えます。このような浅い探索で効いてくるのは評価関数だと思いますが、技巧の評価関数を用いるとBonanzaの一手余計に読むのと同じくらい強いということがわかります。Bonanzaの深さを固定した時の強さについては人間との対局もあるようなので後で情報を増やしていくつもりです。あと、Gikou depth 2, 3 Bonanza4の対局結果を見ると明らかなとおり三すくみ的なレーティングの矛盾が既に現れています。この対局結果は統計精度も高いので、レーティングの矛盾の明らかな証明になっていますね。
最後にGikou depth1に対する今手に入れられるソフトの実力ですが、対局できたのは
Gikou depth 1 vs Lesserkai (1秒) 43-0
ssp (1秒) vs Gikou depth 1 51-46
というでした。さすがにLesserkaiは相手にならず、sspの持ち時間1秒(深さ9位まで読んでいる)とはほぼ同程度の棋力ということになりました。その意味で上の表の772というのは明らかに高すぎです。この辺りは人間のプレーヤーが大勢いらっしゃる領域ですので24などで深さ1-9くらいまでのレートが測れる面白いなと思います。
最近スマホで技巧が使えるようになったようです。ただ、目いっぱいの力量を発揮させるのはスマホの電源(電池)にはちょっと酷なのではないでしょうか。一方これらの力を弱めたバージョンはは普段ちょっと対戦したり、少し上級者の立場でアドバイスをくれるよいお相手だと思います。depth7くらいまではほとんど電気も使わないと思いますのでアマチュア高段者くらいまで十分お相手できるのではないでしょうか。
個人的に今この話題にはまっていますので、今後同じような機能があるソフトについて調査したりBonanzaの各depthにおける棋力なども含めて原稿を膨らませていけたらよいなと思っています。何かご存知の方がおられるようでしたら情報をいただけると大変助かります。
追記(7/11): 有限深さの探索結果で評価関数の優劣が分かるように書いてしまいましたが、その結果がどうかまだはっきりしていません。ちなみにdepth9のBonanza6はアマチュアレート2500程度だとまふさんと言おうメールで教えていただき、depth 9のBonanza6が技巧のdepthいくつに対応するか調べていたのですが、
となり、Bonanza depth9がGikou depth 9より強いという、数字になってしまいました。ただし、この結果は観戦している限り両ソフトが同じ条件で対局しておらず、Bonanza 6 (Bonadapterを使用)が時折かなり深いところまで10秒以上読んでいることがあるのに対してGikouは常に即指で、おそらくソフト設定がうまくいっていないということだと考えざるを得ませんでした。(Bonanzaは状況に応じて「可変」depthのように見える)。その意味で、この記事でコメントされていた池氏のUsapyon2の有限depth版というのはもし可能であれば作っていただければ大変参考になります。
また、自己対局によるレーティング変化は限られた視点のものであり、ほかのソフトと対局するときのレーティングとは相応の差があります。上では1スレ持ち時間0.1秒のレーティングから計算すると1スレ持ち時間0.4秒でR3000を見かけ上越えてしまうと書きましたが実際にそのレンジのソフトと対局させると4スレ0.2秒(思考node数1.5倍くらい)でR2900程度です(400局程度の評価)。様々なソフトと対局することによるレート圧縮効果がはっきり見えているように思います。