二枚落ちの限界レーティング
これまで4回ほど駒落ちのレーティング、すなわち測定時トップRの評価関数が駒落ちしたときにどの程度のレートのソフトと互角になるか調べてきました。第4回までの調査で飛車落ちのレーティングがR3400となり、人類の限界を超えてしまいました。かつて羽生永世七冠が神様と人類トップとの手合は角落程度なのではとコメントされましたが、現在の将棋ソフトと人類との手合はすでに飛車落よりも大きいと考えたほうが良さそうです。
最近のソフトは非常に精度の高い手を選びますので、駒落ちで勝てるかどうかは最初に与えられた得点差(角落ちで600点、飛車落ちで900点、二枚落ちだと1600点程度)の範囲で下手がミスを最小限にとどめて逃げ切れるかどうかという問題になります。その意味では下手の指し手の精度がある程度高ければ、上手がいくら強くなっても勝ち越せるのではないかと想像できます。例えば100手辺りまで差をキープできれば勝ちなのであれば、50手精度がある程度高い手を指し続けていれば勝てるはずです。上手をどれだけ強くしても勝ち越せるようなレベルを限界レーティングと呼ぶことにしましょう
以前は飛車落ちでこのような限界レーティングが現れて、人類の限界(R3200位?)は超えないのではと思っておりましたが、想定以上に伸びていき、あっさり超えてしまいました。二枚落ちについてはハンデが大きいためかなり低いところに限界があると思われます。この意味で今回の調査では二枚落ちに集中して調べることにしました。まずこれまでの調査の結果をまとめると、
第1回調査:上手 浮かむ瀬(R3654)・技巧 (R3513)上手(浮かむ瀬) 33-67 下手Bonanza 1.2 (R2122) (レート差-123)2枚落ち浮かむ瀬のレーティングはR2000
二枚落ちのハンデは
上手(技巧) 56-44 下手Bonanza 1.2 (R2122) (レート差41)2枚落ち技巧のレーティングはR2163
第3回調査:Yaneuraou4.73/yaselmo (R4047)
上手(YO/yaselmo) 56-0-44 Nanoha Nano (R2359) R差41
概算レート R2400
第4回調査:上手Yaneuraou/QQR (R4232)
上手(YO/QQR) 51-49 Nanoha mini (R2641)
上手(YO/QQR) 44-56 Bonanza 6 (R2755, レート差40程度)
概算レート R2660
今回の調査では上手としてYO/水匠改(R4400)を用いてまず調査を行いました。結果は
上手(YO/水匠改) 59-60 Nanoha mini (R2608)
上手(YO/水匠改) 51-51 技巧2D9 (R2663)
概算レート R2630
つまり、今回の調査では上手の平手レートが170程度伸びたのにもかかわらず二枚落ちレートはほとんど伸びていません。もしかすると上で述べたような限界レートが見えてきたのかもしれません。
最近、ソフトのレーティングの伸びは以前と比べて鈍化傾向にあり、大きな変化は当面は望めない状況だと考えています。その意味で限界レートがあったとしても今の対局条件のままであれば見えてこないと思われます。このため、上手を極限まで強くさせるため、測定できる限界(上手を下手の10倍、Ryzen1800Xの8スレッドで一手30秒)に設定し、対局させることにしました。上手ソフトとしては二枚落ちに特化した評価関数NNUEkaiUを用いて再計測をかなり大規模に行いました。NNUEkaiUの平手レーティングは明らかではないですが、かりに平手用の水匠改より、R100低いとしてR4300。持ち時間を10倍するとレーティング的には600程度伸びるので上手のレーティングはR4900と概算できます。対局結果は以下のようになりました。
上手(YO/NNUEkaiU) 67-33 Bonanza6 (R2763) 上手推定R 2886 棋譜
上手(YO/NNUEkaiU) 33-10 GPSFish (R2911) 上手推定R 3118 棋譜
上手(YO/NNUEkaiU) 4-41 Apery_twig (R3250) 上手推定R 2846 棋譜
上手(YO/NNUEkaiU) 33-1-66 技巧2D12 (R3031) 上手推定R 2911 棋譜
下手により推定レートは大きな変動がありますが、この中でGPSFishは指手が特におかしく、うまく指してないように見えました。GPSFishを除くと残りのソフトが示している二枚落ちレーティングはR2900弱となりました。ちなみに、棋譜へのリンクを貼っておりますが、これらは二枚落ちの対局としては最も精度が高い対局だと思いますので興味があればぜひご覧ください。
これまでの調査と今回の調査で上手平手レート、駒落ちレート、レートの差を表にすると以下のようになります。
いろいろ見て取れますが、2つだけあげると
上手の平手レートが上がるほど駒落ちレートは上がり続けていている。
上手の平手レートと駒落ちレートの差は大きくなり続けていて駒落ちレートの伸びが落ちているのがわかる。
グラフにするとこのような感じです。
個人的にはR3000くらいに限界レートがあるのではと考えていましたが、上手のレートを上げ続けるとそれ以上に伸びていくように見えます。ちなみにフィッティングは二次関数で行っています。二次関数の勾配がゼロになる(すなわち駒落ちレートが最大化する)のはこのフィッテイングが意味を成すという仮定のもとでR6400, その時の下手レートはR3220となります。現在のソフトでR6400を出そうとすると一手1300億ノード、私のパソコンだと一手8時間、私が掲載しているベンチマークで一番良い値を出している160スレッドのものでも一手1時間はかかると思います。そのあたりまで行っても下手のレートはR3220, 下に述べているように定跡を工夫すればR3000以下になると思います。というわけで、2枚落ちではソフトがいくら強くなっても人類最高レベルの指し手には勝てないということになります。
%注意:この原稿最初のバージョンでは二枚落ちのレートの最高値がR4400と書いていましたが、これはエクセルが出しているフィット関数が正確でなかったため起きたミスでした。正確にはフィッティング関数の2次の係数は0.0001ではなく0.000137です。
しかし、それにしても限界レートがR3220というのは際どい所。評価関数の二枚落ちへの最適化、定跡の整備などが進めばよくわからなくなる可能性もあります。羽生永世七冠がおっしゃられていた「神様との手合は角落ち」というのはソフトの発展からみる限り、二枚落ちといいかえたほうがより正確なのかもしれません。
なお、これまで私の駒落ちレーティングの調査は定跡なしでの対局で行っていましたが二枚落ちの場合は二歩突切りなど有力な定跡があって、定跡無しでのレート測定に意味があるのかという疑問をずっと持っていたので、今回は定跡を自作して測定ということにも挑戦してみました。二歩突切りの場合の初期盤面として
この局面から上位のソフトに一手10秒で20手程度対局させたもの100局、上位ソフト同士で24手定跡無しで指させたもの100局を定跡として使用し25手目から対局させてみました。下手がNanohaMiniの場合は
上手(水匠改)59-60 NanohaMini (定跡off)
上手(水匠改)23-77 NanohaMini (定跡on)
定跡on/offの差は約200となりました。R200程度の余分なハンデがあるというのはそれなりに意味がありそうな結果ではないかと思いますがいかがでしょうか。