駒落ちハンデ 第3回調査
(7月29日 2枚落ちのデータを追記)
最近の野良評価関数の出現でソフトのレーティングも急速に向上しています。あまりに進歩が速いので色々な面からチェックを入れてみようと思うようになりました。まずは駒落ちでどの程度のソフトと釣り合うかについて調べてみました。前回の調査ではWCSC27で登場したelmoと技巧2について調査を行い、角落ちについてはelmoが大樹の枝とほぼ互角(R3270程度)、飛車落ちについてはGPSFishよりやや上(R2912)あたりまで到達していました。今回はYaneuraou4.73とyaselmo (野生の読み太1.1とelmoを50:50で配合した評価関数)で同じような調査を行いました。この組み合わせのレーティングはこれまでの調査ではR4100前後でelmoよりもR130ほど強いと思われます。対局の結果は以下のようになりました。
yaselmo (YaneuraOu 4.73) R4098 yaselmo (角落ち) vs 技巧20160606 (R3520) 41-1-57 R差-57 R3463 yaselmo(飛車落ち) vs Apery_WCSC25 (R3157) 59-0-41 R差63 R3220
yaselmo(二枚落ち) vs Nanoha Nano (R2359) 56-0-44 R差41 R2400
前回のelmoを用いた調査と比べると
角落ちについては R3270 → R3463 (約200増)
飛車落ちについては R2902 → R3220 (約300増)
二枚落ちについては前々回の調査の技巧が最後で2枚落ちレートR2163→R2400 (約230増)
% 追記(10/24 技巧2についてもやってみました。
技巧2(2枚落ち) vs Nanoha Nano (R2359) 87-3-110 R差40 R2320
今回注目に値するのは飛車落ちのレートが顕著に伸びたことがわかります。前回の調査では飛車落ちの伸びが特に少なかったことから飛車落ちについてはある程度のレートの壁(R3000程度)よりも上には行かないのではないかという観測をしていましたが、今回の調査ではそれが間違いであり、飛車落ちについても順調に強くなっていることがわかりました。
2枚落ちについても上限がありそうだったのですが少しずつまだ伸びている感じがします。2枚落ちの場合銀多伝にするとソフトは勝手にコケてくれるイメージ(千田さんツィート)らしいのですが、ソフトの指手を見ると初手から外しているような気がするのですが、真正面から対抗すると棋譜を見る限りアマチュアだと勝ち切るのは大変そうなイメージがあります。これがR2600くらいになるとアマチュアでは勝てない領域に到達するのかもしれません。
最近の記事でやね(磯崎)氏は「飛車落ちの手合が妥当なのかどうかはこの後の検証が待たれる。」と書いておられましたが、今回の結果をやね氏の図で表現すると
平均的なプロ棋士 << (R138差) << 斎藤慎太郎六段(2015年当時) << 家庭用PC(4コア)Apery(2014) << (R200差) << 家庭用PC(4コア)大樹の枝 = 飛車落ち → 家庭用PC(4コア) yaseelmo << << (R200〜400ぐらいの差) << 最新のPC(48コア) yaselmo
データが少ないのであまりはっきりとはいえませんが、人類が到達できる限界はR3100あたりかなと推定しています。(100m走の限界が9秒くらいにあるというのと近い意味で)今回の測定は定跡無しでの対局ですので、研究で定跡を開発すればR100~200程度のレートは逆転できると考えると、家庭用PCでの飛車落ちyaselmoは研究してぎりぎり勝てるかどうかのように見受けられるのですが実際のところはどうなっているのでしょう。
今回の対局の棋譜は駒落ちの棋譜の中にあります。日時が最新のものを選んでください。ソフトの駒落ち戦は人間のそれとは全く違いますので大変興味深いと思われます(なんせ下手がAperyや技巧ですので!)