電王ポナンザ企画で出てきた新ハンデ
3月11日~12日にニコ生で行われていた電王戦プレイベント「人類vs電王ポナンザに勝てたら300万円」企画、今回からハンデ付きのチャレンジが可能になり、大変興味深いイベントとなりました。特に、飛車落ち、角落ちなど昔から行われてきたもの以外に、「両成」「竜王」という選択枝も入り、どんな将棋になるのだろうとわくわく致しました。平手で勝利すると賞金300万円全額もらえるのですが、「飛車落」「両成」で勝つと賞金30万、「角落」「竜王」で勝つと賞金100万円に減額というルールです。
これまで将棋のハンデでどの程度レーティングが落とせるのか調べてきましたので、今回も同様に調べることにいたしました。上手としては浮かむ瀬(R3674) を使います。現在最上位にいるソフトで、ノートパソコンにCPUをダウングレードされたポナンザに近い実力を持つと推察します。
両成
初期画面で下手側の大駒が成り下手から始まるというルールです。浮かむ瀬による初期状態の評価値は1196(約5億ノード)で飛車落ち(評価値1077)よりやや大きいので飛車落程度のレート落ち-R900位-が想定されました。賞金金額も飛車落ちと同じで、運営側もその程度のハンデとして考えていたと思われます。
実際に下位のソフトと対局させると、上手側の大ゴマが残っているためそれらを有効活用されると下手は結構大変だということが分かりました。下手として互角だったのはGPSFish_minimal (R3036)で
浮かむ瀬(上手)55-47 GPSFish_minimal (R差27)
駒落ちした浮かむ瀬のratingはR3063、平手との差は611となりました。これは角落ちによるハンデとほぼ同じ(レート落ち639)ということになりました。駒得ハンデの調査でもそうでしたが、初期状態の評価値と、最終的に勝ちきるまでの力量差は単純な比例関係とは言えないようです。
竜王
初期盤面で下手の飛車先の歩が上手の持ち駒になる設定で下手から始めます。初手2三飛成でいきなり竜が作れます。上手の持ち歩がない場合はさらにハンデが大きく「太閤将棋」と呼ばれています。その意味ではこの形は「変則太閤」と呼ばれています。浮かむ瀬による初期評価値は905で角落ちの評価値811より少し大きい程度で、賞金金額も角落ちと同じに設定されていました。
実際の対局では両成と同じで上手の駒がすべて残っているためこの設定で下手として互角なソフトはもう少し力が上のApery_WCSC25(R3162)となりました。
浮かむ瀬(上手)34-35 Apery_WCSC25 (下手)
レート落ちは角落ち(R639)よりも少ないR512となりました。Apery_WCSC25はプロ棋士でも勝つのは難しい強いソフトだという認識で、短い持ち時間でアマチュアが勝つのは難しい設定だったと思います。
太閤将棋
このハンデの由来はWikipediaを参照のこと。ポナチャレでは出てこなかったのですが、せっかく変則太閤を調べたのでこちらも調べることにしてみました。初期評価値は1946で2枚落ちの評価値(2203)に近く、実際Wikipediaでも2枚落ち並みのハンデであると解説してあります。
しかし、実際に調べてみると上の二つと同じで思ったよりハンデが大きくないことが分かりました。
Nanoha mini(R2594)を下手にして、上手36-14下手
Bonanza 6 (R2742)を下手にすると、上手47-23 下手
GPSFish (R2889)を下手にして、上手1-13 下手
でレート落ちを計算すると881、これは飛車落ちでのレート落ち889とほぼ同じです。レート落ちが1500位ある2枚落ちよりははるかにハンデが小さいということになりました。
以上が、ポナンザチャレンジで現れて話題になった二つのハンデ(両成、竜王)の調査結果です。両者とも評価値レベルでは飛車落ち、角落ちよりもややお得(評価値が大きかった)のにもかかわらず、実際にソフト対局させてみるとハンデがかなり小さくコスパに劣るという結果となりました。初期評価値と実際のハンデが必ずしも単純な比例関係にないというのは、実際に下位のソフトと対局させないとわからなかったことであり(しかも各ソフトのレーティングを知っている必要がある)新たな知見だったと思います。これについてはまた別の記事にまとめるつもりです。
今年のポナンザチャレンジは人間側が全敗という結果になりました。私が行った評価では最も大きなハンデの飛車落ちでもBonanza6よりも強いのではという結果でしたので、慣れない駒落ちで人間側が勝ち切るのはなかなか難しい設定だったのではないかといわざるを得ません。