将棋倶楽部24レーティングとの比較
前回のブログ記事でアナウンスしたとおり、将棋倶楽部24にソフトレートがわかっている3種類のソフトを参加させて、24レートを計測し2つのレーティングの対応関係を調査しております。今のところ各ソフトのレーティングは次のようになりました。レートを測るときの対局条件は将棋倶楽部24での早指し(30秒将棋)です。設定が徹底してなかったため幾つかの対局は早指し2(30秒+α)で指されていましたがほとんど影響無かったと判断します。ソフト側はほぼ即指しでしたので通常の早指しより人間側にきつい設定だったと想像します。
各レベルともある程度の対局数を経てレートも安定してきましたので判定が可能になった考えます。将棋倶楽部24におけるレートはソフトレートとは違い対局数を増やしたからといってより正確になるものではなく、ある程度の幅で上下する性質のものです。このため、今のレートよりは直近40局のレートの平均値を採用することにしました。これにカツ丼将棋作者松本浩志氏が測定された「海底(wcsc27版) -- 迫田 真太郎氏作」のレートも含め(そちらも平均を取りました)ソフトレートとの比較を行うと次のようになります。
これをグラフに致しますと、次のようになります。
このグラフ、いくつか注目すべき点があります。
まず、24レートとソフトレートの対応はほぼ直線グラフに乗っているが、比例係数は1からかなりずれている。両方共、イロレーティングに基いて計算されていますので理想的には比例係数は1であるべきなのですが、実際には
(24レート)=1.47(ソフトレート)-760
という近似式になります。つまりソフトレートよりも24レートの値の幅のほうが大きくなっています。
また、より細かく見ると計測された4点は実はそれほど正確に直線グラフになっておらず、最初の3点は一つの直線 (24R)=1.64(SoftR)-959 にのっていますが、一番右の点(Lv3に対応)はずれています。最初の三点の勾配は1.64に対して最後の2点の勾配は1.1しかない。あるレートより先は比例係数が1に近づいていくように見えます。
この現象、原因は将棋倶楽部24の場合は多くのプレーヤーが居るため近いレートのプレーヤーとの対局が多数行われレートが大きめに出ているのではないかと考えます。上の方で勾配がゆるくなる理由は、上位陣は人口が減るため、通常のイロレートに近づき、ソフトレートと勾配が変わらなくなるのではないかというものです。あくまでも仮説ですので何らかの方法で検証できないものか考えています。
過去に24に参戦したソフトのレートとどんな対応になっているのか、一応検証します。
Bonanza1 (2005年) は当時の24レートでR2400だったそうです。Bonanza1.2のソフトレートはR2151で上記の式に代入するとR2417。偶然かもしれませんが大体あっていますね!
Bonanza3 (2007年) 、当時の24レートはR2600。一方Bonanza3のソフトレートはR2286。上記の式に代入するとR2616。これもあっています。
Ponanzaは何度か24に参戦していますが、ある程度正確なレートが出たと思われるのは2011年の参戦(その当時のレートでR3138)です。このレベルだとレートが高いので勾配がおち、Lv2, Lv3からの類推を行うとソフトレートで約R2800。これが正しいか判断するのは難しいですが、このPonanzaはWCSC21に参戦していて5位。決勝に残っていたソフトでレートが読めそうなのは2位のBonanza が単体でR2751、クラスターでしたのでR3000位あったのでしょうか。4位は激指。12コアのマシンで参戦。激指12に相当するとして激指14のレートがR3015からレート200程度落ちるとするとR2850? Ponanza WCSC21のソフトレートがR2800という推定はそれほど外れてはいないかもしれません。
Lv2, L3からの類推(外挿の是非は明らかではないですが)では24のR3500はソフトレートではR3120になります。Ponanzaの2013年参戦では24R3440, 2015年は24R3455でした。その頃はとっくにソフトレートR3100を超えていたと思うので2013年の段階で既に24の上限を打っていたのではないかと思われます。
調査を始めてから10日あまり、短い時間に多数の対局を安定して行えたのはカツ丼将棋松本氏の技術協力のおかげです。また、ソフトと対局していただいた多数の将棋倶楽部24会員の皆様、ソフトを使わせていただいたやねうら王作者磯崎氏、調査のためのソフト参戦を快諾していただいた将棋倶楽部24席主に感謝いたします。皆様のご協力なしには今回の調査は不可能でした。
まだ、調査が終了したわけではなく、より詳しいデータの解析を今後も行っていきたいと考えております。なにか、ご意見、ご要望などがお有りであれば折角の機会ですのでお聞かせください。
#1/26 Lv1, Lv2, Lv3ともノード数を半分にして再投入。ソフトレート的には200程度下がりますがそれぞれどの程度レートが落ちるのか観察します。