Apery公表と互換ソフトの発展
現在の将棋ソフトの興隆・強化を導いたものはフリーソフトの相次ぐ公表だったと思います。時代を画したものとしてBonanza, GPS shogi/Fishなどがありましたが2015年電王戦Final後のAperyのソースコード公表・ライブラリ登録のインパクトは将棋ソフトのその後の発展に巨大なインパクトを与え、また、今も続いています。整理しないとわけがわからなくなりそうなので、私の目に入った範囲でまとめておきます。
Aperyは将棋エンジン本体、評価関数、定跡にモジュール化されていました。Apery発表後、様々な開発者たちがそれぞれのモジュールを活用、あるいはモジュール自体を改良させて現在に至っています。始まりになったApery電王戦ファイナルバージョンは私のレーティングではR3000超、GPSfishとトップフリーソフトの位置を争うという位置づけでしたが、現時点では様々な変転を辿った後やねうら王+elmo評価関数でR4000近くまで強化されました。わずか2年少しですがレートにして1000近く上昇、オリジナルのAperyは今のトップの組み合わせと対局させても100局に1局も勝てないほど急速な進歩を遂げています。
個人的な印象として、Aperyは公表されてから1年程度はそれほどインパクトが無かったように思えたのですが、水面下でその影響は計り知れないものがありました。私がレートを調べ始めたのは2016年の3月くらいでしたが、レートを調べるきっかけとなったのはその当時のうさぴょん2とやねうら王の開発競争でした。それまで、Bonanza, Blunder, GPSshogiとAperyくらいしか目立った強豪ソフトは無かったのがうさぴょんとやねうら王が参入してきたのでレート表を調べてもよいかというのが動機づけでした。(数個調べれば良いという楽観的見通しはその後全く外れましたが)その当時(と言っても一年数ヶ月前程度)はAperyの電王トーナメントバージョン「大樹の枝」(Apery_twig)に追いつくのが目標だったと思います。
WCSC26後のフリーソフトの発表で、Aperyは本体がSilent Majority(通称魔女)に追い抜かれ魔女+Apery評価関数最強という時代がしばらく続きました。(2016年5月頃)。一方、魔女発表の数週間後に技巧が発表され技巧と魔女の並走時代が数ヶ月続くことになります。
その当時(といっても一年前ですが)、これらのフリーソフト勢に対して絶対的存在として立ちはだかっていたのがPonanzaで、打倒ポナでフリーソフト勢が一致団結し、集結していったのがApery互換形式への転換だったと思います。インパクトが有ったものとしては(1)やねうら王が評価関数としてAperyのKPPT型評価関数を採用したこと(YaneuraOu 2016mid)が大きな転換点となりました。それまでやねうら王は独自の評価関数を採用していましたが、磯崎氏の方針(わかりやすいソースコードでフリーソフト参入を増やす)とフリーソフト最強だったAperyの組み合わせにより、将棋ソフトに参入しやすい環境が整えられました。やねうら王公開後、Apery形式を採用するソフトは現時点における最大勢力を形成する形になりました。(2)評価関数が平岡さんの主導とコミュニティーの協力の末、大幅に強化されました。私は新しいバージョンが出るたびに技巧と対局させてレートの変動を見守っていました。この進展は個人的にはとてもワクワクさせるものでした。
その後、互換エンジン、評価関数、定跡それぞれに大幅な改良が加えられ、もともとのApery自体が見えない形にまで発展しました。ある意味でApery開発者の平岡氏がソフトをモジュールに分けておいたことが現在の興隆のきっかけだと思います。
この記事の目的はApery互換フォーマットで現在どのようなものが入手可能でどの程度強いかということです。以下、各項目についてどのようなものが発表されたのかまとめます。リンクは時間が取れ次第行っていきます。
互換エンジン:Apery型評価関数(定跡)を用いることのできるソフト(現時点ではやねうら王最新版が最強で魔女がそれに続いているように見える)
Apery(大樹の枝、wcsc26, 浮かむ瀬)
やねうら王(YaneuraOu 2016 mid, 2016 late, 2017 early)
Silent Majority, 通称魔女(1.0, 1.1, 現在は1.25), クジラちゃん用エンジン候補god_whale_sdt4aも
tanuki-(sdt4,wcsc27)
読み太(sdt4, wcsc27)
うさぴょん2、2dash
評価関数:(現時点ではelmo_wcsc27とそれに改良を加えたelmo-Qhapaqが最強)
Apery: 大樹の枝、wcsc26, 浮かむ瀬、wcsc26から浮かむ瀬までにコミュニティーで評価関数を強化していった途上バージョンが10数種類
やねうら王:ほぼ駒得のみの評価関数からApery wcsc26程度のものまで28種類、浮かむ瀬評価関数の追加学習版
elmo: wcsc27版。現時点では最強。
Qhapaq, elmo-Qhapaq 1.0, 1.1: wcsc27版、elmo評価関数を用いて再学習させたバージョン(elmo-Qhapaq)は同じくらい強い
tanuki- (sdt4, wcsc27)
読み太(sdt4, wcsc27)
うさぴょん2dash
定跡:(得手不得手があるのでまふ、やねうら、elmoなど、どれが最強か一概には言えない状況)
Apery定跡(2種類)
まふ定跡
(以下やねうら王系列)
やねうら王定跡(大定跡、真やね定跡)
elmo定跡、
tanuki-定跡
Qhapaq定跡
読み太定跡
Honey Waffle定跡
最近一年でフリーソフト全体のかなりの部分を覆ってしまいました。
wcsc27での劇的な結果によりやねうら王+elmo評価関数+elmo定跡は一時到達不能だと思われたPonanzaに勝つという快挙を遂げました。また、弱い評価関数との組み合わせをとればアマチュアとの対局も可能なレベルです。今後、Apery形式がフリーソフト全体を覆っていくのか、技巧のライブラリー化によるインパクトと共に見つめていきたいと思います。